Por Jorge Azama
Hoy en día, con el desarrollo cada vez más difundido del llamado “Audio Inmersivo”, uno de los términos de los que se habla constantemente, y que podría confundir a los neófitos en el tema, es “Ambisónico(a)”. Este termino surge del prefijo “ambi” (que significa “alrededor”) y de la palabra “sónico(a)” (que significa “perteneciente o relativo al sonido”).
En este artículo, repasaremos la historia de esta tecnología y hablaremos de algunos aspectos técnicos referidos a su uso para elaborar material de audio inmersivo.
La técnica “Ambisónica” es aquella que permite grabar y reproducir audio en una esfera sónica de 360°, de tal manera que el oyente no sólo recibe señales desde el frente (como en un sistema estéreo convencional) sino de todas direcciones, lo que produce que se sienta “inmerso” en dicha experiencia sonora (de ahí el término “audio inmersivo”).
Esta tecnología, muy usada en la actualidad, tiene sus orígenes a mediados de la década de los 70’s, cuando un grupo de científicos británicos de las Universidades de Oxford y Reading, liderados por los Profesores Michael Gerzon, Peter Fellgett y Geoffrey Barton, se avocaron en la idea de diseñar un sistema capaz de grabar y reproducir material sonoro que pudiera dar la sensación de dirección, distancia y altura del sonido grabado, utilizando 4 canales de audio (como una extensión de la técnica estereofónica llamada “Mid/Side” ó “M/S”, patentada por Alan Blumlein en 1931).
Cabe mencionar que Michael Gerzon fue autor de más de 120 trabajos de investigación sobre Grabación y Reproducción de Audio Espacial, Procesamiento de Señales, Modelamiento de Ruido, etc., siendo descrito muchas veces como “uno de los más grandes pensadores y escritores de la industria del audio”, habiendo recibido el Fellowship Award de la Audio Engineering Society – AES en 1978, así como la Medalla Dorada (el más alto reconocimiento otorgado por la AES) en 1991.
Las bases del micrófono Soundfield y de la teoría Ambisónica de Gerzon, se generaron en la OUTRS (Sociedad de Grabación en Cinta de la Universidad de Oxford, por sus siglas en inglés), en el período comprendido entre 1967 y 1972, realizando su primera grabación tetraédrica en Mayo de 1971.

Arreglo tetraédrico, con 4 micrófonos Calrec, desarrollado por la OUTRS.
(Foto: Stephen Thompson)
Uno de los aportes más importantes de Gerzon, junto al Dr. Peter Craven, fue el diseñar y construir un micrófono especialmente creado para tal objetivo, al cuál llamarían “Soundfield”, realizando en Octubre 1975 la demostración del primer prototipo de dicho micrófono a los miembros del OUTRS, utilizando para su construcción cápsulas fabricadas por la empresa Calrec. Gracias a ello, Gerzon siguió trabajando en sucesivos prototipos con los ingenieros Ken Farrar y Clement Beaumont, quienes trabajaban para Calrec, hasta que dicha compañía lanzó oficialmente al mercado el primer modelo del micrófono Soundfield en 1978. Dicho micrófono contiene 4 cápsulas de micrófono, perfectamente alineadas, en un arreglo tetraédrico. La razón de usar 4 cápsulas proviene del siguiente criterio: 2 puntos definen una línea (una dimensión); 3 puntos definen un plano (2 dimensiones); 4 puntos definen un volumen (3 dimensiones en el espacio). Expertos en acústica definen el funcionamiento del micrófono Soundfield como una “decomposición del campo sonoro armónico esférico”, lo que significa que para una representación mínima en 3 dimensiones necesitamos al menos 4 micrófonos, los cuáles nos brindan “4 armónicos esféricos”.

Imagen cercana de la cápsula compuesta tetraédrica del micrófono Soundfield de Calrec, con 4 diafragmas.
(Foto: Steve Thornton)

Peter Craven (izq.) y Michael Gerzon (der.) con el 1er prototipo del micrófono Soundfield hecho por Carlec en 1976.
(Foto: Steve Thornton)

Diagrama esquemático de la alineación de la captura sonora tridimensional en el espacio.
Históricamente, la batalla por el entonces llamado “Sonido Envolvente” se libró en la década de los 70’s entre el “Ambisónico” y el “Quadrafónico” (sistema en el cuál se utilizaban 4 parlantes discretos para la reproducción sonora de 4 canales distintos de audio, que tuvo al músico experimental alemán Karlheinz Stockhausen como uno de sus máximos partidarios, y más adelante a la mítica banda Pink Floyd). Incluso se dice que Gerzon estuvo muy cerca de cerrar un acuerdo con Ray Dolby (fundador de Dolby Labs), quien por entonces estaba buscando tener la licencia de algún formato de “sonido envolvente”. Lamentablemente, por motivos ajenos a Gerzon y Dolby, ese trato nunca se concretó.
Otro dato curioso es una cita que se atribuye a Peter Craven, quien dijo lo siguiente a mediados de los 70’s: “Lo que Michael (Gerzon) hace ahora, será apreciado por el mundo en unos 30 años”. Y Craven tenía toda la razón.
La teoría Ambisónica de Gerzon se mantuvo como un sistema poco comprendido y marginalmente usado por décadas, hasta el presente cercano. Su habilidad para capturar y representar un campo sonoro esférico de 360° lo ha convertido en una opción natural para la Realidad Virtual (VR, por sus siglas en inglés). Actualmente, los oyentes pueden estar inmersos en un ambiente sonoro dinámico usando audífonos, por lo cuál muchas plataformas distribuidoras de contenido como YouTube, Facebook y algunas otras han adoptado al Sonido Ambisónico como su formato predilecto.
Además, en la actualidad, existen diversos fabricantes a nivel mundial que ofrecen micrófonos ambisónicos, con el mismo principio básico de funcionamiento que el Soundfield, lo que reafirma la importancia actual de esta tecnología gracias a aplicaciones como la Realidad Virtual.

Diversas opciones actuales de micrófonos ambisónicos en el mercado.
De izquierda a derecha: Soyuz 013 de Soyuz Microphones; Spatial Mic de Voyage Audio; NT-SF1 de Røde y Ambeo VR Mic de Sennheiser
FORMATOS AMBISÓNICOS : “FORMATO A” Y “FORMATO B”
El Formato A (“A-Format” en inglés) y el Formato B (“B-Format”) son los 2 estándares de audio analógico que son parte del flujo de trabajo Ambisónico.
Formato A (A-Format) : se llama así a la grabación sin procesar (“cruda”) de las 4 cápsulas cardioides individuales tetraédricas en un micrófono ambisónico. Debido a que los micrófonos de cada fabricante tienen distintas cápsulas a distancias ligeramente diferentes, este formato es algo específico para cada modelo de micrófono.
Formato B (B-Format) : Éste es un formato estandarizado derivado del Formato A, que consiste de 4 canales. El primer canal contiene la información de amplitud de la señal, mientras que los demás determinan la direccionalidad a través de relaciones de fase entre cada una de las señales. Este formato luego puede ser decodificado para ser escuchado en diferentes sistemas, como auriculares o sistemas de cine en casa. Existen muchas herramientas ambisónicas para combinar y alterar las señales en este formato. Debido a esto último, dentro del Formato B también existen 2 estándares, a saber:
- Furse – Malham (FuMa) : Estándar antiguo (llamado así en honor de los profesores Richard Furse y Dave Malham de la Universidad de York), que aún es compatible con una gran variedad de plug-ins y otras herramientas de procesamiento ambisónico. En este caso, los 4 canales se denominan “WXYZ”.
- AmbiX : Estándar moderno que ha sido ampliamente adoptado por plataformas de distribución de contenidos, como YouTube. El orden de los canales en AmbiX es “WYZX”.
AMBISÓNICOS DE ÓRDENES MÁS ALTOS
Los llamados Ambisónicos de Órdenes Más Altos o “Higher Order Ambisonics” (HOA), son aquellos en los cuáles no se utilizan solo 4 micrófonos o señales para traducirlas al Formato B y hacer la decomposición del campo sonoro armónico esférico, sino que se usan más de 4 para obtener así una representación más precisa. Dicha “precisión” se obtiene aumentando el orden del muestreo armónico esférico, de acuerdo al siguiente cuadro:
| Orden Ambisónico | # de Armónicos Esféricos |
| 1° | 4 |
| 2° | 9 |
| 3° | 16 |

Finalmente, es importante mencionar que, sin importar el formato en el cuál entregues tus archivos ambisónicos, es vital tener en cuenta los estándares que estás usando en tu cadena y hacer las conversiones necesarias cuando sea apropiado. De lo contrario, las rotaciones y movimientos terminarán en la dirección equivocada y toda la esfera sonora terminará hecha un desastre.
BIBLIOGRAFÍA :
– Arteaga, Daniel – «Introduction to Ambisonics» (2025)
https://www.researchgate.net/publication/280010078_Introduction_to_Ambisonics
– Ambisonics.info – «Ambisonics» (2017)
https://ambisonic.info/ambisonics.html
– Anderson, Joseph – «The Ambisonic Technique» (2010)
– Rode Microphones – «The Beginner’s Guide to Ambisonics» (2022)
https://rode.com/en-au/about/news-info/the-beginners-guide-to-ambisonics
– Santos, Claudio – “VR Audio — Differences between A Format and B Format” (2017)
– University of Oxford – «Into the Soundfield: Michael Gerzon and Ambisonics at Oxford» (2018)
https://intothesoundfield.music.ox.ac.uk
Sobre el autor:
Jorge Azama es Profesional Técnico en Ingeniería de Sonido, graduado con honores en 1998 del Instituto Superior Tecnológico Orson Welles (Lima, Perú). Miembro de la Audio Engineering Society (AES) desde 2003 y uno de los fundadores de la Sección AES Perú en 2004. Entre 2018 y 2021 fue el Vice-Chair de AES Perú. En 2019 fue el Chair de la Conferencia Latinoamericana de la Audio Engineering Society, realizada en Lima. Por ello, en 2020 recibió el Premio de la Junta de Gobernadores de AES (Board of Governors Award). Ha sido Vice-Presidente Regional de AES para Latinoamérica (el cargo más alto en la región), en el período 2022-2025.
Tiene una amplia experiencia tanto en Sonido en Vivo como en Grabación y Mezcla en Estudio, habiendo trabajado con artistas nacionales y extranjeros de diversos géneros musicales.
Ha dictado conferencias, charlas, talleres, seminarios, clases maestras y webinars en diversos eventos internacionales de audio profesional en países como: Uruguay, Bolivia, Ecuador, Colombia, Argentina, Panamá, Haití, Brasil, Estados Unidos, Chile, España, Venezuela, Guatemala, México, Honduras y Perú.
En la actualidad, trabaja como Docente en la Universidad Peruana de Ciencias Aplicadas (UPC), en la Especialidad de Producción Musical; y en el Instituto Superior Tecnológico Orson Welles, en la Carreras Técnicas en Ingeniería de Sonido y Producción Musical.