Ambisonics es un formato de sonido envolvente de esfera completa : además del plano horizontal, cubre las fuentes de sonido por encima y por debajo del oyente. [1] [2]
A diferencia de otros formatos de sonido envolvente multicanal, sus canales de transmisión no transportan señales de los altavoces, sino que contienen una representación independiente del altavoz de un campo sonoro llamado formato B , que luego se decodifica en la configuración de altavoces del oyente. Este paso adicional permite al productor pensar en términos de direcciones de fuente en lugar de posiciones de altavoces, y ofrece al oyente un grado considerable de flexibilidad en cuanto a la disposición y la cantidad de altavoces utilizados para la reproducción.
Ambisonics se desarrolló en el Reino Unido en la década de 1970 bajo los auspicios de la Corporación Nacional de Investigación y Desarrollo británica .
A pesar de su sólida base técnica y sus muchas ventajas, hasta hace poco [ ¿cuándo? ] Ambisonics no había sido un éxito comercial y sólo sobrevivió en aplicaciones de nicho y entre los entusiastas de la grabación.
Con la amplia disponibilidad de un potente procesamiento de señales digitales (a diferencia de los costosos y propensos a errores circuitos analógicos que se debían utilizar durante sus primeros años) y la exitosa introducción en el mercado de los sistemas de sonido envolvente de cine en casa desde la década de 1990, el interés en Ambisonics entre ingenieros de grabación, diseñadores de sonido, compositores, empresas de medios, emisoras e investigadores ha regresado y continúa aumentando.
En particular, ha demostrado ser una forma eficaz de presentar audio espacial en aplicaciones de realidad virtual (por ejemplo, videos 360 de YouTube), ya que la escena en formato B se puede rotar para que coincida con la orientación de la cabeza del usuario y luego decodificarse como estéreo binaural.
La ambisónica puede entenderse como una extensión tridimensional del estéreo M/S (medio/lateral) , que añade canales de diferencia adicionales para altura y profundidad. El conjunto de señales resultante se denomina formato B. Sus canales componentes están etiquetados para la presión sonora (la M en M/S), para el gradiente de presión sonora frontal-menos-posterior, para izquierda-menos-derecha (la S en M/S) y para arriba-menos-abajo. [nota 1]
La señal corresponde a un micrófono omnidireccional, mientras que los componentes serían captados por cápsulas en forma de ocho orientadas a lo largo de los tres ejes espaciales.
Un panner (o codificador ) ambisónico simple toma una señal de origen y dos parámetros, el ángulo horizontal y el ángulo de elevación . Coloca la fuente en el ángulo deseado distribuyendo la señal sobre los componentes ambisónicos con diferentes ganancias:
Al ser omnidireccional, el canal siempre recibe la misma señal de entrada constante, independientemente de los ángulos. De modo que tiene más o menos la misma energía media que los otros canales, W se atenúa en unos 3 dB (precisamente, dividido por la raíz cuadrada de dos). [3] Los términos para producen en realidad los patrones polares de los micrófonos en forma de ocho (véase la ilustración de la derecha, segunda fila). Tomamos su valor en y , y multiplicamos el resultado por la señal de entrada. El resultado es que la entrada acaba en todos los componentes exactamente tan fuerte como la habría captado el micrófono correspondiente.
Los componentes de formato B se pueden combinar para obtener micrófonos virtuales con cualquier patrón polar de primer orden (omnidireccional, cardioide, hipercardioide, en forma de ocho o cualquier patrón intermedio) apuntando en cualquier dirección. Se pueden obtener varios micrófonos de este tipo con diferentes parámetros al mismo tiempo para crear pares estéreo coincidentes (como un Blumlein ) o conjuntos envolventes.
Patrón | |
---|---|
Figura de ocho | |
Hipercardioides y supercardioides | |
Cardioide | |
Cardioides anchos | |
Omnidireccional |
Un micrófono virtual horizontal en ángulo horizontal con patrón se da por
Este micrófono virtual está normalizado en campo libre , lo que significa que tiene una ganancia constante de uno para los sonidos en el eje. La ilustración de la izquierda muestra algunos ejemplos creados con esta fórmula.
Los micrófonos virtuales se pueden manipular en la postproducción: se pueden seleccionar los sonidos deseados, suprimir los no deseados y se puede ajustar el equilibrio entre el sonido directo y el reverberante durante la mezcla.
Un decodificador ambisónico básico es muy similar a un conjunto de micrófonos virtuales. Para diseños perfectamente regulares, se puede generar un decodificador simplificado apuntando un micrófono cardioide virtual en la dirección de cada altavoz. Aquí se muestra un cuadrado:
Los signos de los componentes y son la parte importante, el resto son factores de ganancia. El componente se descarta porque no es posible reproducir señales de altura con solo cuatro altavoces en un plano.
En la práctica, un decodificador ambisónico real requiere una serie de optimizaciones psicoacústicas para funcionar correctamente. [4]
Actualmente, el decodificador ambisónico integral (AllRAD) puede considerarse la solución estándar para la reproducción basada en altavoces, [5] y los mínimos cuadrados de magnitud (MagLS) [6] o la decodificación binaural, tal como se implementa, por ejemplo, en las herramientas de producción ambisónica IEM y SPARTA. [7] [8]
La decodificación dependiente de la frecuencia también se puede utilizar para producir estéreo binaural; esto es particularmente relevante en aplicaciones de realidad virtual.
La resolución espacial de los ambisónicos de primer orden descritos anteriormente es bastante baja. En la práctica, eso se traduce en fuentes ligeramente borrosas, pero también en un área de escucha utilizable o punto óptimo comparativamente pequeño . La resolución se puede aumentar y el punto óptimo se puede ampliar agregando grupos de componentes direccionales más selectivos al formato B. Estos ya no corresponden a los patrones polares de micrófono convencionales, sino que parecen hojas de trébol. El conjunto de señales resultante se denomina entonces ambisónico de segundo orden , ambisónico de tercer orden o, colectivamente, ambisónico de orden superior .
Para un orden determinado , los sistemas de esfera completa requieren componentes de señal y se necesitan componentes para la reproducción solo horizontal.
Históricamente ha habido varias convenciones de formato diferentes para Ambisonic de orden superior; para obtener más detalles, consulte Formatos de intercambio de datos Ambisonic .
Ambisonics se diferencia de otros formatos envolventes en varios aspectos:
En el lado negativo, Ambisonics es:
Las señales en formato B comprenden una descomposición armónica esférica truncada del campo sonoro. Corresponden a la presión sonora y a los tres componentes del gradiente de presión (que no debe confundirse con la velocidad de la partícula relacionada ) en un punto del espacio. En conjunto, estos componentes aproximan el campo sonoro en una esfera alrededor del micrófono; formalmente, el truncamiento de primer orden de la expansión multipolar ( la señal mono) es la información de orden cero, que corresponde a una función constante en la esfera, mientras que son los términos de primer orden (los dipolos o figuras de ocho). Este truncamiento de primer orden es solo una aproximación del campo sonoro general.
Los órdenes superiores corresponden a términos adicionales de la expansión multipolar de una función en la esfera en términos de armónicos esféricos. En la práctica, los órdenes superiores requieren más altavoces para la reproducción, pero aumentan la resolución espacial y amplían el área en la que el campo sonoro se reproduce perfectamente (hasta una frecuencia límite superior).
El radio de esta área para el orden y frecuencia ambisónicos viene dado por
donde denota la velocidad del sonido.
Esta área se vuelve más pequeña que una cabeza humana por encima de los 600 Hz para el primer orden o 1800 Hz para el tercer orden. La reproducción precisa en un volumen del tamaño de una cabeza hasta 20 kHz requeriría un orden de 32 o más de 1000 altavoces.
En aquellas frecuencias y posiciones de escucha donde ya no es posible una reconstrucción perfecta del campo sonoro , la reproducción Ambisonics debe centrarse en proporcionar señales direccionales correctas para permitir una buena localización incluso en presencia de errores de reconstrucción.
This article needs additional citations for verification. (December 2013) |
El aparato auditivo humano tiene una localización muy precisa en el plano horizontal (hasta 2° de separación de fuentes en algunos experimentos). Se pueden identificar dos señales predominantes para diferentes rangos de frecuencia:
En las frecuencias bajas, donde la longitud de onda es grande en comparación con la cabeza humana, el sonido entrante se difracta a su alrededor, de modo que prácticamente no hay sombra acústica y, por lo tanto, no hay diferencia de nivel entre los oídos. En este rango, la única información disponible es la relación de fase entre las dos señales del oído, llamada diferencia de tiempo interaural o ITD . La evaluación de esta diferencia de tiempo permite una localización precisa dentro de un cono de confusión : el ángulo de incidencia es inequívoco, pero la ITD es la misma para los sonidos que vienen de adelante o de atrás. Siempre que el sonido no sea totalmente desconocido para el sujeto, la confusión generalmente se puede resolver percibiendo las variaciones tímbricas de adelante hacia atrás causadas por las aletas de las orejas (o pabellones auriculares ).
A medida que la longitud de onda se acerca al doble del tamaño de la cabeza, las relaciones de fase se vuelven ambiguas, ya que ya no está claro si la diferencia de fase entre los oídos corresponde a uno, dos o incluso más períodos a medida que aumenta la frecuencia. Afortunadamente, la cabeza creará una sombra acústica significativa en este rango, lo que provoca una ligera diferencia de nivel entre los oídos. Esto se llama diferencia de nivel interaural o ILD (se aplica el mismo cono de confusión). Combinados, estos dos mecanismos proporcionan localización en todo el rango auditivo.
Gerzon ha demostrado que la calidad de las señales de localización en el campo sonoro reproducido corresponde a dos métricas objetivas: la longitud del vector de velocidad de partículas para el ITD y la longitud del vector de energía para el ILD. Gerzon y Barton (1992) definen un decodificador para sonido envolvente horizontal como ambisónico si
En la práctica, se consiguen resultados satisfactorios en órdenes de magnitud moderados incluso para áreas de escucha muy grandes. [11] [12]
Los humanos también pueden obtener información sobre la ubicación de la fuente de sonido en el espacio 3D, teniendo en cuenta la altura. Gran parte de esta capacidad se debe a la forma de la cabeza (especialmente el pabellón auricular ), que produce una respuesta de frecuencia variable según el ángulo de la fuente. La respuesta se puede medir colocando un micrófono en el canal auditivo de una persona y luego reproduciendo sonidos desde varias direcciones. La función de transferencia relacionada con la cabeza (HRTF) registrada se puede utilizar para reproducir sonidos ambisónicos en auriculares, imitando el efecto de la cabeza. Las HRTF difieren de una persona a otra debido a las variaciones en la forma de la cabeza, pero una genérica puede producir un resultado satisfactorio. [13]
En principio, las señales de los altavoces se obtienen mediante una combinación lineal de las señales de los componentes ambisónicos, donde cada señal depende de la posición real del altavoz en relación con el centro de una esfera imaginaria cuya superficie pasa por todos los altavoces disponibles. En la práctica, las distancias ligeramente irregulares de los altavoces se pueden compensar con un retardo .
Sin embargo, la verdadera decodificación ambisónica requiere una ecualización espacial de las señales para tener en cuenta las diferencias en los mecanismos de localización de sonido de alta y baja frecuencia en la audición humana. [14] Un refinamiento adicional tiene en cuenta la distancia del oyente respecto de los altavoces ( compensación de campo cercano ). [15]
También se utilizan diversos métodos de decodificación más modernos.
Actualmente, los decodificadores Ambisonic no se comercializan de forma significativa para los usuarios finales y no hay grabaciones Ambisonic nativas disponibles comercialmente. Por lo tanto, el contenido producido en Ambisonic debe ponerse a disposición de los consumidores en formatos estéreo o multicanal discretos.
El contenido ambisónico se puede convertir a estéreo automáticamente, sin necesidad de una mezcla especial. El método más sencillo es muestrear el formato B con un micrófono estéreo virtual . El resultado es equivalente a una grabación estéreo coincidente. La imagen dependerá de la geometría del micrófono, pero normalmente las fuentes traseras se reproducirán de forma más suave y difusa. Se omite la información vertical (del canal).
Como alternativa, el formato B se puede codificar en matriz en formato UHJ , que es adecuado para la reproducción directa en sistemas estéreo. Como antes, se descartará la información vertical, pero además de la reproducción de izquierda a derecha, el formato UHJ intenta conservar parte de la información envolvente horizontal al traducir las fuentes en la parte posterior en señales desfasadas. Esto le da al oyente una cierta sensación de localización trasera.
El UHJ de dos canales también se puede decodificar nuevamente en Ambisonic horizontal (con cierta pérdida de precisión), si se dispone de un sistema de reproducción Ambisonic. El UHJ sin pérdida de hasta cuatro canales (incluida la información de altura) existe, pero nunca se ha utilizado ampliamente. En todos los esquemas UHJ, los dos primeros canales son alimentaciones de altavoz izquierda y derecha convencionales.
Asimismo, es posible predecodificar material Ambisonics para configuraciones de altavoces arbitrarias, como Quad , 5.1 , 7.1 , Auro 11.1 o incluso 22.2 , nuevamente sin intervención manual. El canal LFE se omite o se crea una mezcla especial manualmente. La predecodificación para medios 5.1 se conoce comoFormato G [16]durante los primeros días del audio DVD, aunque el término ya no se usa comúnmente.
La ventaja obvia de la decodificación previa es que cualquier oyente de sonido envolvente puede experimentar Ambisonics; no se requiere ningún hardware especial más allá del que se encuentra en un sistema de cine en casa común. La principal desventaja es que se pierde la flexibilidad de reproducir una única señal Ambisonics estándar en cualquier conjunto de altavoces de destino: la señal asume un diseño "estándar" específico y cualquiera que escuche con un conjunto diferente puede experimentar una degradación de la precisión de localización.
Los diseños de objetivos a partir de 5.1 suelen superar la resolución espacial de los Ambisonics de primer orden, al menos en el cuadrante frontal. Para lograr una resolución óptima, evitar una diafonía excesiva y sortear las irregularidades del diseño de objetivos, las decodificaciones previas para dichos objetivos deben derivarse de material fuente en Ambisonics de orden superior. [17]
El contenido ambisónico se puede crear de dos formas básicas: grabando un sonido con un micrófono de primer orden o superior adecuado, o tomando fuentes monofónicas independientes y colocándolas en las posiciones deseadas. El contenido también se puede manipular mientras está en formato B.
Dado que los componentes de los Ambisonics de primer orden corresponden a patrones físicos de captación de micrófonos, es completamente práctico grabar directamente en formato B, con tres micrófonos coincidentes: una cápsula omnidireccional, una cápsula en forma de 8 orientada hacia adelante y una cápsula en forma de 8 orientada hacia la izquierda, lo que produce los componentes , y . [18] [19] Esto se conoce como un conjunto de micrófonos nativos o Nimbus/Halliday , en honor a su diseñador, el Dr. Jonathan Halliday en Nimbus Records , donde se utiliza para grabar su extensa y continua serie de lanzamientos Ambisonic. Un micrófono nativo integrado en formato B, el C700S [20] ha sido fabricado y vendido por Josephson Engineering desde 1990.
La principal dificultad inherente a este enfoque es que la localización y claridad de alta frecuencia depende de que los diafragmas se acerquen a la coincidencia verdadera. Al apilar las cápsulas verticalmente, se obtiene una coincidencia perfecta para las fuentes horizontales. Sin embargo, el sonido desde arriba o desde abajo sufrirá teóricamente efectos sutiles de filtrado de peine en las frecuencias más altas. En la mayoría de los casos, esto no es una limitación, ya que las fuentes de sonido alejadas del plano horizontal suelen ser de reverberación ambiental. Además, los elementos de micrófono en forma de 8 apilados tienen un nulo profundo en la dirección de su eje de apilamiento, de modo que el transductor principal en esas direcciones es el micrófono omnidireccional central. En la práctica, esto puede producir menos error de localización que cualquiera de las alternativas (matrices tetraédricas con procesamiento o un cuarto micrófono para el eje Z). [ cita requerida ]
Los arreglos nativos se utilizan con mayor frecuencia para sonido envolvente solo horizontal, debido al aumento de errores de posición y efectos de sombreado cuando se agrega un cuarto micrófono.
Dado que es imposible construir un conjunto de micrófonos perfectamente coincidentes, el siguiente mejor enfoque es minimizar y distribuir el error de posición de la forma más uniforme posible. Esto se puede lograr organizando cuatro cápsulas cardioides o subcardioides en un tetraedro y ecualizando para lograr una respuesta de campo difuso uniforme. [21] Las señales de la cápsula se convierten luego al formato B con una operación matricial.
Fuera de Ambisonics, los micrófonos tetraédricos se han vuelto populares entre los ingenieros de grabación en exteriores que trabajan en estéreo o 5.1 por su flexibilidad en la posproducción; aquí, el formato B solo se utiliza como intermedio para derivar micrófonos virtuales.
Por encima del primer orden, ya no es posible obtener componentes ambisónicos directamente con cápsulas de micrófono individuales. En su lugar, se derivan señales diferenciales de orden superior a partir de varias cápsulas distribuidas espacialmente (normalmente omnidireccionales) mediante un procesamiento de señales digitales muy sofisticado. [22]
El Eigenmike em32 [23] y el ZYLIA ZM-1 [24] son un conjunto de micrófonos ambisónicos de 32 canales disponibles comercialmente.
Un artículo reciente de Peter Craven et al. [25] (posteriormente patentado) describe el uso de cápsulas bidireccionales para micrófonos de orden superior con el fin de reducir la extremidad de la ecualización involucrada. Hasta el momento no se han fabricado micrófonos que utilicen esta idea.
La forma más sencilla de producir mezclas Ambisonic de orden arbitrariamente alto es tomar fuentes monofónicas y posicionarlas con un codificador Ambisonic.
Un codificador de esfera completa normalmente tiene dos parámetros: acimut (u horizonte) y ángulo de elevación. El codificador distribuirá la señal de origen a los componentes ambisónicos de modo que, al decodificarla, la fuente aparecerá en la ubicación deseada. Los panoramizadores más sofisticados también proporcionarán un parámetro de radio que se ocupará de la atenuación dependiente de la distancia y del refuerzo de graves debido al efecto de campo cercano.
Las unidades de paneo de hardware y mezcladores para Ambisonics de primer orden han estado disponibles desde la década de 1980 [26] [27] [28] y se han utilizado comercialmente. Hoy en día, los complementos de paneo y otras herramientas de software relacionadas están disponibles para todas las principales estaciones de trabajo de audio digital, a menudo como software gratuito . Sin embargo, debido a restricciones arbitrarias de ancho de bus, pocas estaciones de trabajo de audio digital (DAW) profesionales admiten órdenes superiores al segundo. Las excepciones notables son REAPER , Pyramix, ProTools , Nuendo y Ardour .
El formato B de primer orden se puede manipular de diversas maneras para cambiar el contenido de una escena auditiva. Las manipulaciones más conocidas incluyen la "rotación" y la "dominancia" (mover las fuentes hacia una dirección particular o alejarlas de ella). [10] [29]
Además, el procesamiento de señales lineales invariantes en el tiempo, como la ecualización, se puede aplicar al formato B sin alterar las direcciones del sonido, siempre que se aplique a todos los canales componentes por igual.
Los desarrollos más recientes en Ambisonics de orden superior permiten una amplia gama de manipulaciones que incluyen rotación, reflexión, movimiento, reverberación 3D , mezcla ascendente desde formatos heredados como 5.1 o primer orden, visualización y enmascaramiento y ecualización dependientes de la dirección.
La transmisión del formato B ambisónico entre dispositivos y hacia los usuarios finales requiere un formato de intercambio estandarizado. Si bien el formato B de primer orden tradicional está bien definido y es universalmente comprendido, existen convenciones conflictivas para los ambisónicos de orden superior, que difieren tanto en el orden de los canales como en la ponderación, y que podrían necesitar soporte durante algún tiempo. Tradicionalmente, el más extendido es el formato de orden superior Furse-Malham en el .amb
contenedor basado en el formato de archivo WAVE-EX de Microsoft. [30] Es escalable hasta el tercer orden y tiene una limitación de tamaño de archivo de 4 GB.
Las nuevas implementaciones y producciones podrían considerar la propuesta AmbiX [31].caf
, que adopta el formato de archivo y elimina el límite de 4 GB. Se escala a órdenes arbitrariamente altas y se basa en la codificación SN3D. Google ha adoptado la codificación SN3D como base para su formato YouTube 360. [32]
Para distribuir de manera eficaz los datos ambisónicos a los no profesionales, se desea una compresión con pérdida para mantener un tamaño de datos aceptable. Sin embargo, la compresión multimono simple no es suficiente, ya que la compresión con pérdida tiende a destruir la información de fase y, por lo tanto, degrada la localización en forma de reducción espacial, desenfoque y fuente fantasma. Se desea la reducción de la redundancia entre canales, no solo para mejorar la compresión, sino también para reducir el riesgo de errores de fase detectables. [33] (También es posible utilizar el posprocesamiento para ocultar los artefactos). [34]
Al igual que con la codificación estéreo conjunta mid-side, un esquema de matriz estática (como en Opus) es utilizable para ambisonics de primer orden, pero no es óptimo en caso de múltiples fuentes. Una serie de esquemas como DirAC utilizan un esquema similar al estéreo paramétrico , donde se codifica una señal mezclada, se graba la dirección principal y se agrega alguna descripción del ambiente. MPEG-H 3D Audio , basándose en algunos trabajos de MPEG Surround , extiende el concepto para manejar múltiples fuentes. MPEG-H utiliza análisis de componentes principales para determinar las fuentes principales y luego codifica una señal multimono correspondiente a las direcciones principales. Estos métodos paramétricos proporcionan una buena calidad, siempre que tengan cuidado de suavizar las direcciones del sonido entre los fotogramas. [33] PCA/SVD es aplicable para la entrada ambisónica de primer orden, así como de alto orden. [35]
Desde 2018 existe una implementación libre y de código abierto en el IEM Plugin Suite [7] y el SPARTA suite [8] que implementan los recientes desarrollos académicos y el códec de sonido Opus . Opus proporciona dos modos de codificación de canales: uno que simplemente almacena los canales individualmente y otro que pondera los canales a través de una matriz fija e invertible para reducir la redundancia. [36] En 2020 se publicó una prueba de escucha de la ambisónica Opus, como calibración para AMBIQUAL, una métrica objetiva para la ambisónica comprimida de Google. La ambisónica de tercer orden Opus a 256 kbps tiene una precisión de localización similar en comparación con la ambisónica de primer orden Opus a 128 kbps. [37] : Fig. 12
Desde que Google y otros fabricantes lo adoptaron como el formato de audio preferido para la realidad virtual , Ambisonics ha despertado un gran interés. [38] [39] [40]
En 2018, Sennheiser lanzó su micrófono VR, [41] y Zoom lanzó una grabadora de campo Ambisonics. [42] Ambas son implementaciones del diseño de micrófono tetraédrico que produce Ambisonics de primer orden.
Actualmente varias empresas están realizando investigaciones en Ambisonics:
Dolby Laboratories ha expresado su "interés" en Ambisonics al adquirir (y liquidar) el especialista en Ambisonics con sede en Barcelona imm sound antes de lanzar Dolby Atmos [48] , que, aunque no se ha revelado su funcionamiento preciso, implementa el desacoplamiento entre la dirección de la fuente y las posiciones reales de los altavoces. Atmos adopta un enfoque fundamentalmente diferente en el sentido de que no intenta transmitir un campo de sonido; transmite premezclas discretas o pistas (es decir, flujos sin procesar de datos de sonido) junto con metadatos sobre la ubicación y la dirección de la que deberían parecer provenir. Luego, las pistas se decodifican, se mezclan y se renderizan en tiempo real utilizando los altavoces disponibles en la ubicación de reproducción.
La tecnología Ambisonic de orden superior ha encontrado un nicho de mercado en los videojuegos desarrollados por Codemasters . Su primer juego en utilizar un motor de audio Ambisonic fue Colin McRae: DiRT , sin embargo, este solo utilizó Ambisonic en la plataforma PlayStation 3. [49] Su juego Race Driver: GRID extendió el uso de Ambisonic a la plataforma Xbox 360 , [50] y Colin McRae: DiRT 2 utiliza Ambisonic en todas las plataformas, incluida la PC. [51]
Los juegos recientes de Codemasters, F1 2010 , Dirt 3 , [52] F1 2011 [53] y Dirt: Showdown , [54] usan Ambisonic de cuarto orden en PC más rápidas, [55] renderizados por el controlador Rapture3D OpenAL de Blue Ripple Sound y audio Ambisonic premezclado producido usando los complementos WigWare Ambisonic de Bruce Wiggins. [56]
OpenAL Soft [2], una implementación gratuita y de código abierto de la especificación OpenAL, también utiliza Ambisonics para renderizar audio 3D. [57] OpenAL Soft a menudo se puede utilizar como un reemplazo directo para otras implementaciones de OpenAL, lo que permite que varios juegos que usan la API de OpenAL se beneficien de la renderización de audio con Ambisonics.
En el caso de muchos juegos que no utilizan la API OpenAL de forma nativa, el uso de un contenedor o una cadena de contenedores puede ayudar a que estos juegos utilicen indirectamente la API OpenAL. En última instancia, esto hace que el sonido se represente en Ambisonics si se utiliza un controlador OpenAL compatible, como OpenAL Soft. [58]
El motor Unreal Engine admite la representación de campos sonoros Ambisonics desde la versión 4.25. [59] El motor Unity admite el trabajo con clips de audio Ambisonics desde la versión 2017.1. [60]
La mayoría de las patentes que cubren los desarrollos Ambisonic han expirado (incluidas las que cubren el micrófono Soundfield ) y, como resultado, la tecnología básica está disponible para que cualquiera pueda implementarla.
El "fondo" de patentes que comprende la tecnología Ambisonics fue creado originalmente por la National Research & Development Corporation (NRDC) del gobierno del Reino Unido, que existió hasta fines de los años 70 para desarrollar y promover inventos británicos y otorgar licencias a fabricantes comerciales, idealmente a un único licenciatario. El sistema fue finalmente licenciado a Nimbus Records (ahora propiedad de Wyastone Estate Ltd).
El logotipo de Ambisonic de "círculos entrelazados" (marcas comerciales del Reino Unido UK00001113276 y UK00001113277 ), y las marcas de texto "AMBISONIC" y "AMBISO N" (marcas comerciales del Reino Unido UK00001500177 y UK00001112259 ), anteriormente propiedad de Wyastone Estate Ltd., expiraron a partir de 2010.
Para hacer que las señales de formato B transporten una energía promedio más o menos igual, X, Y, Z tienen una ganancia de √ 2 en sus direcciones de sensibilidad máxima.