El sonido envolvente es una técnica para enriquecer la fidelidad y profundidad de la reproducción del sonido mediante el uso de múltiples canales de audio desde altavoces que rodean al oyente ( canales envolventes ). Su primera aplicación fue en las salas de cine . Antes del sonido envolvente, los sistemas de sonido de los cines solían tener tres canales de sonido en pantalla que se reproducían desde tres altavoces (izquierdo, central y derecho) ubicados frente a la audiencia. El sonido envolvente agrega uno o más canales desde altavoces a un costado o detrás del oyente que son capaces de crear la sensación de sonido proveniente de cualquier dirección horizontal (a nivel del suelo) alrededor del oyente.
La técnica mejora la percepción de la espacialización del sonido explotando la localización del sonido : la capacidad del oyente de identificar la ubicación o el origen de un sonido detectado en dirección y distancia. Esto se logra utilizando múltiples canales de audio discretos enrutados a una matriz de altavoces . [1] El sonido envolvente generalmente tiene una ubicación del oyente ( punto óptimo ) donde los efectos de audio funcionan mejor y presenta una perspectiva fija o hacia adelante del campo sonoro al oyente en esta ubicación.
Los formatos de sonido envolvente varían en los métodos de reproducción y grabación, junto con el número y la posición de los canales adicionales. La especificación de sonido envolvente más común, el estándar 5.1 de la UIT , requiere 6 altavoces: central (C), frente al oyente; izquierdo (L) y derecho (R), en ángulos de 60°; envolvente izquierdo (LS) y envolvente derecho (RS) en ángulos de 100–120°; y un subwoofer , cuya posición no es crítica. [2]
Aunque el cine y las bandas sonoras representan los principales usos de las técnicas de sonido envolvente, su ámbito de aplicación es más amplio que eso, ya que el sonido envolvente permite la creación de un entorno de audio para todo tipo de propósitos. Las técnicas de audio multicanal se pueden utilizar para reproducir contenidos tan variados como música, voz, sonidos naturales o sintéticos para cine, televisión , radiodifusión o computadoras. En términos de contenido musical, por ejemplo, una actuación en vivo puede utilizar técnicas multicanal en el contexto de un concierto al aire libre, de una actuación de teatro musical o para radiodifusión ; [3] para una película , se adaptan técnicas específicas al cine o al hogar (por ejemplo, sistemas de cine en casa ). [4] El espacio narrativo también es un contenido que se puede mejorar a través de técnicas multicanal. Esto se aplica principalmente a las narrativas cinematográficas, por ejemplo, el habla de los personajes de una película, [5] [6] [7] pero también se puede aplicar a obras de teatro representadas en un teatro, a una conferencia o para integrar comentarios basados en voz en un sitio o monumento arqueológico. Por ejemplo, una exposición puede ser mejorada con un sonido ambiental temático de agua, pájaros, trenes o ruido de máquinas. Los sonidos naturales temáticos también pueden usarse en aplicaciones educativas. [8] Otros campos de aplicación incluyen consolas de videojuegos, computadoras personales y otras plataformas. [9] [10] [11] [12] En tales aplicaciones, el contenido normalmente sería ruido sintético producido por el dispositivo informático en interacción con su usuario. También se ha realizado un trabajo significativo utilizando sonido envolvente para mejorar la conciencia de la situación en aplicaciones militares y de seguridad pública. [13]
Los medios de sonido envolvente comerciales incluyen videocasetes , DVD y transmisiones SDTV codificadas como Dolby Surround comprimido con matriz analógica , Dolby Digital y DTS , y audio sin pérdida como DTS HD Master Audio y Dolby TrueHD en HDTV Blu-ray Disc y HD DVD , que son idénticos al master de estudio. Otros formatos comerciales incluyen los formatos DVD-Audio (DVD-A) y Super Audio CD (SACD) de la competencia, y MP3 Surround . Los formatos de sonido envolvente Cinema 5.1 incluyen Dolby Digital y DTS . Sony Dynamic Digital Sound (SDDS) es una configuración de cine de 8 canales que presenta 5 canales de audio independientes en el frente con dos canales envolventes independientes y un canal de efectos de baja frecuencia . La configuración tradicional de altavoces envolventes 7.1 introduce dos altavoces traseros adicionales a la disposición 5.1 convencional, para un total de cuatro canales envolventes y tres canales frontales, para crear un campo de sonido de más de 360°.
La mayoría de las grabaciones de sonido envolvente son creadas por compañías productoras de películas o productores de videojuegos; sin embargo, algunas videocámaras de consumo tienen esa capacidad incorporada o disponible por separado. Las tecnologías de sonido envolvente también se pueden utilizar en la música para permitir nuevos métodos de expresión artística. Después del fracaso del audio cuadrafónico en la década de 1970, la música multicanal se ha reintroducido lentamente desde 1999 con la ayuda de los formatos SACD y DVD-Audio. Algunos receptores AV , sistemas estereofónicos y tarjetas de sonido de computadora contienen procesadores de señal digital integrados o procesadores de audio digital para simular el sonido envolvente de una fuente estereofónica (consulte falso estéreo ).
En 1967, el grupo de rock Pink Floyd realizó el primer concierto de sonido envolvente en "Games for May", un evento lujoso en el Queen Elizabeth Hall de Londres , donde la banda estrenó su sistema de altavoces cuadrafónicos hecho a medida . [14] El dispositivo de control que habían fabricado, el Azimuth Co-ordinator , ahora se exhibe en el Victoria and Albert Museum de Londres , como parte de su galería Theatre Collections. [15]
El primer uso documentado del sonido envolvente fue en 1940, para la película animada Fantasía del estudio Disney . Walt Disney se inspiró en la pieza operística de Nikolai Rimsky-Korsakov El vuelo del moscardón para que un abejorro apareciera en su musical Fantasía y también sonara como si estuviera volando en todas las partes del teatro. La aplicación de audio multicanal inicial se llamó ' Fantasound ', que comprendía tres canales de audio y altavoces. El sonido se difundía por todo el cine, controlado por un ingeniero que utilizaba unos 54 altavoces. El sonido envolvente se lograba utilizando la suma y la diferencia de la fase del sonido. Sin embargo, este uso experimental del sonido envolvente se excluyó de la película en proyecciones posteriores. En 1952, el "sonido envolvente" reapareció con éxito con la película "This is Cinerama", utilizando un sonido discreto de siete canales, y despegó la carrera para desarrollar otros métodos de sonido envolvente. [16] [17]
En la década de 1950, el compositor alemán Karlheinz Stockhausen experimentó y produjo composiciones electrónicas innovadoras como Gesang der Jünglinge y Kontakte , esta última utilizando sonidos cuadrafónicos totalmente discretos y rotatorios generados con equipo electrónico industrial en el estudio de Herbert Eimert en la Westdeutscher Rundfunk (WDR). El Poème électronique de Edgar Varese , creado para el pabellón Philips diseñado por Iannis Xenakis en la Feria Mundial de Bruselas de 1958 , también utilizó audio espacial con 425 altavoces utilizados para mover el sonido por todo el pabellón.
En 1957, en colaboración con el artista Jordan Belson , Henry Jacobs produjo Vortex: Experiments in Sound and Light, una serie de conciertos con música nueva, incluida algo del propio Jacobs, y de Karlheinz Stockhausen , entre muchos otros, que se llevó a cabo en el Planetario Morrison en el Golden Gate Park de San Francisco. Los diseñadores de sonido suelen considerar esto como el origen del concepto (ahora estándar) de "sonido envolvente". El programa fue popular y Jacobs y Belson fueron invitados a reproducirlo en la Exposición Universal de 1958 en Bruselas. [18] También hay muchos otros compositores que crearon obras de sonido envolvente innovadoras en el mismo período de tiempo.
En 1978, un concepto ideado por Max Bell para Dolby Laboratories llamado "split surround" fue probado con la película Superman . Esto condujo al lanzamiento de Apocalypse Now en formato surround estéreo de 70 mm , que se convirtió en uno de los primeros lanzamientos formales en cines con tres canales en la parte delantera y dos en la trasera. [19] Por lo general, había cinco altavoces detrás de las pantallas de los cines con capacidad para 70 mm, pero solo el izquierdo, el central y el derecho se usaban con frecuencia completa, mientras que el centro-izquierdo y el centro-derecho solo se usaban para frecuencias graves (como es común actualmente). El codificador/decodificador de Apocalypse Now fue diseñado por Michael Karagosian, también para Dolby Laboratories . La mezcla envolvente fue producida por un equipo ganador del Oscar dirigido por Walter Murch para American Zoetrope . El formato también se implementó en 1982 con el lanzamiento de Blade Runner en formato surround estéreo .
La versión 5.1 del sonido envolvente se originó en 1987 en el famoso cabaret francés Moulin Rouge . Un ingeniero francés, Dominique Bertrand, utilizó una mesa de mezclas especialmente diseñada en cooperación con Solid State Logic , basada en la serie 5000 e incluyendo seis canales. Respectivamente: A izquierda, B derecha, C centro, D trasera izquierda, E trasera derecha, F graves. El mismo ingeniero ya había logrado un sistema 3.1 en 1974, para la Cumbre Internacional de Estados Francófonos en Dakar , Senegal.
El sonido envolvente se crea de varias maneras. El primer método y el más simple es usar una técnica de grabación de sonido envolvente (capturando dos imágenes estéreo distintas, una para la parte frontal y otra para la parte posterior, o usando una configuración dedicada, por ejemplo, un árbol Decca aumentado [20] ) o mezclando sonido envolvente para reproducirlo en un sistema de audio usando parlantes que rodean al oyente para reproducir audio desde diferentes direcciones. Un segundo enfoque es procesar el audio con métodos de localización de sonido psicoacústico para simular un campo de sonido bidimensional (2-D) con auriculares. Un tercer enfoque, basado en el principio de Huygens , intenta reconstruir los frentes de onda del campo de sonido grabado dentro del espacio de escucha; una forma de "holograma de audio". Una forma, la síntesis de campo de onda (WFS), produce un campo de sonido con un campo de error uniforme sobre toda el área. Los sistemas WFS comerciales, actualmente comercializados por las empresas sonic emotion e Iosono , requieren muchos altavoces y una potencia de procesamiento significativa. El cuarto enfoque consiste en utilizar tres micrófonos, uno para el frente, uno para el costado y uno para la parte trasera, también llamado grabación Doble MS .
La forma Ambisonics , también basada en el principio de Huygens , proporciona una reconstrucción de sonido exacta en el punto central; sin embargo, es menos precisa lejos del punto central. Hay muchos programas de software gratuitos y comerciales disponibles para Ambisonics, que domina la mayor parte del mercado de consumo, especialmente los músicos que utilizan música electrónica y por ordenador. Además, los productos Ambisonics son el estándar en hardware de sonido envolvente vendido por Meridian Audio . En su forma más simple, Ambisonics consume pocos recursos, sin embargo, esto no es cierto para los desarrollos recientes, como Near Field Compensated Higher Order Ambisonics. [21] Hace algunos años se demostró que, en el límite, WFS y Ambisonics convergen. [22]
Por último, el sonido envolvente también se puede conseguir mediante la masterización del nivel, a partir de fuentes estereofónicas como con Penteo, que utiliza el análisis del procesamiento de señales digitales de una grabación estéreo para analizar los sonidos individuales en posiciones panorámicas de componentes y luego los posiciona, en consecuencia, en un campo de cinco canales. Sin embargo, hay más formas de crear sonido envolvente a partir del estéreo, por ejemplo, con las rutinas basadas en QS y SQ para codificar sonido Quad , donde los instrumentos se dividían en 4 altavoces en el estudio. Esta forma de crear sonido envolvente con rutinas de software normalmente se conoce como "mezcla ascendente", [23] que fue particularmente exitosa en los decodificadores de la serie QSD de Sansui que tenían un modo en el que mapeaba el estéreo L ↔ R en un arco ∩. [ cita requerida ]
Hay muchas configuraciones alternativas disponibles para una experiencia de sonido envolvente, con una configuración 3-2 (3 altavoces frontales, 2 traseros y un canal de efectos de baja frecuencia) (más comúnmente conocida como surround 5.1) siendo el estándar para la mayoría de las aplicaciones de sonido envolvente, incluyendo cine, televisión y aplicaciones de consumo. [2] [24] Este es un compromiso entre la creación de imagen ideal de una habitación y la de practicidad y compatibilidad con estéreo de dos canales. [25] Debido a que la mayoría de las mezclas de sonido envolvente se producen para surround 5.1 (6 canales), las configuraciones más grandes requieren matrices o procesadores para alimentar los altavoces adicionales. [25]
La configuración estándar de sonido envolvente consta de tres altavoces frontales LCR (izquierdo, central y derecho), dos altavoces envolventes LS y RS (izquierdo y derecho respectivamente) y un subwoofer para el canal de efectos de baja frecuencia (LFE), que se filtra mediante un filtro de paso bajo a 120 Hz. Los ángulos entre los altavoces han sido estandarizados por la recomendación 775 de la ITU (Unión Internacional de Telecomunicaciones) y la AES (Sociedad de Ingeniería de Audio) de la siguiente manera: 60 grados entre los canales L y R (permite compatibilidad estéreo de dos canales) con el altavoz central directamente frente al oyente. Los canales envolventes se colocan a 100–120 grados del canal central, y la posición del subwoofer no es crítica debido al bajo factor direccional de frecuencias por debajo de 120 Hz. [26] La norma ITU también permite altavoces envolventes adicionales, que deben distribuirse uniformemente entre 60 y 150 grados. [24] [26]
Las mezclas envolventes de más o menos canales son aceptables, si son compatibles, como se describe en la norma ITU-R BS. 775-1, [2] con sonido envolvente 5.1. La configuración de canal 3-1 (que consta de un canal envolvente monofónico) es un caso de este tipo, donde tanto LS como RS son alimentados por la señal monofónica a un nivel atenuado de -3 dB. [25]
La función del canal central es anclar la señal de modo que las imágenes panorámicas centrales no se desplacen cuando un oyente se mueve o se sienta lejos del punto óptimo. [27] El canal central también evita que se produzcan modificaciones tímbricas, lo que es típico del estéreo de dos canales, debido a las diferencias de fase en los dos oídos de un oyente. [24] El canal central se utiliza especialmente en películas y televisión, y los diálogos se alimentan principalmente del canal central. [25] La función del canal central puede ser de naturaleza monofónica (como en el caso de los diálogos) o puede utilizarse en combinación con los canales izquierdo y derecho para lograr un verdadero estéreo de tres canales. Las películas tienden a utilizar el canal central para fines monofónicos, mientras que el estéreo se reserva exclusivamente para los canales izquierdo y derecho. Sin embargo, se han desarrollado técnicas de micrófonos envolventes que aprovechan al máximo el potencial del estéreo de tres canales.
En el sonido envolvente 5.1, las imágenes fantasma entre los altavoces frontales son bastante precisas, mientras que las imágenes hacia atrás y, especialmente, hacia los lados son inestables. [24] [25] La localización de una fuente virtual, basada en las diferencias de nivel entre dos altavoces al costado de un oyente, muestra una gran inconsistencia en la configuración 5.1 estandarizada, y también se ve afectada en gran medida por el movimiento que se aleja de la posición de referencia. Por lo tanto, el sonido envolvente 5.1 tiene una capacidad limitada para transmitir sonido 3D, lo que hace que los canales envolventes sean más apropiados para el ambiente o los efectos. [24] )
El sonido envolvente de 7.1 canales es otra configuración, más comúnmente utilizada en cines grandes, que es compatible con el sonido envolvente 5.1, aunque no está indicado en los estándares de la UIT. El sonido envolvente de 7.1 canales agrega dos canales adicionales, centro-izquierdo (CL) y centro-derecho (CR) a la configuración envolvente 5.1, con los altavoces situados a 15 grados del centro del oyente. [24] Esta convención se utiliza para cubrir un ángulo aumentado entre los altavoces frontales como producto de una pantalla más grande.
La mayoría de las técnicas de micrófonos estereofónicos de 2 canales son compatibles con una configuración de 3 canales (LCR), ya que muchas de estas técnicas ya contienen un micrófono central o un par de micrófonos. Sin embargo, las técnicas de micrófono para LCR deben intentar obtener una mayor separación de canales para evitar imágenes fantasma conflictivas entre L/C y L/R, por ejemplo. [25] [27] [28] Por lo tanto, se han desarrollado técnicas especializadas para estéreo de 3 canales. Las técnicas de micrófonos envolventes dependen en gran medida de la configuración utilizada, por lo que se inclinan hacia la configuración envolvente 5.1, ya que es el estándar. [24]
Las técnicas de grabación envolvente se pueden diferenciar entre aquellas que utilizan conjuntos individuales de micrófonos colocados muy cerca y aquellas que tratan los canales delanteros y traseros con conjuntos separados. [24] [26] Los conjuntos cercanos presentan imágenes fantasma más precisas, mientras que el tratamiento separado de los canales traseros se utiliza generalmente para el ambiente. [26] Para una representación precisa de un entorno acústico, como una sala, las reflexiones laterales son esenciales. Por lo tanto, se deben utilizar técnicas de micrófono adecuadas, si la impresión de la sala es importante. Aunque la reproducción de imágenes laterales es muy inestable en la configuración envolvente 5.1, las impresiones de la sala aún se pueden presentar con precisión. [25]
Algunas técnicas de micrófono utilizadas para la cobertura de tres canales frontales incluyen técnicas de doble estéreo, INA-3 (disposición cardioide ideal), la configuración Decca Tree y el OCT (triángulo cardioide óptimo). [25] [28] Las técnicas envolventes se basan en gran medida en técnicas de 3 canales con micrófonos adicionales utilizados para los canales envolventes. Un factor distintivo para la captación de los canales frontales en el sonido envolvente es que se debe captar menos reverberación, ya que los micrófonos envolventes serán responsables de la captación de la reverberación. [24] Por lo tanto, los patrones polares cardioide, hipercardioide o supercardioide a menudo reemplazarán a los patrones polares omnidireccionales para grabaciones envolventes. Para compensar la pérdida de graves de los micrófonos direccionales (gradiente de presión), se pueden agregar micrófonos omnidireccionales (de presión) adicionales, que exhiban una respuesta de graves extendida. La salida del micrófono generalmente se filtra con paso bajo. [25] [28] Una configuración sencilla de micrófono envolvente implica el uso de un conjunto frontal en combinación con dos micrófonos omnidireccionales de sala orientados hacia atrás colocados a unos 10-15 metros de distancia del conjunto frontal. Si los ecos son notables, el conjunto frontal se puede retrasar adecuadamente. Alternativamente, los micrófonos cardioides orientados hacia atrás se pueden colocar más cerca del conjunto frontal para una captación de reverberación similar. [26]
El INA-5 (disposición cardioide ideal) es un conjunto de micrófonos envolventes que utiliza cinco micrófonos cardioides que se asemejan a los ángulos de la configuración de altavoces envolventes estandarizada definida por la Rec. 775 de la UIT. [26] Las dimensiones entre los tres micrófonos frontales, así como los patrones polares de los micrófonos, se pueden cambiar para obtener diferentes ángulos de captación y respuesta ambiental. [24] Por lo tanto, esta técnica permite una gran flexibilidad.
Un conjunto de micrófonos bien establecido es el Fukada Tree, que es una variante modificada de la técnica estéreo Decca Tree. El conjunto consta de cinco micrófonos cardioides espaciados, tres micrófonos frontales que se asemejan a un Decca Tree y dos micrófonos envolventes. Se pueden agregar dos estabilizadores omnidireccionales adicionales para aumentar el tamaño percibido de la orquesta o para integrar mejor los canales frontal y envolvente. [24] [25] Los micrófonos L, R, LS y RS deben colocarse en una formación cuadrada, con L/R y LS/RS en ángulos de 45 grados y 135 grados desde el micrófono central respectivamente. El espacio entre estos micrófonos debe ser de aproximadamente 1,8 metros. Esta formación cuadrada es responsable de las impresiones de la sala. El canal central se coloca un metro delante de los canales L y R, lo que produce una imagen central fuerte. Los micrófonos envolventes generalmente se colocan a la distancia crítica (donde el campo directo y reverberante son iguales), y el conjunto completo generalmente se ubica varios metros por encima y detrás del director. [24] [25]
La NHK (empresa de radiodifusión japonesa) desarrolló una técnica alternativa que también implica cinco micrófonos cardioides. Aquí se utiliza un deflector para separar los canales frontales izquierdo y derecho, que están separados por 30 cm. [24] Los micrófonos omnidireccionales de estabilizadores, filtrados por paso bajo a 250 Hz, están espaciados a 3 metros de distancia en línea con los cardioides L y R. Estos compensan la caída de graves de los micrófonos cardioides y también agregan expansividad. [27] Un par de micrófonos espaciados a 3 metros, situados a 2-3 metros detrás del arreglo frontal, se utiliza para los canales envolventes. [24] El canal central se coloca nuevamente ligeramente hacia adelante, con el L/R y LS/RS nuevamente en ángulos de 45 y 135 grados respectivamente.
El arreglo de micrófonos OCT-Surround (Optimum Cardioid Triangle-Surround) es una técnica aumentada de la técnica OCT estéreo que utiliza el mismo arreglo frontal con micrófonos envolventes agregados. El arreglo frontal está diseñado para una diafonía mínima, con los micrófonos frontales izquierdo y derecho que tienen patrones polares supercardioides y están en un ángulo de 90 grados con respecto al micrófono central. [24] [25] Es importante que se utilicen micrófonos de diafragma pequeño de alta calidad para los canales L y R para reducir la coloración fuera del eje. [26] La ecualización también se puede utilizar para aplanar la respuesta de los micrófonos supercardioides a las señales que ingresan hasta aproximadamente 30 grados desde el frente del arreglo. [24] El canal central se coloca ligeramente hacia adelante. Los micrófonos envolventes son micrófonos cardioides orientados hacia atrás, que se colocan a 40 cm detrás de los micrófonos L y R. Los micrófonos L, R, LS y RS captan reflexiones tempranas de ambos lados y la parte posterior de un lugar acústico, por lo tanto, brindan impresiones significativas de la sala. [25] El espaciamiento entre los micrófonos L y R se puede variar para obtener el ancho estéreo requerido. [25]
Se han desarrollado conjuntos de micrófonos especializados para grabar puramente el ambiente de un espacio. Estos conjuntos se utilizan en combinación con conjuntos frontales adecuados, o se pueden agregar a las técnicas envolventes mencionadas anteriormente. [26] El cuadrado Hamasaki (también propuesto por NHK) es un conjunto de micrófonos bien establecido que se utiliza para la captura del ambiente de la sala. Cuatro micrófonos en forma de ocho se disponen en un cuadrado, idealmente ubicado lejos y en lo alto de la sala. El espacio entre los micrófonos debe ser de entre 1 y 3 metros. [25] Los nulos de los micrófonos (punto de captura cero) se configuran para mirar hacia la fuente de sonido principal con polaridades positivas hacia afuera, por lo tanto, minimizando de manera muy efectiva la captura directa del sonido, así como los ecos de la parte posterior de la sala. [26] Los dos micrófonos traseros se mezclan con los canales envolventes, y los dos canales frontales se mezclan en combinación con el conjunto frontal en L y R.
Otra técnica ambiental es la técnica cruzada IRT (Institut für Rundfunktechnik). En esta técnica, se colocan cuatro micrófonos cardioides, a 90 grados entre sí, en formación cuadrada, separados por 21-25 cm. [26] [28] Los dos micrófonos frontales deben colocarse a 45 grados del eje de la fuente de sonido. Por lo tanto, esta técnica se asemeja a pares estéreo casi coincidentes uno detrás del otro. Las salidas de los micrófonos se envían a los canales L, R y LS, RS. La desventaja de este enfoque es que la captación directa del sonido es bastante significativa.
Muchas grabaciones no requieren la captación de reflexiones laterales. Para conciertos de música pop en vivo, un arreglo más apropiado para la captación del ambiente es el trapecio cardioide. [25] Los cuatro micrófonos cardioides están orientados hacia atrás y en un ángulo de 60 grados entre sí, por lo que son similares a un semicírculo. Esto es efectivo para la captación de la audiencia y el ambiente.
Todos los conjuntos de micrófonos mencionados anteriormente ocupan un espacio considerable, lo que los hace bastante ineficaces para grabaciones de campo. En este sentido, la técnica doble MS (Mid Side) es bastante ventajosa. Este conjunto utiliza micrófonos cardioides consecutivos, uno orientado hacia adelante y el otro hacia atrás, combinados con uno o dos micrófonos en forma de ocho. Se obtienen diferentes canales mediante la suma y la diferencia de los patrones en forma de ocho y cardioide. [25] [26] Cuando se utiliza solo un micrófono en forma de ocho, la técnica doble MS es extremadamente compacta y, por lo tanto, también perfectamente compatible con la reproducción monofónica. Esta técnica también permite cambios en la posproducción del ángulo de captación.
Los sistemas de reproducción envolvente pueden hacer uso de la gestión de graves , cuyo principio fundamental es que el contenido de graves en la señal entrante, independientemente del canal, debe dirigirse únicamente a los altavoces capaces de manejarlo, ya sean estos los altavoces del sistema principal o uno o más altavoces especiales de baja frecuencia llamados subwoofers .
Hay una diferencia de notación antes y después del sistema de gestión de graves. Antes del sistema de gestión de graves hay un canal de efectos de baja frecuencia (LFE). Después del sistema de gestión de graves hay una señal de subwoofer. Un malentendido común es la creencia de que el canal LFE es el "canal del subwoofer". El sistema de gestión de graves puede dirigir los graves a uno o más subwoofers (si están presentes) desde cualquier canal, no solo desde el canal LFE. Además, si no hay ningún altavoz de subwoofer presente, el sistema de gestión de graves puede dirigir el canal LFE a uno o más de los altavoces principales.
Debido a que el canal de efectos de baja frecuencia (LFE) requiere solo una fracción del ancho de banda de los otros canales de audio, se lo denomina canal .1 ; por ejemplo, 5.1 o 7.1 . [ cita requerida ]
El canal LFE es una fuente de cierta confusión en el sonido envolvente. Originalmente se desarrolló para transmitir efectos de sonido cinematográficos de subgraves extremadamente bajos (por ejemplo, el fuerte estruendo de los truenos o las explosiones) en su propio canal. Esto permitió a los cines controlar el volumen de estos efectos para adaptarlos al entorno acústico y al sistema de reproducción de sonido de cada cine en particular. El control independiente de los efectos de subgraves también redujo el problema de la distorsión por intermodulación en la reproducción de sonido de películas analógicas.
En la implementación original de las salas de cine, el LFE era un canal separado que se alimentaba a uno o más subwoofers. Sin embargo, los sistemas de reproducción en el hogar pueden no tener un subwoofer separado, por lo que los decodificadores y sistemas de sonido envolvente domésticos modernos a menudo incluyen un sistema de gestión de graves que permite que los graves de cualquier canal (principal o LFE) se transmitan solo a los altavoces que pueden manejar señales de baja frecuencia. El punto sobresaliente aquí es que el canal LFE no es el canal del subwoofer ; puede que no haya subwoofer y, si lo hay, puede que esté manejando mucho más que efectos. [29]
Algunas discográficas como Telarc y Chesky han argumentado que los canales LFE no son necesarios en un sistema de entretenimiento multicanal digital moderno. [ cita requerida ] Argumentan que, dados los altavoces que tienen una respuesta de baja frecuencia a 30 Hz, todos los canales disponibles tienen un rango de frecuencia completo y, como tal, no hay necesidad de un LFE en la producción de música envolvente, porque todas las frecuencias están disponibles en todos los canales principales. Estas discográficas a veces utilizan el canal LFE para transportar un canal de altura. [ cita requerida ] El sello BIS Records generalmente utiliza una mezcla de 5.0 canales.
La notación de canal indica la cantidad de canales discretos codificados en la señal de audio, no necesariamente la cantidad de canales reproducidos para la reproducción. La cantidad de canales de reproducción se puede aumentar mediante el uso de la decodificación matricial . La cantidad de canales de reproducción también puede diferir de la cantidad de parlantes utilizados para reproducirlos si uno o más canales controlan un grupo de parlantes. La notación representa la cantidad de canales, no la cantidad de parlantes.
El primer dígito de "5.1" es el número de canales de rango completo. El ".1" refleja el rango de frecuencia limitado del canal LFE.
Por ejemplo, dos altavoces estéreo sin canal LFE = 2,0
5 canales de rango completo + 1 canal LFE = 5,1
Una notación alternativa muestra la cantidad de canales de rango completo frente al oyente, separados por una barra de la cantidad de canales de rango completo al lado o detrás del oyente, con un punto decimal que marca la cantidad de canales LFE de rango limitado.
Por ejemplo, 3 canales frontales + 2 canales laterales + un canal LFE = 3/2,1
La notación se puede ampliar para incluir decodificadores de matriz . Dolby Digital EX, por ejemplo, tiene un sexto canal de rango completo incorporado en los dos canales traseros con una matriz . Esto se expresa:
3 canales frontales + 2 canales traseros + 3 canales reproducidos en la parte trasera en total + 1 canal LFE = 3/2:3.1
El término estéreo , aunque se popularizó en referencia al audio de dos canales, históricamente también se refería al sonido envolvente, ya que estrictamente significa sonido "sólido" (tridimensional). Sin embargo, este ya no es un uso común y "sonido estéreo" significa casi exclusivamente dos canales, izquierdo y derecho.
De acuerdo con ANSI/CEA-863-A [30]
Índice de canal basado en cero | Nombre del canal | Codificación de colores en receptores comerciales y cableado | |||
---|---|---|---|---|---|
MP3 / WAV / FLAC [31] [32] [33] [34] | DTS / CAA [35] | Vorbis / Opus [36] [37] | |||
0 | 1 | 0 | Delantero izquierdo | Blanco | |
1 | 2 | 2 | Delantero derecho | Rojo | |
2 | 0 | 1 | Centro | Verde | |
3 | 5 | 7 | Altavoz de subgraves | Púrpura | |
4 | 3 | 3 | Lado izquierdo | Azul | |
5 | 4 | 4 | Lado derecho | Gris | |
6 | 6 | 5 | Trasero izquierdo | Marrón | |
7 | 7 | 6 | Trasero derecho | Caqui |
Índice | Nombre del canal | Codificación de colores en receptores comerciales y cableado | |
---|---|---|---|
8 | Altura izquierda 1 | Amarillo | |
9 | Altura derecha 1 | Naranja | |
10 | Altura izquierda 2 | Rosa | |
11 | Altura derecha 2 | Magenta |
En 2002, Dolby estrenó un master de We Were Soldiers que incluía una banda sonora de Sonic Whole Overhead Sound. Esta mezcla incluía un nuevo canal de altura montado en el techo .
Ambisonics es una técnica de grabación y reproducción que utiliza mezcla multicanal que se puede utilizar en vivo o en el estudio y que recrea el campo sonoro tal como existía en el espacio, en contraste con los sistemas envolventes tradicionales, que solo pueden crear la ilusión del campo sonoro si el oyente se encuentra en un punto óptimo muy estrecho entre los altavoces. Se puede utilizar cualquier número de altavoces en cualquier disposición física para recrear un campo sonoro. Con 6 o más altavoces dispuestos alrededor de un oyente, se puede presentar un campo sonoro tridimensional ("perifónico" o de esfera completa). Ambisonics fue inventado por Michael Gerzon .
La grabación binaural es un método de grabación de sonido que utiliza dos micrófonos, dispuestos con la intención de crear la experiencia estéreo 3D de estar presente en la sala con los intérpretes o los instrumentos. La idea de una forma de sonido tridimensional o "interna" se ha convertido en tecnología para estetoscopios que crean una acústica "dentro de la cabeza" y películas IMAX que crean una experiencia acústica tridimensional.
PanAmbio combina un dipolo estéreo y cancelación de diafonía en la parte delantera y un segundo conjunto detrás del oyente (cuatro altavoces en total) para una reproducción envolvente 2D de 360°. Las grabaciones de cuatro canales, especialmente las que contienen señales binaurales, crean un sonido envolvente binaural entre altavoces. Las grabaciones de 5.1 canales, incluidos los DVD de películas, son compatibles mezclando el contenido del canal C con el par de altavoces delanteros. Se puede reproducir 6.1 mezclando SC con el par trasero.
En los equipos de consumo se utilizan habitualmente varias configuraciones de altavoces. El orden y los identificadores son los especificados para la máscara de canal en el formato de archivo WAV sin comprimir estándar (que contiene una secuencia PCM multicanal sin procesar ) y se utilizan según la misma especificación para la mayoría de los sistemas operativos y hardware de sonido digital conectables a PC capaces de gestionar varios canales. [38] [39] Si bien es posible crear cualquier configuración de altavoces, hay poco contenido comercial de películas o música para configuraciones de altavoces alternativas. Sin embargo, los canales de origen se pueden remezclar para los canales de altavoces utilizando una tabla de matriz que especifica cuánto de cada canal de contenido se reproduce a través de cada canal de altavoz.
Nombre del canal | IDENTIFICACIÓN | Identificador | Índice | Bandera |
---|---|---|---|---|
Delantero izquierdo | Florida | ALTAVOZ DELANTERO IZQUIERDO | 0 | 0x00000001 |
Delantero derecho | ES | ALTAVOZ DELANTERO DERECHO | 1 | 0x00000002 |
Centro delantero | FC | ALTAVOZ AL FRENTE CENTRAL | 2 | 0x00000004 |
Baja frecuencia | LFE | ALTAVOZ DE BAJA FRECUENCIA | 3 | 0x00000008 |
Atrás a la izquierda | licenciado en Derecho | ALTAVOZ_ATRÁS_IZQUIERDA | 4 | 0x00000010 |
Atrás a la derecha | ES | ALTAVOZ_ATRÁS_DERECHA | 5 | 0x00000020 |
Delantero izquierdo del centro | FLC | ALTAVOZ AL FRENTE A LA IZQUIERDA DEL CENTRO | 6 | 0x00000040 |
Delante a la derecha del centro | CRF | ALTAVOZ AL FRENTE A LA DERECHA DEL CENTRO | 7 | 0x00000080 |
Centro trasero | ANTES DE CRISTO | ALTAVOZ_TRASERO_CENTRAL | 8 | 0x00000100 |
Lado izquierdo | SL | ALTAVOZ LADO IZQUIERDO | 9 | 0x00000200 |
Lado derecho | SR | ALTAVOZ LADO DERECHO | 10 | 0x00000400 |
Centro superior | TC | ALTAVOZ EN EL CENTRO SUPERIOR | 11 | 0x00000800 |
Altura delantera izquierda | TFL | ALTAVOZ SUPERIOR DELANTERO IZQUIERDO | 12 | 0x00001000 |
Altura central delantera | CFC-T | ALTAVOZ SUPERIOR DELANTERO CENTRAL | 13 | 0x00002000 |
Altura delantera derecha | TFR | ALTAVOZ SUPERIOR DELANTERO DERECHO | 14 | 0x00004000 |
Altura trasera izquierda | TBL | ALTAVOZ_ARRIBA_ATRÁS_IZQUIERDA | 15 | 0x00008000 |
Altura central trasera | Por confirmar | ALTAVOZ_SUPERIOR_TRASERO_CENTRAL | 16 | 0x00010000 |
Altura trasera derecha | Por descubrir | ALTAVOZ_SUPERIOR_ATRÁS_DERECHA | 17 | 0x00020000 |
La mayoría de las configuraciones de canales pueden incluir un canal de efectos de baja frecuencia (LFE) (el canal que se reproduce a través del subwoofer ). Esto hace que la configuración sea ".1" en lugar de ".0". La mayoría de las mezclas multicanal modernas contienen un LFE, algunas usan dos.
El sonido envolvente 7.1 es un formato popular en teatros y cine en casa, incluidos los Blu-ray, siendo Dolby y DTS los principales protagonistas. [43]
El sonido envolvente 7.1.2 y 7.1.4 junto con el formato 5.1.2 y 5.1.4 agrega 2 o 4 parlantes superiores para permitir que los objetos de sonido y los sonidos de efectos especiales se ubiquen en la parte superior para el oyente. Introducido para estrenos de películas en salas de cine en 2012 por Dolby Laboratories bajo el nombre comercial Dolby Atmos . [44]
Dolby Atmos (y otros motores de sonido espacial de Microsoft; consulte AudioObjectType
en SpatialAudioClient.h
) también admiten una configuración virtual "8.1.4.4", que se renderiza mediante un HRTF . [45] La configuración se suma a 7.1.4 con un altavoz central detrás del oyente y 4 altavoces debajo. [46]
10.2 es el formato de sonido envolvente desarrollado por el creador de THX , Tomlinson Holman , de TMH Labs y la Universidad del Sur de California (escuelas de Cine/Televisión e Ingeniería). Desarrollado junto con Chris Kyriakakis de la Escuela de Ingeniería Viterbi de la USC , 10.2 hace referencia al eslogan promocional del formato: "El doble de bueno que el 5.1". Los defensores de 10.2 argumentan que es el equivalente en audio de IMAX . [ palabras ambiguas ]
BARCO respalda el sonido 11.1 con instalaciones en cines de todo el mundo. [47]
22.2 es el componente de sonido envolvente de la televisión de ultraalta definición , desarrollado por NHK Science & Technical Research Laboratories. Como sugiere su nombre, utiliza 24 altavoces. Estos están dispuestos en tres capas: una capa intermedia de diez altavoces, una capa superior de nueve altavoces y una capa inferior de tres altavoces y dos subwoofers. El sistema se demostró en la Expo 2005 , Aichi , Japón , las ferias NAB 2006 y 2009, Las Vegas , y las ferias comerciales IBC 2006 y 2008, Ámsterdam , Países Bajos .
{{cite web}}
: Mantenimiento de CS1: postscript ( enlace )