AES3 es un estándar para el intercambio de señales de audio digital entre dispositivos de audio profesionales . Una señal AES3 puede transportar dos canales de audio digital modulado por código de pulsos a través de varios medios de transmisión, incluidas líneas balanceadas , líneas no balanceadas y fibra óptica . [1]
AES3 fue desarrollado conjuntamente por la Audio Engineering Society (AES) y la European Broadcasting Union (EBU), por lo que también se lo conoce como AES/EBU . El estándar se publicó por primera vez en 1985 y se revisó en 1992 y 2003. AES3 se incorporó al estándar IEC 60958 de la Comisión Electrotécnica Internacional y está disponible en una variante para consumidores conocida como S/PDIF .
El desarrollo de estándares para la interconexión de audio digital para equipos de audio profesionales y domésticos comenzó a fines de la década de 1970 [2] en un esfuerzo conjunto entre la Audio Engineering Society y la European Broadcasting Union, y culminó con la publicación de AES3 en 1985. El estándar AES3 ha sido revisado en 1992 y 2003 y se publica en versiones AES y EBU. [1] Al principio, el estándar se conocía con frecuencia como AES/EBU.
En la norma IEC 60958 se especifican variantes que utilizan conexiones físicas diferentes. Se trata, en esencia, de versiones de consumo de AES3 para su uso en entornos domésticos de alta fidelidad mediante conectores que se encuentran con más frecuencia en el mercado de consumo. Estas variantes se conocen comúnmente como S/PDIF.
IEC 60958 (anteriormente IEC 958) es el estándar de la Comisión Electrotécnica Internacional sobre interfaces de audio digital . Reproduce el estándar de interconexión de audio digital profesional AES3 y su versión para consumidores, S/PDIF .
La norma consta de varias partes:
AES-2id es un documento de información de AES publicado por la Audio Engineering Society [3] para ingeniería de audio digital: Directrices para el uso de la interfaz AES3. Este documento proporciona directrices para el uso de AES3, Práctica recomendada de AES para ingeniería de audio digital, Formato de transmisión en serie para datos de audio digital representados linealmente de dos canales. Este documento también cubre la descripción de estándares relacionados utilizados junto con AES3, como AES11 . Los detalles completos de AES-2id se pueden estudiar en la sección de estándares del sitio web de Audio Engineering Society [4] descargando copias del documento AES-2id como archivo PDF.
El estándar AES3 es paralelo a la parte 4 del estándar internacional IEC 60958. De los tipos de interconexión física definidos por IEC 60958, dos son de uso común.
Las conexiones de tipo I utilizan cableado de par trenzado balanceado de tres conductores y 110 ohmios con conectores XLR . Las conexiones de tipo I se utilizan con mayor frecuencia en instalaciones profesionales y se consideran el conector estándar para AES3. La interfaz de hardware generalmente se implementa utilizando controladores y receptores de línea RS-422 .
Extremo del cable | Extremo del dispositivo | |
---|---|---|
Aporte | Conector macho XLR | Conector hembra XLR |
Producción | Conector hembra XLR | Conector macho XLR |
IEC 60958 Tipo II define una interfaz eléctrica u óptica no balanceada para aplicaciones de electrónica de consumo . El precursor de la especificación IEC 60958 Tipo II fue la Interfaz Digital Sony/Philips o S/PDIF . Ambas se basaron en el trabajo original de AES/EBU. S/PDIF y AES3 son intercambiables a nivel de protocolo, pero a nivel físico, especifican diferentes niveles de señalización eléctrica e impedancias , lo que puede ser significativo en algunas aplicaciones.
Las señales AES/EBU también se pueden transmitir mediante conectores BNC no balanceados con un cable coaxial de 75 ohmios. La versión no balanceada tiene una distancia de transmisión muy larga en comparación con los 150 metros máximos de la versión balanceada. [5] El estándar AES-3id define una variante eléctrica BNC de 75 ohmios de AES3. Esta utiliza el mismo cableado, conexión e infraestructura que el video analógico o digital y, por lo tanto, es común en la industria de la transmisión.
AES3 fue diseñado principalmente para admitir audio codificado en PCM estéreo en formato DAT a 48 kHz o en formato CD a 44,1 kHz. No se intentó utilizar un portador capaz de admitir ambas velocidades; en cambio, AES3 permite que los datos se ejecuten a cualquier velocidad y codificar el reloj y los datos juntos mediante un código de marca bifásica (BMC).
Cada bit ocupa un intervalo de tiempo . Cada muestra de audio (de hasta 24 bits) se combina con cuatro bits de bandera y un preámbulo de sincronización que tiene una longitud de cuatro intervalos de tiempo para formar una subtrama de 32 intervalos de tiempo. Los 32 intervalos de tiempo de cada subtrama se asignan de la siguiente manera:
Franja horaria | Nombre | Descripción |
---|---|---|
0–3 | Preámbulo | Un preámbulo de sincronización (violación del código de marca bifásica) para bloques de audio, cuadros y subcuadros. |
4–7 | Muestra auxiliar (opcional) | Un canal auxiliar de baja calidad utilizado según lo especificado en la palabra de estado del canal, especialmente para la comunicación entre productores o entre estudios de grabación . |
8–27, o 4–27 | Muestra de audio | Una muestra almacenada con el bit más significativo (MSB) al final. Si se utiliza la muestra auxiliar, no se incluyen los bits 4 a 7. Los datos con profundidades de bits de muestra más pequeñas siempre tienen el MSB en el bit 27 y se extienden a cero hasta el bit menos significativo (LSB). |
28 | Validez (V) | Desactivado si los datos de audio son correctos y adecuados para la conversión D/A. Si hay muestras defectuosas, se puede indicar al equipo receptor que silencie su salida. La mayoría de los reproductores de CD lo utilizan para indicar que se está realizando una ocultación en lugar de una corrección de errores. |
29 | Datos de usuario (U) | Forma un flujo de datos en serie para cada canal (con 1 bit por cuadro), con un formato especificado en la palabra de estado del canal. |
30 | Estado del canal (C) | Los bits de cada cuadro de un bloque de audio se agrupan para generar una palabra de estado de canal de 192 bits. Su estructura depende de si se utiliza AES3 o S/PDIF . |
31 | Paridad (P) | Bit de paridad par para detección de errores en la transmisión de datos. Excluye el preámbulo; los bits 4 a 31 tienen un número par de unos. |
Dos subtramas (A y B, normalmente utilizadas para los canales de audio izquierdo y derecho) forman una trama . Las tramas contienen periodos de 64 bits y se producen una vez por cada periodo de muestra de audio. En el nivel más alto, cada 192 tramas consecutivas se agrupan en un bloque de audio . Si bien las muestras se repiten cada vez que se produce una trama, los metadatos solo se transmiten una vez por bloque de audio. A una frecuencia de muestreo de 48 kHz, hay 250 bloques de audio por segundo y 3.072.000 intervalos de tiempo por segundo, respaldados por un reloj bifásico de 6,144 MHz. [6]
El preámbulo de sincronización es un preámbulo codificado especialmente que identifica la subtrama y su posición dentro del bloque de audio. Los preámbulos no son bits de datos codificados BMC normales, aunque aún tienen una polarización de CC cero .
Son posibles tres preámbulos:
Los tres preámbulos se denominan X, Y, Z en el estándar AES3; y M, W, B en IEC 958 (una extensión AES).
Los preámbulos de 8 bits se transmiten en el tiempo asignado a los primeros cuatro intervalos de tiempo de cada subtrama (intervalos de tiempo 0 a 3). Cualquiera de los tres marca el comienzo de una subtrama. X o Z marca el comienzo de una trama y Z marca el comienzo de un bloque de audio.
| 0 | 1 | 2 | 3 | | 0 | 1 | 2 | 3 | Franjas horarias _____ _ _____ _ / \_____/ \_/ \_____/ \_/ \ Preámbulo X _____ _ ___ ___ / \___/ \___/ \_____/ \_/ \ Preámbulo Y _____ _ _ _____ / \_/ \_____/ \_____/ \_/ \ Preámbulo Z ___ ___ ___ ___ / \___/ \___/ \___/ \___/ \ Todos los bits 0 codificados por BMC _ _ _ _ _ _ _ _ / \_/ \_/ \_/ \_/ \_/ \_/ \_/ \_/ \_/ \ Todos los 1 bits codificados por BMC | 0 | 1 | 2 | 3 | | 0 | 1 | 2 | 3 | Franjas horarias
En AES3 de dos canales, los preámbulos forman un patrón de ZYXYXYXY..., pero es sencillo extender esta estructura a canales adicionales (más subtramas por trama), cada uno con un preámbulo Y, como se hace en el protocolo MADI .
Hay un bit de estado de canal en cada subtrama, un total de 192 bits o 24 bytes para cada canal en cada bloque. Entre los estándares AES3 y S/PDIF, el contenido de la palabra de estado de canal de 192 bits difiere significativamente, aunque coinciden en que el primer bit de estado de canal distingue entre los dos. En el caso de AES3, el estándar describe, en detalle, la función de cada bit. [1]
Los datos de código de tiempo SMPTE se pueden incorporar en señales AES3. Se pueden utilizar para la sincronización y para registrar e identificar contenido de audio. Se incorporan como una palabra binaria de 32 bits en los bytes 18 a 21 de los datos de estado del canal. [8]
El estándar AES11 proporciona información sobre la sincronización de estructuras de audio digital. [9]
El estándar AES52 describe cómo insertar identificadores únicos en un flujo de bits AES3. [10]
SMPTE 2110-31 define cómo encapsular un flujo de datos AES3 en paquetes de Protocolo de transporte en tiempo real para su transmisión a través de una red IP utilizando el marco de multidifusión basado en IP SMPTE 2110. [11]
SMPTE 302M-2007 define cómo encapsular un flujo de datos AES3 en un flujo de transporte MPEG para aplicaciones de televisión. [12]
El formato de audio digital AES3 también se puede transmitir a través de una red de modo de transferencia asíncrono . El estándar para empaquetar tramas AES3 en celdas ATM es AES47 .
En 1977, estimulado por la creciente necesidad de estándares en audio digital, se formó el Comité de estándares de audio digital AES.
Bytes 18 a 21, bits 0 a 7: código de dirección de muestra de hora del día. Valor (cada byte): valor binario de 32 bits que representa la primera muestra del bloque actual. Los LSB se transmiten primero. El valor predeterminado será el "0" lógico. Nota: Esta es la hora del día establecida durante la codificación de la fuente de la señal y permanecerá sin cambios durante las operaciones posteriores. Un valor de todos ceros para el código de dirección de muestra binaria, a los efectos de la transcodificación a tiempo real, o a códigos de tiempo en particular, se tomará como medianoche (es decir, 00 h, 00 min, 00 s, 00 cuadro). La transcodificación del número binario a cualquier código de tiempo convencional requiere información precisa de la frecuencia de muestreo para proporcionar la hora precisa de la muestra.