AES3

Estándar de interfaz de audio digital profesional

AES3 es un estándar para el intercambio de señales de audio digital entre dispositivos de audio profesionales . Una señal AES3 puede transportar dos canales de audio digital modulado por código de pulsos a través de varios medios de transmisión, incluidas líneas balanceadas , líneas no balanceadas y fibra óptica . [1]

AES3 fue desarrollado conjuntamente por la Audio Engineering Society (AES) y la European Broadcasting Union (EBU), por lo que también se lo conoce como AES/EBU . El estándar se publicó por primera vez en 1985 y se revisó en 1992 y 2003. AES3 se incorporó al estándar IEC 60958 de la Comisión Electrotécnica Internacional y está disponible en una variante para consumidores conocida como S/PDIF .

Historia y desarrollo

El desarrollo de estándares para la interconexión de audio digital para equipos de audio profesionales y domésticos comenzó a fines de la década de 1970 [2] en un esfuerzo conjunto entre la Audio Engineering Society y la European Broadcasting Union, y culminó con la publicación de AES3 en 1985. El estándar AES3 ha sido revisado en 1992 y 2003 y se publica en versiones AES y EBU. [1] Al principio, el estándar se conocía con frecuencia como AES/EBU.

En la norma IEC 60958 se especifican variantes que utilizan conexiones físicas diferentes. Se trata, en esencia, de versiones de consumo de AES3 para su uso en entornos domésticos de alta fidelidad mediante conectores que se encuentran con más frecuencia en el mercado de consumo. Estas variantes se conocen comúnmente como S/PDIF.

IEC 60958

IEC 60958 (anteriormente IEC 958) es el estándar de la Comisión Electrotécnica Internacional sobre interfaces de audio digital . Reproduce el estándar de interconexión de audio digital profesional AES3 y su versión para consumidores, S/PDIF .

La norma consta de varias partes:

  • IEC 60958-1: General
  • IEC 60958-2: Modo de entrega de información de software
  • IEC 60958-3: Aplicaciones de consumo
  • IEC 60958-4: Aplicaciones profesionales
  • IEC 60958-5: Mejora de aplicaciones para el consumidor

AES-2id

AES-2id es un documento de información de AES publicado por la Audio Engineering Society [3] para ingeniería de audio digital: Directrices para el uso de la interfaz AES3. Este documento proporciona directrices para el uso de AES3, Práctica recomendada de AES para ingeniería de audio digital, Formato de transmisión en serie para datos de audio digital representados linealmente de dos canales. Este documento también cubre la descripción de estándares relacionados utilizados junto con AES3, como AES11 . Los detalles completos de AES-2id se pueden estudiar en la sección de estándares del sitio web de Audio Engineering Society [4] descargando copias del documento AES-2id como archivo PDF.

Conexiones de hardware

El estándar AES3 es paralelo a la parte 4 del estándar internacional IEC 60958. De los tipos de interconexión física definidos por IEC 60958, dos son de uso común.

IEC 60958 tipo I

Conectores XLR, utilizados para conexiones IEC 60958 tipo I.

Las conexiones de tipo I utilizan cableado de par trenzado balanceado de tres conductores y 110 ohmios con conectores XLR . Las conexiones de tipo I se utilizan con mayor frecuencia en instalaciones profesionales y se consideran el conector estándar para AES3. La interfaz de hardware generalmente se implementa utilizando controladores y receptores de línea RS-422 .

Extremos del conector tipo I
Extremo del cableExtremo del dispositivo
AporteConector macho XLRConector hembra XLR
ProducciónConector hembra XLRConector macho XLR

IEC 60958 tipo II

IEC 60958 Tipo II define una interfaz eléctrica u óptica no balanceada para aplicaciones de electrónica de consumo . El precursor de la especificación IEC 60958 Tipo II fue la Interfaz Digital Sony/Philips o S/PDIF . Ambas se basaron en el trabajo original de AES/EBU. S/PDIF y AES3 son intercambiables a nivel de protocolo, pero a nivel físico, especifican diferentes niveles de señalización eléctrica e impedancias , lo que puede ser significativo en algunas aplicaciones.

Conector BNC

Conector BNC, utilizado para conexiones AES-3id.

Las señales AES/EBU también se pueden transmitir mediante conectores BNC no balanceados con un cable coaxial de 75 ohmios. La versión no balanceada tiene una distancia de transmisión muy larga en comparación con los 150 metros máximos de la versión balanceada. [5] El estándar AES-3id define una variante eléctrica BNC de 75 ohmios de AES3. Esta utiliza el mismo cableado, conexión e infraestructura que el video analógico o digital y, por lo tanto, es común en la industria de la transmisión.

Protocolo

Representación sencilla del protocolo tanto para AES3 como para S/PDIF
El protocolo de bajo nivel para la transmisión de datos en AES3 y S/PDIF es en gran medida idéntico, y la siguiente discusión se aplica a S/PDIF, excepto cuando se indique lo contrario.

AES3 fue diseñado principalmente para admitir audio codificado en PCM estéreo en formato DAT a 48 kHz o en formato CD a 44,1 kHz. No se intentó utilizar un portador capaz de admitir ambas velocidades; en cambio, AES3 permite que los datos se ejecuten a cualquier velocidad y codificar el reloj y los datos juntos mediante un código de marca bifásica (BMC).

Cada bit ocupa un intervalo de tiempo . Cada muestra de audio (de hasta 24 bits) se combina con cuatro bits de bandera y un preámbulo de sincronización que tiene una longitud de cuatro intervalos de tiempo para formar una subtrama de 32 intervalos de tiempo. Los 32 intervalos de tiempo de cada subtrama se asignan de la siguiente manera:

Subtrama AES3
Franja horariaNombreDescripción
0–3PreámbuloUn preámbulo de sincronización (violación del código de marca bifásica) para bloques de audio, cuadros y subcuadros.
4–7Muestra auxiliar (opcional)Un canal auxiliar de baja calidad utilizado según lo especificado en la palabra de estado del canal, especialmente para la comunicación entre productores o entre estudios de grabación .
8–27, o 4–27Muestra de audioUna muestra almacenada con el bit más significativo (MSB) al final. Si se utiliza la muestra auxiliar, no se incluyen los bits 4 a 7. Los datos con profundidades de bits de muestra más pequeñas siempre tienen el MSB en el bit 27 y se extienden a cero hasta el bit menos significativo (LSB).
28Validez (V)Desactivado si los datos de audio son correctos y adecuados para la conversión D/A. Si hay muestras defectuosas, se puede indicar al equipo receptor que silencie su salida. La mayoría de los reproductores de CD lo utilizan para indicar que se está realizando una ocultación en lugar de una corrección de errores.
29Datos de usuario (U)Forma un flujo de datos en serie para cada canal (con 1 bit por cuadro), con un formato especificado en la palabra de estado del canal.
30Estado del canal (C)Los bits de cada cuadro de un bloque de audio se agrupan para generar una palabra de estado de canal de 192 bits. Su estructura depende de si se utiliza AES3 o S/PDIF .
31Paridad (P)Bit de paridad par para detección de errores en la transmisión de datos. Excluye el preámbulo; los bits 4 a 31 tienen un número par de unos.

Dos subtramas (A y B, normalmente utilizadas para los canales de audio izquierdo y derecho) forman una trama . Las tramas contienen periodos de 64 bits y se producen una vez por cada periodo de muestra de audio. En el nivel más alto, cada 192 tramas consecutivas se agrupan en un bloque de audio . Si bien las muestras se repiten cada vez que se produce una trama, los metadatos solo se transmiten una vez por bloque de audio. A una frecuencia de muestreo de 48 kHz, hay 250 bloques de audio por segundo y 3.072.000 intervalos de tiempo por segundo, respaldados por un reloj bifásico de 6,144 MHz. [6]

Preámbulo de sincronización

El preámbulo de sincronización es un preámbulo codificado especialmente que identifica la subtrama y su posición dentro del bloque de audio. Los preámbulos no son bits de datos codificados BMC normales, aunque aún tienen una polarización de CC cero .

Son posibles tres preámbulos:

  • X (o M): 11100010 2 si el intervalo de tiempo anterior fue 0 , 00011101 2 si fue 1. (Equivalentemente, 10010011 2 codificado en NRZI ). Marca una palabra para el canal A (izquierda), excepto al comienzo de un bloque de audio.
  • Y (o W): 11100100 2 si el intervalo de tiempo anterior fue 0 , 00011011 2 si fue 1. (Equivalentemente, 10010110 2 codificado en NRZI ). Marca una palabra para el canal B (derecha).
  • Z (o B): 11101000 2 si el intervalo de tiempo anterior fue 0 , 00010111 2 si fue 1. (Equivalentemente, 10011100 2 codificado en NRZI ). Marca una palabra para el canal A (izquierda) al comienzo de un bloque de audio.

Los tres preámbulos se denominan X, Y, Z en el estándar AES3; y M, W, B en IEC 958 (una extensión AES).

Los preámbulos de 8 bits se transmiten en el tiempo asignado a los primeros cuatro intervalos de tiempo de cada subtrama (intervalos de tiempo 0 a 3). Cualquiera de los tres marca el comienzo de una subtrama. X o Z marca el comienzo de una trama y Z marca el comienzo de un bloque de audio.

| 0 | 1 | 2 | 3 | | 0 | 1 | 2 | 3 | Franjas horarias _____ _ _____ _ / \_____/ \_/ \_____/ \_/ \ Preámbulo X _____ _ ___ ___ / \___/ \___/ \_____/ \_/ \ Preámbulo Y _____ _ _ _____ / \_/ \_____/ \_____/ \_/ \ Preámbulo Z ___ ___ ___ ___ / \___/ \___/ \___/ \___/ \ Todos los bits 0 codificados por BMC _ _ _ _ _ _ _ _ / \_/ \_/ \_/ \_/ \_/ \_/ \_/ \_/ \_/ \ Todos los 1 bits codificados por BMC  | 0 | 1 | 2 | 3 | | 0 | 1 | 2 | 3 | Franjas horarias

En AES3 de dos canales, los preámbulos forman un patrón de ZYXYXYXY..., pero es sencillo extender esta estructura a canales adicionales (más subtramas por trama), cada uno con un preámbulo Y, como se hace en el protocolo MADI .

Palabra de estado del canal

Hay un bit de estado de canal en cada subtrama, un total de 192 bits o 24 bytes para cada canal en cada bloque. Entre los estándares AES3 y S/PDIF, el contenido de la palabra de estado de canal de 192 bits difiere significativamente, aunque coinciden en que el primer bit de estado de canal distingue entre los dos. En el caso de AES3, el estándar describe, en detalle, la función de cada bit. [1]

  • Byte 0: Datos de control básicos: frecuencia de muestreo, compresión, énfasis
    • bit 0: un valor de 1 indica que se trata de datos de estado del canal AES3. 0 indica que se trata de datos S/PDIF.
    • bit 1: un valor de 0 indica que se trata de datos PCM de audio lineal. Un valor de 1 indica otros datos (normalmente no de audio).
    • Bits 2–4: Indica el tipo de preénfasis de señal aplicado a los datos. Generalmente se establece en 100 2 (ninguno).
    • bit 5: un valor de 0 indica que la fuente está bloqueada con alguna sincronización horaria externa (no especificada). Un valor de 1 indica una fuente desbloqueada.
    • Bits 6–7: Frecuencia de muestreo. Estos bits son redundantes cuando se transmite audio en tiempo real (el receptor puede observar la frecuencia de muestreo directamente), pero son útiles si se graban o almacenan datos AES3. Las opciones no están especificadas: 48 kHz (predeterminado), 44,1 kHz y 32 kHz. Se pueden indicar opciones de frecuencia de muestreo adicionales en el campo de frecuencia de muestreo extendida (consulte a continuación).
  • Byte 1: indica si el flujo de audio es estéreo, mono o alguna otra combinación.
    • bits 0–3: indica la relación de los dos canales; pueden ser datos de audio no relacionados, un par estéreo, datos mono duplicados, música y comentarios de voz, un código de suma/diferencia estéreo.
    • bits 4–7: se utilizan para indicar el formato de la palabra del canal de usuario
  • Byte 2: Longitud de la palabra de audio
    • Bits 0–2: Uso de bits auxiliares. Esto indica cómo se utilizan los bits auxiliares (ranuras de tiempo 4–7). Generalmente se configura en 000 2 (sin usar) o 001 2 (usado para datos de audio de 24 bits).
    • bits 3–5: longitud de palabra. Especifica el tamaño de la muestra, en relación con el máximo de 20 o 24 bits. Puede especificar 0, 1, 2 o 4 bits faltantes. Los bits no utilizados se rellenan con 0, pero las funciones de procesamiento de audio, como la mezcla, generalmente los rellenarán con datos válidos sin cambiar la longitud de palabra efectiva.
    • bits 6–7: sin usar
  • Byte 3: Se utiliza solo para aplicaciones multicanal [ se necesita más explicación ]
  • Byte 4: Información adicional sobre la frecuencia de muestreo [ se necesita más explicación ]
    • bits 0–1: indica el grado de la referencia de frecuencia de muestreo, según AES11
    • bit 2: Reservado
    • bits 3–6: frecuencia de muestreo extendida. Esto indica otras frecuencias de muestreo, no representables en los bits 6 y 7 del byte 0. Se asignan valores para 24, 96 y 192 kHz, así como para 22,05, 88,2 y 176,4 kHz.
    • bit 7: Indicador de escala de frecuencia de muestreo. Si está configurado, indica que la frecuencia de muestreo se multiplica por 1/1.001 para que coincida con las frecuencias de cuadros de video NTSC .
  • Byte 5: Reservado
  • Bytes 6–9: Cuatro caracteres ASCII para indicar el origen del canal. Muy utilizado en estudios grandes.
  • Bytes 10–13: Cuatro caracteres ASCII que indican el destino del canal, para controlar conmutadores automáticos. Se utiliza con menos frecuencia.
  • Bytes 14–17: dirección de muestra de 32 bits, que se incrementa de bloque a bloque en 192 (porque hay 192 cuadros por bloque). A 48 kHz, esto se repite aproximadamente todos los días. [a]
  • Bytes 18–21: desplazamiento de dirección de muestra de 32 bits para indicar muestras desde la medianoche. [7]
  • Byte 22: Indicación de confiabilidad de la palabra de estado del canal
    • bits 0–3: reservados
    • bit 4: si se configura, los bytes 0 a 5 (formato de señal) no son confiables.
    • bit 5: si se configura, los bytes 6 a 13 (etiquetas de canal) no son confiables.
    • bit 6: si se configura, los bytes 14 a 17 (dirección de muestra) no son confiables.
    • bit 7: si se configura, los bytes 18–21 (marca de tiempo) no son confiables.
  • Byte 23: CRC . Este byte se utiliza para detectar la corrupción de la palabra de estado del canal, como podría ser causada por un cambio a mitad de bloque. [b]

Código de tiempo incorporado

Los datos de código de tiempo SMPTE se pueden incorporar en señales AES3. Se pueden utilizar para la sincronización y para registrar e identificar contenido de audio. Se incorporan como una palabra binaria de 32 bits en los bytes 18 a 21 de los datos de estado del canal. [8]

El estándar AES11 proporciona información sobre la sincronización de estructuras de audio digital. [9]

El estándar AES52 describe cómo insertar identificadores únicos en un flujo de bits AES3. [10]

SMPTE 2110

SMPTE 2110-31 define cómo encapsular un flujo de datos AES3 en paquetes de Protocolo de transporte en tiempo real para su transmisión a través de una red IP utilizando el marco de multidifusión basado en IP SMPTE 2110. [11]

SMPTE 302M

SMPTE 302M-2007 define cómo encapsular un flujo de datos AES3 en un flujo de transporte MPEG para aplicaciones de televisión. [12]

Otros formatos

El formato de audio digital AES3 también se puede transmitir a través de una red de modo de transferencia asíncrono . El estándar para empaquetar tramas AES3 en celdas ATM es AES47 .

Véase también

Notas

  1. ^ Exactamente 24 h 51 min 18.485333 s
  2. ^ El polinomio generador es x 8 + x 4 + x 3 + x 2 + 1, preestablecido en 1.

Referencias

  1. ^ abc "Especificación de la interfaz de audio digital AES/EBU (La interfaz AES/EBU)" (PDF) . Unión Europea de Radiodifusión. 2004 . Consultado el 7 de enero de 2014 .
  2. ^ "Acerca de los estándares AES". Audio Engineering Society . Consultado el 7 de enero de 2014. En 1977, estimulado por la creciente necesidad de estándares en audio digital, se formó el Comité de estándares de audio digital AES.
  3. ^ Sitio oficial de AES
  4. ^ Sitio web de normas
  5. ^ John Emmett (1995), Directrices de ingeniería: la interfaz de audio digital EBU/AES (PDF) , Unión Europea de Radiodifusión
  6. ^ Robin, Michael (1 de septiembre de 2004). "El estándar de distribución de señales de audio digital AES/EBU". Broadcastengineering.com. Archivado desde el original el 9 de julio de 2012. Consultado el 13 de mayo de 2012 .
  7. ^ "Especificación de la interfaz de audio digital AES/EBU (La interfaz AES/EBU)" (PDF) . Unión Europea de Radiodifusión. 2004. p. 12 . Consultado el 7 de enero de 2014 . Bytes 18 a 21, bits 0 a 7: código de dirección de muestra de hora del día. Valor (cada byte): valor binario de 32 bits que representa la primera muestra del bloque actual. Los LSB se transmiten primero. El valor predeterminado será el "0" lógico. Nota: Esta es la hora del día establecida durante la codificación de la fuente de la señal y permanecerá sin cambios durante las operaciones posteriores. Un valor de todos ceros para el código de dirección de muestra binaria, a los efectos de la transcodificación a tiempo real, o a códigos de tiempo en particular, se tomará como medianoche (es decir, 00 h, 00 min, 00 s, 00 cuadro). La transcodificación del número binario a cualquier código de tiempo convencional requiere información precisa de la frecuencia de muestreo para proporcionar la hora precisa de la muestra.
  8. ^ Ratcliff, John (1999). Timecode: A user's guide (Código de tiempo: guía del usuario) . Focal Press. pp. 226, 228. ISBN. 0-240-51539-0.
  9. ^ AES11-2009 (r2019): Práctica recomendada por AES para ingeniería de audio digital: sincronización de equipos de audio digital en operaciones de estudio, Audio Engineering Society , 2009
  10. ^ AES52-2006 (r2017): Estándar AES para ingeniería de audio digital: inserción de identificadores únicos en el flujo de transporte AES3, Audio Engineering Society , 2006
  11. ^ "ST 2110-31:2018 - Estándar SMPTE - Medios profesionales sobre redes IP administradas: transporte transparente AES3", St 2110-31:2018 : 1–12, agosto de 2018, doi :10.5594/SMPTE.ST2110-31.2018, ISBN 978-1-68303-151-2, archivado del original el 15 de agosto de 2020
  12. ^ "ST 302:2007 - Estándar SMPTE - Para televisión: mapeo de datos AES3 en un flujo de transporte MPEG-2", St 302:2007 : 1–9, octubre de 2007, doi : 10.5594/SMPTE.ST302.2007, ISBN 978-1-68303-151-2, archivado desde el original el 3 de junio de 2018

Lectura adicional

  • Watkinson, John (2001). El arte del audio digital. Tercera edición . Focal Press. ISBN 0-240-51587-0.
  • Watkinson, John (agosto de 1989). "La interfaz de audio digital AES/EBU". Conferencia del Reino Unido: Interfaz AES/EBU . EBU-02.
  • Página de descarga del estándar AES3
  • Unión Europea de Radiodifusión, Especificación de la interfaz de audio digital (interfaz AES/EBU) Tech 3250-E tercera edición (2004)
  • Emmett, John (1995). "Directrices de ingeniería: la interfaz de audio digital EBU/AES" (PDF) . EBU .
  • Mark Yonge (junio-julio de 2005). "AES3 Channel Status Revisited" (PDF) . Line up (101): 20–22. Archivado desde el original (PDF) el 2015-05-01 . Consultado el 2013-09-01 .
  • "Configuración de bytes de estado de canal AES3/AES-EBU". Archivado desde el original el 22 de febrero de 2012. Consultado el 24 de marzo de 2009 .
  • IEC - Colección histórica, IHS
Obtenido de "https://es.wikipedia.org/w/index.php?title=AES3&oldid=1247267241"