El audio digital es una representación de sonido grabado o convertido en formato digital . En el audio digital, la onda sonora de la señal de audio se codifica normalmente como muestras numéricas en una secuencia continua. Por ejemplo, en el audio de CD , las muestras se toman 44.100 veces por segundo , cada una con una resolución de 16 bits . El audio digital también es el nombre de toda la tecnología de grabación y reproducción de sonido mediante señales de audio que se han codificado en formato digital. Tras los avances significativos en la tecnología de audio digital durante las décadas de 1970 y 1980, reemplazó gradualmente a la tecnología de audio analógico en muchas áreas de la ingeniería de audio , la producción de discos y las telecomunicaciones en las décadas de 1990 y 2000.
En un sistema de audio digital, una señal eléctrica analógica que representa el sonido se convierte con un convertidor analógico a digital (ADC) en una señal digital, generalmente mediante modulación por código de pulsos (PCM). Esta señal digital se puede grabar, editar, modificar y copiar mediante computadoras , reproductores de audio y otras herramientas digitales. Para la reproducción, un convertidor digital a analógico (DAC) realiza el proceso inverso, convirtiendo una señal digital nuevamente en una señal analógica, que luego se envía a través de un amplificador de potencia de audio y, finalmente, a un altavoz .
Los sistemas de audio digital pueden incluir componentes de compresión , almacenamiento , procesamiento y transmisión . La conversión a un formato digital permite manipular, almacenar, transmitir y recuperar una señal de audio de manera conveniente. A diferencia del audio analógico, en el que hacer copias de una grabación da como resultado una pérdida de generación y una degradación de la calidad de la señal, el audio digital permite realizar una cantidad infinita de copias sin ninguna degradación de la calidad de la señal.
Las tecnologías de audio digital se utilizan en la grabación, manipulación, producción en masa y distribución de sonido, incluidas grabaciones de canciones , piezas instrumentales, podcasts , efectos de sonido y otros sonidos. La distribución moderna de música en línea depende de la grabación digital y la compresión de datos . La disponibilidad de música como archivos de datos, en lugar de como objetos físicos, ha reducido significativamente los costos de distribución y ha facilitado el intercambio de copias. [1] Antes del audio digital, la industria musical distribuía y vendía música vendiendo copias físicas en forma de discos y cintas de casete . Con el audio digital y los sistemas de distribución en línea como iTunes , las empresas venden archivos de sonido digitales a los consumidores, que el consumidor recibe a través de Internet. Los servicios de transmisión populares como Apple Music , Spotify o YouTube ofrecen acceso temporal al archivo digital y ahora son la forma más común de consumo de música. [2]
Un sistema de audio analógico convierte las formas de onda físicas del sonido en representaciones eléctricas de esas formas de onda mediante el uso de un transductor , como un micrófono . Luego, los sonidos se almacenan en un medio analógico, como una cinta magnética , o se transmiten a través de un medio analógico, como una línea telefónica o una radio . El proceso se invierte para la reproducción: la señal de audio eléctrica se amplifica y luego se convierte nuevamente en formas de onda físicas a través de un altavoz . El audio analógico conserva sus características fundamentales de onda durante su almacenamiento, transformación, duplicación y amplificación.
Las señales de audio analógicas son susceptibles al ruido y la distorsión, debido a las características innatas de los circuitos electrónicos y los dispositivos asociados. Las perturbaciones en un sistema digital no dan lugar a errores a menos que sean tan grandes como para que un símbolo se interprete erróneamente como otro símbolo o alteren la secuencia de símbolos. Por lo tanto, generalmente es posible tener un sistema de audio digital totalmente libre de errores en el que no se introduzca ruido ni distorsión entre la conversión al formato digital y la conversión de nuevo al analógico. [a]
Una señal de audio digital puede codificarse para corregir cualquier error que pueda ocurrir en el almacenamiento o transmisión de la señal. Esta técnica, conocida como codificación de canal , es esencial para que los sistemas digitales de transmisión o grabación mantengan la precisión de bits. La modulación de ocho a catorce es el código de canal utilizado para el disco compacto de audio (CD).
Si una señal de audio es analógica, un sistema de audio digital comienza con un ADC que convierte una señal analógica en una señal digital. [b] El ADC funciona a una frecuencia de muestreo especificada y convierte a una resolución de bits conocida. El audio de CD , por ejemplo, tiene una frecuencia de muestreo de 44,1 kHz (44 100 muestras por segundo) y tiene una resolución de 16 bits para cada canal estéreo . Las señales analógicas que aún no han sido limitadas en banda deben pasar por un filtro anti-aliasing antes de la conversión, para evitar la distorsión de aliasing que causan las señales de audio con frecuencias superiores a la frecuencia de Nyquist (la mitad de la frecuencia de muestreo).
Una señal de audio digital puede almacenarse o transmitirse. El audio digital puede almacenarse en un CD, un reproductor de audio digital , un disco duro , una unidad flash USB o cualquier otro dispositivo de almacenamiento de datos digitales . La señal digital puede alterarse mediante el procesamiento de señales digitales , donde puede filtrarse o aplicarse efectos . La conversión de frecuencia de muestreo, incluido el sobremuestreo y el submuestreo, se puede utilizar para cambiar las señales que se han codificado con una frecuencia de muestreo diferente a una frecuencia de muestreo común antes del procesamiento. Las técnicas de compresión de datos de audio, como MP3 , Advanced Audio Coding (AAC), Opus , Ogg Vorbis o FLAC , se emplean comúnmente para reducir el tamaño del archivo. El audio digital se puede transmitir a través de interfaces de audio digital como AES3 o MADI . El audio digital se puede transmitir a través de una red utilizando audio sobre Ethernet , audio sobre IP u otros estándares y sistemas de transmisión de medios .
Para reproducir, el audio digital debe convertirse nuevamente en una señal analógica con un DAC. De acuerdo con el teorema de muestreo de Nyquist-Shannon , con algunas restricciones prácticas y teóricas, se puede reconstruir con precisión una versión de banda limitada de la señal analógica original a partir de la señal digital.
Durante la conversión, los datos de audio pueden incrustarse con una marca de agua digital para evitar la piratería y el uso no autorizado. La marca de agua se realiza mediante un método de espectro ensanchado por secuencia directa (DSSS). A continuación, la información de audio se modula mediante una secuencia de pseudorruido (PN), se le da forma dentro del dominio de frecuencia y se vuelve a colocar en la señal original. La intensidad de la incrustación determina la intensidad de la marca de agua en los datos de audio. [4]
La modulación por código de pulsos (PCM) fue inventada por el científico británico Alec Reeves en 1937. [5] En 1950, C. Chapin Cutler de Bell Labs presentó la patente de la modulación por código de pulsos diferencial (DPCM), [6] un algoritmo de compresión de datos . La DPCM adaptativa (ADPCM) fue introducida por P. Cummiskey, Nikil S. Jayant y James L. Flanagan en Bell Labs en 1973. [7] [8]
La codificación perceptiva se utilizó por primera vez para la compresión de codificación de voz , con la codificación predictiva lineal (LPC). [9] Los conceptos iniciales para LPC se remontan al trabajo de Fumitada Itakura ( Universidad de Nagoya ) y Shuzo Saito ( Nippon Telegraph and Telephone ) en 1966. [10] Durante la década de 1970, Bishnu S. Atal y Manfred R. Schroeder en Bell Labs desarrollaron una forma de LPC llamada codificación predictiva adaptativa (APC), un algoritmo de codificación perceptiva que explotaba las propiedades de enmascaramiento del oído humano, seguido a principios de la década de 1980 con el algoritmo de predicción lineal excitada por código (CELP). [9]
La codificación por transformada de coseno discreta (DCT), un método de compresión con pérdida propuesto por primera vez por Nasir Ahmed en 1972, [11] [12] proporcionó la base para la transformada de coseno discreta modificada (MDCT), que fue desarrollada por JP Princen, AW Johnson y AB Bradley en 1987. [13] La MDCT es la base de la mayoría de los estándares de codificación de audio , como Dolby Digital (AC-3), [14] MP3 ( MPEG Layer III), [15] [9] AAC, Windows Media Audio (WMA), Opus y Vorbis ( Ogg ). [14]
El PCM se utilizó en aplicaciones de telecomunicaciones mucho antes de su primer uso en la radiodifusión y grabación comerciales. La grabación digital comercial fue iniciada en Japón por NHK y Nippon Columbia y su marca Denon , en la década de 1960. Las primeras grabaciones digitales comerciales se lanzaron en 1971. [16]
La BBC también comenzó a experimentar con audio digital en la década de 1960. A principios de la década de 1970, había desarrollado una grabadora de dos canales y en 1972 implementó un sistema de transmisión de audio digital que vinculaba su centro de transmisión con sus transmisores remotos. [16]
La primera grabación PCM de 16 bits en los Estados Unidos fue realizada por Thomas Stockham en la Ópera de Santa Fe en 1976, en una grabadora Soundstream . Una versión mejorada del sistema Soundstream se utilizó para producir varias grabaciones clásicas por Telarc en 1978. La grabadora multipista digital 3M en desarrollo en ese momento se basaba en la tecnología de la BBC. El primer álbum completamente digital grabado en esta máquina fue Bop till You Drop de Ry Cooder en 1979. El sello discográfico británico Decca comenzó el desarrollo de sus propias grabadoras de audio digitales de 2 pistas en 1978 y lanzó la primera grabación digital europea en 1979. [16]
Las populares grabadoras multipista digitales profesionales producidas por Sony/Studer ( DASH ) y Mitsubishi ( ProDigi ) a principios de los años 80 ayudaron a que las principales compañías discográficas aceptaran la grabación digital. Las máquinas para estos formatos también tenían sus propios transportadores incorporados, utilizando cintas de carrete a carrete de 1/4", 1/2" o 1" de ancho, y los datos de audio se grababan en la cinta utilizando un cabezal de cinta estacionario multipista. Los adaptadores PCM permitieron la grabación de audio digital estéreo en una grabadora de cinta de vídeo NTSC o PAL convencional .
La introducción del CD en 1982 por parte de Philips y Sony popularizó el audio digital entre los consumidores. [16]
ADAT estuvo disponible a principios de la década de 1990, lo que permitió la grabación de ocho pistas a 44,1 o 48 kHz en casetes S-VHS, y DTRS realizó una función similar con cintas Hi8.
Formatos como ProDigi y DASH se denominaban formatos SDAT (cinta de audio digital de cabezal estacionario), a diferencia de formatos como los sistemas basados en adaptadores PCM y la cinta de audio digital (DAT), que se denominaban formatos RDAT (cinta de audio digital de cabezal giratorio), debido a su proceso de grabación de escaneo helicoidal.
Al igual que el casete DAT, las máquinas ProDigi y DASH también admitían la frecuencia de muestreo obligatoria de 44,1 kHz, pero también de 48 kHz en todas las máquinas y, finalmente, una frecuencia de muestreo de 96 kHz. Superaron los problemas que hacían que las grabadoras analógicas típicas no pudieran satisfacer las demandas de ancho de banda (rango de frecuencia) de la grabación digital mediante una combinación de velocidades de cinta más altas, espacios entre cabezales más estrechos utilizados en combinación con cintas de fórmula metálica y la distribución de datos en múltiples pistas paralelas.
A diferencia de los sistemas analógicos, las estaciones de trabajo de audio digital modernas y las interfaces de audio permiten tantos canales en tantas frecuencias de muestreo diferentes como la computadora pueda ejecutar de manera efectiva al mismo tiempo. Avid Audio y Steinberg lanzaron los primeros programas de software para estaciones de trabajo de audio digital en 1989. [17] Las estaciones de trabajo de audio digital facilitan mucho la grabación y mezcla multipista para proyectos grandes que, de otro modo, serían difíciles con equipos analógicos.
El rápido desarrollo y la amplia adopción de la telefonía digital PCM fue posible gracias a la tecnología de circuitos de condensadores conmutados (SC) de semiconductores de óxido de metal (MOS) , desarrollada a principios de la década de 1970. [18] Esto condujo al desarrollo de chips de filtro de códec PCM a fines de la década de 1970. [18] [19] El chip de filtro de códec PCM CMOS (MOS complementario) de compuerta de silicio , desarrollado por David A. Hodges y WC Black en 1980, [18] ha sido desde entonces el estándar de la industria para la telefonía digital. [18] [19] En la década de 1990, las redes de telecomunicaciones como la red telefónica pública conmutada (PSTN) se habían digitalizado en gran medida con filtros códec PCM CMOS VLSI ( integración a muy gran escala ), ampliamente utilizados en sistemas de conmutación electrónica para centrales telefónicas , módems de usuario y una gama de aplicaciones de transmisión digital como la red digital de servicios integrados (ISDN), teléfonos inalámbricos y teléfonos celulares . [19]
El audio digital se utiliza en la transmisión de audio. Las tecnologías estándar incluyen la transmisión de audio digital (DAB), la radio digital mundial (DRM), la radio HD y la transmisión en banda en el canal (IBOC).
El audio digital en aplicaciones de grabación se almacena en tecnologías específicas de audio, como CD, DAT, Digital Compact Cassette (DCC) y MiniDisc . El audio digital se puede almacenar en formatos de archivo de audio estándar y almacenarse en una grabadora de disco duro , Blu-ray o DVD-Audio . Los archivos se pueden reproducir en teléfonos inteligentes, computadoras o reproductores de MP3 . La resolución de audio digital se mide en profundidad de bits de audio . La mayoría de los formatos de audio digital utilizan una resolución de 16 bits, 24 bits y 32 bits.
USB e IEEE 1394 (FireWire) para audio digital en tiempo real Contenido original: menciona la popularidad de las interfaces USB debido a su pequeño tamaño y facilidad de uso, y la IEEE 1394 para audio digital. Verificación de relevancia: esto es directamente relevante para el tema, ya que USB y FireWire son interfaces clave para audio digital en tiempo real tanto en aplicaciones de audio para consumidores como profesionales. Acción: dejar esta sección como está. 2. Audio sobre Ethernet y protocolos profesionales Contenido original: menciona varios protocolos de audio sobre Ethernet y audio sobre IP en radiodifusión y telefonía. Verificación de relevancia: es relevante para entornos de audio profesionales donde se utilizan comúnmente protocolos de audio basados en Ethernet e IP. Esto cubre sistemas tanto para radiodifusión (audio sobre IP) como para audio de telefonía (VoIP). Acción: mantener la referencia a las tecnologías de audio sobre Ethernet y audio sobre IP, ya que son muy relevantes en contextos profesionales. 3. TDIF (formato propietario de TASCAM) Contenido original: incluye TDIF, un formato de TASCAM, que utiliza cables D-sub. Verificación de relevancia: esta es una mención muy específica y relevante en el audio profesional, especialmente para configuraciones multicanal donde TDIF todavía se utiliza en algunos sistemas de audio de alta gama. Acción: conserve esta información. 4. Problemas con el micrófono y el altavoz (Fix My Mic Speaker) Contenido original: analiza el problema de los sonidos apagados debido al polvo o el agua, y cómo la herramienta "Fix My Mic Speaker" ayuda a limpiar el altavoz y eliminar el agua. Verificación de relevancia: esta sección parece un poco desconectada del resto del contenido técnico sobre interfaces de audio digital. Parece más centrada en la resolución de problemas de dispositivos de consumo (como teléfonos o portátiles) que en equipos de audio profesionales. Acción: la sección es relevante para los problemas de audio, pero menos en el contexto de las interfaces de audio profesionales. Si el enfoque está en los equipos profesionales (como lo indica el resto del contenido), esta parte podría ubicarse mejor por separado u omitirse a menos que esté planteando un punto más amplio sobre el mantenimiento del dispositivo. 5. Interfaces específicas de audio digital Contenido original: enumera varias interfaces de audio digital como A2DP, AC'97, ADAT, AES3, etc. Verificación de relevancia: esta sección es muy relevante para la discusión general. Cada una de estas interfaces es fundamental para varias aplicaciones de audio, tanto en entornos profesionales como de consumo. Cubre una amplia gama de tipos de interfaz, desde transmisión Bluetooth (A2DP) hasta estándares profesionales multicanal (AES3, MADI, S/PDIF). Acción: esta sección encaja bien y debería permanecer intacta, aunque podría simplificarse un poco para evitar redundancias. Sugerencias para una mayor relevancia y fluidez: Solución de problemas de micrófonos y altavoces: dado que el artículo se centra principalmente en las interfaces de audio y las tecnologías de audio profesional, la sección sobre "Reparar mi altavoz de micrófono" podría ajustarse para que sea relevante para los equipos de audio profesionales. Si desea mantenerla en el artículo, considere reformularla como una breve mención de cómo se realiza el mantenimiento del dispositivo (por ejemplo,La limpieza de los conectores o la protección contra el agua y la humedad son importantes para la longevidad y la calidad de las interfaces de audio y los micrófonos profesionales.
Vinculación contextual: para mantener un flujo coherente, considere vincular la sección de solución de problemas de micrófonos y altavoces con el tema más amplio de mantenimiento del equipo de audio para una mejor calidad de sonido, asegurando que todas las partes del sistema (hardware y software) estén en óptimas condiciones.
Texto revisado con relevancia ajustada: Interfaces de audio digital: USB, IEEE 1394 y otros protocolos USB e IEEE 1394 (FireWire) se han vuelto esenciales para el audio digital en tiempo real en la informática personal. Las interfaces USB son especialmente populares entre los ingenieros y productores de audio independientes debido a su forma compacta, versatilidad y facilidad de uso. Estas interfaces se encuentran en equipos de audio de consumo y admiten la transferencia de audio basada en estándares AES3.
Para configuraciones más profesionales, en particular en aplicaciones arquitectónicas y de instalación, varios protocolos de audio sobre Ethernet proporcionan una transmisión de audio confiable y de alta calidad a través de redes. Estas tecnologías son estándar en el sector de la radiodifusión, donde el audio sobre IP es el preferido para transmitir audio digital a través de varios dispositivos y plataformas. Además, la voz sobre IP (VoIP) se usa ampliamente en telefonía para ofrecer comunicaciones de voz digitales con alta fidelidad de audio.
Formatos especializados como TDIF (formato propietario de TASCAM que utiliza cables D-sub) también se utilizan en entornos de audio profesional multicanal, lo que permite conexiones de audio robustas y de alta fidelidad.
Cómo garantizar una calidad de sonido óptima: mantenimiento del micrófono y los altavoces El sonido claro del micrófono y los altavoces de su dispositivo es esencial para llamadas de calidad y una producción de sonido de calidad. En los sistemas de audio de consumo y profesionales, problemas comunes como la acumulación de polvo o humedad en los altavoces pueden provocar un sonido apagado o distorsionado. Si su micrófono o altavoces no producen un sonido claro, es importante limpiar y mantener el hardware con regularidad. Las herramientas diseñadas para eliminar el polvo y la humedad, como Fix My Mic Speaker, pueden mejorar la calidad del sonido al eliminar bloqueos y expulsar el agua del área del altavoz.
Ya sea que trabaje con equipos de audio profesionales o dispositivos de consumo, asegurarse de que las áreas del micrófono y del altavoz estén libres de obstrucciones es fundamental para preservar la calidad del sonido. El polvo o el agua pueden reducir el rendimiento, lo que afecta tanto la longevidad del hardware como la claridad del audio.
Interfaces específicas de audio digital Además de USB y FireWire, existen otras interfaces de audio digital que se utilizan comúnmente tanto en dispositivos electrónicos de consumo como en entornos profesionales:
A2DP a través de Bluetooth, para transmisión de audio de alta calidad a dispositivos inalámbricos. AC'97, una interfaz heredada que se encuentra en placas base de PC antiguas, que ofrece funciones de audio básicas. ADAT Lightpipe, una interfaz de fibra óptica para audio digital multicanal. AES3, una interfaz de audio profesional estándar de la industria que utiliza conectores XLR. AES47, una extensión profesional de AES3, diseñada para transmitir audio digital a través de redes ATM. Intel High Definition Audio, un reemplazo moderno para AC'97, que admite más canales y mayor fidelidad. I²S, utilizado para comunicación de audio entre chips en electrónica de consumo. MADI, una interfaz robusta para audio digital multicanal en entornos profesionales. MIDI, utilizado para transmitir datos de instrumentos digitales (no audio, pero relevante para la producción musical). S/PDIF, comúnmente utilizado para transmitir audio de alta calidad a través de conexiones coaxiales o de fibra óptica. Estas interfaces, que van desde estándares tradicionales como AC'97 hasta tecnologías modernas como AES3 y S/PDIF, son fundamentales para ofrecer audio de alta calidad tanto en productos electrónicos de consumo como en entornos profesionales como estudios, sonido en vivo y transmisiones.
Veredicto final: Relevancia: Las secciones técnicas sobre USB, IEEE 1394 y los diversos protocolos de audio profesional son totalmente relevantes para el tema de las interfaces de audio digital. La mención de los problemas con los micrófonos [20] podría necesitar un ligero ajuste contextual para vincularla mejor con el tema del mantenimiento de equipos de audio profesional. Fluidez: La versión revisada integra toda la información de una manera que mantiene tanto la precisión técnica como una narrativa cohesiva, lo que hace que el artículo sea relevante para una audiencia interesada en las interfaces de audio digital, sin desviarse hacia detalles excesivamente centrados en el consumidor.