Comparación de grabación analógica y digital

Diferencias en el rendimiento de audio entre tecnologías

El sonido se puede grabar , almacenar y reproducir utilizando técnicas digitales o analógicas . Ambas técnicas introducen errores y distorsiones en el sonido, y estos métodos se pueden comparar sistemáticamente. Los músicos y los oyentes han debatido sobre la superioridad de las grabaciones de sonido digitales frente a las analógicas. Los argumentos a favor de los sistemas analógicos incluyen la ausencia de mecanismos de error fundamentales que están presentes en los sistemas de audio digital, incluido el aliasing y la implementación asociada del filtro anti-aliasing , la fluctuación y el ruido de cuantificación . [1] Los defensores de lo digital señalan los altos niveles de rendimiento posibles con el audio digital, incluida la excelente linealidad en la banda audible y los bajos niveles de ruido y distorsión. [2] : 7 

Dos diferencias importantes en el rendimiento entre los dos métodos son el ancho de banda y la relación señal-ruido (relación S/N). El ancho de banda del sistema digital está determinado, según la frecuencia de Nyquist , por la frecuencia de muestreo utilizada. El ancho de banda de un sistema analógico depende de las capacidades físicas y electrónicas de los circuitos analógicos. La relación S/N de un sistema digital puede estar limitada por la profundidad de bits del proceso de digitalización, pero la implementación electrónica de los circuitos de conversión introduce ruido adicional. En un sistema analógico, existen otras fuentes naturales de ruido analógico, como el ruido de parpadeo y las imperfecciones en el medio de grabación. Otras diferencias de rendimiento son específicas de los sistemas en comparación, como la capacidad de algoritmos de filtrado más transparentes en los sistemas digitales [3] y la saturación armónica y las variaciones de velocidad de los sistemas analógicos.

Rango dinámico

El rango dinámico de un sistema de audio es una medida de la diferencia entre los valores de amplitud más pequeños y más grandes que se pueden representar en un medio. Los sistemas digitales y analógicos difieren tanto en los métodos de transferencia y almacenamiento como en el comportamiento que presentan los sistemas debido a estos métodos.

El rango dinámico de los sistemas de audio digital puede superar al de los sistemas de audio analógicos. Las cintas de casete analógicas de consumo tienen un rango dinámico de 60 a 70 dB. Las emisiones de FM analógicas rara vez tienen un rango dinámico que supere los 50 dB. [4] El rango dinámico de un disco de vinilo cortado directamente puede superar los 70 dB. Las cintas maestras de estudio analógicas pueden tener un rango dinámico de hasta 77 dB. [5] Un LP hecho de diamante perfecto tiene un tamaño de característica atómica de aproximadamente 0,5 nanómetros , lo que, con un tamaño de surco de 8 micrones , produce un rango dinámico teórico de 110 dB. Un LP hecho de vinilo perfecto tendría un rango dinámico teórico de 70 dB. [6] Las mediciones indican un rendimiento real máximo en el rango de 60 a 70 dB. [7] Normalmente, un convertidor analógico a digital de 16 bits puede tener un rango dinámico de entre 90 y 95 dB, [8] : 132  mientras que la relación señal-ruido (aproximadamente el equivalente del rango dinámico, teniendo en cuenta la ausencia de ruido de cuantificación pero la presencia de silbido de cinta) de una grabadora de cinta de carrete a carrete profesional de ¼ de pulgada estaría entre 60 y 70 dB a la salida nominal de la grabadora. [8] : 111 

Los beneficios de utilizar grabadoras digitales con una precisión superior a los 16 bits se pueden aplicar a los 16 bits de un CD de audio. El fundador de Meridian Audio, John Robert Stuart, destaca que con el dithering correcto , la resolución de un sistema digital es teóricamente infinita y que es posible, por ejemplo, resolver sonidos a −110 dB (por debajo de la escala completa digital) en un canal de 16 bits bien diseñado. [9] : 3 

Condiciones de sobrecarga

Existen algunas diferencias en el comportamiento de los sistemas analógicos y digitales cuando hay señales de alto nivel, donde existe la posibilidad de que dichas señales puedan sobrecargar el sistema. Con señales de alto nivel, la cinta magnética analógica se acerca a la saturación y la respuesta de alta frecuencia cae en proporción a la respuesta de baja frecuencia. Si bien es indeseable, el efecto audible de esto puede ser razonablemente inobjetable. [10] Por el contrario, las grabadoras PCM digitales muestran un comportamiento no benigno en sobrecarga; [11] : 65  muestras que exceden el nivel de cuantificación pico simplemente se truncan, recortando la forma de onda de manera cuadrada, lo que introduce distorsión en forma de grandes cantidades de armónicos de frecuencia más alta. En principio, los sistemas digitales PCM tienen el nivel más bajo de distorsión no lineal en la amplitud de señal completa. Lo opuesto suele ser cierto en los sistemas analógicos, donde la distorsión tiende a aumentar en niveles de señal altos. Un estudio de Manson (1980) consideró los requisitos de un sistema de audio digital para transmisión de alta calidad. Se concluyó que un sistema de 16 bits sería suficiente, pero se observó la pequeña reserva que el sistema proporcionaba en condiciones de funcionamiento normales. Por este motivo, se sugirió utilizar un limitador de señal de acción rápida o " soft clipper " para evitar que el sistema se sobrecargue. [12]

En muchas grabaciones, las distorsiones de alto nivel en los picos de la señal pueden quedar enmascaradas de forma audible por la señal original, por lo que pueden ser aceptables grandes cantidades de distorsión en los niveles pico de la señal. La diferencia entre los sistemas analógicos y digitales es la forma del error de señal de alto nivel. Algunos de los primeros convertidores analógico-digitales mostraban un comportamiento no benigno cuando estaban sobrecargados, donde las señales de sobrecarga se "envolvían" de escala completa positiva a negativa. Los diseños de convertidores modernos basados ​​en la modulación sigma-delta pueden volverse inestables en condiciones de sobrecarga. Por lo general, un objetivo de diseño de los sistemas digitales es limitar las señales de alto nivel para evitar la sobrecarga. [11] : 65  Para evitar la sobrecarga, un sistema digital moderno puede comprimir las señales de entrada de modo que no se pueda alcanzar la escala completa digital [13] : 4 

Degradación física

A diferencia de la duplicación analógica, las copias digitales son réplicas exactas que pueden duplicarse indefinidamente y sin pérdida de generación , en principio. La corrección de errores permite que los formatos digitales toleren un deterioro significativo del medio, aunque los medios digitales no son inmunes a la pérdida de datos. Los discos compactos CD-R de consumo tienen una vida útil limitada y variable debido a problemas inherentes y de calidad de fabricación. [14]

En el caso de los discos de vinilo, se produce cierta pérdida de fidelidad cada vez que se reproduce el disco. Esto se debe al desgaste de la aguja en contacto con la superficie del disco. Las cintas magnéticas, tanto analógicas como digitales, se desgastan por la fricción entre la cinta y los cabezales, guías y otras partes del transportador de cinta a medida que la cinta se desliza sobre ellos. Los residuos marrones que se depositan en los hisopos durante la limpieza de la ruta de la cinta de una grabadora de cinta son en realidad partículas de revestimiento magnético que se desprenden de las cintas. El síndrome de adherencia es un problema frecuente en las cintas antiguas. Las cintas también pueden sufrir arrugas, estiramientos y ondulaciones en los bordes de la base de plástico de la cinta, especialmente en el caso de grabadoras de cinta de baja calidad o desalineadas.

Cuando se reproduce un CD, no hay contacto físico, ya que los datos se leen ópticamente mediante un rayo láser. Por lo tanto, no se produce dicho deterioro del medio y, con el cuidado adecuado, el CD sonará exactamente igual cada vez que se reproduzca (sin tener en cuenta el envejecimiento del reproductor y del propio CD); sin embargo, se trata de un beneficio del sistema óptico, no de la grabación digital, y el formato Laserdisc disfruta del mismo beneficio sin contacto con las señales ópticas analógicas. Los CD sufren de putrefacción y se degradan lentamente con el tiempo, incluso si se almacenan correctamente y no se reproducen. [15] M-DISC , una tecnología óptica grabable que se comercializa como legible durante 1000 años, está disponible en ciertos mercados, pero a finales de 2020 nunca se ha vendido en formato CD-R . (Sin embargo, el sonido se puede almacenar en un DVD-R M-DISC utilizando el formato DVD-Audio ).

Ruido

En el caso de las señales de audio electrónicas, las fuentes de ruido incluyen ruido mecánico, eléctrico y térmico en el ciclo de grabación y reproducción. La cantidad de ruido que un equipo de audio añade a la señal original se puede cuantificar. Matemáticamente, esto se puede expresar mediante la relación señal/ruido (SNR o relación S/N). A veces, en su lugar, se indica el rango dinámico máximo posible del sistema.

En los sistemas digitales, la calidad de reproducción depende de los pasos de conversión de analógico a digital y de digital a analógico, y no de la calidad del medio de grabación, siempre que sea adecuado para retener los valores digitales sin errores. Los medios digitales capaces de almacenar y recuperar datos con una precisión de bits son algo habitual desde hace algún tiempo, ya que generalmente se desarrollaron para el almacenamiento de software que no tolera errores.

El proceso de conversión de analógico a digital, según la teoría, siempre introducirá distorsión de cuantificación. Esta distorsión se puede representar como ruido de cuantificación no correlacionado mediante el uso de dither . La magnitud de este ruido o distorsión está determinada por el número de niveles de cuantificación. En sistemas binarios, esto se determina y se expresa típicamente en términos del número de bits . Cada bit adicional agrega aproximadamente 6 dB en la relación señal/ruido posible (por ejemplo, 24 x 6 = 144 dB para cuantificación de 24 bits y 120 dB para 20 bits). El sistema digital de 16 bits del CD de audio Red Book tiene 2 16 = 65,536 amplitudes de señal posibles, lo que teóricamente permite una relación señal/ruido de 98  dB . [2] : 49 

Retumbar

El ruido sordo es una forma de ruido característico causado por imperfecciones en los cojinetes de los tocadiscos. El plato tiende a tener una ligera cantidad de movimiento además de la rotación deseada y la superficie del tocadiscos también se mueve hacia arriba, hacia abajo y de lado a lado ligeramente. Este movimiento adicional se agrega a la señal deseada como ruido, generalmente de frecuencias muy bajas, creando un sonido retumbante durante los pasajes tranquilos. Los tocadiscos muy económicos a veces usan cojinetes de bolas , que es muy probable que generen cantidades audibles de ruido sordo. Los tocadiscos más caros tienden a usar cojinetes de manguito masivos , que es mucho menos probable que generen cantidades ofensivas de ruido sordo. El aumento de la masa del tocadiscos también tiende a conducir a una reducción del ruido sordo. Un buen tocadiscos debe tener un ruido sordo al menos 60 dB por debajo del nivel de salida especificado del captador. [16] : 79–82  Debido a que no tienen partes móviles en la ruta de la señal, los sistemas digitales no están sujetos a ruidos sordos.

Guau y revoloteo

El wow y el flutter son un cambio en la frecuencia de un dispositivo analógico y son el resultado de imperfecciones mecánicas. El wow es una forma de flutter que ocurre a un ritmo más lento. El wow y el flutter son más notorios en señales que contienen tonos puros. Para los discos de vinilo, la calidad del tocadiscos tendrá un gran efecto en el nivel de wow y flutter. Un buen tocadiscos tendrá valores de wow y flutter de menos del 0,05 %, que es la variación de velocidad con respecto al valor medio. [16] El wow y el flutter también pueden estar presentes en la grabación, como resultado del funcionamiento imperfecto de la grabadora. Debido al uso de osciladores de cristal de precisión para su base de tiempo , los sistemas digitales no están sujetos a wow y flutter.

Respuesta de frecuencia

En los sistemas digitales, el límite superior de la respuesta de frecuencia está determinado por la frecuencia de muestreo . La elección de la frecuencia de muestreo de la muestra en un sistema digital se basa en el teorema de muestreo de Nyquist-Shannon . Este establece que una señal muestreada se puede reproducir exactamente siempre que se muestree a una frecuencia mayor que el doble del ancho de banda de la señal, la frecuencia de Nyquist . Por lo tanto, una frecuencia de muestreo de 40 kHz es matemáticamente suficiente para capturar toda la información contenida en una señal que tenga componentes de frecuencia menores o iguales a 20 kHz. El teorema de muestreo también requiere que el contenido de frecuencia por encima de la frecuencia de Nyquist se elimine de la señal antes de muestrearla. Esto se logra utilizando filtros anti-aliasing que requieren una banda de transición para reducir suficientemente el aliasing. El ancho de banda proporcionado por la frecuencia de muestreo de 44.100 Hz utilizada por el estándar para CD de audio es lo suficientemente amplio como para cubrir todo el rango de audición humana , que se extiende aproximadamente de 20 Hz a 20 kHz. [2] : 108  Las grabadoras digitales profesionales pueden grabar frecuencias más altas, mientras que algunos sistemas de consumo y de telecomunicaciones graban un rango de frecuencia más restringido.

Algunos fabricantes de cintas analógicas especifican respuestas de frecuencia de hasta 20 kHz, pero estas mediciones pueden haberse realizado a niveles de señal más bajos. [16] Los casetes compactos pueden tener una respuesta que se extiende hasta 15 kHz a un nivel de grabación completo (0 dB). [17] A niveles más bajos (−10 dB), los casetes suelen estar limitados a 20 kHz debido al borrado automático del medio de cinta.

La respuesta de frecuencia de un reproductor de LP convencional puede ser de 20 Hz a 20 kHz, ±3 dB. La respuesta de baja frecuencia de los discos de vinilo está restringida por el ruido retumbante (descrito anteriormente), así como por las características físicas y eléctricas de todo el brazo de captación y el conjunto del transductor. La respuesta de alta frecuencia del vinilo depende del cartucho. Los discos CD4 contenían frecuencias de hasta 50 kHz. Se han recortado experimentalmente frecuencias de hasta 122 kHz en discos de LP. [18]

Alias

Los sistemas digitales requieren que todo el contenido de señal de alta frecuencia por encima de la frecuencia de Nyquist se elimine antes del muestreo, lo que, si no se hace, dará como resultado que estas frecuencias ultrasónicas se "dobleguen" en frecuencias en el rango audible, produciendo un tipo de distorsión llamada aliasing . El aliasing se evita en los sistemas digitales mediante un filtro anti-aliasing . Sin embargo, diseñar un filtro analógico que elimine con precisión todo el contenido de frecuencia exactamente por encima o por debajo de una cierta frecuencia de corte es poco práctico. [19] En cambio, generalmente se elige una frecuencia de muestreo que está por encima del requisito de Nyquist. Esta solución se llama sobremuestreo y permite utilizar un filtro anti-aliasing menos agresivo y de menor costo.

Los primeros sistemas digitales pueden haber sufrido una serie de degradaciones de señal relacionadas con el uso de filtros anti-aliasing analógicos, por ejemplo, dispersión temporal, distorsión no lineal , ondulación , dependencia de la temperatura de los filtros, etc. [20] : 8  Utilizando un diseño de sobremuestreo y modulación delta-sigma , un filtro anti-aliasing analógico menos agresivo se puede complementar con un filtro digital. [19] Este enfoque tiene varias ventajas ya que se puede hacer que el filtro digital tenga una función de transferencia de dominio de frecuencia casi ideal, con baja ondulación en banda y sin envejecimiento o deriva térmica. [20] : 18  Sin embargo, el filtro anti-aliasing digital puede introducir degradaciones debido a la respuesta del dominio del tiempo, particularmente a frecuencias de muestreo más bajas. [21] [22]

Los sistemas analógicos no están sujetos a un límite de Nyquist ni a un efecto de aliasing y, por lo tanto, no requieren filtros antialiasing ni ninguna de las consideraciones de diseño asociadas con ellos. En cambio, los límites de los formatos de almacenamiento analógicos están determinados por las propiedades físicas de su construcción.

Frecuencias de muestreo

El audio con calidad de CD se muestrea a 44.100 Hz ( frecuencia Nyquist = 22,05 kHz) y a 16 bits. El muestreo de la forma de onda a frecuencias más altas y la posibilidad de un mayor número de bits por muestra permiten reducir aún más el ruido y la distorsión. DAT puede muestrear audio a hasta 48 kHz, mientras que DVD-Audio puede tener 96 o 192 kHz y una resolución de hasta 24 bits. Con cualquiera de estas frecuencias de muestreo, la información de la señal se captura por encima de lo que generalmente se considera el rango de frecuencia de audición humana . Las frecuencias de muestreo más altas imponen menos restricciones en la implementación del filtro anti-aliasing, lo que puede dar como resultado una menor complejidad y una menor distorsión de la señal.

Un trabajo realizado en 1981 por Muraoka et al. [23] mostró que sólo unos pocos de los 176 sujetos de prueba distinguieron las señales musicales con componentes de frecuencia superiores a 20 kHz de las que no los tenían. [24] Un estudio perceptual de Nishiguchi et al. (2004) concluyó que "no se encontró ninguna diferencia significativa entre sonidos con y sin componentes de frecuencia muy alta entre los estímulos sonoros y los sujetos... sin embargo, [Nishiguchi et al] todavía no pueden confirmar ni negar la posibilidad de que algunos sujetos pudieran discriminar entre sonidos musicales con y sin componentes de frecuencia muy alta". [25]

En pruebas de escucha a ciegas realizadas por Bob Katz en 1996, relatadas en su libro Mastering Audio: The Art and the Science , los sujetos que usaban el mismo equipo de reproducción de alta frecuencia de muestreo no pudieron discernir ninguna diferencia audible entre el material del programa filtrado de manera idéntica para eliminar frecuencias por encima de 20 kHz frente a 40 kHz. Esto demuestra que la presencia o ausencia de contenido ultrasónico no explica la variación auditiva entre frecuencias de muestreo. Postula que la variación se debe en gran medida al rendimiento de los filtros limitadores de banda en los convertidores. Estos resultados sugieren que el principal beneficio de usar frecuencias de muestreo más altas es que empuja la distorsión de fase consecuente de los filtros limitadores de banda fuera del rango audible y que, en condiciones ideales, las frecuencias de muestreo más altas pueden no ser necesarias. [26] Dunn (1998) examinó el rendimiento de los convertidores digitales para ver si estas diferencias en el rendimiento podían explicarse por los filtros limitadores de banda utilizados en los convertidores y buscar los artefactos que introducen. [27]

Cuantización

Una ilustración de la cuantificación de una forma de onda de audio muestreada utilizando 4 bits

Una señal se graba digitalmente mediante un convertidor analógico a digital , que mide la amplitud de una señal analógica a intervalos regulares especificados por la frecuencia de muestreo y luego almacena estos números muestreados en el hardware de la computadora. Los números en las computadoras representan un conjunto finito de valores discretos, lo que significa que si una señal analógica se muestrea digitalmente utilizando métodos nativos (sin tramado), la amplitud de la señal de audio simplemente se redondeará a la representación más cercana. Este proceso se llama cuantificación, y estos pequeños errores en las mediciones se manifiestan auditivamente como ruido de bajo nivel o distorsión. Esta forma de distorsión, a veces llamada distorsión granular o de cuantificación, se ha señalado como un fallo de algunos sistemas y grabaciones digitales, particularmente algunas grabaciones digitales tempranas, donde se decía que la versión digital era inferior a la versión analógica. [28] Sin embargo, "si la cuantificación se realiza utilizando el tramado correcto, entonces la única consecuencia de la digitalización es efectivamente la adición de un piso de ruido aleatorio benigno, no correlacionado y blanco. El nivel del ruido depende del número de bits en el canal". [9] : 6 

El rango de valores posibles que se pueden representar numéricamente mediante una muestra está determinado por el número de dígitos binarios utilizados. Esto se denomina resolución y, en el contexto del audio PCM, se suele denominar profundidad de bits. El nivel de ruido de cuantificación está determinado directamente por este número, que disminuye exponencialmente (linealmente en unidades de dB) a medida que aumenta la resolución. Con una profundidad de bits adecuada, el ruido aleatorio de otras fuentes dominará y enmascarará por completo el ruido de cuantificación. El estándar Redbook CD utiliza 16 bits, lo que mantiene el ruido de cuantificación 96 dB por debajo de la amplitud máxima, muy por debajo de un nivel discernible con casi cualquier material fuente. [29] La adición de un tramado efectivo significa que, "en términos prácticos, la resolución está limitada por nuestra capacidad para resolver sonidos en el ruido... No tenemos problemas para medir (y escuchar) señales de -110 dB en un canal de 16 bits bien diseñado". [9] Los DVD-Audio y la mayoría de los equipos de grabación profesionales modernos permiten muestras de 24 bits.

Los sistemas analógicos no tienen necesariamente niveles digitales discretos en los que se codifica la señal. En consecuencia, la precisión con la que se puede conservar la señal original está limitada por el nivel de ruido intrínseco y el nivel máximo de señal del medio y del equipo de reproducción.

Cuantización en medios analógicos

Dado que los medios analógicos están compuestos de moléculas , la estructura microscópica más pequeña representa la unidad de cuantificación más pequeña de la señal registrada. Los procesos de tramado naturales, como los movimientos térmicos aleatorios de las moléculas, el tamaño distinto de cero del instrumento de lectura y otros efectos de promediado, hacen que el límite práctico sea mayor que el de la característica estructural molecular más pequeña. Un LP teórico compuesto de diamante perfecto, con un tamaño de ranura de 8 micrones y un tamaño de característica de 0,5 nanómetros, tiene una cuantificación similar a una muestra digital de 16 bits. [6]

El dither como solución

Una ilustración del tramado utilizado en el procesamiento de imágenes.
Ilustración del dither utilizado en el procesamiento de imágenes. Se ha insertado una desviación aleatoria antes de reducir la paleta a solo 16 colores, lo que es análogo al efecto del dither en una señal de audio.

Es posible hacer que el ruido de cuantificación sea audiblemente benigno aplicando dither . Para ello, se añade ruido a la señal original antes de la cuantificación. El uso óptimo de dither tiene el efecto de hacer que el error de cuantificación sea independiente de la señal, [11] : 143  y permite que la información de la señal se conserve por debajo del bit menos significativo del sistema digital. [9] : 3 

Los algoritmos de tramado también suelen tener una opción para emplear algún tipo de modelado de ruido , que empuja la frecuencia de gran parte del ruido de tramado a áreas que son menos audibles para los oídos humanos, reduciendo el nivel del ruido de fondo aparente para el oyente.

El tramado se aplica comúnmente durante la masterización antes de la reducción de profundidad de bits final, [26] y también en varias etapas del DSP .

Fluctuación de tiempo

Un aspecto que puede degradar el rendimiento de un sistema digital es el jitter . Este es el fenómeno de las variaciones en el tiempo con respecto a lo que debería ser el espaciado correcto de las muestras discretas de acuerdo con la frecuencia de muestreo. Esto puede deberse a imprecisiones de sincronización del reloj digital. Idealmente, un reloj digital debería producir un pulso de sincronización a intervalos exactamente regulares. Otras fuentes de jitter dentro de los circuitos electrónicos digitales son el jitter inducido por datos, donde una parte del flujo digital afecta a una parte posterior a medida que fluye a través del sistema, y ​​el jitter inducido por la fuente de alimentación, donde el ruido de la fuente de alimentación causa irregularidades en la sincronización de las señales en los circuitos que alimenta.

La precisión de un sistema digital depende de los valores de amplitud muestreados, pero también de la regularidad temporal de estos valores. Las versiones analógicas de esta dependencia temporal se conocen como error de tono y fluctuación y fluctuación.

La fluctuación periódica produce ruido de modulación y puede considerarse equivalente a la fluctuación analógica. [30] La fluctuación aleatoria altera el nivel de ruido del sistema digital. La sensibilidad del convertidor a la fluctuación depende del diseño del convertidor. [11] Se ha demostrado que una fluctuación aleatoria de 5  ns puede ser significativa para sistemas digitales de 16 bits. [30]

En 1998, Benjamin y Gannon investigaron la audibilidad del jitter utilizando pruebas de escucha. [11] : 34  Encontraron que el nivel más bajo de jitter audible era alrededor de 10 ns ( rms ). Esto fue en una señal de prueba de onda sinusoidal de 17 kHz . Con música, ningún oyente encontró jitter audible en niveles inferiores a 20 ns. Un artículo de Ashihara et al. (2005) intentó determinar los umbrales de detección para jitter aleatorio en señales musicales. Su método implicó pruebas de escucha ABX . Al discutir sus resultados, los autores comentaron que:

Hasta el momento, el jitter real en los productos de consumo parece ser demasiado pequeño para ser detectado al menos para la reproducción de señales musicales. Sin embargo, no está claro si los umbrales de detección obtenidos en el presente estudio realmente representarían el límite de la resolución auditiva o estarían limitados por la resolución del equipo. Las distorsiones debidas a un jitter muy pequeño pueden ser menores que las distorsiones debidas a las características no lineales de los altavoces. Ashihara y Kiryu [8] evaluaron la linealidad de los altavoces y los auriculares. Según su observación, los auriculares parecen ser más preferibles para producir suficiente presión sonora en los tímpanos con distorsiones menores que los altavoces. [31]

Procesamiento de señales

Después de la grabación inicial, es común que la señal de audio se altere de alguna manera, como con el uso de compresión , ecualización , retardos y reverberación . Con la tecnología analógica, esto se realiza en forma de componentes de hardware externos y, con la tecnología digital, lo mismo se logra normalmente con complementos en una estación de trabajo de audio digital (DAW).

Una comparación entre el filtrado analógico y el digital muestra las ventajas técnicas de ambos métodos. Los filtros digitales son más precisos y flexibles. Los filtros analógicos son más simples, pueden ser más eficientes y no introducen latencia.

Hardware analógico

Una ilustración del cambio de fase.
Desplazamiento de fase: la onda sinusoidal en rojo se ha retrasado en el tiempo igual al ángulo , que se muestra como la onda sinusoidal en azul. θ {\estilo de visualización \estilo de script \theta \,}

Al alterar una señal con un filtro, la señal de salida puede diferir en el tiempo de la señal de entrada, que se mide como su respuesta de fase . Todos los ecualizadores analógicos muestran este comportamiento, con la cantidad de cambio de fase que difiere en algún patrón y se centra alrededor de la banda que se está ajustando. Aunque este efecto altera la señal de una manera distinta a un cambio estricto en la respuesta de frecuencia, por lo general no es objetable para los oyentes. [32]

Filtros digitales

Debido a que las variables involucradas se pueden especificar con precisión en los cálculos, se puede lograr que los filtros digitales funcionen objetivamente mejor que los componentes analógicos. [3] [33] Otros procesamientos como el retardo y la mezcla se pueden realizar con exactitud.

Los filtros digitales también son más versátiles. Por ejemplo, el ecualizador de fase lineal no introduce un desplazamiento de fase dependiente de la frecuencia. Este filtro se puede implementar digitalmente utilizando un filtro de respuesta de impulso finito , pero no tiene una implementación práctica utilizando componentes analógicos.

Una ventaja práctica del procesamiento digital es la mayor comodidad para recuperar los ajustes. Los parámetros de los plug-ins se pueden almacenar en el ordenador, mientras que los detalles de los parámetros de una unidad analógica deben escribirse o registrarse de otro modo si es necesario reutilizar la unidad. Esto puede resultar complicado cuando se deben recuperar manualmente mezclas enteras utilizando una consola analógica y un equipo externo. Cuando se trabaja digitalmente, todos los parámetros se pueden almacenar simplemente en un archivo de proyecto de DAW y recuperarse al instante. La mayoría de las DAW profesionales modernas también procesan plug-ins en tiempo real, lo que significa que el procesamiento puede ser en gran medida no destructivo hasta la mezcla final.

Modelado analógico

Actualmente existen muchos plug-ins que incorporan modelado analógico. Hay ingenieros de audio que los avalan y consideran que se comparan en sonido con los procesos analógicos que imitan. El modelado analógico conlleva algunas ventajas sobre sus contrapartes analógicas, como la capacidad de eliminar el ruido de los algoritmos y modificaciones para hacer que los parámetros sean más flexibles. Por otro lado, otros ingenieros también consideran que el modelado sigue siendo inferior a los componentes externos genuinos y aún prefieren mezclar "fuera de la caja". [34]

Calidad de sonido

Evaluación subjetiva

La evaluación subjetiva intenta medir el rendimiento de un componente de audio según el oído humano. La forma más común de prueba subjetiva es una prueba de escucha, en la que el componente de audio simplemente se utiliza en el contexto para el que fue diseñado. Esta prueba es popular entre los revisores de alta fidelidad, en la que el componente se utiliza durante un período de tiempo por el revisor que luego describe el rendimiento en términos subjetivos. Las descripciones comunes incluyen si el componente tiene un sonido brillante o cálido , o qué tan bien el componente logra presentar una imagen espacial .

Otro tipo de prueba subjetiva se realiza en condiciones más controladas e intenta eliminar posibles sesgos de las pruebas de escucha. Este tipo de pruebas se realizan con el componente oculto al oyente y se denominan pruebas a ciegas . Para evitar posibles sesgos por parte de la persona que realiza la prueba, la prueba a ciegas puede realizarse de modo que esta persona tampoco sea consciente del componente que se está probando. Este tipo de prueba se denomina prueba doble ciego. Este tipo de prueba se utiliza a menudo para evaluar el rendimiento de la compresión de audio con pérdida .

Los críticos de las pruebas doble ciego consideran que no permiten que el oyente se relaje por completo al evaluar el componente del sistema y, por lo tanto, no puede juzgar las diferencias entre los diferentes componentes tan bien como en las pruebas para personas videntes (no ciegas). Quienes emplean el método de prueba doble ciego pueden intentar reducir el estrés del oyente permitiéndole una cierta cantidad de tiempo para el entrenamiento del oyente. [35]

Las primeras grabaciones digitales

Las primeras máquinas de audio digital tuvieron resultados decepcionantes, ya que los convertidores digitales introducían errores que el oído podía detectar. [36] Las compañías discográficas lanzaron sus primeros LP basados ​​en masters de audio digital a fines de la década de 1970. Los CD estuvieron disponibles a principios de la década de 1980. En ese momento, la reproducción de sonido analógico era una tecnología madura .

Las primeras grabaciones digitales publicadas en CD tuvieron una respuesta crítica mixta. En comparación con los discos de vinilo, se observó que el CD revelaba mucho más la acústica y el ruido ambiental de fondo del entorno de grabación. [37] Por este motivo, las técnicas de grabación desarrolladas para discos analógicos, por ejemplo, la colocación de micrófonos, tuvieron que adaptarse para adecuarse al nuevo formato digital. [37]

Algunas grabaciones analógicas fueron remasterizadas para formatos digitales. Las grabaciones analógicas realizadas en una acústica natural de sala de conciertos tendían a beneficiarse de la remasterización. [38] El proceso de remasterización fue criticado ocasionalmente por ser mal manejado. Cuando la grabación analógica original era bastante brillante, la remasterización a veces daba como resultado un énfasis de agudos poco natural. [38]

Super Audio CD y DVD-Audio

El formato Super Audio CD (SACD) fue creado por Sony y Philips , quienes también fueron los desarrolladores del anterior formato estándar de CD de audio. SACD utiliza Direct Stream Digital (DSD) basado en modulación delta-sigma . Mediante esta técnica, los datos de audio se almacenan como una secuencia de valores de amplitud fija (es decir, 1 bit) a una frecuencia de muestreo de 2,884 MHz, que es 64 veces la frecuencia de muestreo de 44,1 kHz utilizada por CD. En cualquier momento, la amplitud de la señal analógica original está representada por la densidad de 1 o 0 en el flujo de datos. Por lo tanto, este flujo de datos digitales se puede convertir a analógico pasándolo a través de un filtro de paso bajo analógico.

El formato DVD-Audio utiliza PCM lineal estándar a frecuencias de muestreo y profundidades de bits variables, que como mínimo igualan y generalmente superan ampliamente las del audio CD estándar (16 bits, 44,1 kHz).

En la prensa popular de alta fidelidad, se había sugerido que el PCM lineal "crea [una] reacción de estrés en las personas", y que el DSD "es el único sistema de grabación digital que no [...] tiene estos efectos". [39] Esta afirmación parece tener su origen en un artículo de 1980 del Dr. John Diamond . [40] El núcleo de la afirmación de que las grabaciones PCM (la única técnica de grabación digital disponible en ese momento) creaban una reacción de estrés se basaba en el uso de la técnica pseudocientífica de la kinesiología aplicada , por ejemplo, por el Dr. Diamond en una presentación de la 66.ª Convención de la AES (1980) con el mismo título. [41] Diamond había utilizado anteriormente una técnica similar para demostrar que la música rock (a diferencia de la clásica) era mala para la salud debido a la presencia del "ritmo anapéstico detenido". [42] Las afirmaciones de Diamond con respecto al audio digital fueron retomadas por Mark Levinson , quien afirmó que, si bien las grabaciones PCM producían una reacción de estrés, las grabaciones DSD no. [43] [44] [45] Sin embargo, una prueba subjetiva a doble ciego entre PCM lineal de alta resolución (DVD-Audio) y DSD no reveló una diferencia estadísticamente significativa. Los oyentes que participaron en esta prueba notaron su gran dificultad para escuchar cualquier diferencia entre los dos formatos. [46]

Preferencia analógica

El resurgimiento del vinilo se debe en parte a la imperfección del audio analógico, que añade "calidez". [47] Algunos oyentes prefieren este tipo de audio al de un CD. El fundador y editor de la revista The Absolute Sound , Harry Pearson, dice que "los LP son decididamente más musicales. Los CD drenan el alma de la música. La implicación emocional desaparece". El productor de dub Adrian Sherwood tiene sentimientos similares sobre la cinta de casete analógica, que prefiere por su sonido "más cálido". [48]

Los partidarios del formato digital señalan los resultados de pruebas a ciegas, que demuestran el alto rendimiento posible con las grabadoras digitales. [49] La afirmación es que el "sonido analógico" es más un producto de las imprecisiones del formato analógico que cualquier otra cosa. Uno de los primeros y mayores partidarios del audio digital fue el director de orquesta clásico Herbert von Karajan , que dijo que la grabación digital era "definitivamente superior a cualquier otra forma de grabación que conocemos". También fue pionero del fracasado Digital Compact Cassette y dirigió la primera grabación que se lanzó comercialmente en CD: Eine Alpensinfonie de Richard Strauss . La percepción de que el audio analógico fuera demostrablemente superior también fue puesta en duda por los analistas musicales tras las revelaciones de que el sello audiófilo Mobile Fidelity Sound Lab había estado utilizando de forma encubierta archivos Direct Stream Digital para producir lanzamientos de vinilo comercializados como procedentes de cintas maestras analógicas, y el abogado y audiófilo Randy Braun afirmó que "Estas personas que afirman tener oídos de oro y pueden oír la diferencia entre lo analógico y lo digital, bueno, resulta que no pueden". [50] [51]

Sistemas híbridos

Aunque las palabras audio analógico suelen implicar que el sonido se describe utilizando un enfoque de señal continua, y las palabras audio digital implican un enfoque discreto, existen métodos de codificación de audio que se encuentran en algún punto intermedio entre los dos. De hecho, todos los sistemas analógicos muestran un comportamiento discreto (cuantificado) a escala microscópica. [52] Mientras que los discos de vinilo y los casetes compactos comunes son medios analógicos y utilizan métodos de codificación física cuasi-lineales (por ejemplo, profundidad de surco en espiral, intensidad del campo magnético de la cinta ) sin cuantificación o aliasing perceptibles, existen sistemas analógicos no lineales que exhiben efectos similares a los encontrados en los digitales, como aliasing y pisos dinámicos "duros" (por ejemplo, audio de alta fidelidad modulado en frecuencia en cintas de video, señales codificadas PWM ).

Véase también

Referencias

  1. ^ Liversidge, Anthony (febrero de 1995). "Analógico versus digital: ¿ha sido el vinilo destronado erróneamente por la industria musical?". Omni . Vol. 17, núm. 5. Archivado desde el original el 7 de marzo de 2015. Consultado el 22 de marzo de 2017 .
  2. ^ abc Maes, Jan; Vercammen, Marc, eds. (2001). Tecnología de audio digital: una guía para CD, MiniDisc, SACD, DVD(A), MP3 y DAT (4.ª ed.). Focal Press. ISBN 0240516540Por lo tanto , un sistema de 16 bits proporciona una relación señal-ruido teórica de 98 dB.
  3. ^ ab "Capítulo 21: Comparación de filtros". dspguide.com . Consultado el 13 de septiembre de 2012 .
  4. ^ Garrison, Mark (23 de septiembre de 2011). "Enciclopedia de grabación casera: rango dinámico".
  5. ^ "Transferencia de audio de última generación". The Audio Archive . Consultado el 14 de mayo de 2018. Relación señal/ruido NAB (pista de 2,0 mm y dos pistas de 1/4 de pulgada, RMS, ponderación A) 30 ips - 75 dB
  6. ^ ab Lesurf, Jim (18 de mayo de 2000). "Los defectos 'digitales' del disco de larga duración". Universidad de St. Andrews . Consultado el 22 de septiembre de 2017 .
  7. ^ Fremer, Michael (6 de enero de 1999). «Preamplificador de fono Pass Aleph Ono». Stereophile . Consultado el 14 de mayo de 2018 .
  8. ^ ab Metzler, Bob (2005). The Audio Measurement Handbook (2.ª edición). Audio Precision, EE. UU . . Consultado el 9 de marzo de 2008 .
  9. ^ abcd Stuart, J. "Coding High Quality Digital Audio" (PDF) . Meridian Audio Ltd. Archivado desde el original (PDF) el 11 de octubre de 2007 . Consultado el 9 de marzo de 2008 .Este artículo es sustancialmente el mismo que el artículo de Stuart de 2004 en JAES "Codificación para sistemas de audio de alta resolución", Journal of the Audio Engineering Society , volumen 52, número 3, págs. 117-144; marzo de 2004.
  10. ^ Elsea, Peter (1996). "Grabación analógica de sonido". Estudios de música electrónica de la Universidad de California, Santa Cruz. Archivado desde el original el 16 de octubre de 2009. Consultado el 9 de marzo de 2008 .
  11. ^ abcde Dunn, Julian (2003). "Técnicas de medición para audio digital: Nota de aplicación de Audio Precision n.° 5". Audio Precision, Inc. Archivado desde el original el 20 de marzo de 2007. Consultado el 9 de marzo de 2008 .
  12. ^ Manson, W. (1980). "Sonido digital: resolución de codificación de señales de estudio para radiodifusión" (PDF) . Departamento de Investigación de la BBC, División de Ingeniería. pág. 8.
  13. ^ Jones, Wayne; Wolfe, Michael; Tanner, Theodore C. Jr.; Dinu, Daniel (marzo de 2003). Desafíos de prueba en dispositivos de audio de computadoras personales. 114.ª Convención de la AES. Archivado desde el original el 7 de marzo de 2008. Consultado el 9 de marzo de 2008 .
  14. ^ "CD-R ilegible en menos de dos años". myce.com . 19 de agosto de 2003 . Consultado el 1 de febrero de 2007 .
  15. ^ Byers, Fred R (octubre de 2003). "Care and Handling of CDs and DVDs" (PDF) . Consejo de Recursos de Bibliotecas e Información . Consultado el 27 de julio de 2014 .
  16. ^ abc Driscoll, R. (1980). Practical Hi-Fi Sound , 'Analogue and digital', páginas 61–64; 'The pick-up, arm and turntable', páginas 79–82. Hamlyn. ISBN 0-600-34627-7 . 
  17. ^ Stark, C. (1989). "Conceptos y sistemas de alta fidelidad". Artículo de Macropaedia 'Sonido'. vol. 27 (15 ed.). Enciclopedia Británica . pag. 625.
  18. ^ "masterización". Positive-feedback.com . Consultado el 15 de agosto de 2012 .
  19. ^ ab Thompson, Dan. Comprender el audio . Berklee Press, 2005, cap. 14.
  20. ^ ab Hawksford, Malcolm (septiembre de 1991). Introducción a las imágenes de audio digital (PDF) . Actas de la 10.ª Conferencia Internacional de la AES. Londres. Archivado desde el original (PDF) el 29 de septiembre de 2007. Consultado el 9 de marzo de 2008 .
  21. ^ Story, Mike (septiembre de 1997). "Una explicación sugerida para (algunas de) las diferencias audibles entre el material de audio de frecuencia de muestreo alta y el de frecuencia de muestreo convencional" (PDF) . dCS Ltd. Archivado (PDF) del original el 28 de noviembre de 2009.
  22. ^ Robjohns, Hugh (agosto de 2016). "Precisión en el dominio del tiempo y calidad de audio digital de MQA". soundonsound.com . Sound On Sound. Archivado desde el original el 10 de marzo de 2023.
  23. ^ Muraoka, Teruo; Iwahara, Makoto; Yamada, Yasuhiro (1981). "Examen de los requisitos de ancho de banda de audio para la transmisión óptima de señales de sonido". Revista de la Sociedad de Ingeniería de Audio . 29 (1/2): 2–9.
  24. ^ Kaoru, A.; Shogo, K (2001). Umbral de detección para tonos superiores a 22 kHz. 110.ª Convención de la AEC. Audio Engineering Society Paper 5401{{cite conference}}: Mantenimiento de CS1: postscript ( enlace )
  25. ^ Nishiguchi, Toshiyuki; Iwaki, Masakazu; Ando, ​​Akio (2004). Discriminación perceptual entre sonidos musicales con y sin componentes de frecuencia muy alta. Nota de laboratorio NHK n.º 486 (informe). NHK . Archivado desde el original el 16 de octubre de 2015. Consultado el 15 de agosto de 2012 .
  26. ^ ab Katz, Bob (2015). Mastering Audio: The Art and the Science (3.ª ed.). Focal Press. págs. 316-318. ISBN 978-0240818962.
  27. ^ Dunn, Julian (1998). "Anti-alias y filtrado anti-imagen: los beneficios de los formatos de frecuencia de muestreo de 96 kHz para quienes no pueden escuchar por encima de los 20 kHz" (PDF) . Nanophon Limited . Consultado el 27 de julio de 2014 .
  28. ^ Knee, Anthony B.; Hawksford, Malcolm J. (febrero de 1995). Evaluación de sistemas digitales y grabación digital utilizando datos de audio en tiempo real. 98.ª Convención AES. pág. 3.
  29. ^ Hass, Jeffrey (2013). "Capítulo 5: Principios del audio digital". Centro de música electrónica e informática . Universidad de Indiana.
  30. ^ ab Rumsey, F.; Watkinson, J (1995). "Secciones 2.5 y 6". El manual de interfaz digital (2.ª edición). Focal Press. págs. 37, 154–160.
  31. ^ Ashihara, Kaoru; Kiryu, Shogo; Koizumi, Nobuo; Nishimura, Akira; Ohga, Juro; Sawaguchi, Masaki; Yoshikawa, Shokichiro (2005). «Umbral de detección de distorsiones debidas a fluctuaciones en audio digital». Acoustical Science and Technology . 26 (1): 50–54. doi : 10.1250/ast.26.50 . Archivado desde el original el 12 de agosto de 2009 . Consultado el 31 de enero de 2014 .
  32. ^ Steve Green, Una nueva perspectiva sobre los filtros de diezmado e interpolación (PDF) , Cirrus Logic , consultado el 20 de febrero de 2022
  33. ^ John Eargle, Chris Foreman (2002). Ingeniería de audio para el refuerzo de sonido: las ventajas de la transmisión digital y el procesamiento de señales. ISBN 9780634043550. Recuperado el 14 de septiembre de 2012 .
  34. ^ "Secretos de los ingenieros de mezcla: Chris Lord-Alge". Mayo de 2007. Consultado el 13 de septiembre de 2012 .
  35. ^ Toole, Floyd (1994). "Sección 11.7: Procedimiento experimental". En Borwick, John (ed.). The Loudspeaker and Headphone Handbook (2.ª ed.). Focal Press. págs. 481–488. ISBN 0-240-51371-1.
  36. ^ Watkinson, J. (1994). "Sección 1.2: ¿Qué es el audio digital? ¿Qué podemos escuchar?". Introducción al audio digital. Focal Press. pp. 3, 26. ISBN 0-240-51378-9.
  37. ^ ab Greenfield, E.; y col. (1986). March, Ivan (ed.). La guía Penguin de discos compactos, casetes y LP . Penguin Books, Inglaterra.
  38. ^ ab Greenfield, E.; et al. (1990). "Prefacio". En marzo, Ivan (ed.). The Penguin Guide to Compact Discs . Penguin Books, Inglaterra. págs. viii–ix. ISBN 0-14-046887-0.
  39. ^ Hawksford, M. (2001). SDM versus LPCM: El debate continúa (PDF) . 110.ª Convención de la AES. Archivado desde el original (PDF) el 13 de mayo de 2006, documento 5397{{cite conference}}: Mantenimiento de CS1: postscript ( enlace )
  40. ^ Diamond, John (2003) [1980]. «El estrés humano provocado por grabaciones digitalizadas». The Diamond Center . Archivado desde el original el 12 de agosto de 2004. Consultado el 17 de julio de 2013 .
  41. ^ Diamond, John; Lagadec, Roger (diciembre de 1985). "Más sobre el estrés humano provocado por grabaciones digitalizadas y respuesta". Revista de la Sociedad de Ingeniería de Audio . 33 (12). AES : 968. Consultado el 16 de agosto de 2013 .
  42. ^ Fuller, John Grant (1981). ¿Están bien los chicos?: La generación del rock y su deseo de muerte oculto . pp. 130–135. ISBN 0812909704.
  43. ^ Levinson, Mark. "Revitalizar la industria del audio: música y salud" (PDF) . Archivado desde el original (PDF) el 23 de marzo de 2014.
  44. ^ Levinson, Mark. «Mark Levinson: CD vs. SACD y LP». Redrosemusic.com. Archivado desde el original el 29 de febrero de 2012. Consultado el 16 de agosto de 2013 .
  45. ^ Phillips, Wes (5 de julio de 2005). "Mark Levinson & the Bobcat". Stereophilia. Stereophile.com . Consultado el 16 de agosto de 2013 .
  46. ^ Blech, Dominik; Yang, Min-Chi (8–11 de mayo de 2004). DVD-Audio versus SACD: Discriminación perceptual de formatos de codificación de audio digital (PDF) . Convención AES:116. Berlín: Audio Engineering Society . Archivado desde el original el 27 de septiembre de 2007 . Consultado el 27 de julio de 2014 .
  47. ^ Deffes, Olivia (30 de enero de 2020). «Repetición de la interpretación: los amantes de la música se están animando a escuchar vinilos... otra vez». The Advocate . Consultado el 30 de enero de 2020 .
  48. ^ Paul, James (26 de septiembre de 2003). "Anoche un mixtape me salvó la vida | Música | The Guardian". Londres: Arts.guardian.co.uk . Consultado el 15 de agosto de 2012 .
  49. ^ "Artículo de ABX Testing". Boston Audio Society. 23 de febrero de 1984. Consultado el 15 de agosto de 2012 .
  50. ^ Edgers, Geoff (5 de agosto de 2022). "Cómo el dueño de una tienda de discos de Phoenix incendió el mundo de los audiófilos". The Washington Post . Washington, DC ISSN  0190-8286. OCLC  1330888409.
  51. ^ Sinclair, Paul (6 de agosto de 2022). «Saturday Deluxe / 6 August 2022». SuperDeluxeEdition . Archivado desde el original el 9 de agosto de 2022. Consultado el 9 de agosto de 2022 .
  52. ^ Lesurf, Jim. "¿Analógico o digital?". The Scots Guide to Electronics . St-andrews.ac.uk . Consultado el 15 de agosto de 2012 .

Bibliografía

  • Libbey, Ted (febrero de 1995). «Digital versus analógico: la música digital en CD reina como el estándar de la industria». Omni . Vol. 17, núm. 5. Archivado desde el original el 7 de marzo de 2015. Consultado el 22 de marzo de 2017 .
  • Pohlmann, K. (2005). Principios de audio digital 5.ª ed., McGraw-Hill Comp.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Comparison_of_analog_and_digital_recording&oldid=1243931450"