El sonido se puede grabar , almacenar y reproducir utilizando técnicas digitales o analógicas . Ambas técnicas introducen errores y distorsiones en el sonido, y estos métodos se pueden comparar sistemáticamente. Los músicos y los oyentes han debatido sobre la superioridad de las grabaciones de sonido digitales frente a las analógicas. Los argumentos a favor de los sistemas analógicos incluyen la ausencia de mecanismos de error fundamentales que están presentes en los sistemas de audio digital, incluido el aliasing y la implementación asociada del filtro anti-aliasing , la fluctuación y el ruido de cuantificación . [1] Los defensores de lo digital señalan los altos niveles de rendimiento posibles con el audio digital, incluida la excelente linealidad en la banda audible y los bajos niveles de ruido y distorsión. [2] : 7
Dos diferencias importantes en el rendimiento entre los dos métodos son el ancho de banda y la relación señal-ruido (relación S/N). El ancho de banda del sistema digital está determinado, según la frecuencia de Nyquist , por la frecuencia de muestreo utilizada. El ancho de banda de un sistema analógico depende de las capacidades físicas y electrónicas de los circuitos analógicos. La relación S/N de un sistema digital puede estar limitada por la profundidad de bits del proceso de digitalización, pero la implementación electrónica de los circuitos de conversión introduce ruido adicional. En un sistema analógico, existen otras fuentes naturales de ruido analógico, como el ruido de parpadeo y las imperfecciones en el medio de grabación. Otras diferencias de rendimiento son específicas de los sistemas en comparación, como la capacidad de algoritmos de filtrado más transparentes en los sistemas digitales [3] y la saturación armónica y las variaciones de velocidad de los sistemas analógicos.
El rango dinámico de un sistema de audio es una medida de la diferencia entre los valores de amplitud más pequeños y más grandes que se pueden representar en un medio. Los sistemas digitales y analógicos difieren tanto en los métodos de transferencia y almacenamiento como en el comportamiento que presentan los sistemas debido a estos métodos.
El rango dinámico de los sistemas de audio digital puede superar al de los sistemas de audio analógicos. Las cintas de casete analógicas de consumo tienen un rango dinámico de 60 a 70 dB. Las emisiones de FM analógicas rara vez tienen un rango dinámico que supere los 50 dB. [4] El rango dinámico de un disco de vinilo cortado directamente puede superar los 70 dB. Las cintas maestras de estudio analógicas pueden tener un rango dinámico de hasta 77 dB. [5] Un LP hecho de diamante perfecto tiene un tamaño de característica atómica de aproximadamente 0,5 nanómetros , lo que, con un tamaño de surco de 8 micrones , produce un rango dinámico teórico de 110 dB. Un LP hecho de vinilo perfecto tendría un rango dinámico teórico de 70 dB. [6] Las mediciones indican un rendimiento real máximo en el rango de 60 a 70 dB. [7] Normalmente, un convertidor analógico a digital de 16 bits puede tener un rango dinámico de entre 90 y 95 dB, [8] : 132 mientras que la relación señal-ruido (aproximadamente el equivalente del rango dinámico, teniendo en cuenta la ausencia de ruido de cuantificación pero la presencia de silbido de cinta) de una grabadora de cinta de carrete a carrete profesional de ¼ de pulgada estaría entre 60 y 70 dB a la salida nominal de la grabadora. [8] : 111
Los beneficios de utilizar grabadoras digitales con una precisión superior a los 16 bits se pueden aplicar a los 16 bits de un CD de audio. El fundador de Meridian Audio, John Robert Stuart, destaca que con el dithering correcto , la resolución de un sistema digital es teóricamente infinita y que es posible, por ejemplo, resolver sonidos a −110 dB (por debajo de la escala completa digital) en un canal de 16 bits bien diseñado. [9] : 3
Existen algunas diferencias en el comportamiento de los sistemas analógicos y digitales cuando hay señales de alto nivel, donde existe la posibilidad de que dichas señales puedan sobrecargar el sistema. Con señales de alto nivel, la cinta magnética analógica se acerca a la saturación y la respuesta de alta frecuencia cae en proporción a la respuesta de baja frecuencia. Si bien es indeseable, el efecto audible de esto puede ser razonablemente inobjetable. [10] Por el contrario, las grabadoras PCM digitales muestran un comportamiento no benigno en sobrecarga; [11] : 65 muestras que exceden el nivel de cuantificación pico simplemente se truncan, recortando la forma de onda de manera cuadrada, lo que introduce distorsión en forma de grandes cantidades de armónicos de frecuencia más alta. En principio, los sistemas digitales PCM tienen el nivel más bajo de distorsión no lineal en la amplitud de señal completa. Lo opuesto suele ser cierto en los sistemas analógicos, donde la distorsión tiende a aumentar en niveles de señal altos. Un estudio de Manson (1980) consideró los requisitos de un sistema de audio digital para transmisión de alta calidad. Se concluyó que un sistema de 16 bits sería suficiente, pero se observó la pequeña reserva que el sistema proporcionaba en condiciones de funcionamiento normales. Por este motivo, se sugirió utilizar un limitador de señal de acción rápida o " soft clipper " para evitar que el sistema se sobrecargue. [12]
En muchas grabaciones, las distorsiones de alto nivel en los picos de la señal pueden quedar enmascaradas de forma audible por la señal original, por lo que pueden ser aceptables grandes cantidades de distorsión en los niveles pico de la señal. La diferencia entre los sistemas analógicos y digitales es la forma del error de señal de alto nivel. Algunos de los primeros convertidores analógico-digitales mostraban un comportamiento no benigno cuando estaban sobrecargados, donde las señales de sobrecarga se "envolvían" de escala completa positiva a negativa. Los diseños de convertidores modernos basados en la modulación sigma-delta pueden volverse inestables en condiciones de sobrecarga. Por lo general, un objetivo de diseño de los sistemas digitales es limitar las señales de alto nivel para evitar la sobrecarga. [11] : 65 Para evitar la sobrecarga, un sistema digital moderno puede comprimir las señales de entrada de modo que no se pueda alcanzar la escala completa digital [13] : 4
A diferencia de la duplicación analógica, las copias digitales son réplicas exactas que pueden duplicarse indefinidamente y sin pérdida de generación , en principio. La corrección de errores permite que los formatos digitales toleren un deterioro significativo del medio, aunque los medios digitales no son inmunes a la pérdida de datos. Los discos compactos CD-R de consumo tienen una vida útil limitada y variable debido a problemas inherentes y de calidad de fabricación. [14]
En el caso de los discos de vinilo, se produce cierta pérdida de fidelidad cada vez que se reproduce el disco. Esto se debe al desgaste de la aguja en contacto con la superficie del disco. Las cintas magnéticas, tanto analógicas como digitales, se desgastan por la fricción entre la cinta y los cabezales, guías y otras partes del transportador de cinta a medida que la cinta se desliza sobre ellos. Los residuos marrones que se depositan en los hisopos durante la limpieza de la ruta de la cinta de una grabadora de cinta son en realidad partículas de revestimiento magnético que se desprenden de las cintas. El síndrome de adherencia es un problema frecuente en las cintas antiguas. Las cintas también pueden sufrir arrugas, estiramientos y ondulaciones en los bordes de la base de plástico de la cinta, especialmente en el caso de grabadoras de cinta de baja calidad o desalineadas.
Cuando se reproduce un CD, no hay contacto físico, ya que los datos se leen ópticamente mediante un rayo láser. Por lo tanto, no se produce dicho deterioro del medio y, con el cuidado adecuado, el CD sonará exactamente igual cada vez que se reproduzca (sin tener en cuenta el envejecimiento del reproductor y del propio CD); sin embargo, se trata de un beneficio del sistema óptico, no de la grabación digital, y el formato Laserdisc disfruta del mismo beneficio sin contacto con las señales ópticas analógicas. Los CD sufren de putrefacción y se degradan lentamente con el tiempo, incluso si se almacenan correctamente y no se reproducen. [15] M-DISC , una tecnología óptica grabable que se comercializa como legible durante 1000 años, está disponible en ciertos mercados, pero a finales de 2020 nunca se ha vendido en formato CD-R . (Sin embargo, el sonido se puede almacenar en un DVD-R M-DISC utilizando el formato DVD-Audio ).
En el caso de las señales de audio electrónicas, las fuentes de ruido incluyen ruido mecánico, eléctrico y térmico en el ciclo de grabación y reproducción. La cantidad de ruido que un equipo de audio añade a la señal original se puede cuantificar. Matemáticamente, esto se puede expresar mediante la relación señal/ruido (SNR o relación S/N). A veces, en su lugar, se indica el rango dinámico máximo posible del sistema.
En los sistemas digitales, la calidad de reproducción depende de los pasos de conversión de analógico a digital y de digital a analógico, y no de la calidad del medio de grabación, siempre que sea adecuado para retener los valores digitales sin errores. Los medios digitales capaces de almacenar y recuperar datos con una precisión de bits son algo habitual desde hace algún tiempo, ya que generalmente se desarrollaron para el almacenamiento de software que no tolera errores.
El proceso de conversión de analógico a digital, según la teoría, siempre introducirá distorsión de cuantificación. Esta distorsión se puede representar como ruido de cuantificación no correlacionado mediante el uso de dither . La magnitud de este ruido o distorsión está determinada por el número de niveles de cuantificación. En sistemas binarios, esto se determina y se expresa típicamente en términos del número de bits . Cada bit adicional agrega aproximadamente 6 dB en la relación señal/ruido posible (por ejemplo, 24 x 6 = 144 dB para cuantificación de 24 bits y 120 dB para 20 bits). El sistema digital de 16 bits del CD de audio Red Book tiene 2 16 = 65,536 amplitudes de señal posibles, lo que teóricamente permite una relación señal/ruido de 98 dB . [2] : 49
El ruido sordo es una forma de ruido característico causado por imperfecciones en los cojinetes de los tocadiscos. El plato tiende a tener una ligera cantidad de movimiento además de la rotación deseada y la superficie del tocadiscos también se mueve hacia arriba, hacia abajo y de lado a lado ligeramente. Este movimiento adicional se agrega a la señal deseada como ruido, generalmente de frecuencias muy bajas, creando un sonido retumbante durante los pasajes tranquilos. Los tocadiscos muy económicos a veces usan cojinetes de bolas , que es muy probable que generen cantidades audibles de ruido sordo. Los tocadiscos más caros tienden a usar cojinetes de manguito masivos , que es mucho menos probable que generen cantidades ofensivas de ruido sordo. El aumento de la masa del tocadiscos también tiende a conducir a una reducción del ruido sordo. Un buen tocadiscos debe tener un ruido sordo al menos 60 dB por debajo del nivel de salida especificado del captador. [16] : 79–82 Debido a que no tienen partes móviles en la ruta de la señal, los sistemas digitales no están sujetos a ruidos sordos.
El wow y el flutter son un cambio en la frecuencia de un dispositivo analógico y son el resultado de imperfecciones mecánicas. El wow es una forma de flutter que ocurre a un ritmo más lento. El wow y el flutter son más notorios en señales que contienen tonos puros. Para los discos de vinilo, la calidad del tocadiscos tendrá un gran efecto en el nivel de wow y flutter. Un buen tocadiscos tendrá valores de wow y flutter de menos del 0,05 %, que es la variación de velocidad con respecto al valor medio. [16] El wow y el flutter también pueden estar presentes en la grabación, como resultado del funcionamiento imperfecto de la grabadora. Debido al uso de osciladores de cristal de precisión para su base de tiempo , los sistemas digitales no están sujetos a wow y flutter.
En los sistemas digitales, el límite superior de la respuesta de frecuencia está determinado por la frecuencia de muestreo . La elección de la frecuencia de muestreo de la muestra en un sistema digital se basa en el teorema de muestreo de Nyquist-Shannon . Este establece que una señal muestreada se puede reproducir exactamente siempre que se muestree a una frecuencia mayor que el doble del ancho de banda de la señal, la frecuencia de Nyquist . Por lo tanto, una frecuencia de muestreo de 40 kHz es matemáticamente suficiente para capturar toda la información contenida en una señal que tenga componentes de frecuencia menores o iguales a 20 kHz. El teorema de muestreo también requiere que el contenido de frecuencia por encima de la frecuencia de Nyquist se elimine de la señal antes de muestrearla. Esto se logra utilizando filtros anti-aliasing que requieren una banda de transición para reducir suficientemente el aliasing. El ancho de banda proporcionado por la frecuencia de muestreo de 44.100 Hz utilizada por el estándar para CD de audio es lo suficientemente amplio como para cubrir todo el rango de audición humana , que se extiende aproximadamente de 20 Hz a 20 kHz. [2] : 108 Las grabadoras digitales profesionales pueden grabar frecuencias más altas, mientras que algunos sistemas de consumo y de telecomunicaciones graban un rango de frecuencia más restringido.
Algunos fabricantes de cintas analógicas especifican respuestas de frecuencia de hasta 20 kHz, pero estas mediciones pueden haberse realizado a niveles de señal más bajos. [16] Los casetes compactos pueden tener una respuesta que se extiende hasta 15 kHz a un nivel de grabación completo (0 dB). [17] A niveles más bajos (−10 dB), los casetes suelen estar limitados a 20 kHz debido al borrado automático del medio de cinta.
La respuesta de frecuencia de un reproductor de LP convencional puede ser de 20 Hz a 20 kHz, ±3 dB. La respuesta de baja frecuencia de los discos de vinilo está restringida por el ruido retumbante (descrito anteriormente), así como por las características físicas y eléctricas de todo el brazo de captación y el conjunto del transductor. La respuesta de alta frecuencia del vinilo depende del cartucho. Los discos CD4 contenían frecuencias de hasta 50 kHz. Se han recortado experimentalmente frecuencias de hasta 122 kHz en discos de LP. [18]
Los sistemas digitales requieren que todo el contenido de señal de alta frecuencia por encima de la frecuencia de Nyquist se elimine antes del muestreo, lo que, si no se hace, dará como resultado que estas frecuencias ultrasónicas se "dobleguen" en frecuencias en el rango audible, produciendo un tipo de distorsión llamada aliasing . El aliasing se evita en los sistemas digitales mediante un filtro anti-aliasing . Sin embargo, diseñar un filtro analógico que elimine con precisión todo el contenido de frecuencia exactamente por encima o por debajo de una cierta frecuencia de corte es poco práctico. [19] En cambio, generalmente se elige una frecuencia de muestreo que está por encima del requisito de Nyquist. Esta solución se llama sobremuestreo y permite utilizar un filtro anti-aliasing menos agresivo y de menor costo.
Los primeros sistemas digitales pueden haber sufrido una serie de degradaciones de señal relacionadas con el uso de filtros anti-aliasing analógicos, por ejemplo, dispersión temporal, distorsión no lineal , ondulación , dependencia de la temperatura de los filtros, etc. [20] : 8 Utilizando un diseño de sobremuestreo y modulación delta-sigma , un filtro anti-aliasing analógico menos agresivo se puede complementar con un filtro digital. [19] Este enfoque tiene varias ventajas ya que se puede hacer que el filtro digital tenga una función de transferencia de dominio de frecuencia casi ideal, con baja ondulación en banda y sin envejecimiento o deriva térmica. [20] : 18 Sin embargo, el filtro anti-aliasing digital puede introducir degradaciones debido a la respuesta del dominio del tiempo, particularmente a frecuencias de muestreo más bajas. [21] [22]
Los sistemas analógicos no están sujetos a un límite de Nyquist ni a un efecto de aliasing y, por lo tanto, no requieren filtros antialiasing ni ninguna de las consideraciones de diseño asociadas con ellos. En cambio, los límites de los formatos de almacenamiento analógicos están determinados por las propiedades físicas de su construcción.
El audio con calidad de CD se muestrea a 44.100 Hz ( frecuencia Nyquist = 22,05 kHz) y a 16 bits. El muestreo de la forma de onda a frecuencias más altas y la posibilidad de un mayor número de bits por muestra permiten reducir aún más el ruido y la distorsión. DAT puede muestrear audio a hasta 48 kHz, mientras que DVD-Audio puede tener 96 o 192 kHz y una resolución de hasta 24 bits. Con cualquiera de estas frecuencias de muestreo, la información de la señal se captura por encima de lo que generalmente se considera el rango de frecuencia de audición humana . Las frecuencias de muestreo más altas imponen menos restricciones en la implementación del filtro anti-aliasing, lo que puede dar como resultado una menor complejidad y una menor distorsión de la señal.
Un trabajo realizado en 1981 por Muraoka et al. [23] mostró que sólo unos pocos de los 176 sujetos de prueba distinguieron las señales musicales con componentes de frecuencia superiores a 20 kHz de las que no los tenían. [24] Un estudio perceptual de Nishiguchi et al. (2004) concluyó que "no se encontró ninguna diferencia significativa entre sonidos con y sin componentes de frecuencia muy alta entre los estímulos sonoros y los sujetos... sin embargo, [Nishiguchi et al] todavía no pueden confirmar ni negar la posibilidad de que algunos sujetos pudieran discriminar entre sonidos musicales con y sin componentes de frecuencia muy alta". [25]
En pruebas de escucha a ciegas realizadas por Bob Katz en 1996, relatadas en su libro Mastering Audio: The Art and the Science , los sujetos que usaban el mismo equipo de reproducción de alta frecuencia de muestreo no pudieron discernir ninguna diferencia audible entre el material del programa filtrado de manera idéntica para eliminar frecuencias por encima de 20 kHz frente a 40 kHz. Esto demuestra que la presencia o ausencia de contenido ultrasónico no explica la variación auditiva entre frecuencias de muestreo. Postula que la variación se debe en gran medida al rendimiento de los filtros limitadores de banda en los convertidores. Estos resultados sugieren que el principal beneficio de usar frecuencias de muestreo más altas es que empuja la distorsión de fase consecuente de los filtros limitadores de banda fuera del rango audible y que, en condiciones ideales, las frecuencias de muestreo más altas pueden no ser necesarias. [26] Dunn (1998) examinó el rendimiento de los convertidores digitales para ver si estas diferencias en el rendimiento podían explicarse por los filtros limitadores de banda utilizados en los convertidores y buscar los artefactos que introducen. [27]
Una señal se graba digitalmente mediante un convertidor analógico a digital , que mide la amplitud de una señal analógica a intervalos regulares especificados por la frecuencia de muestreo y luego almacena estos números muestreados en el hardware de la computadora. Los números en las computadoras representan un conjunto finito de valores discretos, lo que significa que si una señal analógica se muestrea digitalmente utilizando métodos nativos (sin tramado), la amplitud de la señal de audio simplemente se redondeará a la representación más cercana. Este proceso se llama cuantificación, y estos pequeños errores en las mediciones se manifiestan auditivamente como ruido de bajo nivel o distorsión. Esta forma de distorsión, a veces llamada distorsión granular o de cuantificación, se ha señalado como un fallo de algunos sistemas y grabaciones digitales, particularmente algunas grabaciones digitales tempranas, donde se decía que la versión digital era inferior a la versión analógica. [28] Sin embargo, "si la cuantificación se realiza utilizando el tramado correcto, entonces la única consecuencia de la digitalización es efectivamente la adición de un piso de ruido aleatorio benigno, no correlacionado y blanco. El nivel del ruido depende del número de bits en el canal". [9] : 6
El rango de valores posibles que se pueden representar numéricamente mediante una muestra está determinado por el número de dígitos binarios utilizados. Esto se denomina resolución y, en el contexto del audio PCM, se suele denominar profundidad de bits. El nivel de ruido de cuantificación está determinado directamente por este número, que disminuye exponencialmente (linealmente en unidades de dB) a medida que aumenta la resolución. Con una profundidad de bits adecuada, el ruido aleatorio de otras fuentes dominará y enmascarará por completo el ruido de cuantificación. El estándar Redbook CD utiliza 16 bits, lo que mantiene el ruido de cuantificación 96 dB por debajo de la amplitud máxima, muy por debajo de un nivel discernible con casi cualquier material fuente. [29] La adición de un tramado efectivo significa que, "en términos prácticos, la resolución está limitada por nuestra capacidad para resolver sonidos en el ruido... No tenemos problemas para medir (y escuchar) señales de -110 dB en un canal de 16 bits bien diseñado". [9] Los DVD-Audio y la mayoría de los equipos de grabación profesionales modernos permiten muestras de 24 bits.
Los sistemas analógicos no tienen necesariamente niveles digitales discretos en los que se codifica la señal. En consecuencia, la precisión con la que se puede conservar la señal original está limitada por el nivel de ruido intrínseco y el nivel máximo de señal del medio y del equipo de reproducción.
Dado que los medios analógicos están compuestos de moléculas , la estructura microscópica más pequeña representa la unidad de cuantificación más pequeña de la señal registrada. Los procesos de tramado naturales, como los movimientos térmicos aleatorios de las moléculas, el tamaño distinto de cero del instrumento de lectura y otros efectos de promediado, hacen que el límite práctico sea mayor que el de la característica estructural molecular más pequeña. Un LP teórico compuesto de diamante perfecto, con un tamaño de ranura de 8 micrones y un tamaño de característica de 0,5 nanómetros, tiene una cuantificación similar a una muestra digital de 16 bits. [6]
Es posible hacer que el ruido de cuantificación sea audiblemente benigno aplicando dither . Para ello, se añade ruido a la señal original antes de la cuantificación. El uso óptimo de dither tiene el efecto de hacer que el error de cuantificación sea independiente de la señal, [11] : 143 y permite que la información de la señal se conserve por debajo del bit menos significativo del sistema digital. [9] : 3
Los algoritmos de tramado también suelen tener una opción para emplear algún tipo de modelado de ruido , que empuja la frecuencia de gran parte del ruido de tramado a áreas que son menos audibles para los oídos humanos, reduciendo el nivel del ruido de fondo aparente para el oyente.
El tramado se aplica comúnmente durante la masterización antes de la reducción de profundidad de bits final, [26] y también en varias etapas del DSP .
Un aspecto que puede degradar el rendimiento de un sistema digital es el jitter . Este es el fenómeno de las variaciones en el tiempo con respecto a lo que debería ser el espaciado correcto de las muestras discretas de acuerdo con la frecuencia de muestreo. Esto puede deberse a imprecisiones de sincronización del reloj digital. Idealmente, un reloj digital debería producir un pulso de sincronización a intervalos exactamente regulares. Otras fuentes de jitter dentro de los circuitos electrónicos digitales son el jitter inducido por datos, donde una parte del flujo digital afecta a una parte posterior a medida que fluye a través del sistema, y el jitter inducido por la fuente de alimentación, donde el ruido de la fuente de alimentación causa irregularidades en la sincronización de las señales en los circuitos que alimenta.
La precisión de un sistema digital depende de los valores de amplitud muestreados, pero también de la regularidad temporal de estos valores. Las versiones analógicas de esta dependencia temporal se conocen como error de tono y fluctuación y fluctuación.
La fluctuación periódica produce ruido de modulación y puede considerarse equivalente a la fluctuación analógica. [30] La fluctuación aleatoria altera el nivel de ruido del sistema digital. La sensibilidad del convertidor a la fluctuación depende del diseño del convertidor. [11] Se ha demostrado que una fluctuación aleatoria de 5 ns puede ser significativa para sistemas digitales de 16 bits. [30]
En 1998, Benjamin y Gannon investigaron la audibilidad del jitter utilizando pruebas de escucha. [11] : 34 Encontraron que el nivel más bajo de jitter audible era alrededor de 10 ns ( rms ). Esto fue en una señal de prueba de onda sinusoidal de 17 kHz . Con música, ningún oyente encontró jitter audible en niveles inferiores a 20 ns. Un artículo de Ashihara et al. (2005) intentó determinar los umbrales de detección para jitter aleatorio en señales musicales. Su método implicó pruebas de escucha ABX . Al discutir sus resultados, los autores comentaron que:
Hasta el momento, el jitter real en los productos de consumo parece ser demasiado pequeño para ser detectado al menos para la reproducción de señales musicales. Sin embargo, no está claro si los umbrales de detección obtenidos en el presente estudio realmente representarían el límite de la resolución auditiva o estarían limitados por la resolución del equipo. Las distorsiones debidas a un jitter muy pequeño pueden ser menores que las distorsiones debidas a las características no lineales de los altavoces. Ashihara y Kiryu [8] evaluaron la linealidad de los altavoces y los auriculares. Según su observación, los auriculares parecen ser más preferibles para producir suficiente presión sonora en los tímpanos con distorsiones menores que los altavoces. [31]
Después de la grabación inicial, es común que la señal de audio se altere de alguna manera, como con el uso de compresión , ecualización , retardos y reverberación . Con la tecnología analógica, esto se realiza en forma de componentes de hardware externos y, con la tecnología digital, lo mismo se logra normalmente con complementos en una estación de trabajo de audio digital (DAW).
Una comparación entre el filtrado analógico y el digital muestra las ventajas técnicas de ambos métodos. Los filtros digitales son más precisos y flexibles. Los filtros analógicos son más simples, pueden ser más eficientes y no introducen latencia.
Al alterar una señal con un filtro, la señal de salida puede diferir en el tiempo de la señal de entrada, que se mide como su respuesta de fase . Todos los ecualizadores analógicos muestran este comportamiento, con la cantidad de cambio de fase que difiere en algún patrón y se centra alrededor de la banda que se está ajustando. Aunque este efecto altera la señal de una manera distinta a un cambio estricto en la respuesta de frecuencia, por lo general no es objetable para los oyentes. [32]
Debido a que las variables involucradas se pueden especificar con precisión en los cálculos, se puede lograr que los filtros digitales funcionen objetivamente mejor que los componentes analógicos. [3] [33] Otros procesamientos como el retardo y la mezcla se pueden realizar con exactitud.
Los filtros digitales también son más versátiles. Por ejemplo, el ecualizador de fase lineal no introduce un desplazamiento de fase dependiente de la frecuencia. Este filtro se puede implementar digitalmente utilizando un filtro de respuesta de impulso finito , pero no tiene una implementación práctica utilizando componentes analógicos.
Una ventaja práctica del procesamiento digital es la mayor comodidad para recuperar los ajustes. Los parámetros de los plug-ins se pueden almacenar en el ordenador, mientras que los detalles de los parámetros de una unidad analógica deben escribirse o registrarse de otro modo si es necesario reutilizar la unidad. Esto puede resultar complicado cuando se deben recuperar manualmente mezclas enteras utilizando una consola analógica y un equipo externo. Cuando se trabaja digitalmente, todos los parámetros se pueden almacenar simplemente en un archivo de proyecto de DAW y recuperarse al instante. La mayoría de las DAW profesionales modernas también procesan plug-ins en tiempo real, lo que significa que el procesamiento puede ser en gran medida no destructivo hasta la mezcla final.
Actualmente existen muchos plug-ins que incorporan modelado analógico. Hay ingenieros de audio que los avalan y consideran que se comparan en sonido con los procesos analógicos que imitan. El modelado analógico conlleva algunas ventajas sobre sus contrapartes analógicas, como la capacidad de eliminar el ruido de los algoritmos y modificaciones para hacer que los parámetros sean más flexibles. Por otro lado, otros ingenieros también consideran que el modelado sigue siendo inferior a los componentes externos genuinos y aún prefieren mezclar "fuera de la caja". [34]
La evaluación subjetiva intenta medir el rendimiento de un componente de audio según el oído humano. La forma más común de prueba subjetiva es una prueba de escucha, en la que el componente de audio simplemente se utiliza en el contexto para el que fue diseñado. Esta prueba es popular entre los revisores de alta fidelidad, en la que el componente se utiliza durante un período de tiempo por el revisor que luego describe el rendimiento en términos subjetivos. Las descripciones comunes incluyen si el componente tiene un sonido brillante o cálido , o qué tan bien el componente logra presentar una imagen espacial .
Otro tipo de prueba subjetiva se realiza en condiciones más controladas e intenta eliminar posibles sesgos de las pruebas de escucha. Este tipo de pruebas se realizan con el componente oculto al oyente y se denominan pruebas a ciegas . Para evitar posibles sesgos por parte de la persona que realiza la prueba, la prueba a ciegas puede realizarse de modo que esta persona tampoco sea consciente del componente que se está probando. Este tipo de prueba se denomina prueba doble ciego. Este tipo de prueba se utiliza a menudo para evaluar el rendimiento de la compresión de audio con pérdida .
Los críticos de las pruebas doble ciego consideran que no permiten que el oyente se relaje por completo al evaluar el componente del sistema y, por lo tanto, no puede juzgar las diferencias entre los diferentes componentes tan bien como en las pruebas para personas videntes (no ciegas). Quienes emplean el método de prueba doble ciego pueden intentar reducir el estrés del oyente permitiéndole una cierta cantidad de tiempo para el entrenamiento del oyente. [35]
Las primeras máquinas de audio digital tuvieron resultados decepcionantes, ya que los convertidores digitales introducían errores que el oído podía detectar. [36] Las compañías discográficas lanzaron sus primeros LP basados en masters de audio digital a fines de la década de 1970. Los CD estuvieron disponibles a principios de la década de 1980. En ese momento, la reproducción de sonido analógico era una tecnología madura .
Las primeras grabaciones digitales publicadas en CD tuvieron una respuesta crítica mixta. En comparación con los discos de vinilo, se observó que el CD revelaba mucho más la acústica y el ruido ambiental de fondo del entorno de grabación. [37] Por este motivo, las técnicas de grabación desarrolladas para discos analógicos, por ejemplo, la colocación de micrófonos, tuvieron que adaptarse para adecuarse al nuevo formato digital. [37]
Algunas grabaciones analógicas fueron remasterizadas para formatos digitales. Las grabaciones analógicas realizadas en una acústica natural de sala de conciertos tendían a beneficiarse de la remasterización. [38] El proceso de remasterización fue criticado ocasionalmente por ser mal manejado. Cuando la grabación analógica original era bastante brillante, la remasterización a veces daba como resultado un énfasis de agudos poco natural. [38]
El formato Super Audio CD (SACD) fue creado por Sony y Philips , quienes también fueron los desarrolladores del anterior formato estándar de CD de audio. SACD utiliza Direct Stream Digital (DSD) basado en modulación delta-sigma . Mediante esta técnica, los datos de audio se almacenan como una secuencia de valores de amplitud fija (es decir, 1 bit) a una frecuencia de muestreo de 2,884 MHz, que es 64 veces la frecuencia de muestreo de 44,1 kHz utilizada por CD. En cualquier momento, la amplitud de la señal analógica original está representada por la densidad de 1 o 0 en el flujo de datos. Por lo tanto, este flujo de datos digitales se puede convertir a analógico pasándolo a través de un filtro de paso bajo analógico.
El formato DVD-Audio utiliza PCM lineal estándar a frecuencias de muestreo y profundidades de bits variables, que como mínimo igualan y generalmente superan ampliamente las del audio CD estándar (16 bits, 44,1 kHz).
En la prensa popular de alta fidelidad, se había sugerido que el PCM lineal "crea [una] reacción de estrés en las personas", y que el DSD "es el único sistema de grabación digital que no [...] tiene estos efectos". [39] Esta afirmación parece tener su origen en un artículo de 1980 del Dr. John Diamond . [40] El núcleo de la afirmación de que las grabaciones PCM (la única técnica de grabación digital disponible en ese momento) creaban una reacción de estrés se basaba en el uso de la técnica pseudocientífica de la kinesiología aplicada , por ejemplo, por el Dr. Diamond en una presentación de la 66.ª Convención de la AES (1980) con el mismo título. [41] Diamond había utilizado anteriormente una técnica similar para demostrar que la música rock (a diferencia de la clásica) era mala para la salud debido a la presencia del "ritmo anapéstico detenido". [42] Las afirmaciones de Diamond con respecto al audio digital fueron retomadas por Mark Levinson , quien afirmó que, si bien las grabaciones PCM producían una reacción de estrés, las grabaciones DSD no. [43] [44] [45] Sin embargo, una prueba subjetiva a doble ciego entre PCM lineal de alta resolución (DVD-Audio) y DSD no reveló una diferencia estadísticamente significativa. Los oyentes que participaron en esta prueba notaron su gran dificultad para escuchar cualquier diferencia entre los dos formatos. [46]
El resurgimiento del vinilo se debe en parte a la imperfección del audio analógico, que añade "calidez". [47] Algunos oyentes prefieren este tipo de audio al de un CD. El fundador y editor de la revista The Absolute Sound , Harry Pearson, dice que "los LP son decididamente más musicales. Los CD drenan el alma de la música. La implicación emocional desaparece". El productor de dub Adrian Sherwood tiene sentimientos similares sobre la cinta de casete analógica, que prefiere por su sonido "más cálido". [48]
Los partidarios del formato digital señalan los resultados de pruebas a ciegas, que demuestran el alto rendimiento posible con las grabadoras digitales. [49] La afirmación es que el "sonido analógico" es más un producto de las imprecisiones del formato analógico que cualquier otra cosa. Uno de los primeros y mayores partidarios del audio digital fue el director de orquesta clásico Herbert von Karajan , que dijo que la grabación digital era "definitivamente superior a cualquier otra forma de grabación que conocemos". También fue pionero del fracasado Digital Compact Cassette y dirigió la primera grabación que se lanzó comercialmente en CD: Eine Alpensinfonie de Richard Strauss . La percepción de que el audio analógico fuera demostrablemente superior también fue puesta en duda por los analistas musicales tras las revelaciones de que el sello audiófilo Mobile Fidelity Sound Lab había estado utilizando de forma encubierta archivos Direct Stream Digital para producir lanzamientos de vinilo comercializados como procedentes de cintas maestras analógicas, y el abogado y audiófilo Randy Braun afirmó que "Estas personas que afirman tener oídos de oro y pueden oír la diferencia entre lo analógico y lo digital, bueno, resulta que no pueden". [50] [51]
Aunque las palabras audio analógico suelen implicar que el sonido se describe utilizando un enfoque de señal continua, y las palabras audio digital implican un enfoque discreto, existen métodos de codificación de audio que se encuentran en algún punto intermedio entre los dos. De hecho, todos los sistemas analógicos muestran un comportamiento discreto (cuantificado) a escala microscópica. [52] Mientras que los discos de vinilo y los casetes compactos comunes son medios analógicos y utilizan métodos de codificación física cuasi-lineales (por ejemplo, profundidad de surco en espiral, intensidad del campo magnético de la cinta ) sin cuantificación o aliasing perceptibles, existen sistemas analógicos no lineales que exhiben efectos similares a los encontrados en los digitales, como aliasing y pisos dinámicos "duros" (por ejemplo, audio de alta fidelidad modulado en frecuencia en cintas de video, señales codificadas PWM ).
un sistema de 16 bits proporciona una relación señal-ruido teórica de 98 dB.
Relación señal/ruido NAB (pista de 2,0 mm y dos pistas de 1/4 de pulgada, RMS, ponderación A) 30 ips - 75 dB
{{cite conference}}
: Mantenimiento de CS1: postscript ( enlace ){{cite conference}}
: Mantenimiento de CS1: postscript ( enlace )