En el análisis de Fourier, el cepstrum (/ˈkɛpstrʌm, ˈsɛp-, -strəm / ; plural cepstra , adjetivo cepstral ) es el resultado de calcular la transformada inversa de Fourier ( IFT ) del logaritmo del espectro de señal estimado . El método es una herramienta para investigar estructuras periódicas en espectros de frecuencia . El cepstrum de potencia tiene aplicaciones en el análisis del habla humana .
El término cepstrum se derivó de la inversión de las primeras cuatro letras de spectrum . Las operaciones sobre cepstra se denominan análisis de quefrencia (o alanysis de quefrencia [1] ), liftingering o análisis cepstral . Puede pronunciarse de las dos formas indicadas, la segunda tiene la ventaja de evitar la confusión con kepstrum .
El concepto de cepstrum fue introducido en 1963 por BP Bogert, MJ Healy y JW Tukey . [1] Sirve como herramienta para investigar estructuras periódicas en espectros de frecuencia. [2] Dichos efectos están relacionados con ecos o reflexiones perceptibles en la señal, o con la aparición de frecuencias armónicas ( parciales , sobretonos ). Matemáticamente se ocupa del problema de la deconvolución de señales en el espacio de frecuencia. [3]
Las referencias al artículo de Bogert en una bibliografía suelen editarse de forma incorrecta. [ cita requerida ] Los términos "quefrency", "alanysis", "cepstrum" y "saphe" fueron inventados por los autores reorganizando las letras de frecuencia, análisis, espectro y fase. Los términos inventados se definen de forma análoga a los términos más antiguos.
El cepstrum es el resultado de la siguiente secuencia de operaciones matemáticas:
El cepstrum se utiliza en muchas variantes. Las más importantes son:
Las siguientes abreviaturas se utilizan en las fórmulas para explicar el cepstrum:
Abreviatura | Explicación |
---|---|
Señal, que es una función del tiempo | |
Cepstro | |
Transformada de Fourier : La abreviatura puede significar, por ejemplo, una transformada de Fourier continua , una transformada de Fourier discreta (DFT) o incluso una transformada z , ya que la transformada z es una generalización de la DFT. [3] | |
Inversa de la transformada de Fourier | |
Logaritmo de x . La elección de la base b depende del usuario. En algunos artículos no se especifica la base, otros prefieren la base 10 o e . La elección de la base no tiene impacto en las reglas básicas de cálculo, pero a veces la base e lleva a simplificaciones (ver "cepstrum complejo"). | |
Valor absoluto , o magnitud de un valor complejo , que se calcula a partir de la parte real e imaginaria utilizando el teorema de Pitágoras . | |
Cuadrado absoluto | |
Ángulo de fase de un valor complejo |
El "cepstrum" se definió originalmente como cepstrum de potencia mediante la siguiente relación: [1] [3]
El cepstrum de potencia tiene aplicaciones principales en el análisis de señales sonoras y vibratorias. Es una herramienta complementaria al análisis espectral. [2]
A veces también se define como: [2]
Debido a esta fórmula, el cepstrum también se denomina a veces espectro de un espectro . Se puede demostrar que ambas fórmulas son coherentes entre sí, ya que la distribución espectral de frecuencias sigue siendo la misma, siendo la única diferencia un factor de escala [2] que se puede aplicar posteriormente. Algunos artículos prefieren la segunda fórmula. [2] [4]
Son posibles otras notaciones debido al hecho de que el logaritmo del espectro de potencia es igual al logaritmo del espectro si se aplica un factor de escala 2: [5]
y por lo tanto:
que proporciona una relación con el cepstrum real (ver más abajo).
Además, debe tenerse en cuenta que la operación de cuadratura final en la fórmula para el espectro de potencia a veces se considera innecesaria [3] y, por lo tanto, a veces se omite. [4] [2]
El cepstrum real está directamente relacionado con el cepstrum de potencia:
Se deriva del cepstrum complejo (definido a continuación) descartando la información de fase (contenida en la parte imaginaria del logaritmo complejo ). [4] Se centra en los efectos periódicos en las amplitudes del espectro: [6]
El cepstrum complejo fue definido por Oppenheim en su desarrollo de la teoría de sistemas homomórficos. [7] [8] La fórmula también se proporciona en otra literatura. [2]
Como es complejo, el término logarítmico también se puede escribir como un producto de magnitud y fase, y posteriormente como una suma. Una simplificación adicional es obvia, si log es un logaritmo natural con base e :
Por lo tanto: El cepstrum complejo también se puede escribir como: [9]
El cepstrum complejo conserva la información sobre la fase, por lo que siempre es posible volver del dominio de la quefrencia al dominio del tiempo mediante la operación inversa: [2] [3]
donde b es la base del logaritmo utilizado.
La principal aplicación es la modificación de la señal en el dominio de la frecuencia de quefrecuencia (liftering) como una operación análoga al filtrado en el dominio de la frecuencia espectral. [2] [3] Un ejemplo es la supresión de efectos de eco mediante la supresión de ciertas frecuencias de quefrecuencia. [2]
El cepstrum de fase (después del espectro de fase ) está relacionado con el cepstrum complejo como
La variable independiente de un grafo cepstral se denomina quefrency . [10] La quefrency es una medida de tiempo, aunque no en el sentido de una señal en el dominio del tiempo . Por ejemplo, si la frecuencia de muestreo de una señal de audio es 44100 Hz y hay un pico grande en el cepstrum cuya quefrency es 100 muestras, el pico indica la presencia de una frecuencia fundamental que es 44100/100 = 441 Hz. Este pico ocurre en el cepstrum porque los armónicos en el espectro son periódicos y el período corresponde a la frecuencia fundamental, ya que los armónicos son múltiplos enteros de la frecuencia fundamental. [11]
El kepstrum , que significa "respuesta temporal de la serie de potencias de la ecuación de Kolmogorov", es similar al cepstrum y tiene con él la misma relación que el valor esperado con el promedio estadístico, es decir, el cepstrum es la cantidad medida empíricamente, mientras que el kepstrum es la cantidad teórica. Se utilizaba antes del cepstrum. [12] [13]
El autocepstrum se define como el cepstrum de la autocorrelación . El autocepstrum es más preciso que el cepstrum en el análisis de datos con ecos.
Siguiendo con el tema del anagrama, un filtro que opera sobre un cepstrum podría llamarse elevador . Un elevador de paso bajo es similar a un filtro de paso bajo en el dominio de frecuencia . Se puede implementar multiplicando por una ventana en el dominio de frecuencia y luego convirtiendo nuevamente al dominio de frecuencia, lo que da como resultado una señal modificada, es decir, con un eco de señal reducido.
El cepstrum puede considerarse como una fuente de información sobre la tasa de cambio en las diferentes bandas del espectro. Fue inventado originalmente para caracterizar los ecos sísmicos resultantes de terremotos y explosiones de bombas . También se ha utilizado para determinar la frecuencia fundamental del habla humana y para analizar los retornos de señales de radar . La determinación del tono mediante el cepstrum es particularmente eficaz porque los efectos de la excitación vocal (tono) y del tracto vocal (formantes) son aditivos en el logaritmo del espectro de potencia y, por lo tanto, están claramente separados. [14]
El cepstrum es una representación utilizada en el procesamiento de señales homomórficas , para convertir señales combinadas por convolución (como una fuente y un filtro) en sumas de sus cepstra, para la separación lineal. En particular, el cepstrum de potencia se utiliza a menudo como un vector de características para representar la voz humana y las señales musicales. Para estas aplicaciones, el espectro generalmente se transforma primero utilizando la escala mel . El resultado se llama cepstrum de frecuencia mel o MFC (sus coeficientes se denominan coeficientes cepstrales de frecuencia mel o MFCC). Se utiliza para la identificación de voz, la detección de tono y mucho más. El cepstrum es útil en estas aplicaciones porque la excitación periódica de baja frecuencia de las cuerdas vocales y el filtrado de formantes del tracto vocal , que convolucionan en el dominio del tiempo y se multiplican en el dominio de la frecuencia , son aditivos y en diferentes regiones en el dominio de la quefrencia.
Tenga en cuenta que no se puede utilizar una onda sinusoidal pura para probar el cepstrum y determinar su tono a partir de la quefrencia, ya que una onda sinusoidal pura no contiene armónicos y no genera picos de quefrencia. En su lugar, se debe utilizar una señal de prueba que contenga armónicos (como la suma de al menos dos senos donde el segundo seno es algún armónico (múltiplo) del primer seno, o mejor, una señal con una forma de onda cuadrada o triangular, ya que dichas señales proporcionan muchos sobretonos en el espectro).
Una propiedad importante del dominio cepstral es que la convolución de dos señales se puede expresar como la suma de sus cepstra complejos:
El concepto de cepstrum ha dado lugar a numerosas aplicaciones: [2] [3]
Recientemente, se ha utilizado la deconvolución basada en cepstrum en señales de electromiografía de superficie, para eliminar el efecto del tren de impulsos estocásticos, que origina una señal sEMG , del espectro de potencia de la propia señal sEMG. De esta manera, solo se mantuvo la información sobre la forma y amplitud del potencial de acción de la unidad motora (MUAP), que luego se utilizó para estimar los parámetros de un modelo de dominio temporal del propio MUAP. [15]
En la década de 1960, Schroeder y Noll propusieron un análisis de cepstrum de corto plazo para su aplicación en la determinación del tono del habla humana. [16] [17] [14]
{{cite book}}
: |work=
ignorado ( ayuda )