Cepstro

Concepto en el análisis de Fourier

En el análisis de Fourier, el cepstrum (/ˈkɛpstrʌm, ˈsɛp-, -strəm / ; plural cepstra , adjetivo cepstral ) es el resultado de calcular la transformada inversa de Fourier ( IFT ) del logaritmo del espectro de señal estimado . El método es una herramienta para investigar estructuras periódicas en espectros de frecuencia . El cepstrum de potencia tiene aplicaciones en el análisis del habla humana .

El término cepstrum se derivó de la inversión de las primeras cuatro letras de spectrum . Las operaciones sobre cepstra se denominan análisis de quefrencia (o alanysis de quefrencia [1] ), liftingering o análisis cepstral . Puede pronunciarse de las dos formas indicadas, la segunda tiene la ventaja de evitar la confusión con kepstrum .

Pasos en la formación del cepstrum a partir de la historia del tiempo

Origen

El concepto de cepstrum fue introducido en 1963 por BP Bogert, MJ Healy y JW Tukey . [1] Sirve como herramienta para investigar estructuras periódicas en espectros de frecuencia. [2] Dichos efectos están relacionados con ecos o reflexiones perceptibles en la señal, o con la aparición de frecuencias armónicas ( parciales , sobretonos ). Matemáticamente se ocupa del problema de la deconvolución de señales en el espacio de frecuencia. [3]

Las referencias al artículo de Bogert en una bibliografía suelen editarse de forma incorrecta. [ cita requerida ] Los términos "quefrency", "alanysis", "cepstrum" y "saphe" fueron inventados por los autores reorganizando las letras de frecuencia, análisis, espectro y fase. Los términos inventados se definen de forma análoga a los términos más antiguos.

Definición general

El cepstrum es el resultado de la siguiente secuencia de operaciones matemáticas:

  • transformación de una señal del dominio del tiempo al dominio de la frecuencia
  • Cálculo del logaritmo de la amplitud espectral.
  • transformación al dominio de la frecuencia, donde la variable independiente final, la quefrencia, tiene una escala de tiempo. [1] [2] [3]

Tipos

El cepstrum se utiliza en muchas variantes. Las más importantes son:

  • cepstrum de potencia: El logaritmo se toma del "espectro de potencia"
  • cepstrum complejo: El logaritmo se toma del espectro, que se calcula mediante análisis de Fourier

Las siguientes abreviaturas se utilizan en las fórmulas para explicar el cepstrum:

AbreviaturaExplicación
F ( a ) {\displaystyle f(t)} Señal, que es una función del tiempo
do {\estilo de visualización C} Cepstro
F {\displaystyle {\mathcal {F}}} Transformada de Fourier : La abreviatura puede significar, por ejemplo, una transformada de Fourier continua , una transformada de Fourier discreta (DFT) o incluso una transformada z , ya que la transformada z es una generalización de la DFT. [3]
F 1 {\displaystyle {\mathcal {F}}^{-1}} Inversa de la transformada de Fourier
registro ( incógnita ) {\displaystyle \log(x)} Logaritmo de x . La elección de la base b depende del usuario. En algunos artículos no se especifica la base, otros prefieren la base 10 o  e . La elección de la base no tiene impacto en las reglas básicas de cálculo, pero a veces la base e lleva a simplificaciones (ver "cepstrum complejo").
| incógnita | {\displaystyle \izquierda|x\derecha|} Valor absoluto , o magnitud de un valor complejo , que se calcula a partir de la parte real e imaginaria utilizando el teorema de Pitágoras .
| incógnita | 2 {\displaystyle \izquierda|x\derecha|^{2}} Cuadrado absoluto
φ {\estilo de visualización \varphi} Ángulo de fase de un valor complejo

Cepstrum de poder

El "cepstrum" se definió originalmente como cepstrum de potencia mediante la siguiente relación: [1] [3]

do pag = | F 1 { registro ( | F { F ( a ) } | 2 ) } | 2 {\displaystyle C_{p}=\left|{\mathcal {F}}^{-1}\left\{\log \left(\left|{\mathcal {F}}\{f(t)\}\right|^{2}\right)\right\}\right|^{2}}

El cepstrum de potencia tiene aplicaciones principales en el análisis de señales sonoras y vibratorias. Es una herramienta complementaria al análisis espectral. [2]

A veces también se define como: [2]

do pag = | F { registro ( | F { F ( a ) } | 2 ) } | 2 {\displaystyle C_{p}=\left|{\mathcal {F}}\left\{\log \left(\left|{\mathcal {F}}\{f(t)\}\right|^{2}\right)\right\}\right|^{2}}

Debido a esta fórmula, el cepstrum también se denomina a veces espectro de un espectro . Se puede demostrar que ambas fórmulas son coherentes entre sí, ya que la distribución espectral de frecuencias sigue siendo la misma, siendo la única diferencia un factor de escala [2] que se puede aplicar posteriormente. Algunos artículos prefieren la segunda fórmula. [2] [4]

Son posibles otras notaciones debido al hecho de que el logaritmo del espectro de potencia es igual al logaritmo del espectro si se aplica un factor de escala 2: [5]

registro | F | 2 = 2 registro | F | {\displaystyle \log |{\mathcal {F}}|^{2}=2\log |{\mathcal {F}}|}

y por lo tanto:

do pag = | F 1 { 2 registro | F | } | 2 ,  o {\displaystyle C_{p}=\left|{\mathcal {F}}^{-1}\left\{2\log |{\mathcal {F}}|\right\}\right|^{2},{\text{ o}}}
do pag = 4 | F 1 { registro | F | } | 2 , {\displaystyle C_{p}=4\cdot \left|{\mathcal {F}}^{-1}\left\{\log |{\mathcal {F}}|\right\}\right|^{2},}

que proporciona una relación con el cepstrum real (ver más abajo).

Además, debe tenerse en cuenta que la operación de cuadratura final en la fórmula para el espectro de potencia a veces se considera innecesaria [3] y, por lo tanto, a veces se omite. [4] [2] do pag {\displaystyle C_{p}}

El cepstrum real está directamente relacionado con el cepstrum de potencia:

do pag = 4 do a 2 {\displaystyle C_{p}=4\cdot C_{r}^{2}}

Se deriva del cepstrum complejo (definido a continuación) descartando la información de fase (contenida en la parte imaginaria del logaritmo complejo ). [4] Se centra en los efectos periódicos en las amplitudes del espectro: [6]

do a = F 1 { registro ( | F { F ( a ) } | ) } {\displaystyle C_{r}={\mathcal {F}}^{-1}\left\{\log({\mathcal {|{\mathcal {F}}\{f(t)\}|}})\right\}}

Cepstrum complejo

El cepstrum complejo fue definido por Oppenheim en su desarrollo de la teoría de sistemas homomórficos. [7] [8] La fórmula también se proporciona en otra literatura. [2]

do do = F 1 { registro ( F { F ( a ) } ) } {\displaystyle C_{c}={\mathcal {F}}^{-1}\left\{\log({\mathcal {F}}\{f(t)\})\right\}}

Como es complejo, el término logarítmico también se puede escribir como un producto de magnitud y fase, y posteriormente como una suma. Una simplificación adicional es obvia, si log es un logaritmo natural con base  e : F {\displaystyle {\mathcal {F}}} F {\displaystyle {\mathcal {F}}}

registro ( F ) = registro ( | F | mi i φ ) {\displaystyle \log({\mathcal {F}})=\log({\mathcal {|F|\cdot e^{i\varphi }}})}
registro mi ( F ) = registro mi ( | F | ) + registro mi ( mi i φ ) = registro mi ( | F | ) + i φ {\displaystyle \log _{e}({\mathcal {F}})=\log _{e}({\mathcal {|F|}})+\log _{e}(e^{i\varphi })=\log _{e}({\mathcal {|F|}})+i\varphi }

Por lo tanto: El cepstrum complejo también se puede escribir como: [9]

do do = F 1 { registro mi ( | F | ) + i φ } {\displaystyle C_{c}={\mathcal {F}}^{-1}\left\{\log _{e}({\mathcal {|F|}})+i\varphi \right\}}

El cepstrum complejo conserva la información sobre la fase, por lo que siempre es posible volver del dominio de la quefrencia al dominio del tiempo mediante la operación inversa: [2] [3]

F ( a ) = F 1 { b ( F { do do } ) } , {\displaystyle f(t)={\mathcal {F}}^{-1}\left\{b^{\left({\mathcal {F}}\{C_{c}\}\right)}\right\},}

donde b es la base del logaritmo utilizado.

La principal aplicación es la modificación de la señal en el dominio de la frecuencia de quefrecuencia (liftering) como una operación análoga al filtrado en el dominio de la frecuencia espectral. [2] [3] Un ejemplo es la supresión de efectos de eco mediante la supresión de ciertas frecuencias de quefrecuencia. [2]

El cepstrum de fase (después del espectro de fase ) está relacionado con el cepstrum complejo como

espectro de fase = (cepstrum complejo − inversión temporal del cepstrum complejo) 2 .

La variable independiente de un grafo cepstral se denomina quefrency . [10] La quefrency es una medida de tiempo, aunque no en el sentido de una señal en el dominio del tiempo . Por ejemplo, si la frecuencia de muestreo de una señal de audio es 44100 Hz y hay un pico grande en el cepstrum cuya quefrency es 100 muestras, el pico indica la presencia de una frecuencia fundamental que es 44100/100 = 441 Hz. Este pico ocurre en el cepstrum porque los armónicos en el espectro son periódicos y el período corresponde a la frecuencia fundamental, ya que los armónicos son múltiplos enteros de la frecuencia fundamental. [11]

El kepstrum , que significa "respuesta temporal de la serie de potencias de la ecuación de Kolmogorov", es similar al cepstrum y tiene con él la misma relación que el valor esperado con el promedio estadístico, es decir, el cepstrum es la cantidad medida empíricamente, mientras que el kepstrum es la cantidad teórica. Se utilizaba antes del cepstrum. [12] [13]

El autocepstrum se define como el cepstrum de la autocorrelación . El autocepstrum es más preciso que el cepstrum en el análisis de datos con ecos.

Siguiendo con el tema del anagrama, un filtro que opera sobre un cepstrum podría llamarse elevador . Un elevador de paso bajo es similar a un filtro de paso bajo en el dominio de frecuencia . Se puede implementar multiplicando por una ventana en el dominio de frecuencia y luego convirtiendo nuevamente al dominio de frecuencia, lo que da como resultado una señal modificada, es decir, con un eco de señal reducido.

Interpretación

El cepstrum puede considerarse como una fuente de información sobre la tasa de cambio en las diferentes bandas del espectro. Fue inventado originalmente para caracterizar los ecos sísmicos resultantes de terremotos y explosiones de bombas . También se ha utilizado para determinar la frecuencia fundamental del habla humana y para analizar los retornos de señales de radar . La determinación del tono mediante el cepstrum es particularmente eficaz porque los efectos de la excitación vocal (tono) y del tracto vocal (formantes) son aditivos en el logaritmo del espectro de potencia y, por lo tanto, están claramente separados. [14]

El cepstrum es una representación utilizada en el procesamiento de señales homomórficas , para convertir señales combinadas por convolución (como una fuente y un filtro) en sumas de sus cepstra, para la separación lineal. En particular, el cepstrum de potencia se utiliza a menudo como un vector de características para representar la voz humana y las señales musicales. Para estas aplicaciones, el espectro generalmente se transforma primero utilizando la escala mel . El resultado se llama cepstrum de frecuencia mel o MFC (sus coeficientes se denominan coeficientes cepstrales de frecuencia mel o MFCC). Se utiliza para la identificación de voz, la detección de tono y mucho más. El cepstrum es útil en estas aplicaciones porque la excitación periódica de baja frecuencia de las cuerdas vocales y el filtrado de formantes del tracto vocal , que convolucionan en el dominio del tiempo y se multiplican en el dominio de la frecuencia , son aditivos y en diferentes regiones en el dominio de la quefrencia.

Tenga en cuenta que no se puede utilizar una onda sinusoidal pura para probar el cepstrum y determinar su tono a partir de la quefrencia, ya que una onda sinusoidal pura no contiene armónicos y no genera picos de quefrencia. En su lugar, se debe utilizar una señal de prueba que contenga armónicos (como la suma de al menos dos senos donde el segundo seno es algún armónico (múltiplo) del primer seno, o mejor, una señal con una forma de onda cuadrada o triangular, ya que dichas señales proporcionan muchos sobretonos en el espectro).

Una propiedad importante del dominio cepstral es que la convolución de dos señales se puede expresar como la suma de sus cepstra complejos:

incógnita 1 incógnita 2 incógnita 1 " + incógnita 2 " . {\displaystyle x_{1}*x_{2}\mapsto x'_{1}+x'_{2}.}

Aplicaciones

El concepto de cepstrum ha dado lugar a numerosas aplicaciones: [2] [3]

  • Manejo de inferencias de reflexión (radar, aplicaciones de sonar, sismología terrestre)
  • Estimación de la frecuencia fundamental del altavoz (tono)
  • Análisis y reconocimiento de voz
  • Aplicaciones médicas en el análisis del electroencefalograma (EEG) y de las ondas cerebrales.
  • Análisis de vibraciones de máquinas basado en patrones armónicos (fallos en cajas de cambios, fallos en álabes de turbinas, ...) [2] [4] [5]

Recientemente, se ha utilizado la deconvolución basada en cepstrum en señales de electromiografía de superficie, para eliminar el efecto del tren de impulsos estocásticos, que origina una señal sEMG , del espectro de potencia de la propia señal sEMG. De esta manera, solo se mantuvo la información sobre la forma y amplitud del potencial de acción de la unidad motora (MUAP), que luego se utilizó para estimar los parámetros de un modelo de dominio temporal del propio MUAP. [15]

En la década de 1960, Schroeder y Noll propusieron un análisis de cepstrum de corto plazo para su aplicación en la determinación del tono del habla humana. [16] [17] [14]

Referencias

  1. ^ abcd BP Bogert, MJR Healy y JW Tukey, The Quefrency Alanysis [ sic ] of Time Series for Echoes: Cepstrum, Pseudo Autocovariance, Cross-Cepstrum and Saphe Cracking , Actas del Simposio sobre Análisis de Series de Tiempo (M. Rosenblatt, Ed) Capítulo 15, 209-243. Nueva York: Wiley, 1963.
  2. ^ abcdefghijklm Norton, Michael Peter; Karczub, Denis (17 de noviembre de 2003). Fundamentos del análisis de ruido y vibraciones para ingenieros. Cambridge University Press. ISBN 0-521-49913-5.
  3. ^ abcdefgh DG Childers, DP Skinner, RC Kemerait, "El cepstrum: una guía para el procesamiento", Actas del IEEE , vol. 65, núm. 10, octubre de 1977, págs. 1428-1443.
  4. ^ abcd RB Randall: Análisis de cepstrum y diagnóstico de fallas en la caja de cambios, Notas de aplicación Brüel&Kjaer 233-80, Edición 2. (PDF)
  5. ^ del sistema de información Beckhoff: TF3600 TC3 Condition Monitoring: Monitorización de cajas de cambios (en línea, 4.4.2020).
  6. ^ "Cepstrum real y reconstrucción de fase mínima - MATLAB rceps".
  7. ^ AV Oppenheim, "Superposición en una clase de sistemas no lineales", Tesis doctoral, Res. Lab. Electronics, MIT 1965.
  8. ^ AV Oppenheim, RW Schafer, "Procesamiento de señales digitales", 1975 (Prentice Hall).
  9. ^ RB Randall:, "Una historia del análisis de cepstrum y su aplicación a problemas mecánicos", (PDF) en: Mechanical Systems and Signal Processing, Volumen 97, diciembre de 2017 (Elsevier).
  10. ^ Steinbuch, Karl W .; Weber, Wolfgang; Heinemann, Traute, eds. (1974) [1967]. Taschenbuch der Informatik - Band III - Anwendungen und spezielle Systeme der Nachrichtenverarbeitung (en alemán). vol. 3 (3 ed.). Berlín, Alemania: Springer Verlag . págs. 272-274. ISBN 3-540-06242-4. Número de LCCN  73-80607. {{cite book}}: |work=ignorado ( ayuda )
  11. ^ "Introducción - Cepstrum discreto". Support.ircam.fr. 1 de enero de 1990. Consultado el 16 de septiembre de 2022 .
  12. ^ "Descomposición predictiva de series temporales con aplicaciones a la exploración sísmica", informe de EA Robinson en el MIT, 1954; Geofísica, 1967, vol. 32, págs. 418-484;
    "Uso del kepstrum en el análisis de señales", MT Silvia y EA Robinson, Geoexploration, volumen 16, números 1-2, abril de 1978, páginas 55-73.
  13. ^ "Un enfoque kepstrum para el filtrado, suavizado y predicción con aplicación a la mejora del habla", TJ Moir y JF Barrett, Proc. Royal Society A, vol. 459, 2003, págs. 2957–2976.
  14. ^ ab A. Michael Noll (1967), “Determinación del tono del cepstrum”, Journal of the Acoustical Society of America, vol. 41, n.º 2, págs. 293–309.
  15. ^ G. Biagetti, P. Crippa, S. Orcioni y C. Turchetti, “Deconvolución homomórfica para estimación de muap a partir de señales EMG de superficie”, IEEE Journal of Biomedical and Health Informatics, vol. 21, n.º 2, págs. 328-338, marzo de 2017.
  16. ^ A. Michael Noll y Manfred R. Schroeder , "Detección de tono de 'Cepstrum' en tiempos cortos", (resumen) Journal of the Acoustical Society of America, vol. 36, n.º 5, pág. 1030
  17. ^ A. Michael Noll (1964), “Técnicas de espectro de tiempo corto y cepstrum para la detección del tono vocal”, Journal of the Acoustical Society of America, vol. 36, n.º 2, págs. 296-302.

Lectura adicional

  • Childers, DG; Skinner, DP; Kemerait, RC (1977). "El cepstrum: una guía para el procesamiento". Actas del IEEE . 65 (10). Instituto de Ingenieros Eléctricos y Electrónicos (IEEE): 1428–1443. Bibcode :1977IEEEP..65.1428C. doi :10.1109/proc.1977.10747. ISSN  0018-9219. S2CID  6108941.
  • Oppenheim, AV; Schafer, RW (2004). "Historia de Dsp - De la frecuencia a la quefrencia: una historia del cepstrum". Revista IEEE de procesamiento de señales . 21 (5). Instituto de Ingenieros Eléctricos y Electrónicos (IEEE): 95–106. Bibcode :2004ISPM...21...95O. doi :10.1109/msp.2004.1328092. ISSN  1053-5888. S2CID  1162306.
  • "Análisis de la señal de voz"
  • "Análisis del habla: análisis cepstral frente a análisis LPC", www.advsolned.com
  • "Un tutorial sobre Cepstrum y LPCC"
Obtenido de "https://es.wikipedia.org/w/index.php?title=Cepstrum&oldid=1237704300"