PSOLA

PSOLA (Pitch Synchronous Overlap and Add) es una técnica de procesamiento de señales digitales que se utiliza para el procesamiento del habla y, más específicamente, para la síntesis del habla . Se puede utilizar para modificar el tono y la duración de una señal de voz. Se inventó alrededor de 1986. ^[2]

El método PSOLA funciona dividiendo la forma de onda del habla en pequeños segmentos superpuestos. Para cambiar el tono de la señal, los segmentos se separan más (para disminuir el tono) o se acercan más (para aumentar el tono). Para cambiar la duración de la señal, los segmentos se repiten varias veces (para aumentar la duración) o se eliminan algunos (para disminuir la duración). Luego, los segmentos se combinan utilizando la técnica de superposición de segmentos .

PSOLA se puede utilizar para cambiar la prosodia de una señal de habla.

Véase también

Estiramiento temporal y escala de tono del audio

Referencias

^ Grazyna Demenko (1999). Analiza cech suprasegmentalnych jezyka polskiego na potrzeby technologii mowy (PDF) (tesis doctoral). Seria Jezykoznawstwo Stosowane. vol. 17. Uniwersytet Im. Adama Mickiewicza W Poznaniu.Fig.7.1, pág.63.
^ Charpentier, F.; Stella, M. (1986). "Síntesis de difonos utilizando una técnica de superposición-adición para la concatenación de formas de onda del habla". ICASSP '86. IEEE International Conference on Acoustics, Speech, and Signal Processing . Vol. 11. págs. 2015–2018. doi :10.1109/ICASSP.1986.1168657. S2CID 62440369.

Enlaces externos

Cambio de tono con PSOLA para conversión de voz (archivado del original)
Tesis que analiza PSOLA con diagramas (formato PDF; ver página 35, que es la página 44 del PDF) (Archivada)

Este artículo relacionado con la tecnología es un esbozo . Puedes ayudar a Wikipedia expandiéndolo.

[1] Grazyna Demenko (1999). Analiza cech suprasegmentalnych jezyka polskiego na potrzeby technologii mowy (PDF) (tesis doctoral). Seria Jezykoznawstwo Stosowane. vol. 17. Uniwersytet Im. Adama Mickiewicza W Poznaniu.Fig.7.1, pág.63.

[2] Charpentier, F.; Stella, M. (1986). "Síntesis de difonos utilizando una técnica de superposición-adición para la concatenación de formas de onda del habla". ICASSP '86. IEEE International Conference on Acoustics, Speech, and Signal Processing . Vol. 11. págs. 2015–2018. doi :10.1109/ICASSP.1986.1168657. S2CID 62440369.