El método PSOLA funciona dividiendo la forma de onda del habla en pequeños segmentos superpuestos. Para cambiar el tono de la señal, los segmentos se separan más (para disminuir el tono) o se acercan más (para aumentar el tono). Para cambiar la duración de la señal, los segmentos se repiten varias veces (para aumentar la duración) o se eliminan algunos (para disminuir la duración). Luego, los segmentos se combinan utilizando la técnica de superposición de segmentos .
PSOLA se puede utilizar para cambiar la prosodia de una señal de habla.
^ Grazyna Demenko (1999). Analiza cech suprasegmentalnych jezyka polskiego na potrzeby technologii mowy (PDF) (tesis doctoral). Seria Jezykoznawstwo Stosowane. vol. 17. Uniwersytet Im. Adama Mickiewicza W Poznaniu.Fig.7.1, pág.63.
^ Charpentier, F.; Stella, M. (1986). "Síntesis de difonos utilizando una técnica de superposición-adición para la concatenación de formas de onda del habla". ICASSP '86. IEEE International Conference on Acoustics, Speech, and Signal Processing . Vol. 11. págs. 2015–2018. doi :10.1109/ICASSP.1986.1168657. S2CID 62440369.
Enlaces externos
Cambio de tono con PSOLA para conversión de voz (archivado del original)
Tesis que analiza PSOLA con diagramas (formato PDF; ver página 35, que es la página 44 del PDF) (Archivada)
Este artículo relacionado con la tecnología es un esbozo . Puedes ayudar a Wikipedia expandiéndolo.