PSOLA

Oscilogramas, espectrogramas y intonogramas de la expresión polaca (a) "jajem" [huevo] (b) "ja jem" [estoy comiendo] (c) "nawóz" [fertilizante] (d) "na wóz" [en un carro ] [1]

PSOLA (Pitch Synchronous Overlap and Add) es una técnica de procesamiento de señales digitales que se utiliza para el procesamiento del habla y, más específicamente, para la síntesis del habla . Se puede utilizar para modificar el tono y la duración de una señal de voz. Se inventó alrededor de 1986. [2]

El método PSOLA funciona dividiendo la forma de onda del habla en pequeños segmentos superpuestos. Para cambiar el tono de la señal, los segmentos se separan más (para disminuir el tono) o se acercan más (para aumentar el tono). Para cambiar la duración de la señal, los segmentos se repiten varias veces (para aumentar la duración) o se eliminan algunos (para disminuir la duración). Luego, los segmentos se combinan utilizando la técnica de superposición de segmentos .

PSOLA se puede utilizar para cambiar la prosodia de una señal de habla.

Véase también

Referencias

  1. ^ Grazyna Demenko (1999). Analiza cech suprasegmentalnych jezyka polskiego na potrzeby technologii mowy (PDF) (tesis doctoral). Seria Jezykoznawstwo Stosowane. vol. 17. Uniwersytet Im. Adama Mickiewicza W Poznaniu.Fig.7.1, pág.63.
  2. ^ Charpentier, F.; Stella, M. (1986). "Síntesis de difonos utilizando una técnica de superposición-adición para la concatenación de formas de onda del habla". ICASSP '86. IEEE International Conference on Acoustics, Speech, and Signal Processing . Vol. 11. págs. 2015–2018. doi :10.1109/ICASSP.1986.1168657. S2CID  62440369.
  • Cambio de tono con PSOLA para conversión de voz (archivado del original)
  • Tesis que analiza PSOLA con diagramas (formato PDF; ver página 35, que es la página 44 del PDF) (Archivada)


Obtenido de "https://es.wikipedia.org/w/index.php?title=PSOLA&oldid=1247779162"