Reproducción de patrones

El reproductor de patrones ^[1]^[2] es un dispositivo parlante temprano que fue construido por el Dr. Franklin S. Cooper y sus colegas, incluidos John M. Borst y Caryl Haskins , en Haskins Laboratories a fines de la década de 1940 y completado en 1950. Hubo varias versiones diferentes de este dispositivo de hardware. Solo una sobrevive actualmente. La máquina convierte imágenes de los patrones acústicos del habla en forma de espectrograma en sonido. Usando este dispositivo, Alvin Liberman , Frank Cooper y Pierre Delattre (a quienes luego se unieron Katherine Safford Harris , Leigh Lisker y otros) pudieron descubrir señales acústicas para la percepción de segmentos fonéticos (consonantes y vocales). Esta investigación fue fundamental para el desarrollo de técnicas modernas de síntesis de voz , máquinas de lectura para ciegos, el estudio de la percepción del habla y el reconocimiento del habla , y el desarrollo de la teoría motora de la percepción del habla .

Para crear el sonido, la máquina de reproducción de patrones utiliza una fuente de luz de arco que se dirige contra un disco giratorio con 50 pistas concéntricas cuyas transparencias varían sistemáticamente para producir 50 armónicos de una frecuencia fundamental. La luz se proyecta a continuación contra un espectrograma , cuya reflectancia corresponde al nivel de presión sonora del parcial de la señal, y luego se dirige hacia una célula fotovoltaica mediante la cual la variación de la luz se convierte en variaciones de presión sonora.

La reproducción de patrones se utilizó por última vez en un estudio experimental realizado por Robert Remez en 1976. La reproducción de patrones ahora reside en el Museo de Haskins Laboratories en New Haven, Connecticut .

La técnica de reproducción de patrones ahora también se refiere, de manera más general, a algoritmos o técnicas para convertir espectrogramas , cocleogramas y correlogramas de imágenes en sonidos.

Una demostración se puede ver en el programa de televisión Adventure . Tecnología pionera en psicolingüística (CBS Television, 1953). ^[3]

Reproducción de patrones digitales

En la década de 1970, la reproducción de patrones digitales comenzó a suplantar a la versión anterior. Patrick Nye, Philip Rubin y sus colegas de Haskins Laboratories desarrollaron un primer prototipo que combinaba un "analizador de espectro ubicuo"[1] para el análisis espectral automático, junto con un procesador de pantalla VAX GT-40 para la manipulación gráfica del espectrograma mostrado, una forma de "síntesis por arte", y una resíntesis posterior utilizando un banco de filtros de 40 canales. Esta reproducción de patrones digitales híbrida de hardware/software fue finalmente reemplazada en Haskins Laboratories por el sistema de análisis y visualización HADES , diseñado por Philip Rubin e implementado en Fortran en la familia de computadoras VAX . Arai y sus colegas describieron una versión más moderna [2]. Hay disponible una demostración en línea [3].

Véase también

Referencias

^ "Laboratorios Haskins". Haskins.yale.edu . Consultado el 21 de octubre de 2016 .^{[ enlace muerto permanente ]}
^ "Historia de la síntesis de voz, 1770 - 1970". Ling.su.se . 1997-07-08. Archivado desde el original el 2015-03-06 . Consultado el 2016-10-21 .
^ 【1950 | Máquina de reproducción de patrones】 Dr. Franklin S. Cooper - Un dispositivo parlante temprano en 1950 , consultado el 26 de febrero de 2023

Bibliografía

Cooper, FS, Liberman, AM, y Borst, JM, La interconversión de patrones audibles y visibles como base para la investigación en la percepción del habla. Actas de la Academia Nacional de Ciencias , 1951, 37, 318-325.
Cooper, Franklin S., Delattre, Pierre C., Liberman, AM, Borst, JM y Gerstman, LJ, Algunos experimentos sobre la percepción de sonidos sintéticos del habla. The Journal of the Acoustical Society of America , 1952, 24, 597-606.
Cooper, Franklin S., Algunas ayudas instrumentales para la investigación sobre el habla. En Informe de la cuarta mesa redonda anual sobre lingüística y enseñanza de idiomas . Washington, DC: Instituto de Lenguas y Lingüística, Universidad de Georgetown, 1953, 46-53.
JM Borst, El uso de espectrogramas para el análisis y síntesis del habla, J. Audio Eng. Soc. , 4, 14-23, 1956.
Liberman, Alvin M., Algunos resultados de la investigación sobre la percepción del habla. The Journal of the Acoustical Society of America , 1957, 29, 117-123.
Remez, Robert E., Adaptación del límite de categorías entre el habla y el no habla: un caso contra los detectores de características. Psicología cognitiva , 1979, 11, 38-57.
Malcolm Slaney . Reproducción de patrones de 1950 a 1995. Actas de la Conferencia IEEE sobre sistemas, hombre y cibernética de 1995. 22 al 25 de octubre de 1995, Vancouver, Canadá.
Malcolm Slaney, Reproducción de patrones en los años 90, en Avances en sistemas de procesamiento de información neuronal 7 , Gerald Tesauro, David Touretzky y Todd Leen (eds.), MIT Press, Cambridge, MA, 1995.
T. Arai, K. Yasu y T. Goto, Reproducción de patrones digitales, Proc. Autumn Meet. Acoust. Soc. Jpn ., 429-430, 2005.
T. Arai, K. Yasu y T. Goto, Reproducción de patrones digitales: conversión de espectrogramas a sonido con fines educativos, Acoust. Sci. & Tech. , 27(6), 393-395, 2006

[1] "Laboratorios Haskins". Haskins.yale.edu . Consultado el 21 de octubre de 2016 .^{[ enlace muerto permanente ]}

[2] "Historia de la síntesis de voz, 1770 - 1970". Ling.su.se . 1997-07-08. Archivado desde el original el 2015-03-06 . Consultado el 2016-10-21 .

[3] 【1950 | Máquina de reproducción de patrones】 Dr. Franklin S. Cooper - Un dispositivo parlante temprano en 1950 , consultado el 26 de febrero de 2023