Reproducción de patrones

La reproducción de patrones ^[1]^[2] es uno de los primeros dispositivos parlantes que fue construido por el Dr. Franklin S. Cooper y sus colegas, incluidos John M. Borst y Caryl Haskins , en Haskins Laboratories a fines de la década de 1940 y completado en 1950. Allí Había varias versiones diferentes de este dispositivo de hardware. Actualmente solo uno sobrevive. La máquina convierte imágenes de los patrones acústicos del habla en forma de espectrograma en sonido. Usando este dispositivo, Alvin Liberman , Frank Cooper y Pierre Delattre (más tarde se unieron a Katherine Safford Harris , Leigh Lisker, y otros) pudieron descubrir pistas acústicas para la percepción de segmentos fonéticos (consonantes y vocales). Esta investigación fue fundamental para el desarrollo de técnicas modernas de síntesis del habla , máquinas de lectura para ciegos, el estudio de la percepción y el reconocimiento del habla y el desarrollo de la teoría motora de la percepción del habla .

Para crear sonido, la máquina de reproducción de patrones utiliza una fuente de luz de arco que se dirige contra un disco giratorio con 50 pistas concéntricas cuyas transparencias varían sistemáticamente para producir 50 armónicos de una frecuencia fundamental. La luz se proyecta además contra un espectrograma cuya reflectancia corresponde al nivel de presión sonora del parcial de la señal, y luego se dirige hacia una celda fotovoltaica mediante la cual la variación de luz se convierte en variaciones de presión sonora.

La reproducción del patrón se utilizó por última vez en un estudio experimental de Robert Remez en 1976. La reproducción del patrón ahora se encuentra en el Museo de los Laboratorios Haskins en New Haven, Connecticut .

La técnica de reproducción de patrones también se refiere ahora, de manera más general, a algoritmos o técnicas para convertir espectrogramas , cocleagramas y correlogramas de imágenes a sonidos.

Reproducción de patrones digitales

En la década de 1970, las reproducciones de patrones digitales comenzaron a suplantar a la versión anterior. Patrick Nye, Philip Rubin y sus colegas de Haskins Laboratories desarrollaron un primer prototipo . Combinó un "analizador de espectro ubicuo" [1] para el análisis espectral automático, junto con un procesador de pantalla VAX GT-40 para la manipulación gráfica del espectrograma mostrado, una forma de "síntesis por arte" y la subsiguiente resíntesis utilizando un 40 banco de filtros de canal. Esta reproducción de patrones digitales híbridos de hardware / software fue finalmente reemplazada en Haskins Laboratories por el sistema de análisis y visualización HADES , diseñado por Philip Rubin , e implementado en Fortran en la familia de computadoras VAX . Arai et al. [2] han descrito una versión más moderna . Está disponible una demostración en línea [3] .

Ver también

Referencias

^ "Laboratorios Haskins" . Haskins.yale.edu . Consultado el 21 de octubre de 2016 .
^ "Historia de la síntesis de voz, 1770 - 1970" . Ling.su.se . 1997-07-08 . Consultado el 21 de octubre de 2016 .

Bibliografía

Cooper, FS, Liberman, AM y Borst, JM, La interconversión de patrones audibles y visibles como base para la investigación de la percepción del habla. Actas de la Academia Nacional de Ciencias , 1951, 37, 318-325.
Cooper, Franklin S., Delattre, Pierre C., Liberman, AM, Borst, JM & Gerstman, LJ, Algunos experimentos sobre la percepción de los sonidos sintéticos del habla. The Journal of the Acoustical Society of America , 1952, 24, 597-606.
Cooper, Franklin S., Algunas ayudas instrumentales para la investigación del habla. En Informe de la cuarta mesa redonda anual sobre lingüística y enseñanza de idiomas . Washington, DC: Instituto de Idiomas y Lingüística, Universidad de Georgetown, 1953, 46-53.
JM Borst, El uso de espectrogramas para análisis y síntesis del habla, J. Audio Eng. Soc. , 4, 14-23, 1956.
Liberman, Alvin M., Algunos resultados de la investigación sobre la percepción del habla. The Journal of the Acoustical Society of America , 1957, 29, 117-123.
Remez, Robert E., Adaptación del límite de categoría entre habla y no habla: un caso contra los detectores de características. Psicología cognitiva , 1979, 11, 38-57.
Malcolm Slaney . Reproducción de patrones de 1950 a 1995. Actas de la IEEE Systems, Man and Cybernetics Conference de 1995 . 22 al 25 de octubre de 1995, Vancouver, Canadá.
Malcolm Slaney, Pattern Playback in the 90's, en Advances in Neural Information Processing Systems 7 , Gerald Tesauro, David Touretzky y Todd Leen (eds.), MIT Press, Cambridge, MA, 1995.
T. Arai, K. Yasu y T. Goto, Reproducción de patrones digitales, Proc. Reunión de otoño. Acoust. Soc. Jpn ., 429-430, 2005.
T. Arai, K. Yasu y T. Goto, Reproducción de patrones digitales: conversión de espectrogramas en sonido con fines educativos, Acoust. Sci. & Tech. , 27 (6), 393-395, 2006

[1] "Laboratorios Haskins" . Haskins.yale.edu . Consultado el 21 de octubre de 2016 .

[2] "Historia de la síntesis de voz, 1770 - 1970" . Ling.su.se . 1997-07-08 . Consultado el 21 de octubre de 2016 .

[1]