Fumitada Itakura (板倉 文忠, Itakura Fumitada , nacido el 6 de agosto de 1940) es un científico japonés . Hizo un trabajo pionero en el procesamiento estadístico de señales y su aplicación al análisis , síntesis y codificación del habla , incluido el desarrollo de los métodos de codificación predictiva lineal (LPC) y pares espectrales de línea (LSP).
Biografía
Itakura nació en Toyokawa , Prefectura de Aichi , Japón . Recibió títulos de grado y posgrado de la Universidad de Nagoya en 1963 y 1965, respectivamente. [1] En 1966, mientras estudiaba su doctorado en Nagoya, desarrolló los primeros conceptos de lo que más tarde se conocería como codificación predictiva lineal (LPC), junto con Shuzo Saito de Nippon Telegraph and Telephone (NTT). Describieron un enfoque para la discriminación automática de fonemas que incluía el primer enfoque de máxima verosimilitud para la codificación del habla . [2] En 1968, se incorporó al Laboratorio de Comunicación Eléctrica NTT Musashino en Tokio . [1] El mismo año, Itakura y Saito presentaron el algoritmo de distancia Itakura-Saito . [3] Al año siguiente, Itakura y Saito introdujeron la correlación parcial (PARCOR) a LPC. [2]
Itakura completó su D.Eng. Licenciado en procesamiento del habla en 1972, escribiendo su disertación sobre "Análisis y síntesis del habla basado en un método estadístico". [1] De 1973 a 1975, trabajó en el Departamento de Investigación Acústica de Bell Labs , habiendo sido invitado a trabajar allí en problemas fundamentales por James Flanagan , quien había quedado impresionado por uno de los artículos de Itakura sobre codificación de baja tasa de bits. [4]
En 1975, Itakura desarrolló el método de pares espectrales de línea (LSP) para la codificación de voz de alta compresión, mientras estaba en NTT. [5] [6] [1] De 1975 a 1981, estudió problemas de análisis y síntesis del habla basados en el método LSP. [1] En 1980, su equipo desarrolló un chip sintetizador de voz basado en LSP. LSP es una tecnología importante para la síntesis y codificación de voz, y en la década de 1990 fue adoptada por casi todos los estándares internacionales de codificación de voz como un componente esencial, contribuyendo a la mejora de la comunicación de voz digital a través de canales móviles e Internet en todo el mundo. [6]
En 1981, fue nombrado Jefe de la Sección de Investigación de Habla y Acústica en NTT. Dejó este puesto en 1984 para tomar una cátedra de teoría de la comunicación y procesamiento de señales en la Universidad de Nagoya . Actualmente enseña en la Universidad de Meijo . [7]
El trabajo de Itakura en la estimación espectral y de formantes sentó las bases para gran parte del progreso inicial en el procesamiento de señales de voz. [8] Su trabajo sobre modelado autorregresivo del habla se utiliza en casi todos los sistemas modernos de transmisión de voz de velocidad de bits baja a media, y la representación de pares espectrales de línea que desarrolló ahora se encuentra en casi todos los sistemas de telefonía celular. [8]
Premios
Sus premios incluyen el IEEE ASSP 1975 Senior Award, un premio del Ministerio de Ciencia y Tecnología de Japón en 1977, el IEEE 1986 Morris N. Liebmann Award [9] (con BS Atal), el IEEE Signal Processing 1996 Society Award, el IEEE Third Medalla del Milenio, Premio a las Contribuciones y Logros Distinguidos del IEICE 2002, y Medalla de la Cinta Morada 2003 del Gobierno Japonés. En 2005, recibió el premio Asahi y la medalla de procesamiento de señales IEEE Jack S. Kilby . [10] [11] En 2009, recibió el premio NEC C&C por su investigación pionera y el desarrollo de tecnología de codificación de voz altamente eficiente con métodos de análisis y síntesis para el habla. Es miembro del IEEE y miembro honorario del Instituto de Ingenieros de Electrónica, Información y Comunicación de Japón.
Referencias
- ^ a b c d e "Historia Oral Fumitada Itakura" . Red de historia global IEEE. 20 de mayo de 2009 . Consultado el 21 de julio de 2009 .
- ^ a b Gray, Robert M. (2010). "Una historia del habla digital en tiempo real en redes de paquetes: parte II de codificación predictiva lineal y el protocolo de Internet" (PDF) . Encontró. Proceso de la señal de tendencias . 3 (4): 203-303. doi : 10.1561 / 2000000036 . ISSN 1932-8346 .
- ^ Itakura, F. y Saito, S. (1968). Análisis de telefonía de síntesis basado en el método de máxima verosimilitud. En Proc. 6º Congreso Internacional de Acústica (págs. C – 17 – C – 20). Los Alamitos, CA: IEEE.
- ^ "Historia oral de James L. Flanagan" . Red de historia global IEEE. 20 de mayo de 2009. Archivado desde el original el 31 de diciembre de 2009 . Consultado el 21 de julio de 2009 .
- ^ Zheng, F .; Song, Z .; Pequeño.; Yu, W. (1998). "La medida de distancia para pares de espectro de líneas aplicados al reconocimiento de voz" (PDF) . Actas de la 5ª Conferencia Internacional sobre el procesamiento del lenguaje hablado (ICSLP'98) (3): 1123–6.
- ^ a b "Lista de hitos de IEEE" . IEEE . Consultado el 15 de julio de 2019 .
- ^ "視 聴 覚 情報 研究室" . Universidad de Meijo.
- ^ a b "Fumitada Itakura" . IEEE . Consultado el 21 de julio de 2009 .
- ^ "Destinatarios del premio IEEE Morris N. Liebmann Memorial" . Consultado el 15 de febrero de 2008 .
- ^ "Destinatarios de la medalla de procesamiento de señal IEEE Jack S. Kilby" (PDF) . IEEE . Consultado el 27 de febrero de 2011 .
- ^ "Ganadores de la medalla de procesamiento de señales IEEE Jack S. Kilby - 2005 - Fumitada Itakura" . IEEE . Consultado el 27 de febrero de 2011 .