De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Frederick Jelinek (18 de noviembre de 1932 - 14 de septiembre de 2010) fue un investigador checo-estadounidense en teoría de la información , reconocimiento automático del habla y procesamiento del lenguaje natural . Es bien conocido por su declaración tan citada: "Cada vez que despido a un lingüista, el rendimiento del reconocedor de voz aumenta". [nota 1]

Jelinek nació en Checoslovaquia antes de la Segunda Guerra Mundial y emigró con su familia a los Estados Unidos en los primeros años del régimen comunista. Estudió ingeniería en el Instituto de Tecnología de Massachusetts y enseñó durante 10 años en la Universidad de Cornell antes de aceptar un trabajo en IBM Research . En 1961 se casó con la guionista checa Milena Jelinek . En IBM, su equipo avanzó en los enfoques del reconocimiento de voz por computadora y la traducción automática. Después de IBM, fue a dirigir el Centro de Procesamiento del Lenguaje y el Habla en la Universidad Johns Hopkins. durante 17 años, donde todavía estaba trabajando el día de su muerte.

Vida personal [ editar ]

Jelinek nació el 18 de noviembre de 1932 como Bedřich Jelínek [6] en Kladno a Vilém y Trude Jelínek. [7] Su padre era judío; su madre nació en Suiza de padres católicos checos y se había convertido al judaísmo. [8] [9] Jelínek senior, un dentista, había planeado temprano escapar de la ocupación nazi y huir a Inglaterra; arregló el pasaporte, la visa y el envío de sus materiales de odontología. La pareja planeaba enviar a su hijo a una escuela privada inglesa . Sin embargo, Vilém decidió quedarse en el último minuto y finalmente fue enviado al campo de concentración de Theresienstadt , [10] donde murió en 1945. [7] [9]La familia se vio obligada a trasladarse a Praga en 1941, pero Frederick, su hermana y su madre, gracias a los antecedentes de esta última, escaparon de los campos de concentración. [9]

En general, se cree que el talento científico se revela en la primera juventud. ... Este ciertamente no fue mi caso. De alguna manera me deslicé en mi profesión científica. Mi madre deseaba que yo fuera médico, al igual que mi padre. ... Yo mismo quería ser abogado, defensor de los injustamente acusados. Pero mi carrera es el resultado de circunstancias políticas, posibilidades académicas y afortunados accidentes.

—Hablando de su vida en un discurso de 2001. [10]

Después de la guerra, Jelinek ingresó al gimnasio , a pesar de haber perdido varios años de escolaridad porque la educación de los niños judíos estaba prohibida desde 1942. Su madre, ansiosa de que su hijo recibiera una buena educación, hizo grandes esfuerzos por su emigración, [nota 2] especialmente cuando quedó claro que no se le permitiría ni siquiera intentar el examen de graduación. Su madre esperaba que su hijo se convirtiera en médico, pero Jelinek soñaba con ser abogada. Estudió ingeniería en clases nocturnas en el City College de Nueva York y recibió estipendios del Comité Nacional por una Europa Libre que le permitieron estudiar en el Instituto de Tecnología de Massachusetts.. Sobre su elección de especialidad, dijo: "Afortunadamente, a la ingeniería eléctrica le pertenecía una disciplina cuyo objetivo no era la construcción de sistemas físicos: la teoría de la información". [10] Obtuvo su Ph.D. en 1962, con Robert Fano como asesor. [11] [12]

En 1957, Jelinek realizó una visita inesperada a Praga. Había estado en Viena y había solicitado una visa, con la esperanza de volver a ver a sus antiguos conocidos. Se reunió con su viejo amigo Miloš Forman , quien le presentó a la estudiante de cine Milena Tobolová, cuyo guión había sido la base de la película Easy Life ( Snadný život ). [13] [14] Su vuelo de regreso a los Estados Unidos tuvo una escala en Munich, durante la cual la llamó para proponerle matrimonio. [9] Tobolová fue considerada una disidente y las autoridades no estaban contentas con su película. [14] Jelinek pidió ayuda a Jerome Wiesner y Cyrus Eaton., este último que presionó a Nikita Khrushchev . [13] Tras la toma de posesión de John F. Kennedy , se permitió emigrar a un grupo de disidentes checos en enero de 1961. Gracias al cabildeo, la futura Milena Jelinek fue uno de ellos. [9] [13]

Después de completar sus estudios de posgrado, Jelinek, que había desarrollado un interés en la lingüística , tenía planes de trabajar con Charles F. Hockett en la Universidad de Cornell . Sin embargo, estos fracasaron y durante los siguientes diez años continuó estudiando la teoría de la información. [10] Habiendo trabajado anteriormente en IBM durante un año sabático, comenzó a trabajar a tiempo completo allí en 1972, al principio de permiso para Cornell, pero permanentemente a partir de 1974. Permaneció allí durante más de veinte años. Aunque al principio le habían ofrecido un trabajo de investigación regular, a su llegada se enteró de que Josef Raviv había sido ascendido recientemente a jefe del recién inaugurado Laboratorio de Investigación de IBM Haifa.y se convirtió en jefe del grupo de Reconocimiento Continuo del Habla en el Centro de Investigación Thomas J. Watson . [10] [12] A pesar de los éxitos de su equipo en esta área, el trabajo de Jelinek siguió siendo poco conocido en su país de origen porque a los científicos checos no se les permitió participar en conferencias clave. [13]

Después de la caída del comunismo en 1989, Jelinek ayudó a establecer relaciones científicas, visitando regularmente para dar conferencias y ayudando a persuadir a IBM para que estableciera un centro de computación en la Universidad Charles . [8] [10] [15] En 1993, se retiró de IBM y fue al Centro de Procesamiento del Lenguaje y el Habla de la Universidad Johns Hopkins , donde fue director y profesor Julian Sinclair Smith de Ingeniería Eléctrica e Informática. [11] [16] Todavía estaba trabajando allí en el momento de su muerte; Jelinek murió de un ataque cardíaco al final de una jornada laboral normal a mediados de septiembre de 2010. [9] [16] Le sobrevivieron su esposa, hija e hijo, hermana, hermanastra y tres nietos, incluida Sophie Gold Jelinek.

Investigación y legado [ editar ]

La teoría de la información fue un enfoque científico de moda a mediados de los años 50. [12] Sin embargo, el pionero Claude Shannon escribió en 1956 que esta tendencia era peligrosa. Dijo: "Nuestros compañeros científicos en muchos campos diferentes, atraídos por la fanfarria y por las nuevas vías abiertas al análisis científico, están usando estas ideas en sus propios problemas ... Será muy fácil que nuestra prosperidad algo artificial colapse de la noche a la mañana cuando se da cuenta de que el uso de algunas palabras interesantes como información, entropía, redundancia, no resuelve todos nuestros problemas ". [17] Durante la próxima década, una combinación de factores cerró la aplicación de la teoría de la información a los problemas de procesamiento del lenguaje natural (PNL), en particulartraducción automática . Un factor fue la publicación de 1957 Noam Chomsky 's Estructuras sintácticas , que se afirma, 'modelos probabilísticos no dan una idea de los problemas básicos de la estructura sintáctica'. [18] Esto concordaba bien con la filosofía de la investigación en inteligencia artificial de la época, que promovía enfoques basados ​​en reglas. El otro factor fue el informe ALPAC de 1966 , que recomendó que el gobierno dejara de financiar la investigación de la traducción automática. John Pierce, presidente de ALPACMás tarde dijo que el campo estaba lleno de "inventores locos o ingenieros poco confiables". Dijo que los problemas lingüísticos subyacentes deben resolverse antes de que se puedan realizar intentos razonables de PNL. Estos elementos esencialmente detuvieron la investigación en el campo. [5] [19]

Jelinek había comenzado a desarrollar un interés en la lingüística después de la inmigración de su esposa, quien inicialmente se inscribió en el programa de lingüística del MIT con la ayuda de Roman Jakobson . Jelinek la acompañaba a menudo a las conferencias de Chomsky e incluso discutía la posibilidad de cambiar de orientación con su asesor. Fano estaba "realmente molesto", y después del fracaso de su proyecto con Hockett en Cornell, no volvió a este campo de investigación hasta que comenzó a trabajar en IBM. [12] El alcance de la investigación en IBM fue considerablemente diferente al de la mayoría de los otros equipos. Según Mark Liberman, "Mientras [Jelinek] lideraba el esfuerzo de IBM para resolver el problema general del dictado durante la década posterior a 1972, la mayoría de las otras empresas e investigadores académicos estadounidenses trabajaban en problemas muy limitados ... o se mantenían fuera del campo por completo". [19]

No fue un pionero del reconocimiento de voz, fue el pionero del reconocimiento de voz.

—Steve Young (2010) [5]

Jelinek consideró el reconocimiento de voz como un problema de la teoría de la información, un canal ruidoso , en este caso la señal acústica, que algunos observadores consideraron un enfoque atrevido. [5] [16] [19] El concepto de perplejidad se introdujo en su primer modelo, [12] New Raleigh Grammar, que se publicó en 1976 como el artículo "Reconocimiento continuo del habla por métodos estadísticos" en la revista Proceedings of the IEEE . [5] Según Young, el enfoque básico de canal ruidoso "redujo el problema del reconocimiento de voz a uno de producir dos modelos estadísticos". [5] Mientras que la nueva gramática de Raleigh era unaEl modelo oculto de Markov , su siguiente modelo, llamado Tangora, era más amplio e incluía n-gramas , específicamente trigramas. Aunque "era obvio para todos que este modelo estaba desesperadamente empobrecido", no se mejoró hasta que Jelinek presentó otro artículo en 1999. [5] El mismo enfoque de triagrama se aplicó a los teléfonos en una sola palabra. Aunque la identificación de partes del habla resultó no ser muy útil para el reconocimiento de voz, los métodos de etiquetado desarrollados durante estos proyectos se utilizan ahora en varias aplicaciones de PNL. [12]

Las técnicas de investigación incrementales desarrolladas en IBM eventualmente se volvieron dominantes en el campo después de que DARPA , a mediados de los 80, regresó a la investigación de PNL e impuso esa metodología a los equipos participantes, compartiendo objetivos comunes, datos y métricas de evaluación precisas. [19] La investigación del Continuous Speech Recognition Group, que requirió grandes cantidades de datos para entrenar los algoritmos, finalmente condujo a la creación del Linguistic Data Consortium . En la década de 1980, aunque el problema más amplio del reconocimiento de voz seguía sin resolverse, buscaron aplicar los métodos desarrollados a otros problemas; la traducción automática y la predicción del valor de las acciones se consideraron opciones. Un grupo de investigadores de IBM pasó a trabajar paraTecnologías renacentistas . Jelinek escribió: "El rendimiento del fondo Renaissance es legendario, pero no tengo ni idea de si se han utilizado alguna vez los métodos que fuimos pioneros en IBM. Mis antiguos colegas no me dirán: ¡la suya es una operación muy secreta!" [12] Métodos muy similares a los desarrollados para lograr el reconocimiento de voz son la base de la mayoría de los sistemas de traducción automática que se utilizan en la actualidad. Los observadores han dicho que el paradigma de Pierce, según el cual los logros de la ingeniería en esta área se basarían en el progreso científico, se ha invertido, y los logros en ingeniería están en la base de una serie de hallazgos científicos. [5] [19]

Los trabajos de Jelinek ganaron premios al "mejor artículo" en varias ocasiones, y recibió varios premios de la empresa mientras trabajaba en IBM. [5] [11] Recibió el Premio de la Sociedad por "contribuciones técnicas sobresalientes y liderazgo" de la Sociedad de Procesamiento de Señales IEEE en 1997, [20] y la Medalla ESCA por Logros Científicos en 1999. [21] Recibió un premio Medalla del Tercer Milenio del IEEE en 2000, el primer premio Antonio Zampolli de la Asociación Europea de Recursos Lingüísticos en 2004, [22] el premio 2005 James L. Flanagan Speech and Audio Processing , [23]y el premio Lifetime Achievement Award 2009 de la Association for Computational Linguistics . [11] [12] Recibió un doctorado honoris causa . de la Universidad Charles en 2001, [24] fue elegido miembro de la Academia Nacional de Ingeniería en 2006 y se convirtió en uno de los doce becarios inaugurales de la Asociación Internacional de Comunicación del Habla en 2008. [5]

Publicaciones seleccionadas [ editar ]

  • Jelinek, Frederick (1968). Teoría probabilística de la información: modelos discretos y sin memoria . Serie de McGraw-Hill en ciencia de sistemas. Nueva York: McGraw-Hill. 689p. LCCN  68-11611 [1] (revisión)
  • ———————- (1969). "Algoritmo de decodificación secuencial rápida usando una pila". IBM Journal of Research and Development 13 (6): 675–685. doi : 10.1147 / rd.136.0675 .
  • ———————- (1969). "Árbol de codificación de fuentes discretas en el tiempo sin memoria con un criterio de fidelidad". Transacciones IEEE sobre teoría de la información 15 (5): 584–590. doi : 10.1109 / TIT.1969.1054355 . (recibió el premio al "Mejor artículo" en 1971)
  • Bahl, Lalit R .; John Cocke , Frederick Jelinek, Josef Raviv (1974). "Decodificación óptima de códigos lineales para minimizar la tasa de error de símbolo". Transacciones IEEE sobre teoría de la información 20 (2): 284-287. doi : 10.1109 / TIT.1974.1055186 . (recibió el premio al artículo del Jubileo de Oro de la Sociedad de Teoría de la Información)
  • ———————- (1976). "Reconocimiento continuo de voz por métodos estadísticos". Actas del IEEE 64 (4): 532–556. doi : 10.1109 / PROC.1976.10159 .
  • Brown, P .; J. Cocke, S. Della Pietra, V. Della Pietra, F. Jelinek, R, Mercer y P. Roossin (1988). "Un enfoque estadístico de la traducción de idiomas" . En Dénes Vargha, ed. Coling 88: Actas de la 12a conferencia sobre lingüística computacional, volumen 1 . Budapest: Sociedad John Von Neumann de Ciencias de la Computación. págs. 71–76. doi : 10.3115 / 991635.991651 . ISBN  963-8431-56-3 .
  • ———————- (1990). "Modelado de lenguaje autoorganizado para el reconocimiento de voz". En Alex Waibel y Kai-Fu Lee, eds. Lecturas en reconocimiento de voz . San Mateo: Morgan Kaufmann. 629p. ISBN 1-55860-124-4 . 
  • ———————-; John D. Lafferty y Robert L. Mercer. (1990) "Métodos básicos de gramáticas libres de contexto probabilístico". Informe técnico RC 16374 (72684), IBM.
    • Reimpreso en Laface, Pietro; Renato De Mori (1992). Reconocimiento y comprensión de voz: avances, tendencias y aplicaciones recientes . Serie ASI de la OTAN. Serie F, Ciencias de la computación y de sistemas, 75 . Nueva York: Springer-Verlag. págs. 345–360. ISBN 0-387-54032-6 . 
  • ———————- (1997). Métodos estadísticos para el reconocimiento de voz . Cambridge, Mass .: MIT Press. 283p. ISBN 0-262-10066-5 . (revisión) (revisión 2) 
  • Chelba, Ciprian; Frederick Jelinek (2000). "Modelado de lenguaje estructurado". Habla y lenguaje por computadora 14 (4): 283–332. doi : 10.1006 / csla.2000.0147 (recibió el premio "Mejor artículo" en 2002).
    • Versión ampliada de una presentación en NLDB'99. Klagenfurt, Austria, 17 a 19 de junio de 1999 ( arXiv : cs / 0001023 ).
  • Xu, Peng; Ahmad Emami y Frederick Jelinek (2003). " Formación de modelos conexionistas para el modelo de lenguaje estructurado ". En Michael Collins y Mark Steedman, eds. EMNLP '03 Actas de la conferencia de 2003 sobre métodos empíricos en el procesamiento del lenguaje natural . East Stroudsburg, Pensilvania: Asociación de Lingüística Computacional. págs. 160-167. ISBN 1-932432-13-2 . doi : 10.3115 / 1119355.1119376 . (ganó el premio al "mejor trabajo") 

Referencias [ editar ]

Notas
  1. Aunque su fama y estatus icónico son indiscutibles (por ejemplo, Julia Hirschberg lo utilizó como título de un discurso de 1998), [1] se desconoce su contexto y su redacción y datación específicas no están claras. Según Daniel Jurafsky y James H. Martin, el propio Jelinek recordó la cita como "Cada vez que un lingüista abandona el grupo, la tasa de reconocimiento aumenta" y la fechó en diciembre de 1988 (Wayne, Pensilvania), y señaló además que la cita no apareció en el procedimiento publicado, [2] [3] mientras que Roger K. Moore expresó la siguiente redacción: "Cada vez que despedimos a un fonético / lingüista, el rendimiento de nuestro sistema aumenta" y lo fechó en un taller de Reconocimiento y Comprensión Automática del Habla IEEE celebrado en 1985.[4] Según Steve Young, "la historia cuenta que un día uno de sus lingüistas renunció y Fred decidió reemplazarlo no por otro lingüista sino por un ingeniero. Poco tiempo después, Fred notó que el desempeño de su sistema mejoró significativamente. Así que animó a otro lingüista a encontrar un empleo alternativo y, efectivamente, el rendimiento volvió a mejorar ". [5]
  2. ^ Como él dijo, "ella no quería emular el gran error de mi padre".
Referencias
  1. ^ Hirschberg, Julia (29 de julio de 1998)."Cada vez que despido a un lingüista, mi rendimiento aumenta", y otros mitos de la revolución del procesamiento estadístico del lenguaje natural (habla). 15ª Conferencia Nacional sobre Inteligencia Artificial, Madison, Wisconsin.CS1 maint: location (link) Discurso invitado.
  2. ^ Jurafsky, Daniel; James H. Martin (2009). Procesamiento del habla y el lenguaje: una introducción al procesamiento del lenguaje natural, la lingüística computacional y el reconocimiento del habla . Serie de Prentice Hall en inteligencia artificial (2ª ed.). Upper Saddle, Nueva Jersey: Prentice Hall. pag. 83 . ISBN 978-0-13-187321-6.
  3. ^ Palmer, Martha; Tim Finin (1990). "Informe del Taller de Evaluación de Sistemas de Procesamiento del Lenguaje Natural" (PDF) . Lingüística computacional . 16 (1): 171–185.
  4. ^ Moore, Roger K. (2005). Resultados de una encuesta de asistentes a ASRU 1997 y 2003 (PDF) . INTERSPEECH-2005. Lisboa, 4 al 8 de septiembre de 2005. Archivado desde el original (PDF) el 20 de julio de 2011. CS1 maint: location (link)
  5. ↑ a b c d e f g h i j Young, Steve (noviembre de 2010). "Frederick Jelinek 1932-2010: el pionero de la tecnología de reconocimiento de voz" . Boletín del Comité Técnico de Procesamiento del Habla y el Lenguaje . Sociedad de procesamiento de señales IEEE . Archivado desde el original el 28 de julio de 2011 . Consultado el 16 de diciembre de 2010 . Adaptado de un discurso pronunciado en 2006.
  6. ^ Rejžek, enero (17 de septiembre de 2010). "Nekrolog" . Lidové noviny . Consultado el 17 de diciembre de 2010 .
  7. ↑ a b Jelinek, Frederick (1997). Métodos estadísticos para el reconocimiento de voz . Cambridge, Mass .: MIT Press. pag. v. ISBN 0-262-10066-5.
  8. ↑ a b Hajic, Jan (noviembre de 2010). "Prof. Frederick Jelinek, 1932-2010" . Boletín EACL . 12 . Consultado el 19 de diciembre de 2010 .
  9. ↑ a b c d e f Lohr, Steve (24 de septiembre de 2010). "Frederick Jelinek, que dio a las máquinas la clave del habla humana, muere a los 77" . New York Times . pag. B10 . Consultado el 16 de diciembre de 2010 .
  10. ↑ a b c d e f Jelinek, Frederick (22 de noviembre de 2001). Cómo llegué aquí (discurso). Universidad Charles, Praga, Checoslovaquia. Archivado desde el original el 16 de marzo de 2008 . Consultado el 17 de diciembre de 2010 . Discurso de aceptación del título honoris causa.
  11. ↑ a b c d Jan, Jelinek (13 de junio de 2006). "Curriculum Vitae" . Archivado desde el original el 3 de septiembre de 2006 . Consultado el 17 de diciembre de 2010 .
  12. ↑ a b c d e f g h Jelinek, Fred (diciembre de 2009). "El amanecer de la estadística ASR y MT". Lingüística computacional . 35 (4): 483–494. doi : 10.1162 / coli.2009.35.4.35401 . S2CID 1486422 . 
  13. ↑ a b c d Hershenson, Roberta (31 de diciembre de 1989). "Pareja checa vigila la patria" . New York Times . Consultado el 17 de diciembre de 2010 .
  14. ↑ a b Willoughby, Ian (9 de junio de 2008). "Milena Jelinek - miembro de la generación dorada de cineastas checos que ahora enseña escritura de guiones en Columbia" . Uno a uno . Radio Praga . Consultado el 1 de febrero de 2014 .
  15. ^ Dresser, Michael (19 de septiembre de 2010). "Frederick Jelinek, pionero del reconocimiento de voz, muere" . El Sol de Baltimore . Consultado el 16 de diciembre de 2010 .
  16. ↑ a b c Sneiderman, Phil (20 de septiembre de 2010). "Frederick Jelinek, 77, pionero en tecnología de comprensión de voz y texto" . La Gaceta JHU . Universidad Johns Hopkins . Consultado el 16 de diciembre de 2010 .
  17. ^ Citado en Liberman (2010).
  18. ^ Citado en Young (2010).
  19. ↑ a b c d e Liberman, Mark (diciembre de 2010). "Obituario: Fred Jelinek" . Lingüística computacional . 36 (4): 595–599. doi : 10.1162 / coli_a_00032 .
  20. ^ "Premio de la sociedad" . Sociedad de procesamiento de señales IEEE . Consultado el 21 de diciembre de 2010 .
  21. ^ "Medalla de 1999 ESCA por logros científicos" . Asociación Internacional de Comunicación del Habla. 1999. Archivado desde el original el 2 de agosto de 2009 . Consultado el 21 de diciembre de 2010 .
  22. ^ "En honor al profesor Antonio Zampolli" . Asociación Europea de Recursos Lingüísticos. Archivado desde el original el 21 de julio de 2011 . Consultado el 21 de diciembre de 2010 .
  23. ^ "Destinatarios del premio IEEE James L. Flanagan Speech and Audio Processing" . IEEE . Consultado el 21 de diciembre de 2010 .
  24. ^ "Dr. hc prof. F. Jelinek" (Comunicado de prensa). Universidad Charles de Praga. 22 de noviembre de 2001 . Consultado el 17 de diciembre de 2010 .

Enlaces externos [ editar ]

  • Página institucional en la Universidad Johns Hopkins