Martin Kay


De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Martin Kay (1935-8 de agosto de 2021) fue un científico informático , conocido especialmente por su trabajo en lingüística computacional .

Nacido y criado en el Reino Unido, recibió su maestría en Trinity College, Cambridge , en 1961. En 1958 comenzó a trabajar en la Cambridge Language Research Unit , uno de los primeros centros de investigación en lo que ahora se conoce como Lingüística Computacional. En 1961, se trasladó a Rand Corporation en Santa Mónica, California , EE. UU., Donde finalmente se convirtió en jefe de investigación en lingüística y traducción automática. Dejó Rand en 1972 para convertirse en presidente del Departamento de Ciencias de la Computación de la Universidad de California, Irvine . En 1974, se trasladó al Centro de Investigación Xerox Palo Alto.como becario de investigación. En 1985, mientras conservaba su puesto en Xerox PARC, se incorporó a la facultad de la Universidad de Stanford a tiempo parcial . Recientemente fue profesor de lingüística en la Universidad de Stanford y profesor honorario de lingüística computacional en la Universidad de Saarland .

Vida

Nació en Edgeware (Middlesex, Gran Bretaña) en 1935 y estudió lingüística y lingüística computacional en el Trinity College de Cambridge.

Sus principales intereses eran la traducción, tanto por personas como por máquinas, y los algoritmos lingüísticos computacionales, especialmente en los campos de la morfología y la sintaxis.

Trabaja

Kay comenzó su carrera en la Unidad de Investigación de Idiomas de Cambridge en Cambridge, Inglaterra, con Margaret Masterman . En 1961 David G. Hays lo contrató para trabajar para la Corporación RAND ; posteriormente trabajó para la Universidad de California, Irvine y Xerox PARC . Kay es uno de los pioneros de la lingüística computacional y la traducción automática. Fue responsable de introducir la noción de análisis sintáctico de gráficos en lingüística computacional y la noción de unificación en lingüística en general.

Con Ron Kaplan , fue pionero en la investigación y el desarrollo de aplicaciones en morfología de estados finitos. Ha sido colaborador y crítico desde hace mucho tiempo del trabajo sobre traducción automática. En su artículo fundamental "El lugar apropiado de hombres y máquinas en la traducción de idiomas", [1] Kay defendió los sistemas de traducción automática que estaban estrechamente integrados en el proceso de traducción humana. Fue revisor y crítico de EUROTRA, Verbmobil y muchos otros proyectos de MT.

Kay fue presidente de la Asociación de Lingüística Computacional y presidente del Comité Internacional de Lingüística Computacional . Fue investigador en Xerox PARC hasta 2002. Obtuvo un doctorado honorario de la Universidad de Gotemburgo . Kay recibió el Premio al Logro de por vida de la Asociación de Lingüística Computacional por su papel sostenido como líder intelectual de la investigación de PNL en 2005.

Logros y honores

Contribuciones

1. El artículo "apropiado" de Martin Kay [1] Después del informe de ALPAC en 1966, se llegó a la conclusión de que "No hay perspectivas inmediatas o predecibles de que la MT útil produzca traducciones útiles de textos científicos generales". [2] Y debido a este resultado, el campo de la traducción automática entró en un período oscuro. De 1966 a 1976, casi diez años, se realizaron pocas investigaciones. Sin embargo, en la década de 1980, se acercaba el período del Renacimiento. [3] "El lugar apropiado de hombres y máquinas en la traducción de idiomas" atrajo más atención sobre la traducción automática. En este artículo, se lograron nuevas reflexiones sobre la relación entre la traducción automática y la traducción humana. En ese momento, con la aplicación de computadoras más baratas y el amplio uso de dominios en la traducción automática, se necesitaban con urgencia resultados de alta calidad.Y la teoría de la traducción automática de alta calidad era el nivel ideal para la traducción automática después de las críticas de Bar-Hillel en su revisión de los años 60 sobre el progreso de la traducción automática: "El objetivo de la traducción automática no debe ser la traducción automática de alta calidad (FAHQT) que puede reemplazar a los traductores humanos. En su lugar, la traducción automática debería adoptar objetivos menos ambiciosos, por ejemplo, una interacción hombre-máquina más rentable y tener como objetivo mejorar la productividad de la traducción humana ". [4] Se promovió la utilidad de la traducción humana a un nuevo nivel superior. Según este pensamiento, Martin Kay propuso una idea más práctica sobre la relación entre humano y máquina en el proceso de traducción automática, llamada "amanuense del traductor".El objetivo de la traducción automática no debería ser la traducción automática de alta calidad (FAHQT) que pueda reemplazar a los traductores humanos. En cambio, la traducción automática debería adoptar objetivos menos ambiciosos, por ejemplo, una interacción hombre-máquina más rentable y tener como objetivo mejorar la productividad de la traducción humana ". [4] La utilidad de la traducción humana se promovió a un nuevo nivel superior. Según este pensamiento, Martin Kay propuso una idea más práctica sobre la relación entre humanos y máquinas en el proceso de traducción automática, llamada "amanuense del traductor".El objetivo de la traducción automática no debería ser la traducción automática de alta calidad (FAHQT) que pueda reemplazar a los traductores humanos. En cambio, la traducción automática debería adoptar objetivos menos ambiciosos, por ejemplo, una interacción hombre-máquina más rentable y tener como objetivo mejorar la productividad de la traducción humana ". [4] La utilidad de la traducción humana se promovió a un nuevo nivel superior. Según este pensamiento, Martin Kay propuso una idea más práctica sobre la relación entre humanos y máquinas en el proceso de traducción automática, llamada "amanuense del traductor".Martin Kay propuso una idea más práctica sobre la relación entre humano y máquina en el proceso de traducción automática, llamada "amanuense del traductor".Martin Kay propuso una idea más práctica sobre la relación entre humano y máquina en el proceso de traducción automática, llamada "amanuense del traductor".

1.1 Dos argumentos en contra de la utilidad de la traducción automática Debido a que esta idea incluye al ser humano y la máquina al mismo tiempo, tanto los informáticos como los lingüistas tienen responsabilidades con el MT. Pero "nunca se les debe pedir que proporcionen una solución de ingeniería a un problema que apenas comprenden". Solo necesitan lograr "haciendo solo lo que se puede hacer con absoluta seguridad y confiabilidad ... se puede garantizar virtualmente a todos los involucrados". Como partes principales de la traducción, hay dos argumentos relacionados contra la plausibilidad de la traducción automática como una empresa industrial desde el punto de vista de la lingüística y la informática. Por lo general, se formulan dos argumentos a favor de soluciones ad hoc a los problemas de la traducción automática. En el primer argumento, "Las soluciones ad hoc tienden a basarse en análisis caso por caso de lo que los lingüistas llaman fenómenos superficiales, esencialmente cadenas de palabras, y en propiedades estadísticas reales o imaginarias de estilos particulares de escritura y dominios del discurso ". Es una simple afirmación estadística En el segundo argumento, las soluciones ad hoc solo se aluden a la comprensión del segundo idioma mediante la lectura del texto, y se denominó aprendiz de brujo, porque "este tipo de argumento es en el sentido de que el tipo de teoría incompleta que lingüistas e informáticos que han podido proporcionar es a menudo una base peor sobre la que construir dispositivos prácticos que ninguna teoría, porque la teoría no sabe cuándo detenerse "." El principal problema con el hechicero ".El argumento del aprendiz es que la decisión de que una oración podría traducirse sin análisis solo se puede tomar después del hecho. La oración de ejemplo muestra que hay más de una interpretación de una oración en algún nivel y un análisis más detallado muestra que hay una única traducción que es compatible con cada una de ellas. En resumen, el algoritmo necesario para decidir cuándo se requiere un análisis tendría que utilizar los resultados del mismo análisis para el que está diseñado para evitarlo ".el algoritmo necesario para decidir cuándo se requiere un análisis tendría que utilizar los resultados del mismo análisis para el que está diseñado para evitarlo ".el algoritmo necesario para decidir cuándo se requiere un análisis tendría que utilizar los resultados del mismo análisis para el que está diseñado para evitarlo ".

1.2 El amanuense del traductor y la memoria de traducción Esta es la parte principal del trabajo, para ilustrar qué es el amanuense del traductor, el autor mostró tres aspectos: edición de textos, ayudas a la traducción y traducción automática. "Supongamos que los traductores cuentan con un terminal que consta de un teclado, una pantalla y alguna forma de señalar palabras y letras individuales. La visualización en la pantalla se divide en dos ventanas. El texto a traducir aparece en la ventana superior y la traducción se compondrá en la de abajo ". Es la forma del amanuense del traductor que no es un dispositivo real y nunca lo será. "Ambas ventanas se comportan de la misma manera. Con el dispositivo señalador, el traductor puede seleccionar una letra, palabra, oración, línea o párrafo y, al presionar la tecla correspondiente,hacer que alguna operación sea visitada sobre él ".

Estas dos figuras muestran el proceso de traducción desde la visualización inicial hasta la selección. Este dispositivo no es tan simple como estas dos figuras, el traductor puede brindarle un servicio más especial. En las ayudas a la traducción, el autor mostró la tercera figura:

"Una adición relativamente trivial sería un diccionario. El traductor selecciona una palabra o secuencia de palabras y da un comando para hacer que se busquen ... Esta nueva ventana da el efecto de superponer una parte de las ventanas ya presentes. En este caso , la nueva ventana contiene una entrada de diccionario engañosamente simple para la palabra seleccionada ". Además, el dispositivo tiene muchas otras características. Por ejemplo, la simplicidad de la entrada del diccionario, las palabras Sintaxis y Semántica se incluirán al apuntar a los símbolos, las entradas del diccionario modificables y las enmiendas temporales hacen que este dispositivo sea más práctico. Luego, se explicará la traducción automática. "Una de las opciones que debería ofrecerse a un usuario del sistema hipotético que he estado describiendo, en una etapa bastante temprana,ser un comando que dirigirá al programa a traducir la unidad seleccionada actualmente. Lo que sucederá cuando se dé este comando será diferente en las diferentes etapas del desarrollo del sistema. Pero un usuario del sistema siempre estará facultado para intervenir en el proceso de traducción en la medida que él mismo especifique. Si elige no intervenir en absoluto, se mostrará un fragmento de texto que pretende traducir la unidad actual en la ventana inferior de su pantalla. Podrá editar esto de la forma que desee, tal como lo han hecho los poseditores en el pasado. Alternativamente, puede solicitar ser consultado siempre que el programa se enfrente a una decisión de un tipo específico, cuando se detecten ciertos tipos de ambigüedades, o lo que sea. En estas ocasiones, el sistema le hará una pregunta al traductor humano. Él puede, por ejemplo,pedir ser consultado sobre cuestiones de referencia pronominal. "En esta parte, la idea de memoria de traducción se mostró como una operación de diccionario". Supongamos, por ejemplo, que una palabra se coloca en la tienda local, esa parte del diccionario que persiste solo siempre que se esté trabajando en este documento, si aparece en el texto con mucha más frecuencia de lo que indican las estadísticas almacenadas en el diccionario principal. Se anotará una frase si aparece dos o tres veces, pero el diccionario no la reconoce como un modismo o frase establecida. Al examinar el contenido de esta tienda antes de embarcarse en la traducción, el usuario puede esperar obtener una vista previa de las dificultades que se avecinan y tomar algunas decisiones de antemano sobre cómo tratarlas. Estas decisiones, por supuesto, quedarán registradas en la propia tienda. En el curso de hacer esto o, de hecho,por cualquier motivo, el traductor puede solicitar que se muestren todas las unidades del texto que contengan una determinada palabra, frase, cadena de caracteres o lo que sea. Después de todo, la referencia más importante que se debe tener al traducir un texto es el texto en sí. Si el fragmento de texto que se va a traducir a continuación no es completamente sencillo, el traductor puede comenzar emitiendo un comando que haga que el sistema muestre cualquier cosa en la tienda que pueda ser relevante para él. Esto llamará su atención sobre las decisiones que tomó antes de que comenzara la traducción real, palabras y frases estadísticamente significativas y un registro de cualquier cosa que haya atraído la atención cuando ocurrió antes. Antes de continuar, puede examinar fragmentos de texto pasados ​​y futuros que contienen material similar ".el traductor puede solicitar una visualización de todas las unidades del texto que contienen una determinada palabra, frase, cadena de caracteres o lo que sea. Después de todo, la referencia más importante que se debe tener al traducir un texto es el texto en sí. Si el fragmento de texto que se va a traducir a continuación no es completamente sencillo, el traductor puede comenzar emitiendo un comando que haga que el sistema muestre cualquier cosa en la tienda que pueda ser relevante para él. Esto llamará su atención sobre las decisiones que tomó antes de que comenzara la traducción real, palabras y frases estadísticamente significativas y un registro de cualquier cosa que haya atraído la atención cuando ocurrió antes. Antes de continuar, puede examinar fragmentos de texto pasados ​​y futuros que contienen material similar ".el traductor puede solicitar una visualización de todas las unidades del texto que contienen una determinada palabra, frase, cadena de caracteres o lo que sea. Después de todo, la referencia más importante que se debe tener al traducir un texto es el texto en sí. Si el fragmento de texto que se va a traducir a continuación no es completamente sencillo, el traductor puede comenzar emitiendo un comando que haga que el sistema muestre cualquier cosa en la tienda que pueda ser relevante para él. Esto llamará su atención sobre las decisiones que tomó antes de que comenzara la traducción real, palabras y frases estadísticamente significativas y un registro de cualquier cosa que haya atraído la atención cuando ocurrió antes. Antes de continuar, puede examinar fragmentos de texto pasados ​​y futuros que contienen material similar ".la referencia más importante que se debe tener al traducir un texto es el texto en sí. Si el fragmento de texto que se va a traducir a continuación no es completamente sencillo, el traductor puede comenzar emitiendo un comando que haga que el sistema muestre cualquier cosa en la tienda que pueda ser relevante para él. Esto llamará su atención sobre las decisiones que tomó antes de que comenzara la traducción real, palabras y frases estadísticamente significativas y un registro de cualquier cosa que haya atraído la atención cuando ocurrió antes. Antes de continuar, puede examinar fragmentos de texto pasados ​​y futuros que contienen material similar ".la referencia más importante que se debe tener al traducir un texto es el texto en sí. Si el fragmento de texto que se va a traducir a continuación no es completamente sencillo, el traductor puede comenzar emitiendo un comando que haga que el sistema muestre cualquier cosa en la tienda que pueda ser relevante para él. Esto llamará su atención sobre las decisiones que tomó antes de que comenzara la traducción real, palabras y frases estadísticamente significativas y un registro de cualquier cosa que haya atraído la atención cuando ocurrió antes. Antes de continuar, puede examinar fragmentos de texto pasados ​​y futuros que contienen material similar ".el traductor puede comenzar emitiendo un comando que hace que el sistema muestre cualquier cosa en la tienda que pueda ser relevante para él. Esto llamará su atención sobre las decisiones que tomó antes de que comenzara la traducción real, palabras y frases estadísticamente significativas y un registro de cualquier cosa que haya atraído la atención cuando ocurrió antes. Antes de continuar, puede examinar fragmentos de texto pasados ​​y futuros que contienen material similar ".el traductor puede comenzar emitiendo un comando que hace que el sistema muestre cualquier cosa en la tienda que pueda ser relevante para él. Esto llamará su atención sobre las decisiones que tomó antes de que comenzara la traducción real, palabras y frases estadísticamente significativas y un registro de cualquier cosa que haya atraído la atención cuando ocurrió antes. Antes de continuar, puede examinar fragmentos de texto pasados ​​y futuros que contienen material similar ".

1.3 Expectativa de un mejor desempeño del amanuense del traductor Al final del artículo, Kay mencionó algunas razones para esperar un mejor desempeño de este dispositivo. Primero, el sistema está en condiciones de llamar la atención de su colaborador humano sobre los asuntos que probablemente lo necesiten, segundo, las decisiones que deben tomarse en el curso de la traducción de un pasaje rara vez son independientes, tercero, una de las más importantes Las instalaciones del sistema son las que realizan un seguimiento de las palabras y frases que se utilizan de alguna manera especial en el texto actual.

  • «Una vida en el lenguaje». Un discurso pronunciado en reconocimiento del Lifetime Achievement Award en la 43ª Reunión Anual de la Asociación de Lingüística Computacional, Ann Arbor, Michigan, 27 de junio de 2005. http://www.stanford.edu/~mjkay/LifeOfLanguage.pdf
  • Alineación de cadenas mediante árboles de sufijos. Un artículo sobre el posible uso de árboles de sufijos para alinear textos y sus traducciones. http://www.stanford.edu/~mjkay/CYCLING.pdf
  • Algunas reflexiones inconclusas sobre la naturaleza de la traducción. Aquí hay algunas reflexiones inconclusas sobre la naturaleza de la traducción. http://www.stanford.edu/~mjkay/CurrentState.pdf
  • Algunas ideas a medias sobre los modelos de lenguaje en la PNL estadística sobre las que necesito ayuda. http://www.stanford.edu/~mjkay/language_models.pdf
  • Su artículo de 1994 sobre " Modelos regulares de sistemas de reglas fonológicas ". Computational Linguistics 20 (3): 331–378 "con Ronald Kaplan. Http://www.stanford.edu/~mjkay/Kaplan%26Kay.pdf

Libros

  • Lingüística y ciencia de la información (con Karen Spärck Jones ), Academic Press , 1973.
  • Natural Language in Information Science (editado con DE Walker y Hans Karlgren), Skriptor, Estocolmo, 1977
  • Verbmobil: A Translation System for Face-to-Face Dialog (con Jean Mark Gawron y Peter Norvig ), CSLI, Stanford, California, 1994.
  • Introducción a la traducción automática . W. John Hutchins y Harold L. Somers. Londres: Academic Press, 1992.
  • Manual de Lingüística Computacional . Ruslan Mitkov (ed.). Oxford University Press , 2003. (Introducción).

Artículos seleccionados

  • " Reglas de interpretación: una aproximación al problema de la computación en la semántica del lenguaje natural ", en Actas del Segundo Congreso Internacional de la Federación Internacional de Procesamiento de la Información, 1962.
  • "Un procedimiento de análisis" Actas del Segundo Congreso Internacional de la Federación Internacional de Procesamiento de Información, 1962.
  • "Un procedimiento general para reescribir cadenas", documento presentado en la reunión anual de la Asociación de Traducción Automática y Lingüística Computacional, Bloomington, Indiana, 1964.
  • The Logic of Cognate Recognition in Historical Linguistics, RM-4224-PR, Santa Mónica, The RAND Corporation, julio de 1964.
  • Un programa de análisis de gramáticas categóricas, RM-4283-PR, Santa Mónica, The RAND Corporation, agosto de 1964.
  • The Tabular Parser: A Parsing Program for Phrase-Structure and Dependency, RM-4933-PR, Santa Mónica, The RAND Corporation, julio de 1966.
  • The Computer System to Aid the Linguistic Field Worker, P-4095, Santa Monica, The RAND Corporation, mayo de 1969.
  • The MIND System: The Morphological Analysis Program, RM-6265/2-PR, Santa Mónica, The RAND Corporation, abril de 1970. (con Gary R. Martins).
  • "Traducción automática de lenguajes naturales" en El lenguaje como problema humano: Dédalo, 1973.
  • " Gramática de unificación funcional: un formalismo para la traducción automática " en Actas de la Conferencia Internacional sobre Lingüística Computacional (COLING 84), Asociación de Lingüística Computacional, 1984.
  • "Análisis en lenguajes de orden de palabras libres" (con Lauri Karttunen), en Dowty, David R., Lauri Karttunen y Arnold M. Zwicky, Análisis del lenguaje natural, Cambridge University Press, 1985.
  • "Unificación en gramática", en Dahl, V. y P. Saint-Dizier, Comprensión del lenguaje natural y programación lógica, Holanda del Norte, 1985.
  • "Cuestiones teóricas en el diseño de una estación de trabajo para traductores", Actas del taller de IBM sobre informática y traducción, Copenhague.
  • "Modelos regulares de sistemas de reglas fonológicas" (con RM Kaplan), Lingüística computacional 20: 3 (septiembre de 1994. Con RM Kaplan).
  • "Alineación de subcadenas mediante árboles de sufijo". Lingüística Computacional y Procesamiento Inteligente de Texto , Springer, Lecture Notes in Computer Science, 2004.

Lecturas del curso

  • Unificación disyuntiva http://www.stanford.edu/~mjkay/DisjunctiveUnification.pdf
  • Incertidumbre funcional http://www.stanford.edu/~mjkay/FunctionalUncertainty.pdf
  • HPSG1 http://www.stanford.edu/~mjkay/pollard-foundations.pdf
  • HPSG2 http://www.stanford.edu/~mjkay/levine03.pdf
  • Generación HPSG http://www.stanford.edu/~mjkay/Shieber.pdf
  • CCG http://www.stanford.edu/~mjkay/Steedman%26Baldridge.pdf
  • Funciones escritas http://www.stanford.edu/~mjkay/Copestake.pdf
  • Dependencia http://www.stanford.edu/~mjkay/covington.pdf

Premios

  • Tiene una cátedra honoraria en la Universidad del Sarre y doctorados honorarios de las universidades de Gotemburgo y Ginebra.
  • También ganó el 2005 ACL Lifetime Achievement Award. Su discurso de aceptación se tituló "Una vida de lenguaje". [2]

Referencias

  1. ^ Kay, Martín. " El lugar adecuado de hombres y máquinas en la traducción de idiomas ". traducción automática 12.1-2 (1997): 3-23.
  2. ^ "Destinatarios del premio ACL Lifetime Achievement Award" . Wiki de ACL . ACL . Consultado el 24 de agosto de 2017 .

enlaces externos

  • Página de inicio de Stanford
  • Página de inicio de la Universidad de Saarland
  • Cita del premio ACL Lifetime Achievement Award
  • "A Life of Language" - Discurso de aceptación del premio ACL Lifetime Award - Martin Kay describiendo su trabajo en Lingüística Computacional (13 páginas)
  • Anuncio de conferencia con nota biográfica
  • Una entrevista (video y audio) con Martin Kay en el Oxford Internet Institute, 18 de junio de 2009
Obtenido de " https://en.wikipedia.org/w/index.php?title=Martin_Kay&oldid=1051149527 "