Traducción automática interactiva

La traducción automática interactiva ( IMT ) es un subcampo específico de la traducción asistida por computadora . Bajo este paradigma de traducción , el software de computadora que ayuda al traductor humano intenta predecir el texto que el usuario ingresará tomando en cuenta toda la información que tiene disponible. Siempre que dicha predicción sea incorrecta y el usuario proporcione retroalimentación al sistema, se realizará una nueva predicción considerando la nueva información disponible. Dicho proceso se repite hasta que la traducción proporcionada coincide con las expectativas del usuario.

La traducción automática interactiva es especialmente interesante cuando se traducen textos en dominios en los que no es admisible generar una traducción que contenga errores, por lo que se requiere que un usuario humano corrija las traducciones proporcionadas por el sistema. En tales casos, se ha demostrado que la traducción automática interactiva beneficia a los usuarios potenciales. ^[1]^[2] Sin embargo, hay pocos programas comerciales que implementen la traducción automática interactiva y el trabajo realizado en el campo se restringe principalmente a la investigación académica .

Historia

Históricamente, la traducción automática interactiva nace como una evolución del paradigma de la traducción asistida por computadora , donde se pretendía que el traductor humano y el sistema de traducción automática funcionaran como un tándem . ^[3] Este primer trabajo se amplió dentro del proyecto de investigación TransType, financiado por el gobierno canadiense. En este proyecto, la interacción humana tuvo como objetivo producir el texto de destino por primera vez mediante la incorporación de técnicas de traducción automática basadas en datos dentro del entorno de traducción interactiva con el objetivo de lograr lo mejor de ambos actores: la eficiencia del sistema automático y la fiabilidad de los traductores humanos.

Posteriormente, un proyecto de investigación a mayor escala, TransType2, ^[1]^[2] financiado por la Comisión Europea amplió dicho trabajo analizando la incorporación de un sistema completo de traducción automática en el proceso, con el objetivo de producir una hipótesis de traducción completa, que el usuario humano puede modificar o aceptar. Si el usuario decide modificar la hipótesis, el sistema intenta hacer el mejor uso de dicha retroalimentación para producir una nueva hipótesis de traducción que tenga en cuenta las modificaciones introducidas por el usuario.

Más recientemente, CASMACAT, ^[4] también financiado por la Comisión Europea , tuvo como objetivo desarrollar nuevos tipos de asistencia a traductores humanos y los integró en un nuevo banco de trabajo, que consta de un editor, un servidor y herramientas de análisis y visualización. El banco de trabajo se diseñó de forma modular y se puede combinar con las herramientas de traducción asistidas por computadora existentes. Además, el banco de trabajo CASMACAT puede aprender de la interacción con el traductor humano actualizando y adaptando sus modelos instantáneamente en función de las opciones de traducción del usuario. ^[5]^[6]

Un trabajo reciente sobre la participación de una evaluación exhaustiva con usuarios humanos ^[7] reveló el hecho de que la traducción automática interactiva puede incluso ser utilizada por usuarios que no hablan el idioma de origen para lograr una calidad de traducción casi profesional. Además, también aclaró el hecho de que un escenario interactivo es más beneficioso que un escenario clásico posterior a la edición.

Los enfoques descritos anteriormente se basan en un sistema de traducción automática basado en corpus subyacente estrechamente acoplado (generalmente, un sistema de traducción automática estadística ) que se utiliza como una caja de cristal , por lo que hereda las deficiencias de los sistemas de traducción y limita el uso de la traducción automática interactiva para algunos escenarios. Por esta razón, se desarrolló un enfoque que utiliza cualquier tipo de recurso bilingüe (no limitado a la traducción automática) como una caja negra para proporcionar traducción automática interactiva. ^[8] Este enfoque no puede extraer tanta información de los recursos bilingües utilizados, debido a la naturaleza de caja negra de la interacción, pero puede utilizar cualquier recurso disponible para el usuario. Forecat es una implementación de traducción automática interactiva de caja negra que está disponible como una aplicación web (que incluye una página web y una interfaz de servicios web) y como un complemento para OmegaT (Forecat-OmegaT).

Proceso

El proceso de traducción automática interactiva comienza con el sistema sugiriendo una hipótesis de traducción al usuario. Luego, el usuario puede aceptar la oración completa como correcta, o puede modificarla si considera que existe algún error. Normalmente, al modificar una palabra determinada, se asume que el prefijo hasta esa palabra es correcto, lo que lleva a un esquema de interacción de izquierda a derecha. Una vez que el usuario ha cambiado la palabra considerada incorrecta, el sistema propone un nuevo sufijo, es decir, el resto de la oración. Dicho proceso continúa hasta que la traducción proporcionada satisface al usuario.

Aunque se explica a nivel de palabra, el proceso anterior también puede implementarse a nivel de carácter y, por lo tanto, el sistema proporciona un sufijo cada vez que el traductor humano escribe un solo carácter. Además, existe un esfuerzo continuo para cambiar el esquema típico de interacción de izquierda a derecha para facilitar la interacción hombre-máquina . ^[9]^[10]

Se utiliza un enfoque similar en la herramienta de traducción Caitra .

Evaluación

La evaluación es un tema difícil en la traducción automática interactiva. Idealmente, la evaluación debería tener lugar en experimentos con usuarios humanos. Sin embargo, dado el alto costo monetario que esto implicaría, rara vez es así. Además, incluso al considerar a los traductores humanos para realizar una verdadera evaluación de las técnicas interactivas de traducción automática, no está claro qué se debe medir en tales experimentos, ya que hay muchas variables diferentes que deben tenerse en cuenta y no pueden controlarse, como es, por ejemplo, el tiempo que tarda el usuario en acostumbrarse al proceso. En el proyecto CASMACAT se han realizado algunos ensayos de campo para estudiar algunas de estas variables. ^[11]^[12]^[13]

Para evaluaciones rápidas en condiciones de laboratorio, la traducción automática interactiva se mide utilizando la relación de pulsaciones de tecla o la relación de pulsaciones de palabras . Dichos criterios intentan medir cuántas pulsaciones de teclas o palabras tuvo que introducir el usuario antes de producir el documento final traducido. ^[2]

Diferencias con la traducción clásica asistida por computadora

Aunque la traducción automática interactiva es un subcampo de la traducción asistida por ordenador , el principal atractivo de la primera con respecto a la segunda es la interactividad. En la traducción clásica asistida por computadora, el sistema de traducción puede sugerir una hipótesis de traducción en el mejor de los casos, y luego se requiere que el usuario edite posteriormente dicha hipótesis. Por el contrario, en la traducción automática interactiva, el sistema produce una nueva hipótesis de traducción cada vez que el usuario interactúa con el sistema, es decir, después de que se ha introducido cada palabra (o letra).

Ver también

Referencias

↑ ^a ^b Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Lagarda, Antonio L .; Lapalme, Guy; Macklovitch, Elliott; Vidal, Enrique (2009). "Interacción humana para la traducción automática de alta calidad" (PDF) . Comunicaciones de la ACM . 52 (10): 135-138. doi : 10.1145 / 1562764.1562798 . Archivado desde el original (PDF) el 6 de julio de 2011.
^ a b c Barrachina, Sergio; Bender, Oliver; Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Khadivi, Shahram; Lagarda, Antonio L .; Ney, Hermann; Tomás, Jesús; Vidal, Enrique (2009). "Enfoques estadísticos para la traducción asistida por computadora" (PDF) . Lingüística computacional . 25 (1): 3–28. doi : 10.1162 / coli.2008.07-055-r2-06-29 .
^ Foster, George; Isabelle, Pierre; Plamondon, Pierre (1997). "Traducción automática interactiva mediada por texto de destino". Traducción automática . 12 (1): 175-194. doi : 10.1023 / a: 1007999327580 .
^ Alabau, Vicent; Buck, Christian; Carl, Michael; Casacuberta, Francisco; García-Martínez, Mercedes; Germann, Ulrich; González-Rubio, Jesús; Hill, Robin; Koehn, Philipp; Leiva, Luis; Mesa-Lao, Barto; Ortiz, Daniel; Saint-Amand, Herve; Sanchis, alemán; Tsoukala, Chara (abril de 2014). "CASMACAT: un banco de trabajo de traducción asistida por ordenador" (PDF) . Actas de la 14ª Conferencia del Capítulo Europeo de la Asociación de Lingüística Computacional . Los Ángeles, California: Asociación de Lingüística Computacional. págs. 25-28.
^ Ortiz-Martínez, Daniel; García-Varea, Ismael; Casacuberta, Francisco (junio de 2010). "Aprendizaje en línea para la traducción automática estadística interactiva" (PDF) . Human Language Technologies: la conferencia anual de 2010 del capítulo norteamericano de la ACL . Asociación de Lingüística Computacional. págs. 546–554.
^ Martínez-Gómez, Pascual; Sanchis-Trilles, alemán; Casacuberta, Francisco (septiembre de 2012). "Estrategias de adaptación online para traducción automática estadística en escenarios de posedición". Reconocimiento de patrones . Elsevier. 45 (9): 3193–3203. doi : 10.1016 / j.patcog.2012.01.011 . hdl : 10251/37324 .
^ Koehn, Philipp (junio de 2010). "Habilitación de traductores monolingües: posedición frente a opciones" (PDF) . Tecnologías del lenguaje humano: Conferencia anual de 2010 del Capítulo norteamericano de la Asociación de Lingüística Computacional (HLT / NAACL) . Los Ángeles, California: Asociación de Lingüística Computacional. págs. 537–545.
^ Juan Antonio, Pérez-Ortiz; Torregrosa, Daniel; Forcada, Mikel (2014). "Integración de caja negra de recursos bilingües heterogéneos en un sistema de traducción interactivo" . Actas del Taller EACL 2014 sobre humanos y traducción asistida por computadora . Los Ángeles, California: Asociación de Lingüística Computacional. págs. 57–65.
^ Sanchis-Trilles, Germán; Ortiz-Martínez, Daniel; Civera, Jorge; Casacuberta, Francisco; Vidal, Enrique; Hoang, Hieu (octubre de 2008). "Mejora de la traducción automática interactiva mediante acciones del mouse" (PDF) . Actas de la Conferencia de 2008 sobre métodos empíricos en el procesamiento del lenguaje natural (EMNLP) . Honolulu, Hawaii: Asociación de Lingüística Computacional. págs. 485–494.
^ González-Rubio, Jesús; Ortiz-Martínez, Daniel; Casacuberta, Francisco (julio de 2010). "Equilibrar el esfuerzo del usuario y el error de traducción en la traducción automática interactiva mediante medidas de confianza" (PDF) . Actas de los artículos breves de la conferencia ACL 2010 (ACL) . Uppsala, Suecia: Asociación de Lingüística Computacional. págs. 173-177.
^ Underwood, Nancy; Mesa-Lao, Bartolomé; García-Martínez, Mercedes; Carl, Michael; Alabau, Vicent; González-Rubio, Jesús; Leiva, Luis; Sanchis-Trilles, Germán; Ortiz-Martínez, Daniel; Casacuberta, Francisco (mayo de 2014). "Evaluación de los efectos de la interactividad en un banco de trabajo de posedición" (PDF) . Actas de la 29ª edición de la Conferencia de Evaluación y Recursos Lingüísticos (LREC) . Reykjavik, Islandia. págs. 553–559.
^ Ortiz-Martínez, Daniel; González-Rubio, Jesús; Alabau, Vicent; Sanchis-Trilles, Germán; Casacuberta, Francisco (agosto de 2015). "Integración del aprendizaje activo y en línea en un banco de trabajo de traducción asistida por computadora". Nuevas direcciones en la investigación del proceso de traducción empírica: exploración del CRITT TPR-DB . Saltador. págs. 54–73.
^ Alabau, Vicent; Carl, Michael; Casacuberta, Francisco; García-Martínez, Mercedes; Mesa-Lao, Bartolomé; Ortiz-Martínez, Daniel; González-Rubio, Jesús; Sanchis-Trilles, Germán; Schaeffer, Moritz (agosto de 2015). "Aprendizaje avanzado de posedición". Nuevas direcciones en la investigación del proceso de traducción empírica: exploración del CRITT TPR-DB . Saltador. págs. 95-111.

enlaces externos

Demostración de traducción automática interactiva de Lilt
Demostración de traducción automática interactiva
Página web del proyecto TransType
Página web del proyecto TransType2
Página web del proyecto MIPRCV
Forecat
Forecat-OmegaT

[Casacuberta_2009-1] Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Lagarda, Antonio L .; Lapalme, Guy; Macklovitch, Elliott; Vidal, Enrique (2009). "Interacción humana para la traducción automática de alta calidad" (PDF) . Comunicaciones de la ACM . 52 (10): 135-138. doi : 10.1145 / 1562764.1562798 . Archivado desde el original (PDF) el 6 de julio de 2011.

[Barrachina_2009-2] Barrachina, Sergio; Bender, Oliver; Casacuberta, Francisco; Civera, Jorge; Cubel, Elsa; Khadivi, Shahram; Lagarda, Antonio L .; Ney, Hermann; Tomás, Jesús; Vidal, Enrique (2009). "Enfoques estadísticos para la traducción asistida por computadora" (PDF) . Lingüística computacional . 25 (1): 3–28. doi : 10.1162 / coli.2008.07-055-r2-06-29 .

[3] Foster, George; Isabelle, Pierre; Plamondon, Pierre (1997). "Traducción automática interactiva mediada por texto de destino". Traducción automática . 12 (1): 175-194. doi : 10.1023 / a: 1007999327580 .

[4] Alabau, Vicent; Buck, Christian; Carl, Michael; Casacuberta, Francisco; García-Martínez, Mercedes; Germann, Ulrich; González-Rubio, Jesús; Hill, Robin; Koehn, Philipp; Leiva, Luis; Mesa-Lao, Barto; Ortiz, Daniel; Saint-Amand, Herve; Sanchis, alemán; Tsoukala, Chara (abril de 2014). "CASMACAT: un banco de trabajo de traducción asistida por ordenador" (PDF) . Actas de la 14ª Conferencia del Capítulo Europeo de la Asociación de Lingüística Computacional . Los Ángeles, California: Asociación de Lingüística Computacional. págs. 25-28.

[5] Ortiz-Martínez, Daniel; García-Varea, Ismael; Casacuberta, Francisco (junio de 2010). "Aprendizaje en línea para la traducción automática estadística interactiva" (PDF) . Human Language Technologies: la conferencia anual de 2010 del capítulo norteamericano de la ACL . Asociación de Lingüística Computacional. págs. 546–554.

[6] Martínez-Gómez, Pascual; Sanchis-Trilles, alemán; Casacuberta, Francisco (septiembre de 2012). "Estrategias de adaptación online para traducción automática estadística en escenarios de posedición". Reconocimiento de patrones . Elsevier. 45 (9): 3193–3203. doi : 10.1016 / j.patcog.2012.01.011 . hdl : 10251/37324 .

[7] Koehn, Philipp (junio de 2010). "Habilitación de traductores monolingües: posedición frente a opciones" (PDF) . Tecnologías del lenguaje humano: Conferencia anual de 2010 del Capítulo norteamericano de la Asociación de Lingüística Computacional (HLT / NAACL) . Los Ángeles, California: Asociación de Lingüística Computacional. págs. 537–545.

[8] Juan Antonio, Pérez-Ortiz; Torregrosa, Daniel; Forcada, Mikel (2014). "Integración de caja negra de recursos bilingües heterogéneos en un sistema de traducción interactivo" . Actas del Taller EACL 2014 sobre humanos y traducción asistida por computadora . Los Ángeles, California: Asociación de Lingüística Computacional. págs. 57–65.

[9] Sanchis-Trilles, Germán; Ortiz-Martínez, Daniel; Civera, Jorge; Casacuberta, Francisco; Vidal, Enrique; Hoang, Hieu (octubre de 2008). "Mejora de la traducción automática interactiva mediante acciones del mouse" (PDF) . Actas de la Conferencia de 2008 sobre métodos empíricos en el procesamiento del lenguaje natural (EMNLP) . Honolulu, Hawaii: Asociación de Lingüística Computacional. págs. 485–494.

[10] González-Rubio, Jesús; Ortiz-Martínez, Daniel; Casacuberta, Francisco (julio de 2010). "Equilibrar el esfuerzo del usuario y el error de traducción en la traducción automática interactiva mediante medidas de confianza" (PDF) . Actas de los artículos breves de la conferencia ACL 2010 (ACL) . Uppsala, Suecia: Asociación de Lingüística Computacional. págs. 173-177.

[11] Underwood, Nancy; Mesa-Lao, Bartolomé; García-Martínez, Mercedes; Carl, Michael; Alabau, Vicent; González-Rubio, Jesús; Leiva, Luis; Sanchis-Trilles, Germán; Ortiz-Martínez, Daniel; Casacuberta, Francisco (mayo de 2014). "Evaluación de los efectos de la interactividad en un banco de trabajo de posedición" (PDF) . Actas de la 29ª edición de la Conferencia de Evaluación y Recursos Lingüísticos (LREC) . Reykjavik, Islandia. págs. 553–559.

[12] Ortiz-Martínez, Daniel; González-Rubio, Jesús; Alabau, Vicent; Sanchis-Trilles, Germán; Casacuberta, Francisco (agosto de 2015). "Integración del aprendizaje activo y en línea en un banco de trabajo de traducción asistida por computadora". Nuevas direcciones en la investigación del proceso de traducción empírica: exploración del CRITT TPR-DB . Saltador. págs. 54–73.

[13] Alabau, Vicent; Carl, Michael; Casacuberta, Francisco; García-Martínez, Mercedes; Mesa-Lao, Bartolomé; Ortiz-Martínez, Daniel; González-Rubio, Jesús; Sanchis-Trilles, Germán; Schaeffer, Moritz (agosto de 2015). "Aprendizaje avanzado de posedición". Nuevas direcciones en la investigación del proceso de traducción empírica: exploración del CRITT TPR-DB . Saltador. págs. 95-111.

[1]