La traducción automática es un subcampo de la lingüística computacional que investiga el uso de software para traducir texto o habla de un idioma natural a otro.
En la década de 1950, la traducción automática se convirtió en una realidad en la investigación, aunque se pueden encontrar referencias al tema ya en el siglo XVII. El experimento de Georgetown , que implicó la traducción completamente automática con éxito de más de sesenta frases rusas al inglés en 1954, fue uno de los primeros proyectos registrados. [1] [2] Los investigadores del experimento de Georgetown afirmaron su creencia de que la traducción automática sería un problema resuelto dentro de tres a cinco años. [3] [Se necesita una mejor fuente ] En la Unión Soviética, se llevaron a cabo experimentos similares poco después. [4]En consecuencia, el éxito del experimento marcó el comienzo de una era de financiación significativa para la investigación de la traducción automática en los Estados Unidos. El progreso logrado fue mucho más lento de lo esperado; en 1966, el informe de ALPAC encontró que diez años de investigación no habían cumplido las expectativas del experimento de Georgetown y dieron como resultado una drástica reducción de fondos [ cita requerida ] .
Creció el interés en los modelos estadísticos para la traducción automática , que se hicieron más comunes y también menos costosos en la década de 1980 a medida que aumentaba la potencia computacional disponible.
Aunque no existe un sistema autónomo de "traducción totalmente automática de alta calidad de texto sin restricciones", [5] [6] [7] hay muchos programas ahora disponibles que son capaces de proporcionar resultados útiles dentro de estrictas restricciones. Varios de estos programas están disponibles en línea, como Google Translate y el sistema SYSTRAN que alimenta BabelFish de AltaVista (ahora Babelfish de Yahoo a partir del 9 de mayo de 2008).
El principio
Los orígenes de la traducción automática se remontan al trabajo de Al-Kindi , un criptógrafo árabe del siglo IX que desarrolló técnicas para la traducción de idiomas sistémica, incluido el criptoanálisis , el análisis de frecuencia y la probabilidad y las estadísticas , que se utilizan en la traducción automática moderna. [8] La idea de la traducción automática apareció más tarde en el siglo XVII. En 1629, René Descartes propuso un lenguaje universal, con ideas equivalentes en diferentes lenguas compartiendo un símbolo. [9]
A mediados de la década de 1930, Georges Artsrouni solicitó las primeras patentes de "máquinas de traducción" para un diccionario bilingüe automático que utilizaba cinta de papel . El ruso Peter Troyanskii presentó una propuesta más detallada [10] [11] que incluía tanto el diccionario bilingüe como un método para tratar los roles gramaticales entre idiomas, basado en el sistema gramatical del esperanto . Este sistema se dividió en tres etapas: la etapa uno consistió en un editor de habla nativa en el idioma de origen para organizar las palabras en sus formas lógicas y ejercer las funciones sintácticas; la segunda etapa requería que la máquina "tradujera" estos formularios al idioma de destino; y la etapa tres requirió un editor de habla nativa en el idioma de destino para normalizar esta salida. La propuesta de Troyanskii permaneció desconocida hasta finales de la década de 1950, cuando las computadoras eran bien conocidas y utilizadas.
Los primeros años
El primer conjunto de propuestas para la traducción automática por computadora fue presentado en 1949 por Warren Weaver , un investigador de la Fundación Rockefeller , " Memorando de traducción ". [12] Estas propuestas se basaron en la teoría de la información , los éxitos en el descifrado de códigos durante la Segunda Guerra Mundial y las teorías sobre los principios universales que subyacen al lenguaje natural .
Unos años después de que Weaver presentara sus propuestas, la investigación comenzó en serio en muchas universidades de los Estados Unidos. El 7 de enero de 1954 se llevó a cabo el experimento Georgetown-IBM en Nueva York en la oficina central de IBM. Esta fue la primera demostración pública de un sistema de traducción automática. La manifestación fue ampliamente difundida en los periódicos y despertó el interés del público. Sin embargo, el sistema en sí no era más que un sistema de "juguete". Tenía solo 250 palabras y traducía 49 oraciones rusas cuidadosamente seleccionadas al inglés, principalmente en el campo de la química . Sin embargo, alentó la idea de que la traducción automática era inminente y estimuló la financiación de la investigación, no solo en los EE. UU. Sino en todo el mundo. [3]
Los primeros sistemas utilizaban grandes diccionarios bilingües y reglas codificadas a mano para fijar el orden de las palabras en el resultado final, lo que finalmente se consideró demasiado restrictivo en los desarrollos lingüísticos en ese momento. Por ejemplo, se aprovecharon la lingüística generativa y la gramática transformacional para mejorar la calidad de las traducciones. Durante este período se instalaron sistemas operativos. La Fuerza Aérea de los Estados Unidos utilizó un sistema producido por IBM y la Universidad de Washington , mientras que la Comisión de Energía Atómica y Euratom , en Italia, utilizaron un sistema desarrollado en la Universidad de Georgetown . Si bien la calidad de la producción fue deficiente, satisfizo muchas de las necesidades de los clientes, particularmente en términos de velocidad. [ cita requerida ]
A finales de la década de 1950, el gobierno de EE. UU. Le pidió a Yehoshua Bar-Hillel que estudiara la traducción automática para evaluar la posibilidad de una traducción automática de alta calidad por máquinas. Bar-Hillel describió el problema de la ambigüedad semántica o el doble sentido, como se ilustra en la siguiente oración:
El pequeño John estaba buscando su caja de juguetes. Finalmente lo encontró. La caja estaba en la pluma.
La palabra bolígrafo puede tener dos significados: el primer significado, algo que se usa para escribir con tinta; el segundo significado, un recipiente de algún tipo. Para un ser humano, el significado es obvio, pero Bar-Hillel afirmó que sin una "enciclopedia universal" una máquina nunca podría resolver este problema. En ese momento, este tipo de ambigüedad semántica solo podía resolverse escribiendo textos fuente para traducción automática en un lenguaje controlado que utiliza un vocabulario en el que cada palabra tiene exactamente un significado. [ cita requerida ]
Los años sesenta, el informe ALPAC y los setenta
La investigación en la década de 1960 tanto en la Unión Soviética como en los Estados Unidos se concentró principalmente en el par de idiomas ruso-inglés. Los objetos de la traducción fueron principalmente documentos científicos y técnicos, como artículos de revistas científicas . Las traducciones aproximadas producidas fueron suficientes para obtener una comprensión básica de los artículos. Si un artículo trataba sobre un tema considerado confidencial, se enviaba a un traductor humano para una traducción completa; si no, se descartó.
En 1966, la investigación de la traducción automática sufrió un gran golpe con la publicación del informe ALPAC . El informe fue encargado por el gobierno de EE. UU. Y presentado por ALPAC , el Comité Asesor de Procesamiento Automático del Lenguaje, un grupo de siete científicos convocados por el gobierno de EE. UU. En 1964. El gobierno de EE. UU. Estaba preocupado por la falta de progreso a pesar de los importantes gastos . El informe concluyó que la traducción automática era más cara, menos precisa y más lenta que la traducción humana y que, a pesar de los gastos, no era probable que la traducción automática alcanzara la calidad de un traductor humano en un futuro próximo.
Sin embargo, el informe recomendaba que se desarrollaran herramientas para ayudar a los traductores (diccionarios automáticos, por ejemplo) y que se siguiera apoyando algunas investigaciones en lingüística computacional.
La publicación del informe tuvo un profundo impacto en la investigación de la traducción automática en los Estados Unidos y, en menor medida, en la Unión Soviética y el Reino Unido. La investigación, al menos en Estados Unidos, estuvo casi completamente abandonada durante más de una década. En Canadá, Francia y Alemania, sin embargo, prosiguieron las investigaciones. En Estados Unidos, las principales excepciones fueron los fundadores de Systran ( Peter Toma ) y Logos (Bernard Scott), quienes establecieron sus empresas en 1968 y 1970 respectivamente y sirvieron en el Departamento de Defensa de Estados Unidos. En 1970, el sistema Systran fue instalado para la Fuerza Aérea de los Estados Unidos y posteriormente por la Comisión de las Comunidades Europeas en 1976. El sistema METEO , desarrollado en la Université de Montréal , se instaló en Canadá en 1977 para traducir los pronósticos meteorológicos del inglés. al francés, y traducía cerca de 80.000 palabras por día o 30 millones de palabras por año hasta que fue reemplazado por un sistema de la competencia el 30 de septiembre de 2001. [13]
Mientras que la investigación en la década de 1960 se concentró en pares de idiomas e insumos limitados, en la década de 1970 la demanda fue de sistemas de bajo costo que pudieran traducir una variedad de documentos técnicos y comerciales. Esta demanda fue impulsada por el aumento de la globalización y la demanda de traducción en Canadá, Europa y Japón. [ cita requerida ]
La década de 1980 y principios de la de 1990
En la década de 1980, había aumentado tanto la diversidad como el número de sistemas instalados para la traducción automática. Se estaban utilizando varios sistemas que dependían de la tecnología de mainframe , como Systran , Logos , Ariane-G5 y Metal . [ cita requerida ]
Como resultado de la disponibilidad mejorada de microcomputadoras , había un mercado para los sistemas de traducción automática de gama baja. Muchas empresas se beneficiaron de esto en Europa, Japón y Estados Unidos. También se introdujeron sistemas en el mercado de China, Europa del Este, Corea y la Unión Soviética . [ cita requerida ]
Durante la década de 1980 hubo mucha actividad en MT en Japón especialmente. Con la computadora de quinta generación, Japón tenía la intención de superar a su competencia en hardware y software, y un proyecto en el que se vieron involucradas muchas grandes empresas japonesas de electrónica fue la creación de software para traducir hacia y desde el inglés (Fujitsu, Toshiba, NTT, Brother, Catena , Matsushita, Mitsubishi, Sharp, Sanyo, Hitachi, NEC, Panasonic, Kodensha, Nova, Oki). [ cita requerida ]
La investigación durante la década de 1980 se basó típicamente en la traducción a través de una variedad de representaciones lingüísticas intermedias que incluían análisis morfológico, sintáctico y semántico. [ cita requerida ]
A fines de la década de 1980, hubo un gran aumento en una serie de métodos novedosos para la traducción automática. En IBM se desarrolló un sistema basado en métodos estadísticos . Makoto Nagao y su grupo utilizaron métodos basados en un gran número de ejemplos de traducción, una técnica que ahora se denomina traducción automática basada en ejemplos . [14] [15] Una característica definitoria de ambos enfoques fue el descuido de las reglas sintácticas y semánticas y la dependencia, en cambio, de la manipulación de grandes corpus de texto .
Durante la década de 1990, alentada por los éxitos en el reconocimiento de voz y la síntesis de voz , se inició la investigación sobre la traducción de voz con el desarrollo del proyecto alemán Verbmobil .
El sistema Forward Area Language Converter (FALCon), una tecnología de traducción automática diseñada por el Laboratorio de Investigación del Ejército , se lanzó en 1997 para traducir documentos para los soldados en Bosnia. [dieciséis]
Hubo un crecimiento significativo en el uso de la traducción automática como resultado de la llegada de computadoras más potentes y de bajo costo. Fue a principios de la década de 1990 cuando la traducción automática comenzó a hacer la transición de las grandes computadoras centrales a las computadoras personales y estaciones de trabajo . Dos empresas que lideraron el mercado de las PC durante un tiempo fueron Globalink y MicroTac, tras lo cual se descubrió que una fusión de las dos empresas (en diciembre de 1994) redundaba en beneficio de los intereses corporativos de ambas. Intergraph y Systran también comenzaron a ofrecer versiones para PC en esta época. Los sitios también llegaron a estar disponibles en el Internet, tales como AltaVista 's Babel Fish (usando la tecnología Systran) y Google Herramientas del idioma (también inicialmente utilizando la tecnología Systran exclusivamente).
2000
El campo de la traducción automática ha experimentado cambios importantes en los últimos años. Actualmente se está realizando una gran cantidad de investigación sobre traducción automática estadística y traducción automática basada en ejemplos . En el área de la traducción de voz, la investigación se ha centrado en pasar de sistemas de dominio limitado a sistemas de traducción de dominio ilimitado. En diferentes proyectos de investigación en Europa (como TC-STAR) [17] y en los Estados Unidos (STR-DUST y US-DARPA-GALE), [18] se han desarrollado soluciones para traducir automáticamente discursos parlamentarios y retransmisiones de noticias. En estos escenarios, el dominio del contenido ya no se limita a un área especial, sino que los discursos a traducir cubren una variedad de temas. Más recientemente, el proyecto francés-alemán Quaero investiga la posibilidad de hacer uso de traducciones automáticas para una Internet multilingüe. El proyecto busca traducir no solo páginas web, sino también videos y archivos de audio en Internet.
Hoy en día, solo unas pocas empresas utilizan comercialmente la traducción automática estadística. Ha habido un interés renovado en la hibridación, con investigadores que combinan conocimientos sintácticos y morfológicos (es decir, lingüísticos) en sistemas estadísticos, así como también combinan estadísticas con sistemas existentes basados en reglas. [ cita requerida ]
Ver también
- Historia del procesamiento del lenguaje natural
- Informe ALPAC
- Traducción asistida por computadora
- Informe Lighthill
- Máquina traductora
Notas
- ^ Nye, Mary Jo (2016). "Hablar en lenguas: la búsqueda de siglos de ciencia por un idioma común" . Destilaciones . 2 (1): 40–43 . Consultado el 22 de marzo de 2018 .
- ^ Gordin, Michael D. (2015). Scientific Babel: cómo se hacía la ciencia antes y después del inglés global . Chicago, Illinois: University of Chicago Press. ISBN 9780226000299.
- ^ a b Hutchins, J. (2005). "La historia de la traducción automática en pocas palabras" (PDF) .[ fuente autoeditada ]
- ^ Madsen, Mathias Winther (23 de diciembre de 2009). Los límites de la traducción automática (tesis). Universidad de Copenhague. pag. 11.
- ^ Melby, Alan K. (1995). La posibilidad del lenguaje . Amsterdam: J. Benjamins. págs. 27–41. ISBN 9027216142.
- ^ Wooten, Adam (14 de febrero de 2006). "Un modelo simple que describe la tecnología de traducción" . T&I Business . Archivado desde el original el 16 de julio de 2012.
- ^ "Anexo III de 'El estado actual de la traducción automática de idiomas ' " (PDF) . Avances en informática . 1960. págs. 158-163. Reimpreso en Y Bar-Hillel (1964). Idioma e información . Massachusetts: Addison-Wesley. págs. 174-179.
- ^ DuPont, Quinn (enero de 2018). "Los orígenes criptológicos de la traducción automática: de al-Kindi a Weaver" . Amodern (8).
- ^ 浜 口, 稔 (30 de abril de 1993).英 仏 普遍 言語 計画. 工作 舎. págs. 70–71. ISBN 978-4-87502-214-5.
普遍的文字の構築という初期の試みに言及するときは1629年11月にデカルトがメルセンヌに宛てた手紙から始まる,というのが通り相場となっている.しかし,この問題への関心を最初に誘発した多くの要因を吟味してみると,ある種の共通の書字という構想は明らかに,ずっと以前から比較的なじみ深いものになっていたようである. ...フランシス·ベイコンは, 1605年出版の学問 の 進 歩 に つ い ての な か で 、 そ の よ う な 真正 の 文字 の 体系 は 便利 で あ る と 述 べ て い た
traducido de
Knowlson, James (1975). ESQUEMAS UNIVERSALES DE IDIOMAS EN INGLATERRA Y FRANCIA 1600-1800 . - ^ 別 所, 照 彦; 棚 橋, 善 照 (15 de octubre de 1960). "自動 翻 訳". En 玉 木, 英 彦; 喜 安, 善 市 (eds.).自動 翻 訳 デ ・ ユ ・ パ ノ フ 著(en japonés) (1 ed.). Tokio: (株) み す ず 書房. págs. 10-11.
翻 訳 の あ る 程度 の 機械化 は 1933 年 に ペ ・ ペ ・ ト ロ ヤ ン ス キ ー が 企 て た の が お そ ら く 最初 で あ ろ う。 彼 は 「一 つ の のの翻訳に際し,単語を選別しかつ印刷する機械」をつくることを提案した.この発明でペ·ペ·トロヤンスキーは特許をとったが,当時それを実現することは巧くいかなかった. ( traducción (asistida por el traductor de Google ): puede ser casi el primer caso de traducción automática que Peter Petrovich Troyanskii probó en 1933. Presentó que "para criar la máquina que elige palabras e imprimirlas en la traducción de un idioma a otro idioma oa múltiples idiomas simultáneamente ". Obtuvo la patente de esta invención, pero no pudo implementarla en ese momento).
- ^ 別 所, 照 彦; 沢 辺, 弘 (25 de febrero de 1964).翻 訳 機械 (文庫 ク セ ジ ュ 現代 知識 の 焦点) (en japonés) (1 ed.). Tokio: (株) 白水 社. pag. 39.
モスクワで1933年に特許をとったロシア人スミルノフ·トロヤンスキーの発明は,同時にいくつかの言語を翻訳し,遠方まで送ることを可能とするように見えた. (Traducción (asistido por Google translate ): La invención patentada por Peter Petrovich Troyanskii en 1933 parecía poder traducir varios idiomas simultáneamente y enviarlos a un lugar lejano).
, traducido de
Delaveney, Émile. LA MACHINE A TRADUIRE (Colección QUE SAIS-JE? No 834) (en francés). Prensas Universitaires de France. - ^ "Memorándum de Weaver" . Marzo de 1949. Archivado desde el original el 5 de octubre de 2006.
- ^ "PROCESO DE ADQUISICIONES" . Tribunal Canadiense de Comercio Internacional . 30 de julio de 2002. Archivado desde el original el 6 de julio de 2011 . Consultado el 10 de febrero de 2007 .
- ^ Nagao, Makoto (1984). "Marco de una traducción mecánica entre japonés e inglés por principio de analogía" (PDF) . Procedimientos del Simposio Internacional OTAN sobre Inteligencia Artificial y Humana . Nueva York: Elsevier North-Holland, Inc. págs. 173–180. ISBN 0-444-86545-4.
- ^ "la Asociación de Lingüística Computacional - 2003 ACL Lifetime Achievement Award" . Asociación de Lingüística Computacional. Archivado desde el original el 12 de junio de 2010 . Consultado el 10 de marzo de 2010 .
- ^ White, John S. (31 de julio de 2003). Visualizando la traducción automática en el futuro de la información: 4ª Conferencia de la Asociación para la Traducción Automática en las Américas, AMTA 2000, Cuernavaca, México, 10 al 14 de octubre de 2000 Actas . Saltador. ISBN 9783540399650.
- ^ "TC-Star" . Consultado el 25 de octubre de 2010 .
- ^ "NOSOTROS-DARPA-GALE" . Archivado desde el original el 11 de noviembre de 2010 . Consultado el 25 de octubre de 2010 .
Referencias
- Hutchins, J. (2005). "Hitos en la traducción automática - No.6: Bar-Hillel y la inviabilidad de FAHQT]" (PDF) .
- Van Slype, Georges (1983). Mejor traducción para una mejor comunicación . París: Pergamon Press. ISBN 9780080305349.
Otras lecturas
- Hutchins, W. John (1986). Traducción automática: pasado, presente, futuro . Serie Ellis Horwood en ordenadores y sus aplicaciones. Chichester: Ellis Horwood. ISBN 0470203137.