La traducción automática neuronal de Google (GNMT) es un sistema de traducción automática neuronal (NMT) desarrollado por Google e introducido en noviembre de 2016, que utiliza una red neuronal artificial para aumentar la fluidez y la precisión en Google Translate . [1] [2] [3] [4]
GNMT mejora la calidad de la traducción mediante la aplicación de un método de traducción automática basado en ejemplos (EBMT) en el que el sistema "aprende de millones de ejemplos". [2] La arquitectura de aprendizaje del sistema propuesta por GNMT se probó por primera vez en más de cien idiomas compatibles con Google Translate. [2] Con el gran marco de trabajo de un extremo a otro, el sistema aprende con el tiempo para crear traducciones mejores y más naturales. [1] GNMT intenta traducir oraciones completas a la vez, en lugar de solo pieza por pieza. [1] La red GNMT puede realizar traducciones automáticas interlingüísticas codificando la semántica de la oración, en lugar de memorizar traducciones de frase a frase.[2] [5]
Historia
El proyecto Google Brain fue establecido en 2011 en el "laboratorio de investigación secreto de Google X" [6] por el miembro de Google Jeff Dean , el investigador de Google Greg Corrado y el profesor de Ciencias de la Computación de la Universidad de Stanford Andrew Ng . [7] [8] [9] El trabajo de Ng ha dado lugar a algunos de los mayores avances en Google y Stanford. [6]
En septiembre de 2016, un equipo de investigación de Google anunció el desarrollo del sistema de traducción automática neuronal de Google (GNMT) y, en noviembre, Google Translate comenzó a utilizar la traducción automática neuronal (NMT) en lugar de sus métodos estadísticos anteriores (SMT) [1] [10 ] [11] [12] que se había utilizado desde octubre de 2007, con su propia tecnología SMT interna. [13] [14]
El sistema NMT de Google Translate utiliza una gran red neuronal artificial capaz de aprendizaje profundo . [1] [2] [3] Utilizando millones de ejemplos, GNMT mejora la calidad de la traducción, [2] utilizando un contexto más amplio para deducir la traducción más relevante. Luego, el resultado se reorganiza y adapta para abordar el lenguaje humano basado en la gramática. [1] La arquitectura de aprendizaje del sistema propuesta por GNMT se probó por primera vez en más de cien idiomas compatibles con Google Translate. [2] GNMT no creó su propio interlingua universal, sino que tuvo como objetivo encontrar los puntos en común entre muchos idiomas utilizando conocimientos de la psicología y la lingüística. [15] El nuevo motor de traducción se habilitó por primera vez para ocho idiomas: hacia y desde inglés y francés, alemán, español, portugués, chino, japonés, coreano y turco en 2016. [16] En marzo de 2017, se habilitaron tres idiomas adicionales: Ruso, hindi y vietnamita junto con tailandés, para lo cual se agregó soporte más adelante. [17] [18] También se agregó soporte para hebreo y árabe con la ayuda de la Comunidad del Traductor de Google en el mismo mes. [19] A mediados de abril de 2017, Google Netherlands anunció la compatibilidad con el holandés y otros idiomas europeos relacionados con el inglés. [20] Se añadió más apoyo para nueve idiomas indios: hindi, bengalí, marathi, gujarati, punjabi, tamil, telugu, malayalam y kannada a finales de abril de 2017. [21]
Evaluación
Se dice que el sistema GNMT representa una mejora con respecto al antiguo Traductor de Google en el sentido de que podrá manejar la "traducción de cero", es decir, traduce directamente un idioma a otro (por ejemplo, del japonés al coreano). [2] Google Translate traducía previamente primero el idioma de origen al inglés y luego traducía el inglés al idioma de destino en lugar de traducir directamente de un idioma a otro. [5]
Un estudio de julio de 2019 en Annals of Internal Medicine encontró que "Google Translate es una herramienta viable y precisa para traducir ensayos en idiomas distintos al inglés". Sólo un desacuerdo entre los revisores que leyeron los ensayos traducidos automáticamente se debió a un error de traducción. Dado que muchos estudios médicos están excluidos de las revisiones sistemáticas porque los revisores no entienden el idioma, GNMT tiene el potencial de reducir el sesgo y mejorar la precisión en dichas revisiones. [22]
Idiomas admitidos por GNMT
En octubre de 2020, el número de idiomas admitidos por Google Translate aumentó a 109, con el kyrgrz, el bielorruso, el latín, el maltés y el sudanés ahora incluidos.
- africaans
- albanés
- Amárico
- Arábica
- armenio
- Azerbaiyano
- vasco
- Bielorruso
- bengalí
- bosnio
- búlgaro
- birmano
- catalán
- Cebuano
- Chichewa
- Chino simplificado)
- Chino tradicional)
- corso
- croata
- checo
- danés
- holandés
- inglés
- esperanto
- Estonio
- Filipino
- finlandés
- francés
- gallego
- georgiano
- alemán
- griego
- Gujarati
- Criollo haitiano
- Hausa
- hawaiano
- hebreo
- hindi
- Hmong
- húngaro
- islandés
- Igbo
- indonesio
- irlandesa
- italiano
- japonés
- javanés
- Canarés
- Kazajo
- Jemer
- coreano
- Kurdo ( Kurmanji )
- Lao
- letón
- lituano
- Luxemburgués
- macedónio
- madagascarí
- malayo
- Malayalam
- maltés
- maorí
- Marathi
- mongol
- Nepalí
- Noruego ( bokmål )
- Pashto
- persa
- polaco
- portugués
- punjabi
- rumano
- ruso
- Samoano
- Gaélico escocés
- serbio
- Sesotho
- Shona
- Sindhi
- Cingalés
- eslovaco
- esloveno
- somalí
- Español
- Sundanés
- swahili
- sueco
- Tayiko
- Tamil
- Telugu
- tailandés
- turco
- ucranio
- Urdu
- Uzbeko
- vietnamita
- galés
- Frisón occidental
- Xhosa
- yídish
- Yoruba
- zulú
Ver también
- Traducción automática basada en ejemplos
- Traducción automática basada en reglas
- Comparación de aplicaciones de traducción automática
- Traducción automática estadística
- Inteligencia artificial
- Modelo de lenguaje de caché
- Ligüística computacional
- Traducción asistida por computadora
- Historia de la traducción automática
- Lista de tecnologías emergentes
- Lista de laboratorios de investigación para traducción automática
- Traducción automática neuronal
- Máquina traductora
- Traductor universal
Referencias
- ^ a b c d e f Barak Turovsky (15 de noviembre de 2016), "Encontrado en la traducción: oraciones más precisas y fluidas en el Traductor de Google" , Blog de Google , consultado el 11 de enero de 2017
- ^ a b c d e f g h Mike Schuster, Melvin Johnson y Nikhil Thorat (22 de noviembre de 2016), "Zero-Shot Translation with Multilingual Neural Machine Translation System de Google " , Blog de investigación de Google , consultado el 11 de enero de 2017Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
- ^ a b Gil Fewster (5 de enero de 2017), "El anuncio de IA alucinante de Google que probablemente te perdiste" , freeCodeCamp , consultado el 11 de enero de 2017
- ^ Wu, Yonghui; Schuster, Mike; Chen, Zhifeng; Le, Quoc V .; Norouzi, Mohammad (2016). "Sistema de traducción automática neuronal de Google: cerrar la brecha entre la traducción humana y automática". arXiv : 1609.08144 . Código Bibliográfico : 2016arXiv160908144W . Cite journal requiere
|journal=
( ayuda ) - ^ a b Boitet, cristiano; Blanchon, Hervé; Seligman, Mark; Bellynck, Valérie (2010). "MT en y para la Web" (PDF) . Consultado el 1 de diciembre de 2016 .
- ^ a b Robert D. Hof (14 de agosto de 2014). "Un gigante chino de Internet comienza a soñar: Baidu es un elemento fijo de la vida en línea en China, pero quiere convertirse en una potencia mundial. ¿Puede uno de los principales investigadores de inteligencia artificial del mundo ayudarlo a desafiar a las empresas más grandes de Silicon Valley?" . Revisión de tecnología . Consultado el 11 de enero de 2017 .
- ^ Jeff Dean y Andrew Ng (26 de junio de 2012). "Uso de simulaciones cerebrales a gran escala para el aprendizaje automático y la inteligencia artificial" Blog oficial de Google . Consultado el 26 de enero de 2015 .
- ^ "Proyecto de redes neuronales profundas a gran escala de Google" . Consultado el 25 de octubre de 2015 .
- ^ Markoff, John (25 de junio de 2012). "¿Cuántas computadoras para identificar un gato? 16.000" . New York Times . Consultado el 11 de febrero de 2014 .
- ^ Katyanna Quach (17 de noviembre de 2016), la red neuronal de Google aprende a traducir idiomas en los que no ha recibido capacitación: la primera traducción automática ha utilizado el aprendizaje de transferencia verdadero , consultado el 11 de enero de 2017
- ^ Lewis-Kraus, Gideon (14 de diciembre de 2016). "El gran despertar de la IA" . The New York Times . Consultado el 11 de enero de 2017 .
- ^ Le, Quoc; Schuster, Mike (27 de septiembre de 2016). "Una red neuronal para la traducción automática, a escala de producción" . Blog de investigación de Google . Consultado el 1 de diciembre de 2016 .
- ^ Google cambia a su propio sistema de traducción , 22 de octubre de 2007
- ^ Barry Schwartz (23 de octubre de 2007). "Google Translate cae SYSTRAN para traducción casera" . Search Engine Land .
- ^ Chris McDonald (7 de enero de 2017), comentando el artículo de Gil Fewster del 5 de enero en el Atlántico , consultado el 11 de enero de 2017
- ^ Turovsky, Barak (15 de noviembre de 2016). "Encontrado en la traducción: oraciones más precisas y fluidas en el Traductor de Google" . Blog de Google de palabras clave . Consultado el 1 de diciembre de 2016 .
- ^ Pérez, Sarah (6 de marzo de 2017). "El sistema de traducción más inteligente de Google, impulsado por inteligencia artificial, se expande a más idiomas" . TechCrunch . Oath Inc.
- ^ Turovsky, Barak (6 de marzo de 2017). "Traducciones neuronales de mayor calidad para muchos más idiomas" . Blog de Google de palabras clave . Consultado el 6 de marzo de 2017 .
- ^ Novet, Jordania (30 de marzo de 2017). "Google ahora ofrece traducciones basadas en inteligencia artificial para árabe y hebreo" . VentureBeat .
- ^ Finge, Rachid (19 de abril de 2017). "Grote verbetering voor het Nederlands en Google Translate" [Gran mejora para el holandés en Google Translate]. Blog de Google Netherlands (en holandés).
- ^ Turovsky, Barak (25 de abril de 2017). "Hacer que Internet sea más inclusivo en la India" . La palabra clave .
- ^ Jackson, Jeffrey L; Kuriyama, Akira; Anton, Andreea; Choi, abril; Fournier, Jean-Pascal; Geier, Anne-Kathrin; Jacquerioz, Frederique; Kogan, Dmitry; Scholcoff, Cecilia; Sun, Rao (30 de julio de 2019). "La precisión del traductor de Google para resumir datos de ensayos en idiomas distintos del inglés para revisiones sistemáticas". Annals of Internal Medicine . 171 (9): 678. doi : 10.7326 / M19-0891 . ISSN 0570-183X . PMID 31357212 . S2CID 198980789 .
enlaces externos
- Sistema de traducción automática neuronal de Google: superando la brecha entre la traducción humana y la automática
- Las ventajas y desventajas de la traducción automática
- Traducción automática estadística
- Asociación Internacional de Traducción Automática (IAMT)
- Archivo de traducción automática de John Hutchins . Un repositorio electrónico (y bibliografía) de artículos, libros y trabajos en el campo de la traducción automática y la tecnología de traducción basada en computadora.
- Traducción automática (traducción por computadora) : publicaciones de John Hutchins (incluye archivos PDF de varios libros sobre traducción automática)