La traducción de imágenes se refiere a una tecnología en la que el usuario puede traducir el texto en imágenes o fotografías tomadas de texto impreso (carteles, pancartas, lista de menú, letrero, documento, captura de pantalla, etc.). Esto se hace mediante la aplicación del reconocimiento óptico de caracteres (OCR). tecnología a una imagen para extraer cualquier texto contenido en la imagen, y luego hacer que este texto se traduzca al idioma de su elección, y aplicar el procesamiento de imagen digital en la imagen original para obtener la imagen traducida con un nuevo idioma. La traducción de imágenes está relacionada con la traducción automática .
General
La traducción automática disponible en Internet (web y móvil) es un avance notable en la comunicación multilingüe que elimina la necesidad de un traductor / intérprete intermediario; la traducción de textos extranjeros sigue siendo un problema para el usuario, ya que no se puede esperar que pueda escribir el texto extranjero que desean traducir y comprender. La introducción manual del texto extranjero puede resultar una dificultad, especialmente en los casos en que se utiliza un alfabeto desconocido de una escritura que el usuario no puede leer, por ejemplo, cirílico, chino, japonés, etc. para un hablante de inglés o cualquier hablante de origen latino. idioma o viceversa.
Los avances técnicos en OCR hicieron posible reconocer texto a partir de imágenes. La posibilidad de usar la cámara de un dispositivo móvil para capturar y extraer texto impreso también se conoce como OCR móvil y se introdujo por primera vez en los teléfonos móviles fabricados en Japón en 2004. Con la cámara de la computadora de mano, se podía tomar una foto de (una línea de) texto y tener se extrajo (digitalizó) para una mayor manipulación, como almacenar la información en su lista de contactos, como una dirección de página web (URL) o texto para usar en un mensaje SMS / correo electrónico, etc.
Actualmente, los dispositivos móviles que tienen una resolución de cámara de 2 megapíxeles o más con capacidad de enfoque automático, a menudo cuentan con el servicio de escáner de texto. Llevando la función de escaneo de texto un paso más allá, surgió la traducción de imágenes, lo que brinda a los usuarios la capacidad de capturar texto con la cámara de su teléfono móvil, extraer el texto y traducirlo en su propio idioma.
Cada vez surgieron más aplicaciones de esta tecnología, incluida Word Lens [1] [ referencia circular ] . Después de ser adquirido por Google, se convirtió en parte de la aplicación móvil Google Translate.
Otro avance simultáneo en el procesamiento de imágenes también ha hecho posible ahora reemplazar el texto de la imagen con el texto traducido y crear una nueva imagen por completo. [2]
Historia
El desarrollo del servicio de traducción de imágenes surge de los avances en la tecnología OCR (miniaturización y reducción de los recursos de memoria consumidos) que permiten el escaneo de texto en teléfonos móviles.
Entre los primeros en anunciar un software móvil capaz de "leer" texto usando la cámara del dispositivo móvil se encuentra International Wireless Inc., quien en febrero de 2003 lanzó sus aplicaciones "CheckPoint" y "WebPoint". "CheckPoint" lee información simbólica crítica en los cheques y tiene como objetivo reducir las pérdidas que los comerciantes móviles sufren por los cheques "rebotados" escaneando el número MICR en la parte inferior de un cheque, mientras que "WebPoint" permite el reconocimiento visual y la decodificación de URL impresas, que luego son abiertos por el navegador web del dispositivo. [3]
Sin embargo, el primer lanzamiento comercial de un escáner de texto móvil tuvo lugar en diciembre de 2004 cuando Vodafone y Sharp comenzaron a vender el móvil 902SH, que fue el primero en presentar una cámara digital de 2 megapíxeles con zoom óptico. Entre las diversas funciones multimedia del dispositivo se encontraba el escáner de texto / código de barras / código QR integrado. La función de escáner de texto puede manejar hasta 60 caracteres alfabéticos simultáneamente. El texto escaneado podría enviarse como un correo electrónico o mensaje SMS, agregarse como una entrada de diccionario o, en el caso de URL escaneadas, abrirse a través del navegador web del dispositivo. Todos los teléfonos móviles posteriores de Sharp cuentan con la función de escáner de texto. [4]
En septiembre de 2005, NEC Corporation y el Instituto de Ciencia y Tecnología de Nara en Japón (NAIST) anunciaron un nuevo software capaz de transformar teléfonos con cámara en escáneres de texto. La aplicación difiere sustancialmente de los teléfonos móviles equipados de manera similar en Japón (capaces de escanear tarjetas de visita y pequeños fragmentos de texto y usar OCR para convertirlos en texto editable o en direcciones URL) por su capacidad para escanear una página completa. Sin embargo, las dos empresas dijeron que no lanzarían el software comercialmente antes de finales de 2008. [5]
La combinación de la función de escáner de texto con la tecnología de traducción automática fue realizada por primera vez por la empresa estadounidense RantNetwork, que en julio de 2007 comenzó a vender Communilator, una aplicación de traducción automática para dispositivos móviles con la función de traducción de imágenes. Con la cámara incorporada, el usuario móvil podría tomar una foto de un texto impreso, aplicar OCR para reconocer el texto y luego traducirlo a cualquiera de los más de 25 idiomas disponibles. [6]
En abril de 2008, Nokia presentó su aplicación Shoot-to-Translate para el modelo N73, que es capaz de tomar una foto con la cámara del dispositivo, extraer el texto y luego traducirlo. La aplicación solo ofrece traducción del chino al inglés y no maneja grandes segmentos de texto. Nokia dijo que están en el proceso de desarrollar su producto Multiscanner que, además de escanear texto y tarjetas de presentación, podría traducir entre 52 idiomas. [7]
Nuevamente en abril de 2008, la empresa coreana Unichal Inc. lanzó su escáner de texto portátil Dixau capaz de escanear y reconocer texto en inglés y luego traducirlo al coreano utilizando herramientas de traducción en línea como Wikipedia o Google Translate. El dispositivo está conectado a una PC o computadora portátil a través del puerto USB. [8]
En febrero de 2009, la empresa búlgara Interlecta presentó en el Mobile World Congress de Barcelona su traductor móvil que incluye reconocimiento de imágenes y síntesis de voz. La aplicación maneja todos los idiomas europeos junto con el chino, japonés y coreano. El software se conecta a un servidor a través de Internet para lograr el reconocimiento de imágenes y la traducción. [9]
En mayo de 2014, Google adquirió Word Lens para mejorar la calidad de la traducción visual y de voz. Puede escanear texto o imágenes con el dispositivo y traducirlo al instante. [10] [ referencia circular ]
Dado que el OCR ha ido mejorando, muchas empresas o sitios web comenzaron a combinar OCR y traducción, para leer el texto de una imagen y mostrar el texto traducido.
En agosto de 2018, una empresa india creó ImageTranslate. Puede leer, traducir y recrear la imagen en otro idioma.
Actualmente, la traducción de imágenes es ofrecida por las siguientes empresas:
Referencias
- ^ "WordLens Tm: wiki" . Consultado el 23 de marzo de 2019 .
- ^ "ImageTranslate Tm: sitio web" . Consultado el 23 de marzo de 2019 .
- ^ "International Wireless, Inc. lee cheques personales con teléfonos celulares. - Biblioteca en línea gratuita" . Thefreelibrary.com . Consultado el 24 de febrero de 2012 .
- ^ "El Sharp 902 - Primer móvil 3G de Europa con cámara digital de 2 megapíxeles" . Foro UMTS . Consultado el 24 de febrero de 2012 .
- ^ "Los teléfonos con cámara serán escáneres de alta precisión - tecnología - 14 de septiembre de 2005" . Nuevo científico . Consultado el 24 de febrero de 2012 .
- ^ "RantNetwork Tm: PressRelease" . Rantnetwork.com . Consultado el 24 de febrero de 2012 .
- ^ [1] Archivado el 12 de abril de 2009 en la Wayback Machine.
- ^ "Diccionario Dixau de 1 clic - Noticias - Escáner de texto Dixau" (en coreano). En.dixau.com . Consultado el 24 de febrero de 2012 .
- ^ "Software de traducción con voz para BlackBerry" . Archivado desde el original el 13 de enero de 2010 . Consultado el 28 de abril de 2017 .
- ^ "Traductor de Google" . Consultado el 23 de marzo de 2019 .
- ^ "ImageTranslate" . Consultado el 23 de marzo de 2019 .
- ^ "Yandex ocr translate" . Consultado el 23 de marzo de 2019 .