De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La detección, extracción y resumen de información translingual (TIDES) es un programa de desarrollo tecnológico financiado por la Agencia de Proyectos de Investigación Avanzada de Defensa de los Estados Unidos ( DARPA ), que se centra en el procesamiento y la comprensión automatizados de los datos del idioma. El objetivo principal del programa es permitir a los angloparlantes localizar e interpretar la información requerida de forma rápida y eficaz, independientemente del idioma original.

Componentes [ editar ]

Las capacidades de cuatro componentes de la tecnología que está desarrollando TIDES incluyen:

  • Detección: localización de la información requerida.
  • Extracción: extraer datos clave.
  • Resumen : reducción de la información a una longitud legible.
  • Traducción: conversión de texto de otro idioma al inglés.

Las herramientas de detección, extracción y resumen deben funcionar dentro de un idioma (monolingüe) y entre idiomas (translingual), para que las utilicen personas que solo hablan inglés. Además de desarrollar tecnología, TIDES también está investigando métodos para adaptarla de forma rápida y económica a otros idiomas, incluidos idiomas con recursos lingüísticos limitados. TIDES tiene como objetivo integrar las capacidades de los componentes junto y con otras tecnologías para producir herramientas para aplicaciones del mundo real.

Almacén de datos de investigación [ editar ]

El FBI 's Almacén de Datos Investigativos contiene una biblioteca de noticias de código abierto, que contiene noticias recogida por el programa de mareas. La información se recopila de sitios web públicos de todo el mundo, incluidos Ha'aretz , Pravda , Jordan Times , The People's Daily , The Washington Post y otros. [1] Utiliza el sistema de procesamiento de audio y texto Mitre ( MiTAP ). [2]

Ver también [ editar ]

Notas y bibliografía [ editar ]

Enlaces externos [ editar ]