Tecnología básica


Basis Technology Corp. es una empresa de software especializada en aplicar técnicas de inteligencia artificial para comprender documentos y datos no estructurados escritos en diferentes idiomas. Tiene su sede en Somerville, Massachusetts y oficinas en San Francisco, Washington, DC, Londres y Tokio.

La empresa fue fundada en 1995 por graduados del Instituto Tecnológico de Massachusetts para usar técnicas de inteligencia artificial para ayudar a comprender los diferentes idiomas que usan los humanos. Su software se enfoca en encontrar la estructura dentro del texto para que los algoritmos puedan hacer un mejor trabajo al comprender el significado de las palabras. Las herramientas identifican diferentes formas de nombres y frases. El nombre de alguien, digamos Albert P. Jones por ejemplo, puede aparecer de muchas maneras diferentes. Algunos textos lo llamarán "Al Jones", otros "Mr. Jones" y otros "Albert Paul Jons". El software de Basis Technology puede coincidir con todas estas instancias.

Su software mejora las herramientas de análisis al clasificar el papel de las palabras y proporciona metadatos sobre el papel de las palabras a otros algoritmos. El software de Basis Technology identificará, por ejemplo, el idioma de un flujo de caracteres entrante y luego identificará las partes de cada oración como el sujeto o el objeto directo. [ cita requerida ]

La empresa es más conocida por su plataforma lingüística Rosette, que utiliza técnicas de procesamiento del lenguaje natural para mejorar la recuperación de información , la minería de textos , los motores de búsqueda y otras aplicaciones. La herramienta se utiliza para crear formas de texto normalizadas por los principales motores de búsqueda y traductores. [ cita requerida ] Los analistas forenses también utilizan el software Basis Technology para buscar en los archivos palabras, tokens, frases o números que pueden ser importantes para los investigadores. [ cita requerida ]

Rosette Linguistics Platform consta de una biblioteca de componentes para la recuperación y el análisis de textos multilingües. Rosette proporciona identificación automática de idiomas, análisis lingüístico, extracción de entidades y traducción de entidades de texto no estructurado. Se puede integrar en aplicaciones para ayudar a analizar volúmenes de texto no estructurado. [ cita requerida ]

La plataforma Rosette se utiliza tanto en las oficinas del gobierno de los Estados Unidos para respaldar la traducción como en las principales empresas de infraestructura de Internet, como los motores de búsqueda. [5] [6]