El Ubiquitous Knowledge Processing Lab (también UKP Lab ) es un laboratorio de investigación en el Departamento de Ciencias de la Computación de la Technische Universität Darmstadt . Fue fundada en 2006 por Iryna Gurevych .
Actividades de investigación
UKP Lab desarrolla técnicas de procesamiento del lenguaje natural para comprender automáticamente el texto escrito y las aplica a la gestión de la información, como la recuperación de información , la respuesta a preguntas y la estructuración de la información en wikis . [1]
Ubiquitous Knowledge Processing Lab se encuentra entre los principales institutos de investigación en el campo de la utilización de contenido Web 2.0 como fuente de información semántica léxica para el procesamiento del lenguaje natural (NLP). Wikipedia y Wiktionary se emplean como recursos semánticos léxicos construidos en colaboración y se utilizan para mejorar los recursos creados por expertos como WordNet . Estos recursos se utilizan para desarrollar algoritmos mejorados semánticamente para la recuperación de información y la respuesta a preguntas. Un ejemplo es la búsqueda semántica : si un usuario ingresa la consulta "pie-fruit" en un motor de búsqueda, un motor de búsqueda estándar recuperará páginas que contengan las palabras "pie" pero no la palabra "fruit", proporcionando muchas páginas sobre "apple tarta". Un buscador inteligente "entenderá" que el usuario está interesado en recetas de tartas que no utilizan ningún tipo de fruta y recuperará los documentos adecuados. [2]
Otras actividades de investigación en el laboratorio de UKP son la evaluación automática de la calidad del texto, el análisis de sentimientos y la extracción de opiniones. Las actividades de investigación se organizan en las siguientes áreas de investigación:
- Procesamiento educativo del lenguaje natural
- Gestión de información semántica multilingüe
- Procesamiento de lenguaje natural para wikis
Un fuerte enfoque en UKP Lab es utilizar nuevos algoritmos de procesamiento de lenguaje natural en aplicaciones de la vida real. UKP Lab colabora con socios de la academia y la industria para mejorar varios escenarios de aplicaciones, como la gestión de relaciones con los clientes , humanidades digitales , aplicaciones educativas o seguridad pública.
Software
Parte de los esfuerzos de investigación en UKP Lab es el desarrollo de software de procesamiento del lenguaje natural (NLP) . Los siguientes paquetes de software están disponibles gratuitamente para fines de investigación:
DKPro
El repositorio de software de procesamiento de conocimientos de Darmstadt (DKPro) es una comunidad de código abierto de proyectos de software destinados al procesamiento del lenguaje natural. Ofrece componentes NLP robustos y listos para usar que se construyen sobre la Arquitectura de Gestión de Información No Estructurada (UIMA) de IBM como un marco común y abierto .
DKPro contiene componentes básicos de procesamiento de lenguaje natural como etiquetado y lematización de parte del discurso . Además, el paquete ofrece componentes que apoyan el procesamiento del discurso generado por el usuario. El contenido generado por el usuario contiene errores ortográficos, abreviaturas y emoticonos que prohíben la aplicación directa de componentes estándar de PNL. DKPro proporciona las herramientas de preprocesamiento necesarias.
API de Wikipedia
La Biblioteca de Wikipedia de Java (JWPL) [3] también se desarrolló en UKP Lab. Es una interfaz de programación de aplicaciones basada en Java para Wikipedia y permite el acceso programático a toda la información contenida en Wikipedia .
API de wikcionario
Paralelamente a JWPL, la biblioteca de Wiktionary de Java (JWKTL) [3] ofrece acceso programático a la información contenida en las versiones inglesa y alemana de Wiktionary .
Referencias
- ^ Noticias de Hessen-IT 03/2008 .
- ^ Ejemplo de: Impulse für die Wissenschaft 2010 (Volkswagenstiftung) .
- ^ a b Publicación de referencia: [1] Zesch, Müller, Gurevych: Extracción del conocimiento semántico léxico de Wikipedia y Wiktionary, Actas de LREC 2008.
enlaces externos
- Laboratorio de procesamiento de conocimiento ubicuo del sitio web
- Sitio web Iryna Gurevych
- DKPro
- API de Wikipedia
- API de wikcionario
Coordenadas :49 ° 52′38 ″ N 8 ° 39′17 ″ E / 49.877235 ° N 8.654688 ° E