Kit de herramientas de lenguaje natural


El kit de herramientas de lenguaje natural , o más comúnmente NLTK , es un conjunto de bibliotecas y programas para el procesamiento de lenguaje natural (NLP) simbólico y estadístico para inglés escrito en el lenguaje de programación Python . Fue desarrollado por Steven Bird y Edward Loper en el Departamento de Informática y Ciencias de la Información de la Universidad de Pensilvania . [4] NLTK incluye demostraciones gráficas y datos de muestra. Está acompañado por un libro que explica los conceptos subyacentes detrás de las tareas de procesamiento del lenguaje compatibles con el kit de herramientas, [5] además de un libro de cocina. [6]

NLTK está destinado a apoyar la investigación y la enseñanza en NLP o áreas estrechamente relacionadas, incluida la lingüística empírica , la ciencia cognitiva , la inteligencia artificial , la recuperación de información y el aprendizaje automático . [7] NLTK se ha utilizado con éxito como herramienta de enseñanza, como herramienta de estudio individual y como plataforma para crear prototipos y construir sistemas de investigación. Hay 32 universidades en los EE. UU. y 25 países que usan NLTK en sus cursos. NLTK admite funcionalidades de clasificación, tokenización, derivación, etiquetado, análisis y razonamiento semántico. [8]


Árbol de análisis generado con NLTK