Helsinki Finite-State Technology ( HFST ) es una biblioteca de programación de computadoras y un conjunto de utilidades para el procesamiento del lenguaje natural con autómatas de estado finito y transductores de estado finito . Es un software gratuito y de código abierto , publicado bajo una combinación de la licencia pública general GNU versión 3 (GPLv3) y la licencia Apache .
Desarrollador (es) | Equipo de HFST |
---|---|
Versión inicial | 2008 |
Lanzamiento estable | 3.15.4 / 13 de febrero de 2021 [1] |
Repositorio | |
Escrito en | C ++ , Python , Java |
Sistema operativo | Multiplataforma : Linux , Mac OS X , Windows |
Plataforma | x86 |
Disponible en | inglés |
Tipo | Kit de herramientas de estados finitos |
Licencia | GPLv3 , parte Apache |
Sitio web | hfst |
Características
La biblioteca funciona como una interfaz de intercambio para múltiples backends, como OpenFST, foma y SFST. Las utilidades comprenden varios compiladores, como hfst-twolc (un compilador de reglas morfológicas de dos niveles), [2] hfst-lexc (un compilador de definiciones de léxico) y hfst-regexp2fst (un compilador de expresiones regulares). Las funciones del lenguaje de secuencias de comandos patentado de Xerox , xfst, se duplican en hfst-xfst, y la utilidad de coincidencia de patrones pmatch en hfst-pmatch, que va más allá del formalismo de estado finito al tener redes de transición recursivas (RTN).
La biblioteca y las utilidades están escritas en C ++ , con una interfaz para la biblioteca en Python y una utilidad para buscar resultados de transductores portados a Java y Python.
Los transductores en HFST pueden incorporar pesos dependiendo del backend. Para realizar operaciones FST, esto actualmente solo es posible a través del backend de OpenFST. HFST proporciona dos backends nativos , uno diseñado para una búsqueda rápida (búsqueda optimizada de hfst ) y el otro para el intercambio de formatos. Ambos se pueden ponderar.
Usos
HFST se ha utilizado para escribir diversas herramientas lingüísticas, como correctores ortográficos, guionistas y morfologías. [3] [4] Los diccionarios morfológicos escritos en otros formalismos también se han convertido a los formatos HFST. [5]
Ver también
Notas
- ^ "Lanzamientos · hfst / hfst" . github.com . Consultado el 12 de abril de 2021 .
- ^ "Una breve historia de la morfología de dos niveles" .
- ^ "GitHub - flammie / Omorfi: morfología abierta para finlandés" . 2019-02-23.
- ^ "Cómo configurar y optimizar los deletreos" .
- ^ "Tecnología de estado finito de Helsinki - Explorar / Recursos en SourceForge.net" .
enlaces externos
- Página web oficial
- https://github.com/hfst/hfst/wiki : una wiki de documentación
Referencias
Lindén, Krister; Axelson, Erik; Drobac, Senka; Hardwick, Sam; Kuokkala, Juha; Niemi, Jyrki; Pirinen, Tommi; Silfverberg, Miikka (2013). "HFST - Un sistema para crear herramientas de PNL" . En Mahlow, Cersting; Piotrowski, Michael (eds.). Sistemas y marcos de morfología computacional . Sistemas y marcos de morfología computacional . Comunicaciones en Informática y Ciencias de la Información. 380 . Humboldt-Universität en Berlín: Springer. págs. 53–71.