Kaldi es un kit de herramientas de reconocimiento de voz de código abierto escrito en C ++ para el reconocimiento de voz y el procesamiento de señales , disponible gratuitamente bajo la licencia Apache v2.0.
Desarrollador (es) | Daniel Povey y otros |
---|---|
Lanzamiento estable | Revisión 3122 / octubre de 2013 |
Repositorio | https://github.com/kaldi-asr/kaldi |
Escrito en | C ++ |
Sistema operativo | Sistemas Unix ( Linux , BSD , OSX 10. {8,9} etc.), Windows (a través de Cygwin ) |
Tipo | Reconocimiento de voz |
Licencia | Licencia de Apache v.2.0 [1] |
Sitio web | kaldi-asr |
Kaldi tiene como objetivo proporcionar software que sea flexible y extensible, [2] y está destinado a ser utilizado por investigadores de reconocimiento automático de voz (ASR) para construir un sistema de reconocimiento.
Admite transformaciones lineales, MMI , entrenamiento discriminativo MMI y MCE potenciado, entrenamiento discriminativo de espacio de características y redes neuronales profundas . [3]
Kaldi es capaz de generar características como mfcc , fbank , fMLLR , etc. Por lo tanto, en investigaciones recientes de redes neuronales profundas, un uso popular de Kaldi es preprocesar formas de onda sin procesar en características acústicas para modelos neuronales de extremo a extremo.
Kaldi ha sido incorporado como parte del Desafío de Reconocimiento y Separación de Habla de CHiME en varios eventos sucesivos. [4] [5] [6] El software se desarrolló inicialmente como parte de un taller de 2009 en la Universidad Johns Hopkins . [7]
Kaldi lleva el nombre del legendario pastor de cabras etíope Kaldi, quien se dice que descubrió la planta del café . [8]
Ver también
Referencias
- ^ "Kaldi: asuntos legales" . kaldi-asr.org .
- ^ "Kaldi: sobre el proyecto Kaldi" . kaldi-asr.org .
- ^ "Kaldi: redes neuronales profundas en Kaldi" . kaldi-asr.org .
- ^ "El cuarto desafío de reconocimiento y separación de voz de CHiME" . Consultado el 15 de febrero de 2017 .
- ^ "El tercer desafío de separación y reconocimiento de voz de CHiME" . Consultado el 15 de febrero de 2017 .
- ^ Emmanuel Vincent, Jon Barker, Shinji Watanabe, Jonathan Le Roux, Francesco Nesta, et al. El segundo desafío de separación y reconocimiento de voz 'CHiME': conjuntos de datos, tareas y líneas de base. ICASSP - 38th International Conference on Acustics, Speech, and Signal Processing - 2013, mayo de 2013, Vancouver, Canadá. pp.126-130, 2013.
- ^ "Historia del proyecto Kaldi" . Consultado el 26 de julio de 2017 .
- ^ https://kaldi-asr.org/doc/about.html
enlaces externos
- Página web oficial
- Kaldi - El proyecto oficial de Github
- Cómo comenzar con Kaldi y el reconocimiento de voz : una guía sobre las diferentes partes del sistema
- Papel Kaldi: el kit de herramientas de reconocimiento de voz de Kaldi