Kaldi (software)

Kaldi es un kit de herramientas de reconocimiento de voz de código abierto escrito en C ++ para el reconocimiento de voz y el procesamiento de señales , disponible gratuitamente bajo la licencia Apache v2.0.

Kaldi
Desarrollador (es)	Daniel Povey y otros

Lanzamiento estable	Revisión 3122 / octubre de 2013 ; hace 7 años ( 2013-10 )

Repositorio	https://github.com/kaldi-asr/kaldi
Escrito en	C ++
Sistema operativo	Sistemas Unix ( Linux , BSD , OSX 10. {8,9} etc.), Windows (a través de Cygwin )
Tipo	Reconocimiento de voz
Licencia	Licencia de Apache v.2.0 ^[1]
Sitio web	kaldi-asr .org

Kaldi tiene como objetivo proporcionar software que sea flexible y extensible, ^[2] y está destinado a ser utilizado por investigadores de reconocimiento automático de voz (ASR) para construir un sistema de reconocimiento.

Admite transformaciones lineales, MMI , entrenamiento discriminativo MMI y MCE potenciado, entrenamiento discriminativo de espacio de características y redes neuronales profundas . ^[3]

Kaldi es capaz de generar características como mfcc , fbank , fMLLR , etc. Por lo tanto, en investigaciones recientes de redes neuronales profundas, un uso popular de Kaldi es preprocesar formas de onda sin procesar en características acústicas para modelos neuronales de extremo a extremo.

Kaldi ha sido incorporado como parte del Desafío de Reconocimiento y Separación de Habla de CHiME en varios eventos sucesivos. ^[4]^[5]^[6] El software se desarrolló inicialmente como parte de un taller de 2009 en la Universidad Johns Hopkins . ^[7]

Kaldi lleva el nombre del legendario pastor de cabras etíope Kaldi, quien se dice que descubrió la planta del café . ^[8]

Ver también

Referencias

^ "Kaldi: asuntos legales" . kaldi-asr.org .
^ "Kaldi: sobre el proyecto Kaldi" . kaldi-asr.org .
^ "Kaldi: redes neuronales profundas en Kaldi" . kaldi-asr.org .
^ "El cuarto desafío de reconocimiento y separación de voz de CHiME" . Consultado el 15 de febrero de 2017 .
^ "El tercer desafío de separación y reconocimiento de voz de CHiME" . Consultado el 15 de febrero de 2017 .
^ Emmanuel Vincent, Jon Barker, Shinji Watanabe, Jonathan Le Roux, Francesco Nesta, et al. El segundo desafío de separación y reconocimiento de voz 'CHiME': conjuntos de datos, tareas y líneas de base. ICASSP - 38th International Conference on Acustics, Speech, and Signal Processing - 2013, mayo de 2013, Vancouver, Canadá. pp.126-130, 2013.
^ "Historia del proyecto Kaldi" . Consultado el 26 de julio de 2017 .
^ https://kaldi-asr.org/doc/about.html

enlaces externos

Página web oficial
Kaldi - El proyecto oficial de Github
Cómo comenzar con Kaldi y el reconocimiento de voz : una guía sobre las diferentes partes del sistema
Papel Kaldi: el kit de herramientas de reconocimiento de voz de Kaldi

Este artículo relacionado con la lingüística computacional es un fragmento . Puedes ayudar a Wikipedia expandiéndolo .

[License-1] "Kaldi: asuntos legales" . kaldi-asr.org .

[2] "Kaldi: sobre el proyecto Kaldi" . kaldi-asr.org .

[3] "Kaldi: redes neuronales profundas en Kaldi" . kaldi-asr.org .

[4] "El cuarto desafío de reconocimiento y separación de voz de CHiME" . Consultado el 15 de febrero de 2017 .

[5] "El tercer desafío de separación y reconocimiento de voz de CHiME" . Consultado el 15 de febrero de 2017 .

[6] Emmanuel Vincent, Jon Barker, Shinji Watanabe, Jonathan Le Roux, Francesco Nesta, et al. El segundo desafío de separación y reconocimiento de voz 'CHiME': conjuntos de datos, tareas y líneas de base. ICASSP - 38th International Conference on Acustics, Speech, and Signal Processing - 2013, mayo de 2013, Vancouver, Canadá. pp.126-130, 2013.

[7] "Historia del proyecto Kaldi" . Consultado el 26 de julio de 2017 .

[8] ttps://kaldi-asr.org/doc/about.html

[1]