Sistemas de diálogo hablado


Un sistema de diálogo hablado es un sistema informático capaz de conversar con un humano con voz. Tiene dos componentes esenciales que no existen en un sistema de diálogo de texto escrito : un reconocedor de voz y un módulo de texto a voz (los sistemas de diálogo de texto escrito suelen utilizar otros sistemas de entrada proporcionados por un sistema operativo). Se puede distinguir aún más de los sistemas de voz de comando y control que pueden responder a las solicitudes pero no intentan mantener la continuidad en el tiempo.

Los sistemas de diálogo hablado varían en su complejidad. Los sistemas de diálogo dirigido son muy simples y requieren que el desarrollador cree un gráfico (típicamente un árbol) que gestione la tarea pero que puede no corresponder a las necesidades del usuario. Los sistemas de acceso a la información, generalmente basados ​​en formularios, permiten a los usuarios cierta flexibilidad (por ejemplo, en el orden en que se especifican las restricciones de recuperación o en el uso de restricciones opcionales), pero tienen capacidades limitadas. Los sistemas de diálogo de resolución de problemas pueden permitir a los usuarios humanos participar en una serie de actividades diferentes que pueden incluir el acceso a la información, la construcción del plan y la posible ejecución de este último.

Pioneros en sistemas de diálogo son empresas como AT&T (con su sistema de reconocimiento de voz en los años setenta) y los laboratorios CSELT , que lideraron algunos proyectos de investigación europeos durante los años ochenta (p. ej. SUNDIAL) tras la finalización del proyecto DARPA en EE.UU.

El campo de los sistemas de diálogo hablado es bastante amplio e incluye investigación (que se presenta en conferencias científicas como SIGdial e Interspeech ) y un gran sector industrial (con sus propias reuniones como SpeechTek y AVIOS ).