Respuesta de Voz Interactiva


La respuesta de voz interactiva ( IVR ) es una tecnología que permite a los humanos interactuar con un sistema telefónico operado por computadora mediante el uso de entrada de tonos de voz y DTMF a través de un teclado. En telecomunicaciones, IVR permite a los clientes interactuar con el sistema host de una empresa a través de un teclado telefónico o mediante reconocimiento de voz, después de lo cual se pueden consultar los servicios a través del diálogo IVR. Los sistemas IVR pueden responder con audio pregrabado o generado dinámicamente para indicar a los usuarios cómo proceder. Los sistemas IVR implementados en la red están dimensionados para manejar grandes volúmenes de llamadas y también se utilizan para llamadas salientes, ya que los sistemas IVR son más inteligentes que muchos sistemas de marcación predictiva . [1]

Los sistemas IVR se pueden utilizar para compras móviles, pagos bancarios, servicios, pedidos minoristas, servicios públicos, información sobre viajes y condiciones climáticas. Un concepto erróneo común se refiere a un operador automático como un IVR. Los términos son distintos y significan cosas diferentes para los profesionales de las telecomunicaciones tradicionales: el propósito de un IVR es recibir entradas, procesarlas y devolver un resultado, mientras que el de un operador automático es enrutar llamadas. A veces también se utiliza el término unidad de respuesta de voz ( VRU ). [2]

A pesar del aumento de la tecnología IVR durante la década de 1970, la tecnología se consideró compleja y costosa para automatizar tareas en los centros de llamadas. [3] La primera aplicación comercial de IVR fue un sistema de control de inventario de entrada de pedidos diseñado y desarrollado por Steven Schmidt en 1973. Los primeros sistemas de respuesta de voz se basaban en la tecnología DSP y se limitaban a vocabularios pequeños. A principios de la década de 1980, Perception Technology de Leon Ferber se convirtió en el primer competidor principal del mercado, después de que la tecnología de disco duro (lectura/escritura de acceso aleatorio a datos de voz digitalizados) alcanzara un precio rentable. [ cita requerida ] En ese momento, un sistema podría almacenar voz digitalizada en disco, reproducir el mensaje hablado adecuado y procesar la respuesta DTMF del ser humano.

A medida que los centros de llamadas comenzaron a migrar a multimedia a fines de la década de 1990, las empresas comenzaron a invertir en integración de telefonía informática (CTI) con sistemas IVR. IVR se volvió vital para los centros de llamadas que implementaban soluciones universales de colas y enrutamiento y actuó como un agente que recopilaba datos de los clientes para permitir decisiones de enrutamiento inteligentes. Con mejoras en la tecnología, los sistemas podrían usar el reconocimiento de voz independiente del hablante [4] de un vocabulario limitado en lugar de requerir que la persona use la señalización DTMF.

A partir de la década de 2000, la respuesta de voz se volvió más común y más barata de implementar. Esto se debió al aumento de la potencia de la CPU y la migración de las aplicaciones de voz del código propietario al estándar VXML .

La decodificación DTMF y el reconocimiento de voz se utilizan para interpretar la respuesta de la persona que llama a las indicaciones de voz. Los tonos DTMF se ingresan a través del teclado del teléfono .