Pasajero artificial

El Pasajero Artificial es un dispositivo telemático , desarrollado por IBM , que interactúa verbalmente con un conductor para reducir la probabilidad de que se quede dormido a los mandos de un vehículo. ^[1] Se basa en invenciones cubiertas por la patente estadounidense 6.236.968. ^[2] Considerando que, los dispositivos telemáticos realizan una variedad de funciones al recopilar la ubicación del vehículo y los datos de actividad, y convertirlos en información empresarial. Además, la máquina telemática funciona capturando datos de ubicación del vehículo a través de un dispositivo con GPS .instalado en un vehículo. El Pasajero Artificial está equipado para involucrar al operador del vehículo manteniendo conversaciones, jugando juegos verbales, controlando el sistema estéreo del vehículo, etc. También monitorea los patrones de habla del conductor para detectar la fatiga y, en respuesta, puede sugerirle que se tome un descanso o duerma un poco. ^[3]^[4] El pasajero artificial también puede integrarse con servicios inalámbricos para proporcionar información meteorológica y de carreteras, direcciones de conducción y otros sistemas de notificación similares. ^[5]

Interfaz de control por voz

Según Dimitri Kanevsky, un ex investigador de IBM, actualmente en Google, The Artificial Passenger se desarrolló utilizando el sistema de voz Conversational Interactivity for Telematics (CIT) que cuenta con el habla natural del conductor en lugar del uso de las manos. El CIT se basa en un sistema de comprensión del lenguaje natural (NLU) que es difícil de desarrollar debido a los sistemas informáticos de baja potencia disponibles dentro de los automóviles. IBM sugiere que este sistema se ubique en un servidor y se acceda a él a través de las tecnologías inalámbricas de los automóviles. IBM también dice que están trabajando en un "cuasi-NLU" que usa menos recursos de la CPU y se puede usar dentro del automóvil. ^[6] El sistema CIT incluye otro sistema llamado Dialog Manager (DM). El DM se hace cargo del sistema NLU al interactuar con el vehículo, el conductor y los sistemas externos, como los sistemas meteorológicos, el correo electrónico, los teléfonos y más. ^[7]

El sistema NLU recibe un comando de voz del controlador y mira a través de un sistema de archivos para encontrar una acción a realizar y ejecuta esa acción. ^[6] El DM trabaja con preguntas hechas por el conductor como "¿A qué distancia está el aeropuerto Gallatin Field de aquí?" El sistema NLU aún no podrá entender todo lo que dice un conductor. Las razones de esto son los diferentes idiomas y dialectos de diferentes regiones. IBM está trabajando en el desarrollo de un sistema que reconozca dónde está el conductor y reconozca la dicción regional utilizada en esa área. ^[7]

Otro sistema utilizado dentro de esta tecnología es el sistema Learning Transformation (LT) que monitorea las acciones de los ocupantes del automóvil y de los automóviles que lo rodean, aprende patrones dentro del habla del conductor y almacena esos datos, y aprende de dichos datos para tratar de mejorar el rendimiento de la tecnología en su conjunto. ^[6]

Reconocimiento de voz

El proceso de reconocimiento de voz se basa en tres pasos. La parte delantera filtra cualquier ruido no deseado, como el del automóvil, la música de fondo o los pasajeros de fondo. Elimina todas las señales de baja energía y alta variabilidad que se reconocen. ^[7] El etiquetador separa el discurso y busca en una base de datos para reconocer lo que se está diciendo. Comienza amplio al ver de qué tema está hablando el conductor. Luego entra en más detalles de lo que realmente está preguntando el conductor. A continuación, el decodificador toma toda esta información y formula una respuesta al controlador. ^[6] IBM afirma a través de mucha experimentación que el reconocimiento de voz es muy preciso, pero el proceso no se ha refinado por completo y todavía tiene problemas. ^[7]

La parte principal del pasajero artificial es el reconocimiento de voz disruptivo. Esta tecnología mantiene una conversación con el conductor y analiza lo que dice y cómo lo dice. Puede reconocer las fluctuaciones en la voz del conductor para determinar si el conductor está somnoliento, molesto o de buen humor a través de diferentes patrones de vibración en el habla del conductor. También registra el tiempo que tarda un conductor en responder en la conversación y, a partir de ahí, determina si el conductor se está quedando dormido o se distrae con algo. ^[7]

Prevención de la somnolencia del conductor

Cuando la computadora reconoce que el conductor se está quedando dormido, envía una señal para interferir. La computadora interviene cambiando la radio, intentando jugar con el conductor o abriendo la ventana para despertar al conductor. ^[5] La computadora quiere mejorar su estado de alerta al hacer esto. Si descubre que el conductor está cabeceando una y otra vez, el sistema informático está programado para solicitar llamar a un hotel cercano y reservar una habitación o sugerirle al conductor que se tome un descanso. ^[6]

El Pasajero Artificial intentará leer chistes, jugar, hacer preguntas o leer libros interactivos para estimular al conductor. Los conductores que muestren más somnolencia recibirán contenido más estimulante que un conductor que no esté tan somnoliento. ^[6]

Interfaz de usuario distributiva entre coches.

IBM reconoce que hay más peligros para un conductor que para él mismo. Se propone que el pasajero artificial trabaje entre automóviles transmitiendo información entre sí. La información podría incluir registros de conducción para mostrar si tienen un historial de ser un mal conductor o un análisis a tiempo de todos los conductores para mostrar cuáles se están volviendo somnolientos y pueden interferir con esta información. También puede mostrar si un conductor se distrae con juegos o dispositivos inalámbricos e interferir con todos los conductores que lo rodean. ^[7]

Ver también

Referencias

^ Muestra, Ian, Me vuelves loco , New Scientist , Número 2300, julio de 2001. Consultado el 29 de junio de 2008.
^ "Patente de Estados Unidos: sistema de coche basado en diálogo de prevención del sueño" . Consultado el 29 de junio de 2008 .
^ The New York Times , 27 de diciembre de 2001. Un pasajero cuya charla siempre se agradece. Archivado el 17 de octubre de 2009 en la Wayback Machine por A. Eisenberg. Consultado el 29 de junio de 2008.
^ Kanevsky, D., Telemática: Pasajero artificial y más allá, Factores humanos y sistemas interactivos de voz , Serie de tecnología de señales y comunicaciones, Springer US, págs. 291-325. https://doi.org/10.1007%2F978-0-387-68439-0_10
^ ^a ^b Kharif, olga. "IBM a los conductores: ¡despierten!" . Consultado el 6 de diciembre de 2011 .
^ ^a ^b ^c ^d ^e ^f Kanevsky, Dimitri. "Informe de investigación de IBM" (PDF) . Consultado el 6 de diciembre de 2011 .
^ ^a ^b ^c ^d ^e ^f Kanevsky, Dimitri (2008). "Telemática: pasajero artificial y más allá". Factores humanos y sistemas interactivos de voz . Tecnología de señales y comunicación. págs. 291-325. doi : 10.1007 / 978-0-387-68439-0_10 . ISBN 978-0-387-25482-1.

[1] Muestra, Ian, Me vuelves loco , New Scientist , Número 2300, julio de 2001. Consultado el 29 de junio de 2008.

[2] "Patente de Estados Unidos: sistema de coche basado en diálogo de prevención del sueño" . Consultado el 29 de junio de 2008 .

[3] The New York Times , 27 de diciembre de 2001. Un pasajero cuya charla siempre se agradece. Archivado el 17 de octubre de 2009 en la Wayback Machine por A. Eisenberg. Consultado el 29 de junio de 2008.

[4] Kanevsky, D., Telemática: Pasajero artificial y más allá, Factores humanos y sistemas interactivos de voz , Serie de tecnología de señales y comunicaciones, Springer US, págs. 291-325. https://doi.org/10.1007%2F978-0-387-68439-0_10

[BWeek-5] Kharif, olga. "IBM a los conductores: ¡despierten!" . Consultado el 6 de diciembre de 2011 .

[bare_url-6] ^ ^a ^b ^c ^d ^e ^f Kanevsky, Dimitri. "Informe de investigación de IBM" (PDF) . Consultado el 6 de diciembre de 2011 .

[springerlink-7] ^ ^a ^b ^c ^d ^e ^f Kanevsky, Dimitri (2008). "Telemática: pasajero artificial y más allá". Factores humanos y sistemas interactivos de voz . Tecnología de señales y comunicación. págs. 291-325. doi : 10.1007 / 978-0-387-68439-0_10 . ISBN 978-0-387-25482-1.

[1]