Altavoz inteligente



Un altavoz inteligente es un tipo de altavoz y dispositivo de comando de voz con un asistente virtual integrado que ofrece acciones interactivas y activación de manos libres con la ayuda de una "palabra clave" (o varias "palabras clave"). Algunos altavoces inteligentes también pueden actuar como un dispositivo inteligente que utiliza Wi-Fi , Bluetooth y otros estándares de protocolo para extender el uso más allá de la reproducción de audio, como para controlar dispositivos de automatización del hogar . Esto puede incluir, entre otras, características como la compatibilidad entre varios servicios y plataformas, la conexión de igual a igual a través deredes de malla , asistentes virtuales y otros. Cada uno puede tener su propia interfaz designada y funciones internas, generalmente iniciadas o controladas a través de una aplicación o un software de automatización del hogar . [1] Algunos altavoces inteligentes también incluyen una pantalla para mostrar al usuario una respuesta visual.

A partir del invierno de 2017, NPR y Edison Research estiman que 39 millones de estadounidenses (16% de la población mayor de 18 años) poseen un altavoz inteligente. [2]

Un altavoz inteligente con pantalla táctil se conoce como pantalla inteligente. [3] [4] Es un dispositivo Bluetooth inteligente que integra una interfaz de usuario conversacional con pantallas de visualización para aumentar la interacción de voz con imágenes y videos. Funcionan con uno de los asistentes de voz comunes y ofrecen controles para dispositivos domésticos inteligentes, cuentan con aplicaciones de transmisión y navegadores web con controles táctiles para seleccionar contenido. Las primeras pantallas inteligentes fueron introducidas en 2017 por Amazon ( Amazon Echo Show , [5] Amazon Echo Spot).

Según un estudio de Proceedings of the National Academy of Sciences de los Estados Unidos de América publicado en marzo de 2020, las seis mayores empresas de desarrollo tecnológico, Amazon , Apple , Google , Yandex , IBM y Microsoft , han identificado erróneamente más palabras pronunciadas por " negros gente "que" gente blanca ". Los sistemas probaron errores e ilegibilidad, con una discrepancia del 19 y 35 por ciento para el primero y de 2 y 20 por ciento para el segundo. [6]

El Capítulo norteamericano de la Asociación de Lingüística Computacional (NAACL) también identificó una discrepancia entre las voces masculinas y femeninas. Según su investigación, el software de reconocimiento de voz de Google es un 13 por ciento más preciso para los hombres que para las mujeres. Funciona mejor que los sistemas utilizados por Bing , AT&T e IBM. [7]

El micrófono incorporado en los altavoces inteligentes escucha continuamente "palabras calientes" seguidas de un comando. Sin embargo, estos micrófonos de escucha continua también plantean preocupaciones sobre la privacidad entre los usuarios. [8] Estos incluyen lo que se está registrando, cómo se utilizarán los datos, cómo se protegerán y si se utilizarán para publicidad invasiva. [9] [10] Además, un análisis de Amazon Alexa Echo Dots mostró que entre el 30 y el 38% de las "grabaciones de audio falsas eran conversaciones humanas", lo que sugiere que estos dispositivos capturan audio de otra manera que no sea estrictamente después de la detección de la palabra clave. [11]