altavoz inteligente


Un altavoz inteligente es un tipo de altavoz y dispositivo de comando de voz con un asistente virtual integrado que ofrece acciones interactivas y activación manos libres con la ayuda de una "palabra caliente" (o varias "palabras calientes"). Algunos parlantes inteligentes también pueden actuar como un dispositivo inteligente que utiliza Wi-Fi , Bluetooth y otros estándares de protocolo para extender el uso más allá de la reproducción de audio, como para controlar los dispositivos de automatización del hogar . Esto puede incluir, pero no se limita a, funciones como la compatibilidad entre una serie de servicios y plataformas, conexión punto a punto a través deredes de malla , asistentes virtuales y otros. Cada uno puede tener su propia interfaz designada y funciones internas, generalmente iniciadas o controladas a través de una aplicación o software de automatización del hogar . [1] Algunos parlantes inteligentes también incluyen una pantalla para mostrar al usuario una respuesta visual.

A partir del invierno de 2017, NPR y Edison Research estiman que 39 millones de estadounidenses (el 16 % de la población mayor de 18 años) posee un altavoz inteligente. [2]

Un altavoz inteligente con pantalla táctil se conoce como pantalla inteligente. [3] [4] Es un dispositivo Bluetooth inteligente que integra una interfaz de usuario conversacional con pantallas de visualización para aumentar la interacción de voz con imágenes y video. Funcionan con uno de los asistentes de voz comunes y ofrecen controles para dispositivos domésticos inteligentes, cuentan con aplicaciones de transmisión y navegadores web con controles táctiles para seleccionar contenido. Amazon introdujo las primeras pantallas inteligentes en 2017 ( Amazon Echo Show , [5] Amazon Echo Spot).

Según un estudio de Proceedings of the National Academy of Sciences of the United States of America publicado en marzo de 2020, las seis mayores empresas de desarrollo tecnológico, Amazon , Apple , Google , Yandex , IBM y Microsoft , han identificado erróneamente más palabras pronunciadas por " negro ". gente " que " gente blanca ". Los sistemas probaron errores e ilegibilidad, con una discrepancia de 19 y 35 por ciento para el primero y 2 y 20 por ciento de discrepancia para el segundo. [6]

El capítulo norteamericano de la Asociación de Lingüística Computacional (NAACL) también identificó una discrepancia entre las voces masculinas y femeninas. Según su investigación, el software de reconocimiento de voz de Google es un 13 por ciento más preciso para hombres que para mujeres. Funciona mejor que los sistemas utilizados por Bing , AT&T e IBM. [7]

El micrófono incorporado en los parlantes inteligentes escucha continuamente "palabras picantes" seguidas de un comando. Sin embargo, estos micrófonos de escucha continua también plantean problemas de privacidad entre los usuarios. [8] Estos incluyen qué se está grabando, cómo se usarán los datos, cómo se protegerán y si se usarán para publicidad invasiva. [9] [10] Además, un análisis de Amazon Alexa Echo Dots mostró que entre el 30% y el 38% de las "grabaciones de audio falsas eran conversaciones humanas", lo que sugiere que estos dispositivos capturan audio que no es estrictamente la detección de la palabra caliente. [11]