El reconocimiento de voz de Windows ( WSR ) es un reconocimiento de voz desarrollado por Microsoft para Windows Vista que permite que los comandos de voz controlen la interfaz de usuario del escritorio ; dictar texto en documentos electrónicos y correo electrónico ; navegar por sitios web ; realizar atajos de teclado ; y operar el cursor del mouse . Admite macros personalizadas para realizar tareas adicionales o complementarias.
Desarrollador (es) | Microsoft |
---|---|
Versión inicial | 30 de noviembre de 2006 |
Sistema operativo | Windows Vista y posterior |
Tipo | Reconocimiento de voz |
WSR es una plataforma de reconocimiento de voz procesada localmente; no depende de la computación en la nube para obtener precisión, dictado o reconocimiento, sino que se adapta en función de contextos, gramáticas, muestras de habla, sesiones de capacitación y vocabularios. Proporciona un diccionario personal que permite a los usuarios incluir o excluir palabras o expresiones del dictado y grabar pronunciaciones para aumentar la precisión del reconocimiento. También se admiten modelos de idiomas personalizados.
Con Windows Vista, WSR se desarrolló para ser parte de Windows, ya que anteriormente el reconocimiento de voz era exclusivo de aplicaciones como Windows Media Player . Está presente en Windows 7 , Windows 8 , Windows 8.1 , Windows RT y Windows 10 .
Historia
Microsoft estuvo involucrado en la investigación de reconocimiento de voz y síntesis de voz durante muchos años antes de WSR. En 1993, Microsoft contrató a Xuedong Huang de la Universidad Carnegie Mellon para dirigir sus esfuerzos de desarrollo del habla; La investigación de la compañía condujo al desarrollo de Speech API (SAPI) introducido en 1994. [1] El reconocimiento de voz también se había utilizado en productos anteriores de Microsoft. Office XP y Office 2003 proporcionaron capacidades de reconocimiento de voz entre las aplicaciones de Internet Explorer y Microsoft Office ; [2] también habilitó una funcionalidad de voz limitada en Windows 98 , Windows ME , Windows NT 4.0 y Windows 2000 . [3] Windows XP Tablet PC Edition 2002 incluyó capacidades de reconocimiento de voz con el Panel de entrada de Tablet PC, [4] [5] y Microsoft Plus! para comandos de voz habilitados para Windows XP para Windows Media Player. [6] Sin embargo, todos estos requirieron la instalación de reconocimiento de voz como un componente separado; antes de Windows Vista, Windows no incluía reconocimiento de voz integrado o extenso. [5] Office 2007 y versiones posteriores se basan en WSR para los servicios de reconocimiento de voz. [7]
Windows Vista
En WinHEC 2002, Microsoft anunció que Windows Vista (con nombre en código "Longhorn") incluiría avances en el reconocimiento de voz y en características como soporte de matriz de micrófonos [8] como parte de un esfuerzo por "proporcionar una infraestructura de audio de calidad consistente para el habla natural (continua) reconocimiento y mando y control (discretos) ". [9] Bill Gates declaró durante PDC 2003 que Microsoft "construiría capacidades de voz en el sistema - un gran avance para eso en 'Longhorn', tanto en reconocimiento como en síntesis, en tiempo real"; [10] [11] y las versiones preliminares durante el desarrollo de Windows Vista incluyeron un motor de voz con funciones de entrenamiento. [12] Una presentación para desarrolladores de PDC 2003 indicó que Windows Vista también incluiría una interfaz de usuario para retroalimentación y control del micrófono, y funciones de configuración y capacitación del usuario. [13] Microsoft aclaró hasta qué punto se integraría el reconocimiento de voz cuando declaró en un kit de desarrollo de software previo al lanzamiento que "los escenarios de voz comunes, como los menús y botones de habilitación de voz, se habilitarán en todo el sistema". [14]
Durante WinHEC 2004, Microsoft incluyó WSR como parte de una estrategia para mejorar la productividad en las PC móviles. [15] [16] Microsoft luego enfatizó la accesibilidad , nuevos escenarios de movilidad, soporte para idiomas adicionales y mejoras en la experiencia del usuario de voz en WinHEC 2005. A diferencia del soporte de voz incluido en Windows XP, que se integró con el Panel de entrada de Tablet PC y requirió cambiar entre los modos de comando y dictado separados, Windows Vista introduciría una interfaz dedicada para la entrada de voz en el escritorio y unificaría los modos de voz separados; [17] los usuarios anteriormente no podían pronunciar un comando después de dictar o viceversa sin primero cambiar entre estos dos modos. [18] Windows Vista Beta 1 incluía reconocimiento de voz integrado. [19] Para incentivar a los empleados de la empresa a analizar WSR en busca de fallas de software y proporcionar comentarios, Microsoft ofreció a sus evaluadores la oportunidad de ganar un modelo Premium de Xbox 360 . [20]
Durante una demostración de Microsoft el 27 de julio de 2006, antes del lanzamiento de Windows Vista a la fabricación (RTM), se produjo un incidente notable que involucró a WSR que resultó en una salida no intencional de "Querida tía, establezcamos el doble del asesino, eliminemos, seleccione todo" cuando varios los intentos de dictar llevaron a errores de salida consecutivos; [21] [22] el incidente fue objeto de burla significativa entre los analistas y periodistas en la audiencia, [23] [24] a pesar de que otra demostración de la gestión de aplicaciones y la navegación fue exitosa. [21] Microsoft reveló que estos problemas se debían a un error de ganancia de audio que hacía que el reconocedor distorsionara los comandos y los dictados; la falla se solucionó antes del lanzamiento de Windows Vista. [25]
Los informes de principios de 2007 indicaron que WSR es vulnerable a los atacantes que utilizan el reconocimiento de voz para operaciones maliciosas al reproducir ciertos comandos de audio a través de los altavoces de un objetivo; [26] [27] fue la primera vulnerabilidad descubierta después de la disponibilidad general de Windows Vista . [28] Microsoft declaró que aunque un ataque de este tipo es teóricamente posible, una serie de factores atenuantes y requisitos previos limitarían su eficacia o lo evitarían por completo: un objetivo necesitaría que el reconocedor esté activo y configurado para interpretar correctamente dichos comandos; los micrófonos y los altavoces deberían estar habilitados y a niveles de volumen suficientes; y un ataque requeriría que la computadora realizara operaciones visibles y produjera retroalimentación audible sin que los usuarios se dieran cuenta. El Control de cuentas de usuario también prohibiría la ocurrencia de operaciones privilegiadas. [29]
Windows 7
WSR se actualizó para usar Microsoft UI Automation y su motor ahora usa la pila de audio WASAPI , mejorando sustancialmente su rendimiento y permitiendo la compatibilidad con la cancelación de eco , respectivamente. El recolector de documentos, que puede analizar y recopilar texto en correos electrónicos y documentos para contextualizar los términos del usuario, ha mejorado el rendimiento y ahora se ejecuta periódicamente en segundo plano en lugar de solo después del inicio del reconocedor. El modo de suspensión también ha experimentado mejoras en el rendimiento y, para solucionar problemas de seguridad, el reconocedor se desactiva de forma predeterminada después de que los usuarios dicen "dejar de escuchar" en lugar de ser suspendido. Windows 7 también presenta una opción para enviar datos de entrenamiento del habla a Microsoft para mejorar las futuras versiones del reconocedor. [30]
Una nueva interfaz de bloc de notas de dictado funciona como un documento temporal en el que los usuarios pueden dictar o escribir texto para insertarlo en aplicaciones que no son compatibles con Text Services Framework . [30] Windows Vista proporcionó anteriormente una "opción de habilitar dictado en todas partes" para tales aplicaciones. [31]
Windows 8.xy Windows RT
WSR se puede utilizar para controlar la interfaz de usuario de Metro en Windows 8, Windows 8.1 y Windows RT con comandos para abrir la barra de accesos ("Presione Windows C"); para dictar o mostrar comandos en aplicaciones estilo Metro ("Presione Windows Z"); para realizar tareas en aplicaciones (por ejemplo, "Cambiar a Celsius" en MSN Weather ); y para mostrar todas las aplicaciones instaladas enumeradas en la pantalla de inicio ("Aplicaciones"). [32] [33]
Windows 10
WSR se incluye en la aplicación Configuración a partir de la actualización de Windows 10 de abril de 2018 ( versión 1803 ); el cambio apareció por primera vez en Insider Preview Build 17083. [34] La actualización de abril de 2018 también presenta un nuevo atajo de teclado ⊞ Win+ Ctrl+ Spara activar WSR. [35]
Resumen y características
WSR permite al usuario controlar las aplicaciones y la interfaz de usuario del escritorio de Windows a través de comandos de voz. [36] Los usuarios pueden dictar texto en documentos, correos electrónicos y formularios; controlar la interfaz de usuario del sistema operativo; realizar atajos de teclado ; y mueva el cursor del mouse . [37] La mayoría de las aplicaciones integradas en Windows Vista se pueden controlar; [36] Las aplicaciones de terceros deben admitir el marco de servicios de texto para el dictado. [1] Inglés (EE. UU.) , Inglés (Reino Unido) , francés , alemán , japonés , chino mandarín y español son idiomas admitidos. [38]
Cuando se inicia por primera vez, WSR presenta un asistente de configuración de micrófono y un tutorial interactivo paso a paso opcional que los usuarios pueden comenzar a aprender los comandos básicos mientras adaptan el reconocedor a sus características de voz específicas; [36] Se estima que el tutorial requiere aproximadamente 10 minutos para completarse. [39] La precisión del reconocedor aumenta con el uso regular, que lo adapta a contextos, gramáticas, patrones y vocabularios. [38] [40] También se admiten modelos de lenguaje personalizados para contextos específicos, fonética y terminologías de usuarios en campos ocupacionales particulares como el legal o el médico. [41] Con Windows Search , [42] el reconocedor también puede recopilar opcionalmente texto en documentos, correo electrónico, así como entradas escritas a mano en la tableta para contextualizar y eliminar la ambigüedad de los términos para mejorar la precisión; no se envía información a Microsoft. [40]
WSR es una plataforma de reconocimiento de voz procesada localmente; no depende de la computación en la nube para su precisión, dictado o reconocimiento. [43] Los perfiles de voz que almacenan información sobre los usuarios se conservan localmente. [40] Se pueden realizar copias de seguridad y transferencias de perfiles a través de Windows Easy Transfer . [44]
Interfaz
La interfaz WSR consta de un área de estado que muestra instrucciones, información sobre comandos (por ejemplo, si el reconocedor no escucha un comando) y el estado del reconocedor; un medidor de voz muestra información visual sobre los niveles de volumen. El área de estado representa el estado actual de WSR en un total de tres modos, que se enumeran a continuación con sus respectivos significados:
- Escuchando : el reconocedor está activo y esperando la entrada del usuario
- Dormido : el reconocedor no escuchará ni responderá a comandos que no sean "Empiece a escuchar".
- Apagado : el reconocedor no escuchará ni responderá a ningún comando; este modo se puede habilitar diciendo "Deja de escuchar"
Los colores del botón de modo de escucha del reconocedor denotan sus diversos modos de funcionamiento: azul al escuchar; gris azulado al dormir; gris cuando está apagado; y amarillo cuando el usuario cambia de contexto (por ejemplo, del escritorio a la barra de tareas) o cuando se malinterpreta un comando de voz. El área de estado también puede mostrar información de usuario personalizada como parte de las macros de reconocimiento de voz de Windows . [45] [46]
Panel de suplentes
Una interfaz de desambiguación del panel alternativo enumera los elementos que se interpretan como relevantes para las palabras habladas de un usuario; Si la palabra o frase que un usuario desea insertar en una aplicación aparece entre los resultados, el usuario puede pronunciar el número correspondiente de la palabra o frase en los resultados y confirmar esta elección diciendo "OK" para insertarla dentro de la aplicación. [47] El panel de alternativas también aparece al iniciar aplicaciones o al pronunciar comandos que se refieren a más de un elemento (p. Ej., Al decir "Iniciar Internet Explorer" puede aparecer tanto el navegador web como una versión separada con los complementos desactivados). Una entrada ExactMatchOverPartialMatch en el Registro de Windows puede limitar los comandos a elementos con nombres exactos si hay más de una instancia incluida en los resultados. [48]
Comandos comunes
A continuación se enumeran los comandos WSR comunes. Las palabras en cursiva indican una palabra que se puede sustituir por el elemento deseado (por ejemplo, "dirección" en " dirección de desplazamiento " se puede sustituir por la palabra " abajo "). [37] Un comando de "empezar a escribir" permite a WSR interpretar todos los comandos de dictado como atajos de teclado. [47]
- Comandos de dictado: "Nueva línea"; "Nuevo párrafo"; "Pestaña"; " Palabra literal "; " Número numérico "; "Ir a palabra "; "Ve tras la palabra "; "Sin espacio"; "Ir al inicio de la oración"; "Ir al final de la oración"; "Ir al inicio del párrafo"; "Ir al final del párrafo"; "Ir al inicio del documento" "Ir al final del documento"; "Ir al nombre del campo " (por ejemplo, ir a la dirección , cc o asunto ). Los caracteres especiales, como una coma, se dictan al pronunciar el nombre del carácter especial. [37]
- Comandos de navegación:
- Atajos de teclado: "Presione la tecla del teclado "; "Presione ⇧ Shiftmás a"; "Presione mayúsculas b".
- Las teclas que pueden pulsarse sin dar primero el comando de prensa incluyen: ← Backspace, Delete, End, ↵ Enter, Home, Page Down, Page Up, y Tab ↹. [37]
- Comandos del mouse: "Hacer clic"; "Haga clic en eso "; "Haga doble clic"; "Haga doble clic en eso "; "Marcos"; "Marque eso "; "Botón derecho del ratón"; "Haga clic derecho en eso "; " MouseGrid ". [37]
- Comandos de administración de ventanas: "Cerrar (como alternativa, maximizar, minimizar o restaurar) la ventana"; "Cierra eso "; "Cerrar el nombre de la aplicación abierta "; "Cambiar aplicaciones"; "Cambiar al nombre de la aplicación abierta "; " Dirección de desplazamiento "; " Dirección de desplazamiento en número de páginas "; "Mostrar escritorio"; " Mostrar números ". [37]
- Comandos de reconocimiento de voz: "Empiece a escuchar"; "Deja de escuchar"; "Mostrar opciones de voz"; "Diccionario de voz abierto"; "Mover el reconocimiento de voz"; "Minimizar el reconocimiento de voz"; "Restaurar el reconocimiento de voz". [37] En el idioma inglés, los comandos aplicables se pueden mostrar diciendo "¿Qué puedo decir?" [38] Los usuarios también pueden consultar el reconocedor sobre tareas en Windows diciendo "¿Cómo puedo nombrar la tarea? " (Por ejemplo, "¿Cómo instalo una impresora?") Que abre la documentación de ayuda relacionada. [49]
MouseGrid
MouseGrid permite a los usuarios controlar el cursor del mouse superponiendo números en nueve regiones de la pantalla; estas regiones se estrechan gradualmente a medida que un usuario habla el número de la región en la que enfocarse hasta que se alcanza el elemento de interfaz deseado. Los usuarios pueden entonces emitir comandos que incluyen "Hacer clic en el número de región ", que mueve el cursor del mouse a la región deseada y luego hace clic en ella; y "Marcar número de región ", que permite seleccionar un elemento (como un icono de computadora ) en una región, que luego se puede hacer clic con el comando de clic anterior . Los usuarios también pueden interactuar con varias regiones a la vez. [37]
Mostrar números
Las aplicaciones y los elementos de la interfaz que no presentan comandos identificables aún se pueden controlar solicitando al sistema que superponga números encima de ellos a través de un comando Show Numbers . Una vez activo, al pronunciar el número superpuesto se selecciona ese elemento para que el usuario pueda abrirlo o realizar otras operaciones. [37] Show Numbers se diseñó para que los usuarios pudieran interactuar con elementos que no son fácilmente identificables. [50]
Dictado
WSR permite el dictado de texto en aplicaciones y Windows. Si se produce un error de dictado, puede corregirse diciendo "Corregir palabra " o "Corregir eso" y aparecerá el panel de alternativas que proporcionará sugerencias para la corrección; estas sugerencias se pueden seleccionar diciendo el número correspondiente al número de la sugerencia y diciendo "OK". Si el elemento deseado no aparece en la lista de sugerencias, un usuario puede pronunciarlo para que aparezca. Alternativamente, los usuarios pueden decir "Deletrearlo" o "Lo deletrearé yo mismo" para pronunciar la palabra deseada letra por letra; los usuarios pueden utilizar su alfabeto personal o el alfabeto fonético de la OTAN (por ejemplo, "N como en noviembre") al deletrear. [41]
Se pueden corregir varias palabras en una oración simultáneamente (por ejemplo, si un usuario dice "dictar" pero el reconocedor interpreta esta palabra como "la cosa", un usuario puede indicar "corregir la cosa" para corregir ambas palabras a la vez). En el idioma inglés se reconocen por defecto más de 100.000 palabras. [41]
Diccionario de voz
Un diccionario personal permite a los usuarios incluir o excluir ciertas palabras o expresiones del dictado. [41] Cuando un usuario agrega una palabra que comienza con una letra mayúscula al diccionario, un usuario puede especificar si siempre debe escribirse en mayúscula o si las mayúsculas dependen del contexto en el que se pronuncia la palabra. Los usuarios también pueden grabar las pronunciaciones de las palabras agregadas al diccionario para aumentar la precisión del reconocimiento; También se almacenan las palabras escritas con un lápiz óptico en una tableta para la función de reconocimiento de escritura a mano de Windows . La información almacenada en un diccionario se incluye como parte del perfil de voz de un usuario. [40] Los usuarios pueden abrir el diccionario de voz pronunciando el comando "mostrar diccionario de voz".
Macros
WSR admite macros personalizadas a través de una aplicación complementaria de Microsoft que habilita comandos adicionales en lenguaje natural . [51] [52] Como ejemplo de esta funcionalidad, una macro de correo electrónico lanzada por Microsoft habilita un comando de lenguaje natural donde un usuario puede decir "enviar correo electrónico al contacto sobre el asunto ", que abre Microsoft Outlook para redactar un nuevo mensaje con el contacto y asunto insertados automáticamente. [53] Microsoft también ha lanzado macros de muestra para el diccionario de voz, [54] para Windows Media Player, [55] para Microsoft PowerPoint , [56] para síntesis de voz , [57] para cambiar entre varios micrófonos, [58] para personalizar varios aspectos de la configuración del dispositivo de audio, como los niveles de volumen, [59] y para consultas generales en lenguaje natural como "¿Cuál es el pronóstico del tiempo?" [60] "¿Qué hora es?" [57] y "¿Cuál es la fecha?" [57] Las respuestas a estas consultas de los usuarios se transmiten al usuario en la voz activa de texto a voz de Microsoft instalada en la máquina.
Aplicación o artículo | Ejemplos de frases macro (las cursivas indican palabras sustituibles) | |||||||
---|---|---|---|---|---|---|---|---|
Microsoft Outlook | Enviar correo electrónico | Enviar el email a | Enviar correo electrónico a Makoto | Enviar correo electrónico a Makoto Yamagishi | Envíe un correo electrónico a Makoto Yamagishi sobre | Envíe un correo electrónico a Makoto Yamagishi sobre la reunión de esta semana | Actualizar los contactos de correo electrónico de Outlook | |
Microsoft PowerPoint | La siguiente diapositiva | Diapositiva anterior | próximo | Anterior | Avanza 5 diapositivas | Retroceder 3 diapositivas | Ir a diapositiva 8 | |
reproductor de medios de Windows | Siguiente pista | Canción anterior | Jugar Beethoven | Toca algo de Mozart | Reproduce el CD que tiene In the Hall of the Mountain King | Pon algo escrito en 1930 | Pausar música | |
Micrófonos en Windows | Micrófono | Interruptor de micrófono | Micrófono de matriz de micrófono | Cambiar a línea | Cambiar a matriz de micrófono | Cambiar a micrófono de línea | Cambiar a micrófono de matriz de micrófono | |
Niveles de volumen en Windows | Silenciar los altavoces | Activar el sonido de los altavoces | Apaga el audio | Aumenta el volumen | Aumenta el volumen 2 veces | Disminuir el volumen en 50 | Ponga el volumen a 66 | |
Diccionario de voz WSR | Exportar el diccionario de voz | Agregar una pronunciación | Agrega ese [ texto seleccionado ] al diccionario de voz. | Bloquear ese [ texto seleccionado ] del diccionario de voz | Eliminar ese [ texto seleccionado ] | [ Texto seleccionado ] suena como ... | ¿Cómo suena ese [ texto seleccionado ]? | |
Síntesis de voz | Leer ese [ texto seleccionado ] | Leer los siguientes 3 párrafos | Leer la oración anterior | Por favor deja de leer | ¿Qué hora es? | ¿Cual es la cita de hoy? | Dime el pronóstico del tiempo en Redmond |
Los usuarios y desarrolladores pueden crear sus propias macros basadas en la transcripción y sustitución de texto; ejecución de la aplicación (con soporte para argumentos de línea de comandos ); atajos de teclado; emulación de comandos de voz existentes; o una combinación de estos elementos. Se admiten XML , JScript y VBScript . [47] Las macros se pueden limitar a aplicaciones específicas [61] y las reglas para macros se pueden definir mediante programación. [53] Para que se cargue una macro, debe estar almacenada en una carpeta Speech Macros dentro del directorio Documentos del usuario activo . Todas las macros están firmadas digitalmente de forma predeterminada si hay un certificado de usuario disponible para garantizar que los comandos almacenados no sean alterados o cargados por terceros; si no hay un certificado disponible, un administrador puede crear uno. [62] Los niveles de seguridad configurables pueden impedir que se carguen macros sin firmar; para solicitar a los usuarios que firmen macros después de la creación; y cargar macros sin firmar. [61]
Actuación
A partir de 2017[actualizar]WSR usa Microsoft Speech Recognizer 8.0, la versión introducida en Windows Vista. Mark Hachman, editor sénior de PC World , encontró una precisión del 93,6% en el dictado sin capacitación, una tasa que no es tan precisa como el software de la competencia. Según Microsoft, la tasa de precisión cuando se entrena es del 99%. Hachman opinó que Microsoft no discute públicamente la función debido al incidente de 2006 durante el desarrollo de Windows Vista, con el resultado de que pocos usuarios sabían que los documentos se podían dictar dentro de Windows antes de la introducción de Cortana . [39]
Ver también
- Lista de software de reconocimiento de voz
- Sistema telefónico inalámbrico de Microsoft
- Narrador de Microsoft
- Comando de voz de Microsoft
- Características técnicas nuevas para Windows Vista
Referencias
- ^ a b Brown, Robert. "Exploración de nuevas API de síntesis y reconocimiento de voz en Windows Vista" . Revista MSDN . Microsoft . Archivado desde el original el 7 de marzo de 2008 . Consultado el 26 de junio de 2015 .
- ^ "Cómo utilizar el reconocimiento de voz en Windows XP" . Soporte de Windows . Microsoft . Archivado desde el original el 14 de marzo de 2015 . Consultado el 15 de mayo de 2020 .
- ^ "Descripción de los métodos de reconocimiento de voz y reconocimiento de escritura a mano en Word 2002" . Soporte de Windows . Microsoft . Archivado desde el original el 3 de julio de 2015 . Consultado el 26 de marzo de 2018 .
- ^ Thurrott, Paul (25 de junio de 2002). "Revisión de Windows XP Tablet PC Edition" . Windows IT Pro . Penton . Archivado desde el original el 19 de julio de 2011 . Consultado el 15 de mayo de 2020 .
- ^ a b Dresevic, Bodin (2005). "Entrada natural en sistemas de PC móviles" . Microsoft . Archivado desde el original (PPT) el 14 de diciembre de 2005 . Consultado el 15 de mayo de 2020 .
- ^ Thurrott, Paul (6 de octubre de 2010). "¡Más! Para Windows XP Review" . Windows IT Pro . Penton . Archivado desde el original el 5 de julio de 2011 . Consultado el 15 de mayo de 2020 .
- ^ "¿Qué pasó con el reconocimiento de voz?" . Soporte de oficina . Microsoft . Archivado desde el original el 10 de noviembre de 2016 . Consultado el 15 de mayo de 2020 .
- ^ Stam, Nick (16 de abril de 2002). "WinHEC: The Pregame Show" . Revista de PC . Ziff Davis Media . Archivado desde el original el 3 de julio de 2015 . Consultado el 15 de mayo de 2020 .
- ^ Flandern Van, Mike (2002). "Consideraciones de audio para aplicaciones habilitadas por voz" . Conferencia de ingeniería de hardware de Windows . Microsoft . Archivado desde el original (EXE) el 6 de mayo de 2002 . Consultado el 30 de marzo de 2018 .
- ^ "Sitio Web de Bill Gates - Transcripción del discurso, Conferencia de desarrolladores profesionales de Microsoft 2003" . Microsoft . 27 de octubre de 2003. Archivado desde el original el 3 de febrero de 2004 . Consultado el 15 de mayo de 2020 .
- ^ Thurrott, Paul; Furman, Keith (26 de octubre de 2003). "Live from PDC 2003: Day 1, Monday" . Windows IT Pro . Penton . Archivado desde el original el 11 de septiembre de 2013 . Consultado el 15 de mayo de 2020 .
- ^ Spanbauer, Scott (4 de diciembre de 2003). "¿Su próximo sistema operativo: Windows 2006?" . TechHive . IDG . Consultado el 25 de junio de 2015 .
- ^ Gjerstad, Kevin; Cámaras, Rob (2003). "Entrada de teclado, voz y lápiz en sus controles" . Conferencia de desarrolladores profesionales . Microsoft . Archivado desde el original (PPT) el 19 de diciembre de 2012 . Consultado el 30 de marzo de 2018 .
- ^ "Interactuar con la computadora usando entrada de voz y salida de voz" . MSDN . Microsoft . 2003. Archivado desde el original el 4 de enero de 2004 . Consultado el 28 de junio de 2015 .
- ^ Suokko, Matti (2004). "Windows para PC móviles y Tablet PC - CY05 y más allá" . Microsoft . Archivado desde el original (PPT) el 14 de diciembre de 2005 . Consultado el 15 de mayo de 2020 .
- ^ Pescado, Darrin (2004). "Windows para PC móviles y Tablet PC - CY04" . Microsoft . Archivado desde el original (PPT) el 14 de diciembre de 2005 . Consultado el 15 de mayo de 2020 .
- ^ Dresevic, Bodin (2005). "Entrada natural en sistemas de PC móviles" . Microsoft . Archivado desde el original (PPT) el 14 de diciembre de 2005 . Consultado el 15 de mayo de 2020 .
- ^ Chambers, Rob (1 de agosto de 2005). "Comando y dictado: ¿uno o dos modos en Windows Vista?" . MSDN . Microsoft . Consultado el 30 de junio de 2015 .
- ^ Thurrott, Paul (6 de octubre de 2010). "Revisión de Windows Vista Beta 1 (Parte 3)" . Windows IT Pro . Penton . Archivado desde el original el 23 de agosto de 2014 . Consultado el 15 de mayo de 2020 .
- ^ Levy, Brian (2006). "Cartel de reconocimiento de voz de Microsoft" . Archivado desde el original el 11 de octubre de 2006 . Consultado el 15 de mayo de 2020 .
- ^ a b Auchard, Eric (28 de julio de 2006). "Actualizado: cuando las buenas demostraciones van (muy, muy) mal" . Thomson Reuters . Archivado desde el original el 21 de mayo de 2011 . Consultado el 29 de marzo de 2018 .
- ^ "Software glitch frustra la demostración de Microsoft" . NBC News . 2 de agosto de 2006. Archivado desde el original el 28 de marzo de 2018 . Consultado el 15 de mayo de 2020 .
- ^ Montalbano, Elizabeth (31 de julio de 2006). "La función de reconocimiento de voz de Vista necesita funcionar" . InfoWorld . IDG . Archivado desde el original el 5 de agosto de 2006 . Consultado el 26 de junio de 2015 .
- ^ Montalbano, Elizabeth (31 de julio de 2006). "Tartamudeos de reconocimiento de voz de Vista" . TechHive . IDG . Archivado desde el original el 3 de julio de 2015 . Consultado el 15 de mayo de 2020 .
- ^ Chambers, Rob (29 de julio de 2006). "FAM: Fallo de la demostración de Vista SR - Y ahora ya conoce el resto de la historia ..." MSDN . Microsoft . Archivado desde el original el 22 de mayo de 2011 . Consultado el 15 de mayo de 2020 .
- ^ "Vista tiene un agujero de reconocimiento de voz" . BBC News . BBC . 1 de febrero de 2007. Archivado desde el original el 3 de febrero de 2007 . Consultado el 15 de mayo de 2020 .
- ^ Miller, Paul (1 de febrero de 2007). "El 'exploit' remoto de Vista Speech revela un defecto fatal" . Engadget . AOL . Consultado el 28 de junio de 2015 .
- ^ Roberts, Paul (1 de febrero de 2007). "Honeymoon Over: First Windows Vista Flaw" . PCWorld . IDG . Archivado desde el original el 4 de febrero de 2007 . Consultado el 28 de junio de 2015 .
- ^ "Problema relacionado con el reconocimiento de voz de Windows Vista" . TechNet . Microsoft . 31 de enero de 2007. Archivado desde el original el 20 de mayo de 2016 . Consultado el 31 de marzo de 2018 .
- ^ a b Brown, Eric (29 de enero de 2009). "¿Qué hay de nuevo en el reconocimiento de voz de Windows?" . MSDN . Microsoft . Archivado desde el original el 28 de enero de 2011 . Consultado el 15 de mayo de 2020 .
- ^ Brown, Eric (24 de octubre de 2007). "¿Dónde funciona el dictado en el reconocimiento de voz de Windows?" . MSDN . Microsoft . Consultado el 28 de marzo de 2018 .
- ^ "Cómo utilizar el reconocimiento de voz" . Soporte de Windows . Microsoft . Archivado desde el original el 25 de octubre de 2012 . Consultado el 24 de diciembre de 2018 .
- ^ "Cómo utilizar el reconocimiento de voz en Windows" . Soporte de Windows . Microsoft . 31 de agosto de 2016 . Consultado el 24 de diciembre de 2018 .
- ^ Sarkar, Dona (24 de enero de 2018). "Anuncio de Windows 10 Insider Preview Build 17083 para PC" . Blogs de Windows . Microsoft . Archivado desde el original el 24 de enero de 2018 . Consultado el 15 de mayo de 2020 .
- ^ "Atajos de teclado de Windows para accesibilidad" . Soporte de Windows . Microsoft . Archivado desde el original el 12 de octubre de 2018 . Consultado el 8 de enero de 2019 .
- ^ a b c Phillips, Todd (2007). "Guía paso a paso del reconocimiento de voz de Windows Vista" . MSDN . Microsoft . Consultado el 30 de junio de 2015 .
- ^ a b c d e f g h yo "Comandos de reconocimiento de voz de Windows" . Soporte de Windows . Microsoft . Consultado el 15 de mayo de 2020 .
- ^ a b c "Reconocimiento de voz de Windows" . Accesibilidad de Microsoft . Microsoft . Archivado desde el original el 4 de febrero de 2007 . Consultado el 15 de mayo de 2020 .
- ^ a b Hachman, Mark (10 de mayo de 2017). "La debilidad de Windows que nadie menciona: el reconocimiento de voz" . PC World . IDG . Consultado el 28 de marzo de 2018 .
- ^ a b c d "Declaración de privacidad de Windows Vista" . Microsoft . 2006. Archivado desde el original (RTF) el 30 de agosto de 2008 . Consultado el 15 de mayo de 2020 .
- ^ a b c d Chambers, Rob (20 de septiembre de 2005). "Vocabularios de voz personalizados en Windows Vista" . MSDN . Microsoft . Consultado el 29 de marzo de 2018 .
- ^ Thurrott, Paul (6 de octubre de 2010). "Jim Allchin habla de Windows Vista" . Windows IT Pro . Penton . Archivado desde el original el 28 de marzo de 2018 . Consultado el 15 de mayo de 2020 .
- ^ "Declaración de privacidad de Microsoft" . Microsoft . Consultado el 12 de mayo de 2020 .
- ^ Chambers, Rob (15 de febrero de 2007). "Transferencia de perfiles de reconocimiento de voz de Windows de una máquina a otra" . MSDN . Microsoft . Consultado el 28 de junio de 2015 .
- ^ Shintaku, Kurt (29 de abril de 2008). "BETA: Vista previa de la tecnología 'Macros de reconocimiento de voz de Windows'" . Consultado el 17 de marzo de 2016 .
- ^ Pash, Adam (20 de mayo de 2008). "Controla tu PC con tu voz" . Lifehacker . Gawker Media . Consultado el 17 de marzo de 2016 .
- ^ a b c Chambers, Rob (19 de noviembre de 2007). "Macros de voz, modo de escritura y modo de ortografía en el reconocimiento de voz de Windows" . MSDN . Microsoft . Consultado el 25 de agosto de 2015 .
- ^ Chambers, Rob (7 de mayo de 2007). "Reconocimiento de voz de Windows - ExactMatchOverPartialMatch" . MSDN . Microsoft . Consultado el 24 de agosto de 2015 .
- ^ Chambers, Rob (12 de marzo de 2007). "Reconocimiento de voz de Windows: comandos generales" . MSDN . Microsoft . Consultado el 1 de mayo de 2017 .
- ^ Patente estadounidense 7742923 , Bickel, Ryan; Murillo, Oscar & Mowatt, David et al., "Esquemas de interfaz gráfica de usuario para admitir sistemas de entrada de reconocimiento de voz", asignado a Microsoft Corporation
- ^ "Macros de reconocimiento de voz de Windows" . Centro de descargas . Microsoft . Consultado el 29 de junio de 2015 .
- ^ Protalinski, Emil (30 de abril de 2008). "WSR Macros amplían la función de reconocimiento de voz de Windows Vista" . ArsTechnica . Condé Nast . Consultado el 29 de junio de 2015 .
- ^ a b Chambers, Rob (9 de junio de 2008). "Macro del día: enviar correo electrónico a [OutlookContact]" . MSDN . Microsoft . Consultado el 26 de junio de 2015 .
- ^ Chambers, Rob (2 de agosto de 2008). "Speech Macro of the Day: Speech Dictionary" . MSDN . Microsoft . Consultado el 3 de septiembre de 2015 .
- ^ Chambers, Rob (1 de julio de 2008). "Macro del día: Windows Media Player" . MSDN . Microsoft . Consultado el 26 de junio de 2015 .
- ^ Chambers, Rob (3 de junio de 2008). "Macro del día: Siguiente diapositiva" . MSDN . Microsoft . Consultado el 3 de septiembre de 2015 .
- ^ a b c Chambers, Rob (28 de mayo de 2008). "Macro del día: lee eso" . MSDN . Microsoft . Consultado el 26 de junio de 2015 .
- ^ Chambers, Rob (7 de noviembre de 2008). "Macro del día: Control de micrófono" . MSDN . Microsoft . Consultado el 30 de junio de 2015 .
- ^ Chambers, Rob (18 de agosto de 2008). "Macro del día: ¡Silencie los altavoces!" . MSDN . Microsoft . Consultado el 3 de septiembre de 2015 .
- ^ Chambers, Rob (2 de junio de 2008). "Macro del día: dime el pronóstico del tiempo para Redmond" . MSDN . Microsoft . Consultado el 26 de junio de 2015 .
- ^ a b Chambers, Rob (30 de junio de 2008). "Hacer una aplicación de macro de voz específica" . MSDN . Microsoft . Consultado el 3 de septiembre de 2015 .
- ^ "Notas de la versión de Macros de reconocimiento de voz de Windows" . Microsoft . 2009. Archivado desde el original (DOCX) el 30 de septiembre de 2011 . Consultado el 15 de mayo de 2020 .
enlaces externos
- Demostración de reconocimiento de voz de Windows Vista en la reunión de analistas financieros de Microsoft