Mike Phillips (reconocimiento de voz)


Michael Phillips (nacido el 1 de agosto de 1961) es el director ejecutivo y cofundador de Sense Labs y un pionero en el aprendizaje automático , incluido el reconocimiento de voz móvil y la tecnología de texto a voz.

Phillips era estudiante de ingeniería eléctrica en la Universidad Carnegie Mellon . [1] También fue investigador de Carnegie Mellon y luego científico investigador en el grupo de Sistemas de Lenguaje Hablado del Instituto Tecnológico de Massachusetts (MIT) , [2] donde ayudó a desarrollar VOYAGER, un “sistema de exploración y navegación urbana”. que pudiera reconocer e interpretar consultas habladas básicas. [3] VOYAGER fue uno de los primeros sistemas de investigación que combinó el reconocimiento de voz y el procesamiento del lenguaje natural para mantener una conversación con un usuario. [4]

En 1994, Phillips cofundó y se convirtió en CTO de SpeechWorks , con sede en Boston , [5] que se convirtió en uno de los principales proveedores de tecnología de reconocimiento de voz con sede en Estados Unidos en ese momento, junto con Nuance Communications e IBM . [6] La startup desarrolló sistemas interactivos de respuesta de voz , incluidas interfaces de centros de llamadas para clientes como Amtrak [7] y FedEx . [8] La tecnología de SpeechWorks funcionó para interfaces de centros de llamadas porque el cliente podía responder verbalmente las preguntas planteadas por el programa de reconocimiento de voz con sonido humano, en lugar de navegar a través de un menú. La tecnología también tenía capacidades de "intrusión" que ahorraban tiempo, lo que significa que un cliente podía interrumpir el sistema antes de que terminara de ofrecer la lista completa de opciones. El sistema también podría "aprender". Mantenía un registro de los nombres o frases que los clientes habían usado en el pasado para poder aprender a comprender nombres y frases que diferían ligeramente de su vocabulario original. [9]

El valor de SpeechWorks se triplicó con creces después de su oferta pública inicial , [8] y fue adquirido por ScanSoft en 2003. [2] Mientras Phillips era CTO en ScanSoft, trabajó en tecnologías en todos los productos de la empresa, incluido el software de dictado líder Dragon NaturallySpeaking. . [10] ScanSoft adquirió Nuance Communications en 2005 y adoptó el nombre de esta última. [5]

Phillips regresó al MIT como científico visitante y cofundó Vlingo en 2006, con el ex colega de SpeechWorks John Nguyen. [5] Vlingo, un asistente de software inteligente , es una aplicación de conversión de voz a texto integrada con aplicaciones orientadas al usuario para iPhone , Android , BlackBerry y otros teléfonos inteligentes. [11] El software Vlingo permitió a los usuarios enviar mensajes de texto y navegar por teléfonos inteligentes mediante reconocimiento de voz . [11] El primer software de reconocimiento de voz para teléfonos móviles que interpretó con éxito la entrada del usuario y aprendió con el tiempo, [12] el software se adaptaría más tarde al popular software de asistente personal Siri . [13]

En 2008, Nuance Communications [14] intentó demandar a Vlingo por infracción de patente . A Phillips se le ofreció la opción de vender Vlingo a Nuance o ser demandado. Después de seis largas demandas, Phillips ganó, pero los 3 millones de dólares en honorarios legales agotaron los fondos de investigación y desarrollo de su empresa. [15] Vlingo se vendió a Nuance en diciembre de 2011. [16]