Mike Phillips (reconocimiento de voz)


Michael Phillips (nacido el 1 de agosto de 1961) es el director ejecutivo y cofundador de Sense Labs y pionero en el aprendizaje automático , incluido el reconocimiento de voz móvil y la tecnología de conversión de texto a voz.

Phillips era estudiante de ingeniería eléctrica en la Universidad Carnegie Mellon . [1] También fue investigador de Carnegie Mellon y luego científico investigador en el grupo Spoken Language Systems del Instituto de Tecnología de Massachusetts (MIT) , [2] donde ayudó a desarrollar VOYAGER, un "sistema de exploración y navegación urbana" que pudiera reconocer e interpretar consultas habladas básicas. [3] VOYAGER fue uno de los primeros sistemas de investigación en combinar el reconocimiento de voz y el procesamiento del lenguaje natural para tener una conversación con un usuario. [4]

En 1994, Phillips cofundó y se convirtió en director de tecnología de SpeechWorks , [5] con sede en Boston , [5] que se convirtió en uno de los principales proveedores estadounidenses de tecnología de reconocimiento de voz en ese momento, junto con Nuance Communications e IBM . [6] La puesta en marcha desarrolló sistemas de respuesta de voz interactivos , incluidas interfaces de centro de llamadas para clientes como Amtrak [7] y FedEx . [8]La tecnología de SpeechWorks funcionó para las interfaces de los centros de llamadas porque el cliente podía responder verbalmente a las preguntas planteadas por el programa de reconocimiento de voz con sonido humano, en lugar de navegar a través de un menú. La tecnología también tenía capacidades de "intrusión" que ahorraban tiempo, lo que significa que un cliente podía interrumpir el sistema antes de que terminara de ofrecer la lista completa de opciones. El sistema también podría "aprender". Mantuvo un registro de los nombres o frases que los clientes habían usado en el pasado para poder aprender a entender nombres y frases que diferían levemente de su vocabulario original. [9]

El valor de SpeechWorks se triplicó con creces después de su oferta pública inicial , [8] y fue adquirido por ScanSoft en 2003. [2] Mientras Phillips era CTO en ScanSoft, trabajó en tecnologías en todos los productos de la compañía, incluido el software líder de dictado Dragon NaturallySpeaking. . [10] ScanSoft adquirió Nuance Communications en 2005 y adoptó el nombre de este último. [5]

Phillips regresó al MIT como científico visitante y cofundó Vlingo en 2006, con el ex colega de SpeechWorks John Nguyen. [5] Un asistente de software inteligente , Vlingo es una aplicación de voz a texto integrada con aplicaciones de cara al usuario para iPhone , Android , BlackBerry y otros teléfonos inteligentes. [11] El software Vlingo permitía a los usuarios enviar mensajes de texto y navegar en teléfonos inteligentes a través del reconocimiento de voz . [11] El primer software de reconocimiento de voz de un teléfono celular que interpretó con éxito la entrada del usuario y aprendió con el tiempo, [12] el software se adaptaría más tarde al popular software de asistente personalSiri . [13]

En 2008, Nuance Communications [14] intentó demandar a Vlingo por infracción de patente . A Phillips se le ofreció la opción de vender Vlingo a Nuance o ser demandado. Después de seis largas demandas, Phillips ganó, pero los $ 3 millones en honorarios legales agotaron los fondos de investigación y desarrollo de su empresa. [15] Vlingo se vendió a Nuance en diciembre de 2011. [16]