De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Google Text-to-Speech es una aplicación de lectura de pantalla desarrollada por Google para el sistema operativo Android . Permite que las aplicaciones lean en voz alta (digan) el texto en la pantalla con soporte para muchos idiomas. Aplicaciones como Google Play Books pueden usar Text-to-Speech para leer libros en voz alta, Google Translate para leer traducciones en voz alta que brindan información útil sobre la pronunciación de palabras, Google Talkback y otras aplicaciones basadas en accesibilidad de retroalimentación hablada, también como por aplicaciones de terceros. Los usuarios deben instalar datos de voz para cada idioma.

Idiomas admitidos [ editar ]

Aplicación de Google Text-to-Speech para Android [ editar ]

  • Abaza (Abazin)
  • Abjasio (abjasio)
  • Afar (Djibouti)
  • Afrikáans (Sudáfrica)
  • Albanés (Albania)
  • Amárico (Etiopía)
  • Angika (India)
  • Arábica
  • Aragonés (Aragón)
  • Armenio (Armenia)
  • Asamés (India)
  • Adwahi (India)
  • Azerbaiyán (Azerbaiyán)
  • Vasco (España)
  • Bajjika (India)
  • Bielorruso (Bielorrusia)
  • Bengalí (Bangladesh)
  • Bengalí (India)
  • Bhojpuri (India)
  • Bodo (India)
  • Bosnio (Bosnia)
  • Breton (Bretaña)
  • Búlgaro (Bulgaria)
  • Cantonés (Hong Kong)
  • Catalán (Cataluña)
  • Cebuano (Filipinas)
  • Cherokee (Estados Unidos)
  • Chhattisgarhi (India)
  • Chichewa (Malaui)
  • Chino (China)
  • Chino (Taiwán)
  • Chitonga (Zambia)
  • Chittagonian (Bengladesh)
  • Cornualles (Cornwalk)
  • Córcega (Córcega)
  • Croata (croacia)
  • Checa (República Checa)
  • Danés (Dinamarca)
  • Dogri (India)
  • Holandés (Holanda)
  • Holandés (Bélgica)
  • Inglés (Australia)
  • Inglés (Canadá)
  • Inglés (India)
  • Inglés (Irlanda)
  • Inglés (Libia)
  • Inglés (Nigeria)
  • Inglés (Singapur)
  • Inglés (Sudáfrica)
  • Inglés reino unido)
  • Inglés Estados Unidos)
  • Inglés (Zimbabwe)
  • Esperanto (Verda Stelo)
  • Estonio (Estonia)
  • Filipino (Filipinas)
  • Finlandés (Finlandia)
  • Francés (Bélgica)
  • Francés (Canadá)
  • Francés Francia)
  • Frisón (Frisia)
  • Gallego (Galicia)
  • Garhwali (India)
  • Georgiano (Georgia)
  • Alemán Alemania)
  • Alemán (Bélgica)
  • Alemán (Austria)
  • Griego (Grecia)
  • Guaraní (Paraguay)
  • Guaraní (Bolivia)
  • Gujarati (India)
  • Gurung (India)
  • Haida (Haida)
  • Criollo haitiano (Haití)
  • Haryanvi (India)
  • Hausa (Nigeria)
  • Hawaiano (Hawái)
  • Hebreo (Israel)
  • Hindi (India)
  • Ho (India)
  • Hmong (China)
  • Hmong (Tailandia)
  • Hmong (Vietnam)
  • Húngaro (Hungría)
  • Islandés (islandia)
  • Igbo (Nigeria)
  • Indonesio (Indonesia)
  • Irlandés (Irlanda)
  • Italiano (Italia)
  • Japonés (Japón)
  • Jarawa (India)
  • Javanés (Indonesia)
  • Canarés (India)
  • Cachemira (India)
  • Kazajstán (Kazajstán)
  • Khmer (Camboya)
  • Kinyarwanda (Ruanda)
  • Konkani (India)
  • Coreano (Corea del Norte)
  • Coreano (Corea del Sur)
  • Kumaoni (India)
  • Kurdo (Kurdistán)
  • Kurukh (India)
  • Kwadi (Angola)
  • Kirguistán (Kirguistán)
  • Ladakhi (India)
  • Lakha (Bután)
  • Ladino (Israel)
  • Lao (Laos)
  • Latina (Italia)
  • Letón (Letonia)
  • Laz (Georgia)
  • Lepcha (India)
  • Limbu (Nepal)
  • Limburgués (Bélgica)
  • Lituano (Lituania)
  • Luganda (Uganda)
  • Luxemburgués (Luxemburgo)
  • Macedonio (Macedonia)
  • Madurese (Indonesia)
  • Magahi (India)
  • Magar (India)
  • Maithili (India)
  • Malgache (Madagascar)
  • Malayo (Malasia)
  • Malayalam (India)
  • Maltés (Malta)
  • Manipuri (India)
  • Maorí (Nueva Zelanda)
  • Manx (Isla de Man)
  • Marathi (India)
  • Mongol (mongolia)
  • Nepalí (Nepal)
  • Noruego Bomkål (Noruega)
  • Nimbadi (India)
  • Odia (India)
  • Oromo (Etiopía)
  • Pahari (India)
  • Purgi (India)
  • Pashto (Afganistán)
  • Persa (Irán)
  • Polaco (Polonia)
  • Portugués (Brasil)
  • Portugués (Portugal)
  • Punjabi (India)
  • Quechua (Bolivia)
  • Rajasthani (India)
  • Rumano (Rumanía)
  • Romanche (Italia)
  • Ruso (Rusia)
  • Sadri (India)
  • Samoa (Samoa)
  • Sánscrito (India)
  • Santali (India)
  • Gaélico escocés (Escocia)
  • Serbio (Serbia)
  • Sesotho (Lesotho)
  • Sherpa (India)
  • Shona (Zimbabue)
  • Sindhi (Pakistán)
  • Sinhala (Sri Lanka)
  • Eslovaco (Eslovaquia)
  • Esloveno (Eslovenia)
  • Somalí (Somalia)
  • Español (España)
  • Español (México)
  • Español (Colombia)
  • Español (Estados Unidos)
  • Sundanés (Indonesia)
  • Sueco (suecia)
  • Tayikistán (Tayikistán)
  • Tamil (India)
  • Tártaro (Tartaristán)
  • Telugu (India)
  • Tailandés (Tailandia)
  • Turco (Turquía)
  • Tulu (India)
  • Turkmenistán (Turkmenistán)
  • Ucraniano (Ucrania)
  • Urdu (Pakistán)
  • Uigur (este de Turkestán)
  • Uzbeko (Uzbekistán)
  • Vietnamita (Vietnam)
  • Galés (Gales)
  • Wolof (senegal)
  • Xhosa (Sudáfrica)
  • Yiddish (Israel)
  • Yoruba (Nigeria)
  • Zulu (Sudáfrica)

Google Cloud Text-to-Speech [1] [ editar ]

  • Afrikáans (Sudáfrica)
  • Bengalí (India)
  • Birmano (Myanmar)
  • Cantonés (Hong Kong)
  • Checa (República Checa)
  • Danés (Dinamarca)
  • Holandés (Holanda)
  • Inglés (Australia)
  • Inglés (India)
  • Inglés reino unido)
  • Inglés Estados Unidos)
  • Filipino (Filipinas)
  • Finlandés (Finlandia)
  • Francés (Canadá)
  • Francés Francia)
  • Alemán Alemania)
  • Griego (Grecia)
  • Gujarati (India)
  • Hebreo (Israel)
  • Hindi (India)
  • Húngaro (Hungría)
  • Indonesio (Indonesia)
  • Italiano (Italia)
  • Japonés (Japón)
  • Canarés (India)
  • Coreano (Corea del Sur)
  • Letón (Letonia)
  • Luxemburgués (Luxemburgo)
  • Malayalam (India)
  • Chino mandarín (China)
  • Noruego (noruega)
  • Polaco (Polonia)
  • Portugués (Brasil)
  • Portugués (Portugal)
  • Punjabi (India)
  • Ruso (Rusia)
  • Eslovaco (Eslovaquia)
  • Español (España)
  • Sueco (suecia)
  • Tamil (India)
  • Telugu (India)
  • Tailandés (Tailandia)
  • Turco (Turquía)
  • Ucraniano (Ucrania)
  • Urdu (Pakistán)
  • Uigur (Turkestán Oriental)
  • Vietnamita (Vietnam)

Evolución [ editar ]

Algunos desarrolladores de aplicaciones han comenzado a adaptar y ajustar sus aplicaciones de Android Auto para incluir Text-to-Speech, como Hyundai en 2015. [2] Aplicaciones como textPlus y WhatsApp usan Text-to-Speech para leer notificaciones en voz alta y proporcionar respuesta de voz. funcionalidad.

Google Cloud Text-to-Speech funciona con WaveNet , software creado por DeepMind, filial de inteligencia artificial de Google con sede en el Reino Unido . Desde que Google compró DeepMind en 2014, ha estado explorando formas de convertir el talento de IA de la compañía en productos tangibles. La integración de WaveNet en su servicio en la nube es importante, ya que Google intenta ganar el negocio de la nube lejos de Amazon y Microsoft, presentando sus habilidades de inteligencia artificial como su factor diferenciador.

La tecnología de síntesis de voz AI de DeepMind es notablemente avanzada y realista. La mayoría de los sintetizadores de voz (incluido Siri de Apple) utilizan síntesis concatenativa, en el que un programa almacena sílabas individuales (sonidos como "ba", "sht" y "oo") y los une para formar palabras y oraciones. WaveNet, en cambio, utiliza el aprendizaje automático para generar voz. Luego, crea formas de onda de una base de datos de habla humana y las vuelve a crear a una velocidad de 24.000 muestras por segundo. El resultado final incluye voces con sutilezas como chasquidos de labios y acentos. Cuando Google presentó WaveNet por primera vez en 2016, era demasiado computacionalmente intensivo para trabajar fuera de los entornos de investigación, pero desde entonces se ha reducido significativamente, lo que muestra una clara línea de desarrollo desde la investigación hasta el producto. Google Cloud Text-to-Speech convierte texto en voz similar a la de un humano en más de 180 voces en más de 30 idiomas y variantes. Aplica una investigación innovadora en síntesis de voz (WaveNet) y Google 's potentes redes neuronales para ofrecer audio de alta fidelidad. Incluye acceso exclusivo a la tecnología WaveNet. DeepMind ha realizado una investigación innovadora en modelos de aprendizaje automático para generar un habla que imita las voces humanas y los sonidos más naturales, reduciendo la brecha con el desempeño humano en un 70%. Cloud Text-to-Speech ofrece acceso exclusivo a más de 90 voces WaveNet y continuará agregando más con el tiempo.

Historial de versiones [ editar ]

Noviembre de 2013 [ editar ]

  • Se agregó soporte para coreano. [3]

Marzo de 2014 [ editar ]

  • Se eliminó el soporte para árabe.
  • Se agregó soporte para voces naturales de alta calidad. Las voces de alta calidad ahora se presentaban en inglés (Estados Unidos) como femenino (alta calidad), mientras que en inglés (Reino Unido) ahora también se presentaban tres nuevas voces de alta calidad; Masculino, Femenino (de alta calidad) y Masculino (de alta calidad). Estas nuevas voces de alta calidad son mucho más grandes que las versiones anteriores en términos de tamaño de archivo con 244 MB para la voz femenina en inglés de EE. UU. (Alta calidad) en comparación con solo 6,8 MB para la versión de voz femenina normal. Estas voces de alta calidad se agregaron para garantizar una pronunciación y una enunciación de mayor calidad con entonaciones más naturales.
  • El soporte para brasileño, portugués y español (Estados Unidos) elevó el número total de idiomas admitidos a nueve en este momento. (Alemán, inglés (Reino Unido), inglés (EE. UU.), Español (ES), español (EE. UU.), Francés, italiano, coreano y portugués (BR). Solo el inglés (EE. UU.) Y el inglés (Reino Unido) tenían voz de alta calidad paquetes por ahora.) Alemán, inglés del Reino Unido, inglés de EE. UU., español de ES, español de EE. UU., francés, italiano, coreano y portugués (BR). Solo el inglés de EE. UU. Y el inglés del Reino Unido tenían paquetes de voz de alta calidad por ahora. [4]
  • Ajustes de la interfaz de usuario: debido a que hay varias voces para algunos idiomas, se agregó un interruptor a las voces con 2 o más paquetes de voz.

Mayo de 2014 [ editar ]

  • Se agregó soporte para ruso, holandés, polaco e inglés (India). [5]

Septiembre de 2014 [ editar ]

  • Soporte agregado para japonés. [6]

Diciembre de 2014 [ editar ]

  • Se agregó soporte para hindi e indonesio.
  • Calidad de salida mejorada. Las voces de calidad estándar ahora superan la calidad de las voces de alta calidad de versiones anteriores. [7]

Julio de 2015 [ editar ]

  • Se agregó soporte para cantonés (Hong Kong), mandarín (China), tailandés (Tailandia) y turco (Turquía).
  • Corrección de errores y otras mejoras.

Febrero de 2016 [ editar ]

  • Calidad de voz mejorada.
  • Se agregó soporte para bengalí (Bangladesh), danés (Dinamarca), inglés (Australia), finlandés (Finlandia), húngaro (Hungría), noruego (Noruega) y mandarín (Taiwán) y sueco.
  • Las voces sin conexión ahora pueden hablar a un ritmo más rápido.
  • Muchas correcciones de errores y mejoras de rendimiento.

Junio ​​de 2016 [ editar ]

  • Se agregó soporte para sueco y vietnamita.
  • Mejoras y correcciones de errores.

Octubre de 2016 [ editar ]

  • Variaciones de voz alternativas ahora disponibles en todos los dispositivos.
  • Se agregó soporte para amplificar el volumen del habla sobre otro audio.
  • Soporte ampliado para la verbalización de emoji en chino, holandés, danés, inglés, francés, alemán, italiano, japonés, coreano, polaco, portugués, ruso y español.
  • Mejoras y correcciones de errores.

Abril de 2017 [ editar ]

  • Se agregó soporte para bengalí (India), checo, jemer, nepalí, cingalés y ucraniano.
  • El procesamiento de números ahora se puede desactivar en la configuración.
  • El control de entonación ahora está disponible para más voces.
  • Varias otras mejoras a varias voces.

Octubre de 2017 [ editar ]

  • Se agregó soporte para filipino y griego.

Enero de 2018 [ editar ]

  • Se agregó soporte para estonio, rumano y eslovaco.
  • Varias otras mejoras a nuestras voces.

Julio de 2018 [ editar ]

  • Se agregó soporte para francés (Canadá), javanés y sundanés.
  • Más voces para elegir: inglés (australiano), inglés (Reino Unido) y francés (Francia).
  • Todas las voces de un idioma ahora se descargan juntas, lo que ahorra espacio de almacenamiento en un dispositivo.
  • Mejoras de rendimiento para dispositivos de 64 bits.
  • Varias otras mejoras a las voces.

Agosto de 2019 [ editar ]

  • Se agregó soporte para inglés (Nigeria), gujarati, kannada, malayalam, marathi, portugués (Portugal), tamil, telugu y urdu.
  • Nuevo icono de aplicación.

Julio de 2020 [ editar ]

  • Soporte readded para árabe.

Julio de 2021 [ editar ]

  • Se agregó soporte para inglés (Zimbabwe), kazajo, kurdo, kirguís, lao, lituano, luxemburgués, mongol, pashto, punjabi, samoano, gaélico escocés, shona, sindhi, tayiko y uzbeko.

Ver también [ editar ]

  • Síntesis de voz
  • Narración

Referencias [ editar ]

  1. ^ Voces e idiomas compatibles | Documentación de texto a voz en la nube
  2. ^ "Google, Hyundai muestra nuevas aplicaciones de Android Auto de terceros" . CNET . CBS Interactive . Consultado el 17 de enero de 2015 .
  3. ^ "El motor de texto a voz de Google llega a Google Play" . Autoridad de Android . Consultado el 23 de noviembre de 2014 .
  4. ^ Bogdan Petrovan (6 de marzo de 2014). "Google actualiza el motor Text-to-Speech con voces nuevas y de alta calidad" . Autoridad de Android .
  5. ^ "Google Text-to-Speech actualizado con nuevos idiomas, incluidos holandés, polaco y ruso" . Android y yo . Archivado desde el original el 3 de junio de 2014 . Consultado el 23 de noviembre de 2014 .
  6. ^ "El motor de texto a voz de Google ahora es compatible con la salida en japonés" . Policía de Android . Consultado el 23 de noviembre de 2014 .
  7. ^ "Google dice que Text-to-Speech ya no necesita voces de alta calidad en la última actualización" . Android Central . Archivado desde el original el 31 de diciembre de 2014 . Consultado el 16 de diciembre de 2014 .