Common Voice es un proyecto de crowdsourcing iniciado por Mozilla para crear una base de datos gratuita para software de reconocimiento de voz . El proyecto cuenta con el apoyo de voluntarios que graban oraciones de muestra con un micrófono y revisan las grabaciones de otros usuarios. Las frases transcritas se recopilarán en una base de datos de voz disponible bajo la licencia de dominio público CC0 . Esta licencia garantiza que los desarrolladores puedan usar la base de datos para aplicaciones de voz a texto sin restricciones ni costos.
Desarrollador (es) | Fundación Mozilla |
---|---|
Versión inicial | 19 de junio de 2017 |
Repositorio | https://github.com/mozilla/voice-web |
Disponible en | Multilingüe ( lista de idiomas ) |
Licencia | Creative Commons CC0 |
Sitio web | commonvoice.mozilla.org |
Objetivos
Common Voice tiene como objetivo proporcionar diversas muestras de voz. Según Katharina Borchert de Mozilla , muchos proyectos existentes tomaron conjuntos de datos de la radio pública o tenían conjuntos de datos que estaban subrepresentados tanto a mujeres como a personas con acento pronunciado. [1]
Base de datos de voz
La base de datos de English Common Voice es la segunda base de datos de voz de libre acceso más grande después de LibriSpeech . Cuando se publicaron los primeros datos el 29 de noviembre de 2017, más de 20.000 usuarios en todo el mundo habían registrado 400.000 frases validadas, con una duración total de 500 horas. [2]
En febrero de 2019, se lanzó el primer lote de idiomas para su uso. Esto incluyó 18 idiomas: inglés , francés , alemán y chino mandarín , pero también idiomas menos frecuentes como galés y cabila . En total, esto incluyó casi 1.400 horas de datos de voz grabados de más de 42.000 colaboradores. [3]
Hasta julio de 2020, la base de datos ha acumulado 7.226 horas de grabaciones de voz en 54 idiomas, 5.591 horas de las cuales han sido verificadas por voluntarios. [4]
Mayo de 2021, luego del trabajo para agregar Kinyarwanda , recibieron una subvención para agregar Kiswahili [5]
Ver también
Referencias
- ^ "¿Por qué generamos IA? Las empresas de tecnología de voz se mueven para ser más inclusivas" . The Guardian . 11 de enero de 2020 . Consultado el 19 de abril de 2020 .
- ^ "Anuncio del lanzamiento inicial del modelo de reconocimiento de voz de código abierto de Mozilla y el conjunto de datos de voz" . blog mozilla.org . 29 de noviembre de 2017.
- ^ "Mozilla actualiza el conjunto de datos de Common Voice con 1.400 horas de conversación en 18 idiomas" . VentureBeat . 28 de febrero de 2019.
- ^ "Las actualizaciones de Mozilla Common Voice ayudarán a entrenar la palabra de activación 'Hey Firefox' para la navegación web basada en voz" . VentureBeat . 1 de julio de 2020. Archivado desde el original el 10 de marzo de 2021 . Consultado el 1 de abril de 2021 .
- ^ "Mozilla Common Voice recibe una inversión de $ 3,4 millones para democratizar y diversificar la tecnología de voz en África Oriental" . Fundación Mozilla . 2021-05-25 . Consultado el 3 de junio de 2021 .