Sinsy ( Sin ging Voice Sy nthesis System) (し ぃ ん し ぃ) es un sistema de síntesis de voz de canto basado en el modelo Hidden Markov (HMM) en línea del Instituto de Tecnología de Nagoya que fue creado bajo la licencia BSD Modificada . [1]
Desarrollador (es) | Instituto de Tecnología de Nagoya |
---|---|
Lanzamiento estable | 0,92 / 25 de diciembre de 2015 |
Versión de vista previa | 3.9 / 25/12/2017 |
Sistema operativo | Linux |
Disponible en | Japonés, inglés, chino |
Tipo | Aplicación de sintetizador vocal |
Licencia | Licencia BSD modificada |
Sitio web | www |
Descripción general
El demostrador en línea es de uso gratuito, pero solo generará pistas de hasta 5 minutos. El usuario carga datos en formato MusicXML , que el sitio web de Sinsy lee para generar un archivo WAV de la voz generada. El factor de género, la intensidad del vibrato y el cambio de tono se pueden ajustar antes de la salida. [2]
Al 25 de diciembre de 2015, los creadores oficiales de Sinsy eran Keiichi Tokuda (Productor y diseñador), Keiichiro Oura (Diseño y desarrollo), [3] Kazuhiro Nakamura (Desarrollo y encargado principal) y Yoshihiko Nankaku. [4]
Originalmente estaba solo en japonés e inglés, pero luego se agregó mandarín, el sitio web solo admite idiomas para inglés y japonés a pesar de esto actualmente. [5] [6]
En 2016, Sinsy declaró utilizar el procesamiento de " aprendizaje profundo " conocido como "DNN". [7]
Productos
- Yoko (謡 子), voz femenina japonesa, tiene dos voces para el servicio en este momento, ambas en japonés, una es una versión beta y la otra una versión completamente lanzada.
- Xiang-Ling (香 鈴), voz femenina japonesa, se agregó una voz en inglés en la Navidad de 2015. También se agregó el mandarín a sus capacidades lingüísticas.
- Matsuo-P (松尾 P), voz masculina inglesa.
- Namine Ritsu S (波音 リ ツ S), una voz masculina japonesa actualmente en beta. Producido originalmente para UTAU , se lanzó el 25 de diciembre de 2013.
- No identificado; una voz desconocida en japonés
- No identificado; una segunda voz desconocida en japonés
Referencias
- ↑ Ju-Yun Cheng, Yi-Chin Huang, Chung-Hsien Wu (4 de diciembre de 2014). "Síntesis de voz cantada en mandarín basada en HMM utilizando unidades de síntesis personalizadas y conjuntos de preguntas" (PDF) . Asociación de Lingüística Computacional y Procesamiento del Idioma Chino . Consultado el 17 de mayo de 2017 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Hentai (27 de diciembre de 2012). "Actualizaciones de Sinsy a 3.3 y versiones de demostración en inglés" . Engloids.Info . Consultado el 4 de junio de 2015 .
- ^ "Keiichiro Oura" . Instituto de Tecnología de Nagoya . Consultado el 17 de mayo de 2017 .
- ^ "El sistema de síntesis de voz cantada basado en HMM" Sinsy "versión 0.92" . Sinsy.sourceforge.net . Consultado el 28 de enero de 2016 .
- ^ ITmedia ニ ュ ー ス- 初 音 ミ ク と も 簡 単 に 対 話 で き る 「MMDAgent」 、 そ の 詳細 を 聞 い て き た. Consultado el 23 de noviembre de 2013.
- ^ Nakamura, K .; Oura, K .; Nankaku, Y .; Tokuda, K. (mayo de 2014). "Síntesis de voz cantada basada en HMM y su aplicación al japonés e inglés". 2014 IEEE International Conference on Acustics, Speech and Signal Processing (ICASSP) : 265–269. doi : 10.1109 / ICASSP.2014.6853599 .
- ^ https://www.itmedia.co.jp/news/articles/1910/02/news087_2.html