Vocaloid

Vocaloid (ボーカロイド, Bōkaroido ) es un producto de software de sintetizador de voz para cantar . Su parte de procesamiento de señales se desarrolló a través de un proyecto de investigación conjunto liderado por Kenmochi Hideki en la Universidad Pompeu Fabra en Barcelona , España , en 2000 y originalmente no tenía la intención de ser un proyecto comercial completo. ^[1] Con el respaldo de Yamaha Corporation , desarrolló el software en el producto comercial "Vocaloid" que se lanzó en 2004. ^[2]^[3]

El software permite a los usuarios sintetizar el "canto" escribiendo la letra y la melodía y también el "discurso" escribiendo el guión de las palabras requeridas. Utiliza tecnología de síntesis con voces grabadas especialmente de actores de voz o cantantes. Para crear una canción, el usuario debe ingresar la melodía y la letra. Se utiliza una interfaz tipo piano roll para ingresar la melodía y la letra se puede ingresar en cada nota. El software puede cambiar el acento de las pronunciaciones, agregar efectos como vibrato o cambiar la dinámica y el tono de la voz.

Se han lanzado varios bancos de voz para su uso con la tecnología de sintetizador Vocaloid. ^[4] Cada uno se vende como "un cantante en una caja" diseñado para actuar como un reemplazo de un cantante real. ^[1] Como tales, se publican bajo un antropomorfismo moe . Estos avatares también se conocen como Vocaloids y, a menudo, se comercializan como ídolos virtuales ; algunos se han presentado en conciertos en vivo como una proyección en el escenario. ^[5]

Originalmente, el software solo estaba disponible en inglés a partir de los primeros Vocaloids Leon, Lola y Miriam de Zero-G , y en japonés con Meiko y Kaito fabricados por Yamaha y vendidos por Crypton Future Media . Vocaloid 3 ha agregado soporte para español para los Vocaloids Bruno, Clara y Maika; Chino para Luo Tianyi , Xin Hua y Yanhe ; y coreano para SeeU .

El software está destinado tanto a músicos profesionales como a usuarios ocasionales de música por ordenador. ^[6] Grupos musicales japoneses como Livetune de Toy's Factory y Supercell de Sony Music Entertainment Japan han lanzado sus canciones con Vocaloid como voz. El sello discográfico japonés Exit Tunes of Quake Inc. también ha lanzado álbumes recopilatorios con Vocaloids. ^[7]^[8] Artistas como Mike Oldfield también han utilizado Vocaloids en su trabajo para respaldar las voces de los cantantes y las muestras de sonido. ^[9]^[10]

La tecnología de síntesis vocal [ ja ] de Vocaloid se clasifica generalmente en la síntesis concatenativa ^[12]^[13] en el dominio de la frecuencia , que empalma y procesa los fragmentos vocales extraídos de las voces cantadas humanas, en las formas de representación de frecuencia de tiempo . El sistema Vocaloid puede producir voces realistas agregando expresiones vocales como el vibrato en la información de la partitura. ^[14] Inicialmente, la tecnología de síntesis de Vocaloid se llamaba "Empalme y modelado de la articulación del canto en el dominio de la frecuencia" (周波数ドメイン歌唱アーティキュレーション接続法,Shūhasū-domain Kashō Articulation Setsuzoku-hō ) en el lanzamiento de Vocaloid en 2004,^[15] aunque este nombre ya no se usa desde el lanzamiento de Vocaloid 2 en 2007.^[16] " Singing Articulation " se explica como "expresiones vocales" como vibrato y fragmentos vocales necesarios para cantar. Los motores de síntesis Vocaloid y Vocaloid 2 están diseñados para cantar, no para leer texto en voz alta,^[17] aunque se ha desarrollado software como Vocaloid-flex y Voiceroid para eso. No pueden reproducir de forma natural expresiones de canto como voces roncas o gritos.^[18]

El modelo de voz detrás del modelo Vocaloid, Excitation plus Resonances (EpR), ^[11] es una combinación de:

Síntesis de modelado espectral (SMS)
Modelo de filtro de fuente

(basado en la Figura 1 de Bonada et al. 2001 )

Diagrama del sistema Vocaloid
(basado en la Fig.1 en Kenmochi, Ohshima & Interspeech 2007 )

Ejemplo de canción: " Sakura Sakura "

Motor de síntesis de Vocaloid ^[21]

Interpolación de envolvente espectral entre muestras

Procesamiento de picos espectrales (SPP) para la manipulación del timbre (basado en la Figura 3 en Bonada y Loscos 2003 )

Captura de pantalla de la interfaz del software para Vocaloid

"Freely Tomorrow" de Mitchie M
Una canción con la voz proporcionada por el personaje de Vocaloid Hatsune Miku.

HRP-4C disfrazado de Gumi , una mascota de Megpoid , en CEATEC JAPAN 2009

Hatsune Miku es en parte responsable del éxito de Vocaloid.

Vocaloid Miriam Stockley

Thingymajigtus