Vocaloid


Vocaloid (ボ ー カ ロ イ ド, Bōkaroido ) es un producto de software de sintetizador de voz para cantar . Su parte de procesamiento de señales se desarrolló a través de un proyecto de investigación conjunto liderado por Kenmochi Hideki en la Universidad Pompeu Fabra en Barcelona , España , en 2000 y originalmente no tenía la intención de ser un proyecto comercial completo. [1] Con el respaldo de Yamaha Corporation , desarrolló el software en el producto comercial "Vocaloid" que se lanzó en 2004. [2] [3]

El software permite a los usuarios sintetizar el "canto" escribiendo la letra y la melodía y también el "discurso" escribiendo el guión de las palabras requeridas. Utiliza tecnología de síntesis con voces grabadas especialmente de actores de voz o cantantes. Para crear una canción, el usuario debe ingresar la melodía y la letra. Se utiliza una interfaz tipo piano roll para ingresar la melodía y la letra se puede ingresar en cada nota. El software puede cambiar el acento de las pronunciaciones, agregar efectos como vibrato o cambiar la dinámica y el tono de la voz.

Se han lanzado varios bancos de voz para su uso con la tecnología de sintetizador Vocaloid. [4] Cada uno se vende como "un cantante en una caja" diseñado para actuar como un reemplazo de un cantante real. [1] Como tales, se publican bajo un antropomorfismo moe . Estos avatares también se conocen como Vocaloids y, a menudo, se comercializan como ídolos virtuales ; algunos se han presentado en conciertos en vivo como una proyección en el escenario. [5]

Originalmente, el software solo estaba disponible en inglés a partir de los primeros Vocaloids Leon, Lola y Miriam de Zero-G , y en japonés con Meiko y Kaito fabricados por Yamaha y vendidos por Crypton Future Media . Vocaloid 3 ha agregado soporte para español para los Vocaloids Bruno, Clara y Maika; Chino para Luo Tianyi , Xin Hua y Yanhe ; y coreano para SeeU .

El software está destinado tanto a músicos profesionales como a usuarios ocasionales de música por ordenador. [6] Grupos musicales japoneses como Livetune de Toy's Factory y Supercell de Sony Music Entertainment Japan han lanzado sus canciones con Vocaloid como voz. El sello discográfico japonés Exit Tunes of Quake Inc. también ha lanzado álbumes recopilatorios con Vocaloids. [7] [8] Artistas como Mike Oldfield también han utilizado Vocaloids en su trabajo para respaldar las voces de los cantantes y las muestras de sonido. [9] [10]

La tecnología de síntesis vocal  [ ja ] de Vocaloid se clasifica generalmente en la síntesis concatenativa [12] [13] en el dominio de la frecuencia , que empalma y procesa los fragmentos vocales extraídos de las voces cantadas humanas, en las formas de representación de frecuencia de tiempo . El sistema Vocaloid puede producir voces realistas agregando expresiones vocales como el vibrato en la información de la partitura. [14] Inicialmente, la tecnología de síntesis de Vocaloid se llamaba "Empalme y modelado de la articulación del canto en el dominio de la frecuencia" (周波 数 ド メ イ ン 歌唱 ア ー テ ィ キ ュ レ ー シ ョ ン 接 続 法,Shūhasū-domain Kashō Articulation Setsuzoku-hō ) en el lanzamiento de Vocaloid en 2004, [15] aunque este nombre ya no se usa desde el lanzamiento de Vocaloid 2 en 2007. [16] " Singing Articulation " se explica como "expresiones vocales" como vibrato y fragmentos vocales necesarios para cantar. Los motores de síntesis Vocaloid y Vocaloid 2 están diseñados para cantar, no para leer texto en voz alta, [17] aunque se ha desarrollado software como Vocaloid-flex y Voiceroid para eso. No pueden reproducir de forma natural expresiones de canto como voces roncas o gritos. [18]


El modelo de voz detrás del modelo Vocaloid, Excitation plus Resonances (EpR), [11] es una combinación de:
  • Síntesis de modelado espectral (SMS)
  • Modelo de filtro de fuente
(basado en la Figura 1 de Bonada et al. 2001 )
Diagrama del sistema Vocaloid
(basado en la Fig.1 en Kenmochi, Ohshima & Interspeech 2007 )
Ejemplo de canción: " Sakura Sakura "
Motor de síntesis de Vocaloid [21]
Interpolación de envolvente espectral entre muestras
Procesamiento de picos espectrales (SPP) para la manipulación del timbre (basado en la Figura 3 en Bonada y Loscos 2003 )
Captura de pantalla de la interfaz del software para Vocaloid
"Freely Tomorrow" de Mitchie M
Una canción con la voz proporcionada por el personaje de Vocaloid Hatsune Miku.
HRP-4C disfrazado de Gumi , una mascota de Megpoid , en CEATEC JAPAN 2009
Hatsune Miku es en parte responsable del éxito de Vocaloid.
Vocaloid Miriam Stockley
Thingymajigtus