La búsqueda por sonido es la recuperación de información basada en la entrada de audio. Hay un puñado de aplicaciones, específicamente para dispositivos móviles que utilizan la búsqueda por sonido. Shazam (servicio) , Soundhound (anteriormente Midomi), Axwave , ACRCloud y otros han tenido un éxito considerable al utilizar un algoritmo simple para hacer coincidir una huella digital acústica con una canción en una biblioteca. Estas aplicaciones toman un clip de muestra de una canción o una melodía generada por el usuario y verifican una biblioteca de música / base de datos de música para ver dónde coincide el clip con la canción. A partir de ahí, la información de la canción se consultará y se mostrará al usuario.
Este tipo de aplicaciones se utilizan principalmente para buscar una canción que el usuario aún no conoce. La búsqueda por sonido no se limita a identificar canciones , sino también a identificar melodías , melodías o anuncios , administración de bibliotecas de sonido y archivos de video .
Toma de huellas acústicas
La forma en que estas aplicaciones buscan por sonido es mediante la generación de una huella dactilar acústica ; un resumen digital del sonido. Se usa un micrófono para tomar una muestra de audio, que luego se divide en una firma numérica simple, un código único para cada pista. Usando el mismo método de toma de huellas digitales, cuando Shazam toma un clip de sonido, generará una firma para ese clip. Entonces es simple la coincidencia de patrones desde allí utilizando una extensa base de datos de música de audio.
Sin embargo, la práctica de usar huellas dactilares acústicas no se limita solo a la música, sino también a otras áreas del negocio del entretenimiento. Shazam también puede identificar programas de televisión con la misma técnica de toma de huellas dactilares acústicas. Por supuesto, este método de descomponer una muestra de sonido en una firma única es inútil a menos que exista una extensa base de datos de música con claves que coincidan con las muestras. Shazam tiene más de 11 millones de canciones en su base de datos. [1]
Otros servicios como Midomi y Soundhound permiten a los usuarios agregar a esa biblioteca de música para expandir las posibilidades de hacer coincidir una muestra de sonido con su sonido correspondiente.
Consulta tarareando
Midomi y Soundhound ofrecen consultas tarareando . Esta es una rama de las huellas dactilares acústicas, pero sigue siendo un sistema de recuperación musical. Después de recibir una melodía tarareada generada por el usuario, que es la consulta de entrada, el sistema devuelve una lista clasificada de canciones que se acercan más a la consulta del usuario.
Ver también
Referencias
- ^ "That Tune, Named" , Slate , consultado el 11 de julio de 2020