Motor de búsqueda de audio

Un motor de búsqueda de audio es un motor de búsqueda basado en la web que rastrea la web en busca de contenido de audio . La información puede consistir en páginas web, imágenes, archivos de audio u otro tipo de documento. Existen varias técnicas para la investigación de estos motores.

Tipos de busqueda

Búsqueda de audio a partir de texto

El texto introducido en una barra de búsqueda por el usuario se compara con la base de datos del motor de búsqueda. Los resultados coincidentes van acompañados de una breve descripción del archivo de audio y sus características, como frecuencia de muestreo, velocidad de bits, tipo de archivo, longitud, duración o tipo de codificación. El usuario tiene la opción de descargar los archivos resultantes.

Búsqueda de audio a partir de la imagen

El sistema de consulta por ejemplo (QBE) es un algoritmo de búsqueda que utiliza recuperación de imágenes basada en contenido (CBIR). Las palabras clave se generan a partir de la imagen analizada. Estas palabras clave se utilizan para buscar archivos de audio en la base de datos. Los resultados de la búsqueda se muestran según las preferencias del usuario en cuanto al tipo de archivo (wav, mp3, aiff…) u otras características.

Arriba: un sonido Una forma de onda
Abajo: un sonido Un espectrograma

Búsqueda de audio a partir de audio

En la búsqueda de audio a partir de audio , el usuario debe reproducir el audio de una canción con un reproductor de música, cantando o tarareando en el micrófono de la computadora. Posteriormente, se deriva un patrón de sonido, A , de la forma de onda de audio, y una representación de frecuencia se deriva de su Transformada de Fourier . Este patrón se emparejará con un patrón, B , correspondiente a la forma de onda y la transformación de los archivos de sonido que se encuentran en la base de datos. Todos aquellos archivos de audio en la base de datos cuyos patrones son similares a la búsqueda de patrones se mostrarán como resultados de la búsqueda.

Diseño y algoritmos

Un espectrograma del sonido de un violín.

La zona objetivo de una canción escaneada por Shazam. ^{[ aclaración necesaria ]}

La búsqueda de audio ha evolucionado lentamente a través de varios formatos de búsqueda básicos que existen en la actualidad y todos utilizan palabras clave . Las palabras clave para cada búsqueda se pueden encontrar en el título del medio, cualquier texto adjunto a los medios y páginas web vinculadas al contenido, también definidas por los autores y usuarios de los recursos alojados en videos.

Algunos motores de búsqueda pueden buscar discursos grabados, como podcasts, aunque esto puede resultar difícil si hay ruido de fondo. Existen alrededor de 40 fonemas en cada idioma y alrededor de 400 en todos los idiomas hablados. En lugar de aplicar un algoritmo de búsqueda de texto después de que se completa el procesamiento de voz a texto, algunos motores utilizan un algoritmo de búsqueda fonética para encontrar resultados dentro de la palabra hablada. Otros trabajan escuchando el podcast completo y creando una transcripción de texto.

Aplicaciones como Munax, utilizan varios procesos de algoritmos de clasificación independientes, que el índice invertido junto con cientos de parámetros de búsqueda para producir la clasificación final para cada documento. También como Shazam que funciona analizando el sonido capturado y buscando una coincidencia basada en una huella acústica en una base de datos de más de 11 millones de canciones. Shazam identifica canciones basándose en una huella digital de audio basada en un gráfico de frecuencia de tiempo llamado espectrograma . Shazam almacena un catálogo de huellas digitales de audio en una base de datos. El usuario etiqueta una canción durante 10 segundos y la aplicación crea una huella digital de audio. Una vez que crea la huella digital del audio, Shazam comienza la búsqueda de coincidencias en la base de datos. Si hay una coincidencia, devuelve la información al usuario; de lo contrario, devuelve un diálogo de "canción desconocida". Shazam puede identificar la música pregrabada que se transmite desde cualquier fuente, como una radio, televisión, cine o música en un club, siempre que el nivel de ruido de fondo no sea lo suficientemente alto como para evitar que se tome una huella digital acústica y que la canción esté presente en la base de datos del software. ^{[ cita requerida ]}

Motores notables

Búsqueda de audio profunda

Picsearch Audio Search tiene licencia para buscar portales desde 2006. Picsearch es un proveedor de tecnología de búsqueda que impulsa la búsqueda de imágenes, videos y audio para más de 100 motores de búsqueda importantes en todo el mundo.

Para smartphones

SoundHound (anteriormente conocido como Midomi ) es un software y una empresa (ambos con el mismo nombre) que permite a los usuarios encontrar resultados con audio. Sus características son tanto un servicio de inteligencia artificial basado en audio como servicios para encontrar canciones y detalles sobre ellas cantándolas , tarareando o grabándolas.
Shazam es una aplicación para teléfonos inteligentes o Mac mejor conocida por sus capacidades de identificación de música. Utiliza un micrófono incorporado para recopilar una breve muestra del audio que se está reproduciendo. Crea una huella digital acústica basada en la muestra y la compara con una base de datos central para una coincidencia. Si encuentra una coincidencia, envía información como el artista, el título de la canción y el álbum al usuario.
Doreso identifica una canción tarareando o cantando la melodía usando un micrófono; y mediante la introducción directa del nombre de una canción o cantante. La aplicación brinda información sobre el título de la canción, su cantante y le permite comprar la canción.
Munax (desaparecida) es una empresa que lanzó su motor de búsqueda de contenido completo en su primera versión en 2005. Su motor de búsqueda multimedia PlayAudioVideo , creado en julio de 2007, fue el primer motor de búsqueda real de multimedia, que ofrecía búsquedas de imágenes en la web. video y audio en el mismo motor de búsqueda, y permite a los usuarios obtener una vista previa en la misma página. ^{[ cita requerida ]} Munax se ha cerrado desde entonces. ^{[ cita requerida ]}