La desverberación es el proceso por el cual los efectos de la reverberación se eliminan del sonido, después de que los micrófonos hayan captado dicho sonido reverberante . La desverberación es un subtema del procesamiento de señales digitales acústicas y se aplica más comúnmente al habla, pero también tiene relevancia en algunos aspectos del procesamiento de música. La desverberación de audio (habla o música) es una función correspondiente a la deconvolución ciega de imágenes, aunque las técnicas utilizadas suelen ser muy diferentes. La reverberación en sí es causada por reflejos de sonido en una habitación (u otro espacio cerrado) y se cuantifica por el tiempo de reverberación de la habitación.y la relación directa a reverberante. El efecto de la desverberación es aumentar la relación de directo a reverberante para que el sonido se perciba más cercano y claro.
Una aplicación principal de la desverberación es en teléfonos manos libres y terminales de conferencias de escritorio porque, en estos casos, los micrófonos no están cerca de la fuente de sonido, la boca del hablante, sino a una distancia mayor o mayor. Además de las telecomunicaciones, la desverberación se aplica de manera importante en el reconocimiento automático de voz porque los reconocedores de voz suelen ser propensos a errores en escenarios reverberantes.
La desverberación se estableció como un tema de investigación científica en los años 2000 a 2005, [1] aunque existen algunos artículos tempranos notables. [2] El primer libro de texto científico sobre el tema se publicó en 2010. [3] En 2014 se llevó a cabo un estudio científico mundial patrocinado por el Comité Técnico de Procesamiento de Señales de Audio y Acústicas del IEEE. [4]
Se pueden seguir tres enfoques diferentes [5] para realizar la desverberación. En el primer enfoque, la reverberación se cancela mediante la explotación de un modelo matemático del sistema acústico (o sala) y, después de la estimación de los parámetros del modelo acústico de la sala, se forma una estimación de la señal original. En el segundo enfoque, la reverberación se suprime tratándola como un tipo de ruido (convolucional) y realizando un proceso de eliminación de ruido específicamente adaptado a la reverberación. En el tercer enfoque, la señal desverberada original se estima directamente a partir de las señales del micrófono utilizando, por ejemplo, un enfoque de aprendizaje automático de red neuronal profunda o, alternativamente, un filtro lineal multicanal. Entre los ejemplos de los métodos más eficaces en el estado de la técnica se incluyen los enfoques basados en la predicción lineal [6] [7]
Referencias
- ^ PA Naylor y ND Gaubitch, "Desverberación del habla", en Proc. Intl. Taller Acoust. Control de ruido de eco (IWAENC), 2005.
- ^ LE Ryall, "Mejoras en amplificadores de señales eléctricas que incorporan dispositivos operados por voz", Patente GB509613A, 1938.
- ^ PA Naylor y ND Gaubitch, Eds., Desverberación del habla. Springer, 2010.
- ^ El desafío REVERB
- ^ E. Habets, Cincuenta años de reducción de la reverberación, 60a Conferencia de la Sociedad de ingeniería de audio sobre desverberación y reverberación de la música y el habla en audio
- ^ A. Jukic et al., "Desverberación del habla basada en predicciones lineales multicanal con priores dispersos"
- ^ M. Delcroix et al, Desverberación basada en predicciones lineales con tecnologías avanzadas de reconocimiento y mejora del habla, Taller de desafío REVERB, 2014