Evaluación perceptual de la calidad del audio

La Evaluación Perceptual de la Calidad de Audio ( PEAQ ) es un algoritmo estandarizado para medir objetivamente la calidad de audio percibida , desarrollado en 1994-1998 por una empresa conjunta de expertos dentro del Grupo de Tareas 6Q del Sector de Radiocomunicaciones de la Unión Internacional de Telecomunicaciones ( UIT-R ). Se publicó originalmente como Recomendación UIT-R BS.1387 en 1998 y se actualizó por última vez en 2001. Utiliza software para simular las propiedades perceptivas del oído humano.y luego integra múltiples variables de salida del modelo en una sola métrica. PEAQ caracteriza la calidad de audio percibida como lo harían los sujetos en una prueba de audición de acuerdo con ITU-R BS.1116. Los resultados de PEAQ modelan principalmente puntuaciones de opinión medias que cubren una escala de 1 (mala) a 5 (excelente).

Motivación

La necesidad de conservar el ancho de banda ha llevado a desarrollos en la compresión de los datos de audio a transmitir. Varios métodos de codificación eliminan tanto la redundancia como la irrelevancia perceptiva en la señal de audio de modo que la tasa de bits requerida para codificar la señal se reduce significativamente. Tienen en cuenta el conocimiento de la percepción auditiva humana y, por lo general, logran una tasa de bits reducida al ignorar la información de audio que probablemente no será escuchada por la mayoría de los oyentes. Las mediciones de audio tradicionales como la respuesta de frecuencia basada en barridos sinusoidales, S / N, THD + N no necesariamente se correlacionan bien con la calidad del códec de audio. Se debe utilizar un modelo psicoacústico para predecir cómo la información está enmascarada por contenido de audio más fuerte adyacente en tiempo y frecuencia.

Dado que las pruebas de audición subjetivas consumen mucho tiempo, son caras y poco prácticas para el uso diario, resultó beneficioso sustituir las pruebas de audición por métodos objetivos basados en computadora. Dirigido por el Grupo de Tareas 6Q del UIT-R, un grupo de expertos líderes en calidad de sonido desarrolló un nuevo modelo objetivo para la calidad del sonido: PEAQ. Estos contribuyentes fueron:

OPTICOM GmbH, Erlangen, Alemania
el Instituto Fraunhofer de Circuitos Integrados, IIS-A, Erlangen, Alemania
Deutsche Telekom Berkom, Berlín, Alemania
la Universidad de Berlín , Berlín, Alemania
el Institut für Rundfunktechnik , IRT, Munich, Alemania
KPN Research , Dr. Neher Laboratorium, Leidschendam, Países Bajos
Centre commun d'études de télévision et télécommunications , Francia
Centro de Investigación de Comunicaciones, CRC, Ottawa, Canadá

Principios

En la codificación perceptiva es fundamental determinar el nivel de ruido que se puede introducir en una señal antes de que se vuelva audible. Debido a que el sistema auditivo humano es altamente no lineal, los niveles de ruido varían con el tiempo y las características de frecuencia de la señal de audio. Los estudios psicoacústicos pueden ofrecer criterios de umbral para varios eventos acústicos y los sonidos percibidos resultantes. La clave es el enmascaramiento , que describe el efecto que produce un sonido en otro sonido simultáneo. El enmascaramiento depende de la composición espectral tanto del enmascarador como de la señal de enmascaramiento, y de otras variaciones con el tiempo. El diagrama de bloques básico de un sistema de codificación perceptual se muestra en la figura.

La señal de entrada se descompone en componentes espectrales submuestreados. Para cada muestra, se deriva una estimación del umbral enmascarado real utilizando reglas conocidas de la psicoacústica. Este es el modelo perceptual del sistema de codificación. Los componentes espectrales se cuantifican y codifican, manteniendo el ruido de cuantificación por debajo del umbral enmascarado. Finalmente, se forma el flujo de bits .

El análisis de los resultados se basa en el Grado de Diferencia Subjetiva . Compara la señal bajo prueba con la señal de referencia original.

Modelos

El modelo sigue las propiedades fundamentales del sistema auditivo y diferencia las etapas de los efectos fisiológicos y psicoacústicos. La primera parte modela la construcción de la señal con una transformada de Fourier discreta y bancos de filtros. La segunda parte proporciona procesamiento cognitivo como lo hace el cerebro humano. La siguiente imagen representa un diagrama de bloques simple de la relación entre el sistema de audio humano y un modelo psicoacústico objetivo.

A partir de la comparación del modelo de la señal de prueba con la señal de referencia (original), se derivan varias variables de salida del modelo. Cada variable de salida del modelo puede medir diferentes dimensiones psicoacústicas. En la etapa final, las variables de salida del modelo se combinan para producir un resultado que se adapta a la evaluación subjetiva de la calidad.

Hay dos variaciones del modelo. La versión básica (menos procesamiento intensivo) fue desarrollada para ser lo suficientemente rápida para el monitoreo en tiempo real. La versión avanzada es computacionalmente más exigente y puede ofrecer resultados un poco más precisos.

Licencia

La tecnología PEAQ recomendada por la Rec. UIT-R. BS.1387 está protegido por varias patentes y está disponible bajo licencia junto con el código original para aplicaciones comerciales de acuerdo con los términos justos, razonables y no discriminatorios de la UIT . Una de las primeras implementaciones de código abierto del modelo básico, denominada EAQUAL, se suspendió en 2002 debido a reclamaciones por infracción de patentes. Para uso educativo, existe un programa multiplataforma gratuito llamado Peaqb que realiza las mismas funciones de manera limitada, ya que no ha sido validado con los datos de la UIT. Otra implementación no validada del modelo básico PEAQ para uso educativo, PQevalAudio, está disponible en el TSP Lab de la Universidad McGill.

Ver también

Referencias

Recomendación UIT-R BS.1387 : Método para mediciones objetivas de la calidad de audio percibida (PEAQ)
Recomendación UIT-R BS.1116 : Métodos para la evaluación subjetiva de pequeñas degradaciones en sistemas de audio, incluidos los sistemas de sonido multicanal
Recomendación UIT-R BS.1534 : Método para la evaluación subjetiva de niveles de calidad intermedios de sistemas de codificación (MUSHRA)

enlaces externos

http://www.peaq.org Sitio oficial de PEAQ
https://web.archive.org/web/20061207095623/http://www.crc.ca/en/html/aas/home/peaq/peaq PEAQ en el CRC
https://web.archive.org/web/20090423074959/http://www.opticom.de/technology/technology.html Información PEAQ de OPTICOM
http://elvera.nue.tu-berlin.de/files/0829Thiede1998.pdf PEAQ - der künftige ITU-Standard zur objektiven Messung der wahrgenommenen Audioqualität
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=01613524 IEEE - Estimación de la calidad del sistema de audio perceptual mediante el algoritmo PEAQ
http://sourceforge.net/projects/peaqb/ Proyecto Peaqb
http://www-mmsp.ece.mcgill.ca/Documents/Software/index.html PQevalAudio - Implementación de Matlab y C del modelo básico PEAQ.
http://www.mp3-tech.org/programmer/sources/eaqual.tgz Código fuente de EAQUAL