Evaluación perceptiva de la calidad de audio


La evaluación perceptiva de la calidad de audio ( PEAQ ) es un algoritmo estandarizado para medir objetivamente la calidad de audio percibida , desarrollado en 1994-1998 por una empresa conjunta de expertos dentro del Grupo de trabajo 6Q del Sector de Radiocomunicaciones de la Unión Internacional de Telecomunicaciones ( UIT-R ). Se publicó originalmente como la Recomendación ITU-R BS.1387 en 1998 y se actualizó por última vez en 2001. Utiliza software para simular las propiedades perceptivas del oído humano .y luego integra múltiples variables de salida del modelo en una sola métrica. PEAQ caracteriza la calidad de audio percibida como lo harían los sujetos en una prueba de audición de acuerdo con ITU-R BS.1116. Los resultados de PEAQ modelan principalmente puntajes de opinión promedio que cubren una escala de 1 (malo) a 5 (excelente).

La necesidad de conservar el ancho de banda ha llevado a desarrollos en la compresión de los datos de audio a transmitir. Varios métodos de codificación eliminan tanto la redundancia como la irrelevancia de la percepción en la señal de audio, de modo que la tasa de bits requerida para codificar la señal se reduce significativamente. Tienen en cuenta el conocimiento de la percepción auditiva humana y, por lo general, logran una tasa de bits reducida al ignorar la información de audio que probablemente no sea escuchada por la mayoría de los oyentes. Las mediciones de audio tradicionales como la respuesta de frecuencia basada en barridos sinusoidales, S/N, THD+N no necesariamente se correlacionan bien con la calidad del códec de audio. Se debe utilizar un modelo psicoacústico para predecir cómo la información queda enmascarada por contenido de audio más alto adyacente en tiempo y frecuencia.

Dado que las pruebas de escucha subjetivas consumen mucho tiempo, son costosas y poco prácticas para el uso diario, fue beneficioso sustituir las pruebas de escucha por métodos objetivos basados ​​en computadora. Dirigido por el Grupo de Trabajo 6Q del UIT-R, un grupo de destacados expertos en calidad de sonido desarrolló un nuevo modelo objetivo para la calidad del sonido: PEAQ. Estos contribuyentes fueron:

En la codificación perceptual es fundamental determinar el nivel de ruido que se puede introducir en una señal antes de que se vuelva audible. Debido a que el sistema auditivo humano es altamente no lineal, los niveles de ruido varían con las características de tiempo y frecuencia de la señal de audio. Los estudios psicoacústicos pueden proporcionar criterios de umbral para varios eventos acústicos y los sonidos percibidos resultantes. La clave es el enmascaramiento , que describe el efecto que produce un sonido en otro sonido simultáneo. El enmascaramiento depende de la composición espectral tanto del enmascarador como de la señal de enmascaramiento, y de otras variaciones con el tiempo. El diagrama de bloques básico de un sistema de codificación perceptivo se muestra en la figura.

La señal de entrada se descompone en componentes espectrales submuestreados. Para cada muestra se deriva una estimación del umbral enmascarado real utilizando reglas conocidas de la psicoacústica. Este es el modelo de percepción del sistema de codificación. Los componentes espectrales se cuantifican y codifican, manteniendo el ruido de cuantificación por debajo del umbral enmascarado. Finalmente, se forma el flujo de bits .

El análisis de los resultados se basa en el Grado de Diferencia Subjetiva . Compara la señal bajo prueba con la señal de referencia original.