MUSHRA


MUSHRA significa Estímulos múltiples con referencia y anclaje ocultos y es una metodología para realizar una prueba de escucha de códec para evaluar la calidad percibida de la salida de los algoritmos de compresión de audio con pérdida . Está definido por la recomendación ITU-R BS.1534-3. [1] Se recomienda la metodología MUSHRA para evaluar la "calidad de audio intermedia". Para deficiencias de audio muy pequeñas, se recomienda en su lugar la Recomendación UIT-R BS.1116-3 (ABC / HR).

La principal ventaja sobre la metodología de puntuación de opinión media (MOS) (que tiene un propósito similar) es que MUSHRA requiere menos participantes para obtener resultados estadísticamente significativos. [ cita requerida ] Esto se debe a que todos los códecs se presentan al mismo tiempo, en las mismas muestras, de modo que se puede utilizar una prueba t pareada o un análisis de varianza de medidas repetidas para el análisis estadístico. Además, la escala de 0 a 100 utilizada por MUSHRA permite calificar diferencias muy pequeñas.

En MUSHRA, al oyente se le presenta la referencia (etiquetada como tal), un cierto número de muestras de prueba, una versión oculta de la referencia y uno o más anclajes. La recomendación especifica que debe incluirse un ancla de rango medio y bajo en las señales de prueba. Suelen ser una versión de paso bajo de 7 kHz y 3,5 kHz de la referencia. El propósito de los anclajes es calibrar la báscula para que los artefactos menores no sean penalizados indebidamente. Esto es particularmente importante cuando se comparan o combinan los resultados de diferentes laboratorios.

Tanto las pruebas MUSHRA como ITU BS.1116 [2] requieren oyentes expertos capacitados que sepan cómo suenan los artefactos típicos y dónde es probable que ocurran. Los oyentes expertos también tienen una mejor internalización de la escala de calificación, lo que conduce a resultados más repetibles que con oyentes no capacitados. Por lo tanto, con oyentes capacitados, se necesitan menos oyentes para lograr resultados estadísticamente significativos .

Se supone que las preferencias son similares para los oyentes expertos y los oyentes ingenuos y, por lo tanto, los resultados de los oyentes expertos también son predictivos para los consumidores. De acuerdo con este supuesto, Schinkel-Bielefeld et al. [3] no encontró diferencias en el orden de rango entre oyentes expertos y oyentes no entrenados cuando se usaron señales de prueba que solo contenían timbre y sin artefactos espaciales. Sin embargo, Rumsey et al. [4] mostró que para las señales que contienen artefactos espaciales, los oyentes expertos pesan los artefactos espaciales un poco más fuerte que los oyentes inexpertos, que se centran principalmente en los artefactos del timbre.

Además de esto, se ha demostrado que los oyentes expertos hacen más uso de la opción de escuchar secciones más pequeñas de las señales bajo prueba repetidamente y realizar más comparaciones entre las señales bajo prueba y la referencia. [3] En contraste con el oyente ingenuo que produce una calificación de preferencia, los oyentes expertos producen una calificación de calidad de audio, calificando las diferencias entre la señal bajo prueba y el original sin comprimir, que es el objetivo real de una prueba MUSHRA.