La planitud espectral o coeficiente de tonalidad , [1] [2] también conocido como entropía de Wiener , [3] [4] es una medida utilizada en el procesamiento de señales digitales para caracterizar un espectro de audio . La planitud espectral se mide típicamente en decibelios y proporciona una forma de cuantificar qué tan parecido al tono es un sonido, en lugar de ser parecido al ruido . [2]
El significado de tonal en este contexto está en el sentido de la cantidad de picos o estructura resonante en un espectro de potencia , en oposición al espectro plano de un ruido blanco . Una planitud espectral alta (cercana a 1.0 para ruido blanco) indica que el espectro tiene una cantidad similar de potencia en todas las bandas espectrales; esto sonaría similar al ruido blanco y el gráfico del espectro parecería relativamente plano y suave. Una planitud espectral baja (que se acerca a 0.0 para un tono puro) indica que la potencia espectral se concentra en un número relativamente pequeño de bandas; esto normalmente sonaría como una mezcla de ondas sinusoidales y el espectro aparecería "puntiagudo". [5]
La planitud espectral se calcula dividiendo la media geométrica del espectro de potencia por la media aritmética del espectro de potencia, es decir:
donde x (n) representa la magnitud del número de intervalo n . Tenga en cuenta que un solo contenedor vacío (o más) arroja una planitud de 0, por lo que esta medida es más útil cuando los contenedores generalmente no están vacíos.
La relación producida por este cálculo a menudo se convierte a una escala de decibelios para informes, con un máximo de 0 dB y un mínimo de −∞ dB.
La planitud espectral también se puede medir dentro de una subbanda específica, en lugar de en toda la banda. Dubnov [2] ha demostrado que la planitud espectral es equivalente al concepto teórico de la información de información mutua que se conoce como correlación total dual.
Aplicaciones
Esta medida es uno de los muchos descriptores de audio utilizados en el estándar MPEG-7 , en el que se etiqueta "AudioSpectralFlatness".
En la investigación del canto de los pájaros , se ha utilizado como una de las características medidas en el audio del canto de los pájaros, al probar la similitud entre dos extractos. [6] La planitud espectral también se ha utilizado en el análisis de diagnóstico e investigación de electroencefalografía (EEG) , [7] y psicoacústica en humanos. [8]
Referencias
- ^ JD Johnston (1988). "Transformar la codificación de señales de audio utilizando criterios de ruido perceptual". Revista IEEE sobre áreas seleccionadas en comunicaciones . 6 (2): 314–332. doi : 10.1109 / 49.608 .
- ^ a b c Shlomo Dubnov (2004). "Generalización de la medida de planitud espectral para procesos lineales no gaussianos". Cartas de procesamiento de señales . 11 (8): 698–701. Código Bibliográfico : 2004ISPL ... 11..698D . doi : 10.1109 / LSP.2004.831663 . ISSN 1070-9908 . S2CID 14778866 .
- ^ Las características de la canción ›Entropía de Wiener " definida como la relación entre la media geométrica y la media aritmética del espectro "
- ^ Parámetros de Luscinia "La entropía de Wiener es una medida alternativa del ruido de una señal. Se define como la relación entre la media geométrica y la media aritmética del espectro de potencia".
- ^ Un gran conjunto de funciones de audio para la descripción del sonido : informe técnico publicado por IRCAM en 2003. Sección 9.1
- ^ Tchernichovski, O., Nottebohm, F., Ho, CE, Pesaran, B., Mitra, PP, 2000. Un procedimiento para una medición automática de la similitud de canciones. Animal Behavior 59 (6), 1167-1176, doi : 10.1006 / anbe.1999.1416 .
- ^ Burns, T .; Rajan, R. (2015). "Burns y Rajan (2015) Combinando medidas de complejidad de los datos de EEG: multiplicar las medidas revelan información previamente oculta. F1000Research. 4: 137" . F1000Research . 4 : 137. doi : 10.12688 / f1000research.6590.1 . PMC 4648221 . PMID 26594331 .
- ^ Burns, T .; Rajan, R. (2019). "Un enfoque matemático para correlacionar características objetivas espectro-temporales de los sonidos no lingüísticos con sus percepciones subjetivas en los seres humanos" . Fronteras en neurociencia . 13 : 794. doi : 10.3389 / fnins.2019.00794 . PMC 6685481 . PMID 31417350 .