La escala mel (después de la palabra melodía ) [1] es una escala perceptiva de tonos que los oyentes consideran iguales en distancia entre sí. El punto de referencia entre esta escala y la medición de frecuencia normal se define asignando un tono de percepción de 1000 mels a un tono de 1000 Hz , 40 dB por encima del umbral del oyente. Por encima de unos 500 Hz, los oyentes juzgan que los intervalos cada vez más grandes producen incrementos de tono iguales.
Fórmula
Una fórmula popular para convertir f hertz en m mels es: [2]
Historia y otras fórmulas
No existe una fórmula única en escala mel. [3] La fórmula popular del libro de O'Shaughnessy se puede expresar con diferentes bases logarítmicas:
Las expresiones inversas correspondientes son:
Se publicaron curvas y tablas sobre escalas de tono psicofísicas desde las curvas de Steinberg de 1937 [4] basadas en diferencias de tono apenas perceptibles . Pronto siguieron más curvas en los artículos de Fletcher y Munson de 1937 [5] y de Fletcher de 1938 [6] y de Stevens de 1937 [1] y de Stevens y Volkmann de 1940 [7] utilizando una variedad de métodos experimentales y enfoques de análisis.
En 1949, Koenig publicó una aproximación basada en segmentos lineales y logarítmicos separados, con una ruptura a 1000 Hz. [8]
Gunnar Fant propuso la fórmula lineal / logarítmica popular actual en 1949, pero con la frecuencia de esquina de 1000 Hz. [9]
En Fant (1968) se observa una expresión alternativa de la fórmula, que no depende de la elección de la base del logaritmo: [10] [11]
En 1976, Makhoul y Cosell publicaron la versión ahora popular con la frecuencia de esquina de 700 Hz. [12] Como Ganchev et al. han observado, "Las fórmulas [con 700], en comparación con [Fant con 1000], proporcionan una aproximación más cercana de la escala Mel para frecuencias por debajo de 1000 Hz, al precio de mayor inexactitud para frecuencias superiores a 1000 Hz". [13] Por encima de 7 kHz, sin embargo, la situación se invierte y la versión de 700 Hz vuelve a encajar mejor.
Los datos que motivan algunas de estas fórmulas están tabulados en Beranek (1949), medidos a partir de las curvas de Stevens y Volkmann: [14]
Datos de escala mel de Beranek 1949 de Stevens y Volkmann 1940 Hz 20 160 394 670 1000 1420 1900 2450 3120 4000 5100 6600 9000 14000 mel 0 250 500 750 1000 1250 1500 1750 2000 2250 2500 2750 3000 3250
Lindsay y Norman (1977) dan una fórmula con una frecuencia de ruptura de 625 Hz; [15] la fórmula no aparece en su primera edición de 1972:
Para una comparación directa con otras fórmulas, esto equivale a:
La mayoría de las fórmulas de escala de melos dan exactamente 1000 mels a 1000 Hz. La frecuencia de corte (por ejemplo, 700 Hz, 1000 Hz o 625 Hz) es el único parámetro libre en la forma habitual de la fórmula. Algunas fórmulas de escala de frecuencia auditiva que no son mel usan la misma forma pero con una frecuencia de ruptura mucho más baja, no necesariamente mapeando a 1000 a 1000 Hz; por ejemplo, la escala de frecuencia ERB de Glasberg y Moore (1990) utiliza un punto de ruptura de 228,8 Hz, [16] y el mapa coclear frecuencia-lugar de Greenwood (1990) utiliza 165,3 Hz. [17]
Umesh et al. Han explorado otras formas funcionales de la escala mel; señalan que las fórmulas tradicionales con una región logarítmica y una región lineal no se ajustan a los datos de las curvas de Stevens y Volkmann, así como a algunas otras formas, según la siguiente tabla de datos de medidas que hicieron a partir de esas curvas: [18]
Umesh y col. Datos de escala mel de 1999 de Stevens y Volkmann 1940 Hz 40 161 200 404 693 867 1000 2022 3000 3393 4109 5526 6500 7743 12000 mel 43 257 300 514 771 928 1000 1542 2000 2142 2314 2600 2771 2914 3228
Crítica
El estudiante de Stevens, Donald D. Greenwood, que había trabajado en los experimentos de la escala mel en 1956, considera que la escala está sesgada por defectos experimentales. En 2009 publicó en una lista de correo, [19]
Yo preguntaría, ¿por qué usar la escala Mel ahora, ya que parece estar sesgada? Si alguien quiere una escala Mel, debe hacerlo de nuevo, controlando cuidadosamente el sesgo de orden y usando muchos temas, más que en el pasado, y usando tanto músicos como no músicos para buscar cualquier diferencia en la interpretación que pueda ser gobernada por el músico. / diferencias de no músicos o diferencias de tema en general.
Ver también
Referencias
- ^ a b Stevens, Stanley Smith; Volkmann; John y Newman, Edwin B. (1937). "Una escala para la medición del tono de magnitud psicológica" . Revista de la Sociedad Americana de Acústica . 8 (3): 185-190. Código bibliográfico : 1937ASAJ .... 8..185S . doi : 10.1121 / 1.1915893 . Archivado desde el original el 14 de abril de 2013.
- ^ Douglas O'Shaughnessy (1987). Comunicación oral: humana y mecánica . Addison-Wesley. pag. 150. ISBN 978-0-201-16520-3.
- ^ W. Dixon Ward (1970). "Percepción musical". En Jerry V. Tobias (ed.). Fundamentos de la teoría auditiva moderna . 1 . Prensa académica. pag. 412.
Nadie afirma haber determinado todavía "la" escala mel.
- ^ John C. Steinberg (1937). "Posiciones de estimulación en la cóclea por tonos puros" . Revista de la Sociedad Americana de Acústica . 8 (3): 176–180. Código bibliográfico : 1937ASAJ .... 8..176S . doi : 10.1121 / 1.1915891 .
- ^ Harvey Fletcher y WA Munson (1937). "Relación entre sonoridad y enmascaramiento". Revista de la Sociedad Americana de Acústica . 9 (1): 1–10. Código bibliográfico : 1937ASAJ .... 9 .... 1F . doi : 10.1121 / 1.1915904 .
- ^ Harvey Fletcher (1938). "Sonoridad, enmascaramiento y su relación con el proceso auditivo y el problema de la medición del ruido" . Revista de la Sociedad Americana de Acústica . 9 (4): 275-293. Código bibliográfico : 1938ASAJ .... 9..275F . doi : 10.1121 / 1.1915935 .
- ^ Stevens, S. y Volkmann, J. (1940). "La relación de tono a frecuencia: una escala revisada". Revista estadounidense de psicología . 53 (3): 329–353. doi : 10.2307 / 1417526 . JSTOR 1417526 .
- ^ W. Koenig (1949). "Una nueva escala de frecuencias para medidas acústicas". Registro de laboratorio de Bell Telephone . 27 : 299-301.
- ^ Gunnar Fant (1949) "Analys av de svenska konsonantljuden: talets allmänna svängningsstruktur", LM Ericsson protokoll H / P 1064
- ^ Fant, Gunnar. (1968). Análisis y síntesis de procesos del habla. En B. Malmberg (Ed.), Manual de fonética (págs. 173-177). Amsterdam: Holanda Septentrional.
- ^ Jonathan Harrington y Steve Cassidy (1999). Técnicas en acústica del habla . Saltador. pag. 18. ISBN 978-0-7923-5731-5.
- ^ John Makhoul y Lynn Cosell (1976). "LPCW: un codificador de voz LPC con deformación espectral predictiva lineal". ICASSP '76. Conferencia internacional IEEE sobre acústica, habla y procesamiento de señales . ICASSP 1976 . 1 . IEEE. págs. 466–469. doi : 10.1109 / ICASSP.1976.1170013 .
- ^ T. Ganchev; N. Fakotakis y G. Kokkinakis (2005), "Evaluación comparativa de varias implementaciones de MFCC en la tarea de verificación del hablante", Actas del SPECOM-2005 , págs. 191-194, CiteSeerX 10.1.1.75.8303
- ^ Beranek, Leo L. (1949). Medidas acústicas . Nueva York: McGraw-Hill.
- ^ Lindsay, Peter H .; Y Norman, Donald A. (1977). Procesamiento de información humana: una introducción a la psicología (2ª ed.). Nueva York: Academic Press.
- ^ BCJ Moore y BR Glasberg, "Fórmulas sugeridas para calcular los anchos de banda del filtro auditivo y los patrones de excitación" Revista de la Sociedad Acústica de América 74: 750-753, 1983.
- ^ Greenwood, DD (1990). Una función coclear de frecuencia-posición para varias especies, 29 años después. The Journal of the Acoustical Society of America , 87, 2592-2605.
- ^ Umesh, S. y Cohen, L. y Nelson, D. (1999), "Fitting the mel scale", Proc. ICASSP 1999 : 217–220, ISBN 978-0-7803-5041-0CS1 maint: varios nombres: lista de autores ( enlace )
- ^ http://lists.mcgill.ca/scripts/wa.exe?A2=ind0907d&L=auditory&P=389
enlaces externos
- Medios relacionados con la escala de Mel en Wikimedia Commons
- Conversión Hz-mel, mel-Hz (utiliza la ecuación de O'Shaughnessy)
- Volkmann, J; Stevens, SS; Newman, EB (1937). "Una escala para la medición del tono de magnitud psicológica" . La Revista de la Sociedad Estadounidense de Acústica . 8 (3): 208. Bibcode : 1937ASAJ .... 8..208V . doi : 10.1121 / 1.1901999 .
- Manual de ecología acústica