De Wikipedia, la enciclopedia libre
  (Redirigido desde Psychoacoustic )
Saltar a navegación Saltar a búsqueda

La psicoacústica es la rama de la psicofísica que involucra el estudio científico de la percepción del sonido y la audiología, cómo los humanos percibimos varios sonidos. Más específicamente, es la rama de la ciencia que estudia las respuestas psicológicas asociadas con el sonido (incluido el ruido , el habla y la música ). La psicoacústica es un campo interdisciplinario de muchas áreas, que incluyen psicología, acústica, ingeniería electrónica, física, biología, fisiología e informática. [1]

Antecedentes [ editar ]

La audición no es un fenómeno puramente mecánico de propagación de ondas , sino que también es un evento sensorial y perceptivo; en otras palabras, cuando una persona escucha algo, ese algo llega al oído como una onda sonora mecánica que viaja por el aire, pero dentro del oído se transforma en potenciales de acción neuronales . Las células ciliadas externas (OHC) de la cóclea de un mamífero dan lugar a una mayor sensibilidad y una mejor resolución de frecuencia [ aclaración necesaria ] de la respuesta mecánica de la partición coclear. Estos pulsos nerviosos luego viajan al cerebro donde se perciben. Por lo tanto, en muchos problemas de acústica, como el procesamiento de audio, es ventajoso tener en cuenta no solo la mecánica del entorno, sino también el hecho de que tanto el oído como el cerebro están involucrados en la experiencia auditiva de una persona. [ aclaración necesaria ] [ cita requerida ]

El oído interno , por ejemplo, realiza un procesamiento de señal significativo al convertir formas de onda de sonido en estímulos neuronales, por lo que ciertas diferencias entre formas de onda pueden ser imperceptibles. [2] Las técnicas de compresión de datos , como MP3 , aprovechan este hecho. [3] Además, el oído tiene una respuesta no lineal a los sonidos de diferentes niveles de intensidad; esta respuesta no lineal se llama sonoridad . Las redes telefónicas y los sistemas de reducción de ruido de audio hacen uso de este hecho comprimiendo de forma no lineal las muestras de datos antes de la transmisión y luego expandiéndolas para su reproducción. [4] Otro efecto de la respuesta no lineal del oído es que los sonidos que tienen una frecuencia cercana producen notas de tiempo fantasma o productos de distorsión de intermodulación . [5]

El término "psicoacústica" también surge en discusiones sobre psicología cognitiva y los efectos que las expectativas personales, los prejuicios y las predisposiciones pueden tener en las evaluaciones relativas de los oyentes y las comparaciones de la estética y la agudeza sonoras y en las diferentes determinaciones de los oyentes acerca de las cualidades relativas de varios instrumentos musicales. instrumentos e intérpretes. La expresión que uno "escucha lo que uno quiere (o espera) escuchar" puede pertenecer a tales discusiones. [ cita requerida ]

Límites de percepción [ editar ]

Un contorno de igual volumen . Note la sensibilidad máxima alrededor de 2–4 kHz, en el medio de la banda de frecuencia de la voz .

El oído humano puede oír nominalmente sonidos en el rango de 20 Hz (0,02 kHz) a 20 000 Hz (20 kHz). El límite superior tiende a disminuir con la edad; la mayoría de los adultos no pueden oír por encima de los 16 kHz. La frecuencia más baja que se ha identificado como tono musical es de 12 Hz en condiciones ideales de laboratorio. [6] Los tonos entre 4 y 16 Hz se pueden percibir a través del sentido del tacto del cuerpo .

La resolución de frecuencia del oído es de aproximadamente 3,6 Hz dentro de la octava de 1000-2000 Hz. Es decir, los cambios en el tono superiores a 3,6 Hz se pueden percibir en un entorno clínico. [6] Sin embargo, se pueden percibir diferencias de tono incluso más pequeñas a través de otros medios. Por ejemplo, la interferencia de dos tonos a menudo se puede escuchar como una variación repetitiva en el volumen del tono. Esta modulación de amplitud ocurre con una frecuencia igual a la diferencia de frecuencias de los dos tonos y se conoce como latido .

La escala de semitonos utilizada en la notación musical occidental no es una escala de frecuencia lineal sino logarítmica . Otras escalas se han derivado directamente de experimentos sobre la percepción auditiva humana, como la escala mel y la escala Bark (estas se utilizan para estudiar la percepción, pero no generalmente en la composición musical), y son aproximadamente logarítmicas en frecuencia en el extremo de alta frecuencia. , pero casi lineal en el extremo de baja frecuencia.

El rango de intensidad de los sonidos audibles es enorme. Los tímpanos humanos son sensibles a las variaciones en la presión del sonido y pueden detectar cambios de presión desde tan solo unos pocos micropascales (µPa) hasta más de 100 kPa . Por esta razón, el nivel de presión acústica también se mide logarítmicamente, con todas las presiones referenciadas a 20 µPa (o 1,97385 × 10 −10 atm ). Por lo tanto, el límite inferior de audibilidad se define como 0 dB , pero el límite superior no está tan claramente definido. El límite superior es más una cuestión del límite donde el oído se dañará físicamente o con el potencial de causarPérdida auditiva inducida por ruido .

Una exploración más rigurosa de los límites inferiores de audibilidad determina que el umbral mínimo en el que se puede escuchar un sonido depende de la frecuencia. Al medir esta intensidad mínima para probar tonos de varias frecuencias, se puede derivar una curva de umbral absoluto de audición (ATH) dependiente de la frecuencia . Por lo general, el oído muestra un pico de sensibilidad (es decir, su ATH más bajo) entre 1 y 5 kHz, aunque el umbral cambia con la edad, y los oídos más viejos muestran una sensibilidad disminuida por encima de 2 kHz. [7]

El ATH es el más bajo de los contornos de igual volumen . Los contornos de igual volumen indican el nivel de presión sonora (dB SPL), en el rango de frecuencias audibles, que se perciben como de igual volumen. Los contornos de igual volumen fueron medidos por primera vez por Fletcher y Munson en Bell Labs en 1933 utilizando tonos puros reproducidos a través de auriculares, y los datos que recopilaron se denominan curvas de Fletcher-Munson . Debido a que la sonoridad subjetiva era difícil de medir, las curvas de Fletcher-Munson se promediaron sobre muchos sujetos.

Robinson y Dadson refinaron el proceso en 1956 para obtener un nuevo conjunto de curvas de igual volumen para una fuente de sonido frontal medida en una cámara anecoica . Las curvas Robinson-Dadson se estandarizaron como ISO 226 en 1986. En 2003, ISO 226 se revisó como contorno de igual volumen utilizando datos recopilados de 12 estudios internacionales.

Localización de sonido [ editar ]

La localización del sonido es el proceso de determinar la ubicación de una fuente de sonido. El cerebro utiliza diferencias sutiles en el volumen, el tono y la sincronización entre los dos oídos para permitirnos localizar las fuentes de sonido. [8] La localización se puede describir en términos de posición tridimensional: el acimut o ángulo horizontal, el cenit o ángulo vertical y la distancia (para sonidos estáticos) o velocidad (para sonidos en movimiento). [9] Los seres humanos, como la mayoría de los animales de cuatro patas , son expertos en detectar la dirección en la horizontal, pero menos en la vertical debido a que las orejas están colocadas simétricamente. Algunas especies de búhostienen las orejas colocadas asimétricamente y pueden detectar sonido en los tres planos, una adaptación para cazar pequeños mamíferos en la oscuridad. [10]

Efectos de enmascaramiento [ editar ]

Gráfico de enmascaramiento de audio

Supongamos que un oyente puede escuchar una determinada señal acústica en silencio. Cuando se reproduce una señal mientras se reproduce otro sonido (un enmascarador), la señal tiene que ser más fuerte para que el oyente la escuche. El enmascarador no necesita tener los componentes de frecuencia de la señal original para que ocurra el enmascaramiento. Se puede escuchar una señal enmascarada aunque sea más débil que el enmascarador. El enmascaramiento ocurre cuando una señal y un enmascarador se reproducen juntos, por ejemplo, cuando una persona susurra mientras otra persona grita, y el oyente no escucha la señal más débil ya que ha sido enmascarada por el enmascarador más fuerte. El enmascaramiento también puede ocurrir cuando comienza una señal después de que se detiene un enmascarador. Por ejemplo, un solo sonido de aplauso fuerte y repentino puede hacer que los sonidos que siguen sean inaudibles. Los efectos del enmascaramiento hacia atrás son más débiles que el enmascaramiento hacia adelante.El efecto de enmascaramiento se ha estudiado ampliamente en la investigación psicoacústica. Se puede cambiar el nivel del enmascarador y medir el umbral, luego crear un diagrama de una curva de sintonía psicofísica que revelará características similares. Los efectos de enmascaramiento también se utilizan en la codificación de audio con pérdida, comoMP3 .

Falta fundamental [ editar ]

Cuando se les presenta una serie armónica de frecuencias en la relación 2 f , 3 f , 4 f , 5 f , etc. (donde f es una frecuencia específica), los humanos tienden a percibir que el tono es f . Se puede encontrar un ejemplo audible en YouTube. [11]

Software [ editar ]

La codificación de audio perceptual utiliza algoritmos basados ​​en psicoacústica.

El modelo psicoacústico proporciona compresión de señal con pérdida de alta calidad al describir qué partes de una señal de audio digital determinada pueden eliminarse (o comprimirse agresivamente) de forma segura, es decir, sin pérdidas significativas en la calidad percibida (conscientemente) del sonido.

Puede explicar cómo un fuerte aplauso de las manos puede parecer dolorosamente fuerte en una biblioteca silenciosa, pero apenas se nota después de que un automóvil fracasa en una concurrida calle urbana. Esto proporciona un gran beneficio a la relación de compresión general, y el análisis psicoacústico conduce habitualmente a archivos de música comprimidos que tienen un tamaño de 1/10 a 1/12 del tamaño de los masters de alta calidad, pero con una pérdida de calidad notablemente menos proporcional. Esta compresión es una característica de casi todos los formatos modernos de compresión de audio con pérdida. Algunos de estos formatos incluyen Dolby Digital (AC-3), MP3 , Opus , Ogg Vorbis , AAC , WMA , MPEG-1 Layer II (utilizado para la transmisión de audio digitalen varios países) y ATRAC , la compresión utilizada en MiniDisc y algunos modelos de Walkman .

La psicoacústica se basa en gran medida en la anatomía humana , especialmente en las limitaciones del oído para percibir el sonido, como se describió anteriormente. Para resumir, estas limitaciones son:

  • Límite de alta frecuencia
  • Umbral absoluto de audición
  • Enmascaramiento temporal (enmascaramiento hacia adelante, enmascaramiento hacia atrás)
  • Enmascaramiento simultáneo (también conocido como enmascaramiento espectral)

Un algoritmo de compresión puede asignar una prioridad más baja a los sonidos fuera del rango del oído humano. Al alejar cuidadosamente los bits de los componentes sin importancia y acercarlos a los importantes, el algoritmo garantiza que los sonidos que es más probable que perciba un oyente estén representados con mayor precisión.

Música [ editar ]

La psicoacústica incluye temas y estudios que son relevantes para la psicología musical y la musicoterapia . Teóricos como Benjamin Boretz consideran que algunos de los resultados de la psicoacústica son significativos solo en un contexto musical. [12]

Irv Teibel 's serie de entornos LPS (1969-79) son un ejemplo temprano de sonidos disponibles en el mercado liberados expresamente para la mejora de las habilidades psicológicas. [13]

Psicoacústica aplicada [ editar ]

Modelo psicoacústico

La psicoacústica ha disfrutado durante mucho tiempo de una relación simbiótica con la informática , la ingeniería informática y las redes informáticas . Los pioneros de Internet JCR Licklider y Bob Taylor completaron su trabajo a nivel de posgrado en psicoacústica, mientras que BBN Technologies se especializó originalmente en consultoría sobre temas de acústica antes de comenzar a construir las primeras redes informáticas de conmutación de paquetes .

Licklider escribió un artículo titulado "Una teoría dúplex de la percepción del tono". [14]

La psicoacústica se aplica en muchos campos del desarrollo de software, donde los desarrolladores trazan patrones matemáticos probados y experimentales en el procesamiento de señales digitales. Muchos códecs de compresión de audio, como MP3 y Opus, utilizan un modelo psicoacústico para aumentar las relaciones de compresión. El éxito de los sistemas de audio convencionales para la reproducción de música en teatros y hogares puede atribuirse a la psicoacústica [15] y las consideraciones psicoacústicas dieron lugar a nuevos sistemas de audio, como la síntesis psicoacústica de campos sonoros . [16] Además, los científicos han experimentado con éxito limitado en la creación de nuevas armas acústicas, que emiten frecuencias que pueden dañar, dañar o matar.[17] La psicoacústica también se aprovecha en la sonificación para hacer que múltiples dimensiones de datos independientes sean audibles y fácilmente interpretables. [18] Esto permite la guía auditiva sin la necesidad de audio espacial y en juegos de computadora de sonificación [19] y otras aplicaciones, como elvuelo con drones y la cirugía guiada por imágenes . [20] También se aplica hoy en día dentro de la música, donde los músicos y artistas continúan creando nuevas experiencias auditivas al enmascarar frecuencias no deseadas de instrumentos, lo que hace que se realicen otras frecuencias. Otra aplicación más es el diseño de altavoces pequeños o de menor calidad, que pueden aprovechar el fenómeno defaltan los fundamentos para dar el efecto de notas graves a frecuencias más bajas que las que los altavoces son capaces de producir físicamente (ver referencias).

Los fabricantes de automóviles diseñan sus motores e incluso sus puertas para que tengan un cierto sonido. [21]

Ver también [ editar ]

Campos relacionados [ editar ]

  • Neurociencia cognitiva de la música
  • Psicología musical

Temas psicoacústicos [ editar ]

  • Ponderación A , una función de transferencia de volumen perceptual de uso común
  • Prueba ABX
  • Ilusiones auditivas
  • Análisis de escena auditiva incl. Percepción de sonido 3D, localización
  • Latidos binaurales
  • Separación de señal ciega
  • Tono combinado (también tono Tartini)
  • Ilusión de la escala de Deutsch
  • Ancho de banda rectangular equivalente (ERB)
  • Efecto Franssen
  • Ilusión glissando
  • Efecto Haas
  • Efecto hipersónico
  • Procesamiento de lenguaje
  • Efecto levitina
  • Misofonia
  • Afinación musical
  • Efectos del ruido en la salud
  • Ilusión de octava
  • Pitch (música)
  • Efecto de precedencia
  • Psicolingüística
  • Teoría de la distorsión de la tasa
  • Localización de sonido
  • Sonido de uñas raspando la pizarra
  • Enmascaramiento de sonido
  • Reconocimiento de voz
  • Timbre
  • Paradoja del tritono

Referencias [ editar ]

Notas [ editar ]

  1. ^ Ballou, G (2008). Manual para ingenieros de sonido (Cuarta ed.). Burlington: Focal Press. pag. 43.
  2. ^ Christopher J. Plack (2005). El sentido del oído . Routledge. ISBN 978-0-8058-4884-7.
  3. ^ Lars Ahlzen; Canción de Clarence (2003). ¡El Sound Blaster Live! Libro . Sin prensa de almidón. ISBN 978-1-886411-73-9.
  4. ^ Rudolf F. Graf (1999). Diccionario moderno de electrónica . Newnes. ISBN 978-0-7506-9866-5.
  5. ^ Jack Katz; Robert F. Burkard y Larry Medwetsky (2002). Manual de audiología clínica . Lippincott Williams y Wilkins. ISBN 978-0-683-30765-8.
  6. ↑ a b Olson, Harry F. (1967). Música, Física e Ingeniería . Publicaciones de Dover. págs. 248-251. ISBN 978-0-486-21769-7.
  7. ^ Fastl, Hugo; Zwicker, Eberhard (2006). Psicoacústica: hechos y modelos . Saltador. págs. 21-22. ISBN 978-3-540-23159-2.
  8. ^ Thompson, Daniel M. Comprensión del audio: aprovechar al máximo su proyecto o estudio de grabación profesional. Boston, MA: Berklee, 2005. Imprimir.
  9. ^ Carreteras, Curtis. El tutorial de música por ordenador. Cambridge, MA: MIT, 2007. Imprimir.
  10. ^ Lewis, DP (2007): Oídos y audición de búho. Owl Pages [en línea]. Disponible: http://www.owlpages.com/articles.php?section=Owl+Physiology&title=Hearing [2011, 5 de abril]
  11. ^ Acústica, Musical. "Falta fundamental" . YouTube . Consultado el 19 de agosto de 2019 .
  12. ^ Sterne, Jonathan (2003). El pasado audible: orígenes culturales de la reproducción de sonido . Durham: Prensa de la Universidad de Duke. ISBN 9780822330134.
  13. ^ Cummings, Jim. Irv Teibel murió esta semana: creador de los LP de Ambientes de los años 70 . Oreja de tierra . Consultado el 18 de noviembre de 2015 .
  14. ^ Licklider, JCR (enero de 1951). "Una teoría dúplex de la percepción del tono" (PDF) . La Revista de la Sociedad Estadounidense de Acústica . 23 (1): 147. Código Bibliográfico : 1951ASAJ ... 23..147L . doi : 10.1121 / 1.1917296 . Archivado (PDF) desde el original el 2 de septiembre de 2016.
  15. ^ Ziemer, Tim (2020). "Sonido estereofónico convencional". Síntesis del campo sonoro de la música psicoacústica . Investigación actual en musicología sistemática. 7 . Cham: Springer. págs. 171–202. doi : 10.1007 / 978-3-030-23033-3_7 . ISBN 978-3-030-23033-3.
  16. ^ Ziemer, Tim (2020). Síntesis del campo sonoro de la música psicoacústica . Investigación actual en musicología sistemática. 7 . Cham: Springer. doi : 10.1007 / 978-3-030-23033-3 . ISBN 978-3-030-23032-6. ISSN  2196-6974 .
  17. ^ "Copia archivada" . Archivado desde el original el 19 de julio de 2010 . Consultado el 6 de febrero de 2010 .Mantenimiento de CS1: copia archivada como título ( enlace )
  18. ^ Ziemer, Tim; Schultheis, Holger; Black, David; Kikinis, Ron (2018). "Sonificación interactiva psicoacústica para navegación de corto alcance". Acta Acustica United con Acustica . 104 (6): 1075–1093. doi : 10.3813 / AAA.919273 .
  19. ^ CURAT. "Juegos y Entrenamientos para Cirugía Mínimamente Invasiva" . CURAT . Universidad de Bremen . Consultado el 15 de julio de 2020 .
  20. ^ Ziemer, Tim; Nuchprayoon, Nuttawut; Schultheis, Holger (2019). "Sonificación psicoacústica como interfaz de usuario para la interacción hombre-máquina" (PDF) . Revista Internacional de Sociedad de Informática . 12 (1). arXiv : 1912.08609 . doi : 10.13140 / RG.2.2.14342.11848 . Consultado el 15 de julio de 2020 .
  21. ^ Tarmy, James (5 de agosto de 2014). "Las puertas de Mercedes tienen un sonido característico: así es como se hace" . Bloomberg Business . Consultado el 10 de agosto de 2020 .

Fuentes [ editar ]

  • E. Larsen y RM Aarts (2004), extensión de ancho de banda de audio. Aplicación de Psicoacústica, Procesamiento de Señales y Diseño de Altavoces. , J. Wiley.
  • Larsen E .; Aarts RM (marzo de 2002). "Reproducción de señales de tono bajo a través de pequeños altavoces" (PDF) . Revista de la Sociedad de Ingeniería de Audio . 50 (3): 147–64.[ enlace muerto ]
  • Oohashi T .; Kawai N .; Nishina E .; Honda M .; Yagi R .; Nakamura S .; Morimoto M .; Maekawa T .; Yonekura Y .; Shibasaki H. (febrero de 2006). "El papel del sistema biológico distinto de la conducción aérea auditiva en la aparición del efecto hipersónico" . Investigación del cerebro . 1073-1074: 339-347. doi : 10.1016 / j.brainres.2005.12.096 . PMID  16458271 .

Enlaces externos [ editar ]

  • El oído musical: percepción del sonido
  • Müller C, Schnider P, Persterer A, Opitz M, Nefjodova MV, Berger M (1993). "[Psicoacústica aplicada en vuelos espaciales]". Wien Med Wochenschr (en alemán). 143 (23-24): 633-5. PMID  8178525 .—Simulación de audición en campo libre por auriculares
  • GPSYCHO: un modelo psicoacústico y modelador de ruido de código abierto para codificadores MP3 basados ​​en ISO.
  • Definición de: codificación de audio perceptual
  • Subprograma Java que demuestra el enmascaramiento
  • Enmascaramiento temporal
  • Conceptos de HyperPhysics: sonido y audición
  • El MP3 como objeto estándar