La envolvente temporal (ENV) y la estructura fina temporal (TFS) son cambios en la amplitud y frecuencia del sonido percibido por los humanos a lo largo del tiempo. Estos cambios temporales son responsables de varios aspectos de la percepción auditiva, incluida la percepción del volumen , el tono y el timbre y la audición espacial .
Los sonidos complejos, como el habla o la música, son descompuestos por el sistema auditivo periférico de los seres humanos en bandas de frecuencia estrechas. Las señales de banda estrecha resultantes transmiten información en diferentes escalas de tiempo que van desde menos de un milisegundo hasta cientos de milisegundos. Se ha propuesto una dicotomía entre señales lentas de "envolvente temporal" y señales más rápidas de "estructura fina temporal" para estudiar varios aspectos de la percepción auditiva (p. Ej., Volumen , percepción de tono y timbre , análisis de la escena auditiva , localización del sonido ) en dos escalas de tiempo distintas en cada banda de frecuencia. [1] [2] [3] [4] [5] [6] [7]Durante las últimas décadas, una gran cantidad de estudios psicofísicos, electrofisiológicos y computacionales basados en esta dicotomía envoltura / estructura fina han examinado el papel de estas señales temporales en la identificación y comunicación del sonido, cómo estas señales temporales son procesadas por el sistema auditivo periférico y central. y los efectos del envejecimiento y el daño coclear en el procesamiento auditivo temporal. Aunque se ha debatido la dicotomía envolvente / estructura fina y quedan dudas sobre cómo se codifican realmente las señales temporales de estructura fina en el sistema auditivo, estos estudios han llevado a una gama de aplicaciones en varios campos, incluido el procesamiento del habla y audio, la audiología clínica y rehabilitación de la hipoacusia neurosensorial mediante audífonos o implantes cocleares .
Definición
Las nociones de envoltura temporal y estructura fina temporal pueden tener diferentes significados en muchos estudios. Una distinción importante a hacer es entre la descripción física (es decir, acústica) y la biológica (o perceptual) de estas señales ENV y TFS.
Cualquier sonido cuyos componentes de frecuencia cubren un rango estrecho (llamado señal de banda estrecha) puede considerarse como una envolvente (ENV p , donde p denota la señal física) superpuesta a una portadora de oscilación más rápida, la estructura fina temporal (TFS p ). [8]
Muchos sonidos de la vida cotidiana, incluidos el habla y la música, son de banda ancha; los componentes de frecuencia se distribuyen en un amplio rango y no existe una forma bien definida de representar la señal en términos de ENV p y TFS p . Sin embargo, en una cóclea que funciona normalmente , las señales complejas de banda ancha se descomponen mediante el filtrado en la membrana basilar (BM) dentro de la cóclea en una serie de señales de banda estrecha. [9] Por lo tanto, la forma de onda en cada lugar del BM puede considerarse como una envolvente (ENV BM ) superpuesta a una portadora de oscilación más rápida, la estructura fina temporal (TFS BM ). [10] El ENV BM y TFS BM dependen del lugar a lo largo del BM. En el extremo apical, que está sintonizado en frecuencias bajas (audio), ENV BM y TFS BM varían relativamente lentamente con el tiempo, mientras que en el extremo basal, que está sintonizado en frecuencias altas, tanto ENV BM como TFS BM varían más rápidamente con el tiempo. . [10]
Tanto ENV BM como TFS BM están representados en los patrones de tiempo de los potenciales de acción en el nervio auditivo [11], estos se denominan ENV n y TFS n . TFS n está representado de manera más prominente en neuronas sintonizadas en frecuencias bajas, mientras que ENV n está representado de manera más prominente en neuronas sintonizadas en frecuencias altas (audio). [11] [12] Para una señal de banda ancha, no es posible manipular TFS p sin afectar a ENV BM y ENV n , y no es posible manipular ENV p sin afectar a TFS BM y TFS n . [13] [14]
Procesamiento de envolvente temporal (ENV)
Aspectos neurofisiológicos
La representación neuronal de la envolvente del estímulo, ENV n , se ha estudiado típicamente utilizando modulaciones ENV p bien controladas , es decir, sonidos modulados en amplitud (AM) sinusoidalmente . El filtrado coclear limita el rango de frecuencias de MA codificadas en las fibras individuales del nervio auditivo . En el nervio auditivo, la fuerza de la representación neural de AM disminuye al aumentar la tasa de modulación. A nivel del núcleo coclear , varios tipos de células muestran una mejora de la información ENV n . Las celdas multipolares pueden mostrar la sintonización de paso de banda a los tonos AM con frecuencias de AM entre 50 y 1000 Hz. [15] [16] Algunas de estas células muestran una excelente respuesta al ENV n y proporcionan entradas de banda lateral inhibidoras a otras células en el núcleo coclear dando un correlato fisiológico de liberación de enmascaramiento de comodulación, un fenómeno por el cual la detección de una señal en un enmascarador mejora cuando el enmascarador ha correlacionado las fluctuaciones de la envolvente en la frecuencia (consulte la sección siguiente). [17] [18]
Las respuestas a las señales de la envoltura temporal del habla u otros sonidos complejos persisten por la vía auditiva, eventualmente a los diversos campos de la corteza auditiva en muchos animales. En la corteza auditiva primaria , las respuestas pueden codificar frecuencias de AM mediante el bloqueo de fase hasta aproximadamente 20-30 Hz, [19] [20] [21] [22] mientras que las frecuencias más rápidas inducen respuestas sostenidas y, a menudo, sintonizadas. [23] [24] Se ha demostrado una representación topográfica de la tasa de MA en la corteza auditiva primaria de los macacos despiertos. [25] Esta representación es aproximadamente perpendicular al eje del gradiente tonotópico, consistente con una organización ortogonal de características espectrales y temporales en la corteza auditiva. La combinación de estas respuestas temporales con la selectividad espectral de las neuronas A1 da lugar a los campos receptivos espectro-temporales que a menudo capturan bien las respuestas corticales a los sonidos modulados complejos. [26] [27] En los campos corticales auditivos secundarios, las respuestas se vuelven temporalmente más lentas y espectralmente más amplias, pero aún pueden sincronizarse con las características más destacadas del habla y los sonidos musicales. [28] [29] [30] [31] La sintonización de frecuencias de AM por debajo de aproximadamente 64 Hz también se encuentra en la corteza auditiva humana [32] [33] [34] [35] según lo revelado por técnicas de imágenes cerebrales ( fMRI ) y grabaciones corticales en pacientes epilépticos ( electrocorticografía ). Esto es consistente con los estudios neuropsicológicos de pacientes con daño cerebral [36] y con la noción de que el sistema auditivo central realiza alguna forma de descomposición espectral del ENV p de los sonidos entrantes. Se ha demostrado que los rangos en los que las respuestas corticales codifican bien las señales de la envolvente temporal del habla son predictivos de la capacidad humana para comprender el habla. En la circunvolución temporal superior humana (STG), se ha encontrado una organización espacial anteroposterior de la sintonización de modulación espectro-temporal en respuesta a los sonidos del habla, estando el STG posterior sintonizado para sonidos del habla que varían temporalmente rápidamente con modulaciones espectrales bajas y el STG anterior estar sintonizado para sonidos del habla variables temporalmente lentos con modulaciones espectrales altas. [37]
Se ha observado un aspecto inesperado del bloqueo de fase en la corteza auditiva en las respuestas provocadas por estímulos acústicos complejos con espectrogramas que exhiben envolventes relativamente lentas (<20 Hz), pero que son transmitidas por modulaciones rápidas que son tan altas como cientos de Hertz. El habla y la música, así como varios estímulos de ruido modulado tienen tal estructura temporal. [38] Para estos estímulos, las respuestas corticales bloquean la fase tanto de la envolvente como de la estructura fina inducida por interacciones entre armónicos no resueltos del sonido, lo que refleja el tono del sonido y excede los límites inferiores típicos de bloqueo de fase cortical a los sobres de unos decenas de Hertz. Esta relación paradójica [38] [39] entre el bloqueo lento y rápido de la fase cortical con la “estructura fina” del portador se ha demostrado tanto en la corteza auditiva [38] como en la visual [40] . También se ha demostrado que se manifiesta ampliamente en las mediciones de los campos receptivos espectro-temporales de la corteza auditiva primaria, lo que les confiere una precisión temporal inesperadamente fina y una selectividad que bordea una resolución de 5 a 10 ms. [38] [40] Las causas subyacentes de este fenómeno se han atribuido a varios orígenes posibles, incluida la depresión y facilitación sinápticas no lineales, y / o una red cortical de excitación talámica e inhibición cortical. [38] [41] [42] [43] Hay muchas razones funcionalmente significativas y perceptualmente relevantes para la coexistencia de estos dos modos de respuesta dinámica complementarios. Incluyen la capacidad de codificar con precisión los inicios y otros 'eventos' rápidos en el ENV p de señales acústicas complejas y otras señales sensoriales, características que son críticas para la percepción de consonantes (habla) y sonidos de percusión (música), así como la textura. de sonidos complejos. [38] [44]
Aspectos psicoacústicos
La percepción de ENV p depende de qué tasas de AM estén contenidas en la señal. Las frecuencias bajas de AM, en el rango de 1 a 8 Hz, se perciben como cambios en la intensidad percibida, es decir, fluctuaciones de volumen (una percepción que también puede evocarse mediante modulación de frecuencia, FM); a velocidades más altas, la AM se percibe como rugosidad, y la mayor sensación de rugosidad ocurre alrededor de los 70 Hz; [45] a tasas aún más altas, AM puede evocar una percepción de tono débil correspondiente a la tasa de modulación. [46] Las tormentas, el crepitar del fuego, el gorjeo de los grillos o los caballos al galope producen "texturas sonoras", el resultado colectivo de muchos eventos acústicos similares, cuya percepción está mediada por las estadísticas ENV n . [47] [48]
El umbral de detección auditiva para AM en función de la frecuencia de AM, denominado función de transferencia de modulación temporal (TMTF), [49] es mejor para frecuencias de AM en el rango de 4 a 150 Hz y empeora fuera de ese rango [49] [ 50] [51] La frecuencia de corte del TMTF proporciona una estimación de la agudeza temporal (resolución temporal) del sistema auditivo. Esta frecuencia de corte corresponde a una constante de tiempo de aproximadamente 1 a 3 ms para el sistema auditivo de los humanos con audición normal.
Las fluctuaciones de envolvente correlacionadas a través de la frecuencia en un enmascarador pueden ayudar a la detección de una señal de tono puro, un efecto conocido como liberación de enmascaramiento de comodulación. [18]
La AM aplicada a una portadora determinada puede interferir perceptualmente con la detección de una AM objetivo impuesta a la misma portadora, un efecto denominado enmascaramiento de modulación . [52] [53] Los patrones de enmascaramiento de modulación están sintonizados (se produce un mayor enmascaramiento para el enmascaramiento y los AM objetivo cercanos en la tasa de modulación), lo que sugiere que el sistema auditivo humano está equipado con canales de frecuencia selectiva para AM. Además, la AM aplicada a portadoras espectralmente remotas puede interferir perceptualmente con la detección de AM en un sonido objetivo, un efecto denominado interferencia de detección de modulación . [54] La noción de canales de modulación también está respaldada por la demostración de efectos de adaptación selectiva en el dominio de la modulación. [55] [56] [57] Estos estudios muestran que los umbrales de detección de AM se elevan selectivamente por encima de los umbrales previos a la exposición cuando la frecuencia de la portadora y la velocidad de AM del adaptador son similares a las del tono de prueba.
Los oyentes humanos son sensibles a señales AM de "segundo orden" relativamente lentas que corresponden a fluctuaciones en la fuerza de AM. Estas señales surgen de la interacción de diferentes velocidades de modulación, anteriormente descritas como "latidos" en el dominio de la frecuencia de la envolvente. La percepción de AM de segundo orden se ha interpretado como resultado de mecanismos no lineales en la vía auditiva que producen un componente de distorsión audible en la frecuencia de la envolvente en el espectro de modulación interno de los sonidos. [58] [59] [60]
Las diferencias de tiempo interaural en la envolvente proporcionan señales binaurales incluso a altas frecuencias donde no se puede usar TFS n . [61]
Modelos de procesamiento de sobres normales
El modelo informático más básico de procesamiento ENV es el modelo de integrador con fugas . [62] [49] Este modelo extrae la envolvente temporal del sonido (ENV p ) mediante filtrado de paso de banda, rectificación de media onda (que puede ir seguida de compresión de amplitud de acción rápida ) y filtrado de paso bajo con una frecuencia de corte de aproximadamente 60 y 150 Hz. El integrador con fugas se utiliza a menudo con una estadística de decisión basada en la potencia envolvente resultante, la relación máxima / mínima o el factor de cresta. Este modelo tiene en cuenta la pérdida de sensibilidad auditiva para frecuencias de AM superiores a aproximadamente 60-150 Hz para portadoras de ruido de banda ancha. [49] Basado en el concepto de selectividad de frecuencia para AM, [53] el modelo de percepción de Torsten Dau [63] incorpora filtros de modulación de paso de banda ampliamente sintonizados (con un valor de Q alrededor de 1) para tener en cuenta los datos de una amplia variedad de tareas psicoacústicas. y particularmente la detección de AM para portadoras de ruido con diferentes anchos de banda, teniendo en cuenta sus fluctuaciones intrínsecas de envolvente. Este modelo de se ha ampliado para dar cuenta de la liberación de enmascaramiento de comodulación (consulte las secciones anteriores). [64] Se han estimado las formas de los filtros de modulación [65] y un “modelo de espectro de potencia de envolvente” (EPSM) basado en estos filtros puede tener en cuenta los patrones de enmascaramiento de AM y la discriminación de profundidad de AM. [66] El EPSM se ha ampliado a la predicción de la inteligibilidad del habla [67] y para dar cuenta de los datos de una amplia variedad de tareas psicoacústicas. [68] También se ha desarrollado un modelo de procesamiento fisiológico que simula las respuestas del tronco encefálico para tener en cuenta la detección de MA y los patrones de enmascaramiento de MA. [69]
Procesamiento de estructura fina temporal (TFS)
Aspectos neurofisiológicos
La representación neuronal de la estructura fina temporal, TFS n , se ha estudiado utilizando estímulos con TFS p bien controlado : tonos puros, tonos complejos armónicos y tonos de frecuencia modulada (FM).
Las fibras del nervio auditivo pueden representar sonidos de baja frecuencia a través de sus descargas de fase bloqueada (es decir, información de TFS n ). El límite de frecuencia superior para el bloqueo de fase depende de la especie. Es de aproximadamente 5 kHz en el gato, 9 kHz en la lechuza común y solo 4 kHz en el conejillo de indias. No conocemos el límite superior del bloqueo de fase en los seres humanos, pero las estimaciones indirectas actuales sugieren que es de unos 4-5 kHz. [70] El bloqueo de fase es una consecuencia directa del proceso de transducción con un aumento en la probabilidad de que ocurra la apertura del canal de transducción con un estiramiento de los estereocilios y una disminución en la apertura del canal que ocurre cuando se empuja en la dirección opuesta. Esto ha llevado a algunos a sugerir que el bloqueo de fase es un epifenómeno. El límite superior parece estar determinado por una cascada de filtros de paso bajo a nivel de la célula ciliada interna y la sinapsis del nervio auditivo . [71] [72]
TFS n información en el nervio auditivo se pueden utilizar para codificar la frecuencia (audio) de sonidos de baja frecuencia, incluyendo los tonos individuales y más complejo estímulos tales como tonos de frecuencia modulada o vocales de estado estable (véase el papel y las aplicaciones de voz y música ).
El sistema auditivo hace todo lo posible para preservar esta información de TFS n con la presencia de sinapsis gigantes (bulbos terminales de Held) en el núcleo coclear ventral . Estas sinapsis entran en contacto con células tupidas (esféricas y globulares) y transmiten fielmente (o mejoran) la información temporal presente en las fibras del nervio auditivo a estructuras superiores en el tronco del encéfalo . [73] Las células tupidas se proyectan hacia la oliva superior medial y las células globulares se proyectan hacia el núcleo medial del cuerpo trapezoide (MNTB). El MNTB también se caracteriza por sinapsis gigantes (cálices de Held) y proporciona una inhibición sincronizada con precisión a la aceituna superior lateral . El olivo superior medial y lateral y el MNTB están involucrados en la codificación del tiempo interaural y las diferencias de intensidad. Existe una aceptación generalizada de que la información temporal es crucial en la localización del sonido, pero aún existe controversia en cuanto a si se utiliza la misma información temporal para codificar la frecuencia de sonidos complejos.
Sigue habiendo varios problemas con la idea de que el TFS n es importante en la representación de los componentes de frecuencia de los sonidos complejos. El primer problema es que la información temporal se deteriora a medida que pasa por etapas sucesivas de la vía auditiva (presumiblemente debido al filtrado dendrítico de paso bajo). Por lo tanto, el segundo problema es que la información temporal debe extraerse en una etapa temprana de la vía auditiva. Actualmente no se ha identificado tal etapa, aunque existen teorías sobre cómo la información temporal se puede convertir en información de tasa (ver la sección Modelos de procesamiento normal: Limitaciones ).
Aspectos psicoacústicos
A menudo se asume que muchas capacidades perceptivas dependen de la capacidad del sistema auditivo monoaural y binaural para codificar y utilizar señales TFS n evocadas por componentes en sonidos con frecuencias por debajo de aproximadamente 1–4 kHz. Estas capacidades incluyen discriminación de frecuencia, [74] [4] [75] [76] discriminación de la frecuencia fundamental de los sonidos armónicos, [75] [4] [76] detección de FM a frecuencias inferiores a 5 Hz, [77] melodía reconocimiento de secuencias de tonos puros y tonos complejos, [74] [4] lateralización y localización de tonos puros y tonos complejos, [78] y segregación de sonidos armónicos concurrentes (como los sonidos del habla). [79] Parece que las señales de TFS n requieren una representación tonotópica ( lugar ) correcta para ser procesada de manera óptima por el sistema auditivo. [80] Además, se ha demostrado la percepción del tono musical para tonos complejos con todos los armónicos por encima de 6 kHz, lo que demuestra que no depende completamente del bloqueo de la fase neural con las señales de TFS BM (es decir, TFS n ). [81]
En cuanto a la detección de FM, la visión actual supone que en el sistema auditivo normal, FM se codifica a través de señales TFS n cuando la frecuencia de FM es baja (<5 Hz) y cuando la frecuencia de la portadora está por debajo de unos 4 kHz, [77] [82 ] [83] [84] ya través de ENV n señales cuando la FM es rápida o cuando la frecuencia de la portadora es superior a 4 kHz. [77] [85] [86] [87] [84] Esto está respaldado por registros de una sola unidad en la parte inferior del tronco encefálico. [73] Según este punto de vista, las señales de TFS n no se utilizan para detectar FM con frecuencias superiores a unos 10 Hz porque el mecanismo de decodificación de la información de TFS n es "lento" y no puede seguir los cambios rápidos de frecuencia. [77] Varios estudios han demostrado que la sensibilidad auditiva a FM lenta a baja frecuencia portadora está asociada con la identificación del habla tanto para personas con audición normal como con deficiencias auditivas cuando la recepción del habla está limitada por degradaciones acústicas (por ejemplo, filtrado) o sonidos del habla concurrentes. [88] [89] [90] [91] [92] Esto sugiere que la inteligibilidad del habla sólida está determinada por el procesamiento preciso de las señales de TFS n .
Modelos de procesamiento normal: limitaciones
La separación de un sonido en ENV py TFS p parece inspirada en parte por cómo se sintetizan los sonidos y por la disponibilidad de una forma conveniente de separar un sonido existente en ENV y TFS, a saber, la transformación de Hilbert . Existe el riesgo de que esta visión del procesamiento auditivo [93] esté dominada por estos conceptos físicos / técnicos, de manera similar a cómo se conceptualizó durante mucho tiempo el mapeo coclear de frecuencia a lugar en términos de la transformada de Fourier . Fisiológicamente, no hay indicios de una separación de ENV y TFS en el sistema auditivo para etapas hasta el núcleo coclear . Solo en esa etapa parece que las vías paralelas, que potencialmente mejoran la información de ENV n o TFS n (o algo similar), pueden implementarse a través de las características de respuesta temporal de diferentes tipos de células del núcleo coclear. [73] Por lo tanto, puede ser útil simular mejor los tipos de células del núcleo coclear para comprender los verdaderos conceptos del procesamiento paralelo creado a nivel del núcleo coclear. Estos conceptos pueden estar relacionados con la separación de ENV y TFS, pero es poco probable que se realicen como la transformada de Hilbert.
Se puede utilizar un modelo computacional del sistema auditivo periférico [94] [95] para simular las respuestas de las fibras nerviosas auditivas a sonidos complejos como el habla y cuantificar la transmisión (es decir, la representación interna) de señales ENV n y TFS n . En dos estudios de simulación, [96] [97] se cuantificó la información de la tasa media y la sincronización de los picos a la salida de dicho modelo para caracterizar, respectivamente, la tasa a corto plazo de disparo neural (ENV n ) y el nivel de sincronización debido al bloqueo de fase (TFS n ) en respuesta a los sonidos del habla degradados por los codificadores de voz. [98] [99] Las mejores predicciones del modelo de inteligibilidad de voz codificada se encontraron cuando se incluyeron señales ENV n y TFS n , lo que proporciona evidencia de que las señales TFS n son importantes para la inteligibilidad cuando las señales ENV p del habla se degradan.
En un nivel más fundamental, se utilizó un modelo computacional similar para demostrar que la dependencia funcional de las diferencias de frecuencia apenas perceptibles humanas en la frecuencia de tono puro no se tuvo en cuenta a menos que se incluyera información temporal (en particular, la mayoría para las frecuencias medias-altas, incluso por encima del límite nominal en el bloqueo de la fase fisiológica). [100] [101] Sin embargo, una advertencia de la mayoría de los modelos TFS es que el rendimiento óptimo del modelo con información temporal generalmente sobreestima el rendimiento humano.
Una visión alternativa es suponer que la información de TFS n a nivel del nervio auditivo se convierte en información de velocidad-lugar (ENV n ) en una etapa posterior del sistema auditivo (p. Ej., El tronco encefálico inferior). Varios estudios de modelado propusieron que los mecanismos neuronales para decodificar TFS n se basan en la correlación de las salidas de lugares adyacentes. [102] [103] [104] [105] [106]
Papel en la percepción del habla y la música.
Papel de la envolvente temporal en la percepción del habla y la música
El ENV p juega un papel fundamental en muchos aspectos de la percepción auditiva, incluida la percepción del habla y la música. [2] [7] [108] [109] El reconocimiento de voz es posible utilizando señales relacionadas con ENV p , incluso en situaciones en las que la información espectral original y TFS p están muy degradados. [110] De hecho, cuando el TFS p espectralmente local de una oración se combina con el ENV p de una segunda oración, solo se escuchan las palabras de la segunda oración. [111] Las tasas ENV p más importantes para el habla son aquellas por debajo de aproximadamente 16 Hz, correspondientes a fluctuaciones en la tasa de sílabas. [112] [107] [113] Por otro lado, el contorno de frecuencia fundamental (" tono ") de los sonidos del habla se transmite principalmente a través de señales TFS p , [107] aunque cierta información sobre el contorno se puede percibir a través de fluctuaciones rápidas de envolvente correspondiente a la frecuencia fundamental. [2] Para la música, las tasas ENV p lentas transmiten información de ritmo y tempo, mientras que las tasas más rápidas transmiten las propiedades de inicio y compensación del sonido (ataque y caída, respectivamente) que son importantes para la percepción del timbre. [114]
Papel de TFS en la percepción del habla y la música
Se cree que la capacidad para procesar con precisión la información de TFS p juega un papel en nuestra percepción del tono (es decir, la altura percibida de los sonidos), una sensación importante para la percepción de la música, así como nuestra capacidad para comprender el habla, especialmente en presencia de ruido de fondo. [4]
Papel de TFS en la percepción del tono
Aunque los mecanismos de recuperación de tono en el sistema auditivo todavía son un tema de debate, [76] [115] La información de TFS n puede usarse para recuperar el tono de tonos puros de baja frecuencia [75] y estimar las frecuencias individuales de los (ca. 1º-8º) armónicos de un sonido complejo, [116] frecuencias a partir de las cuales se puede recuperar la frecuencia fundamental del sonido según, por ejemplo, modelos de ajuste de patrones de percepción del tono. [117] También se ha sugerido un papel de la información TFS n en la percepción de tono de sonidos complejos que contienen armónicos intermedios (ca. 7º-16º) [118] y puede explicarse por modelos temporales o espectrotemporales [119] de percepción de tono. Las señales de TFS n degradadas transmitidas por los dispositivos de implante coclear también pueden ser en parte responsables de la percepción de la música deficiente de los receptores de implantes cocleares. [120]
Papel de las señales de TFS en la percepción del habla
Se cree que las señales p de TFS son importantes para la identificación de hablantes y para la identificación de tonos en idiomas tonales . [121] Además, varios estudios de codificadores de voz han sugerido que las señales p de TFS contribuyen a la inteligibilidad del habla en ambientes silenciosos y ruidosos. [98] Aunque es difícil aislar TFS p de las señales ENV p , [109] [122] hay evidencia de estudios en oyentes con problemas de audición de que la percepción del habla en presencia de ruido de fondo puede explicarse en parte por la capacidad de procesar con precisión TFS p , [92] [99] aunque la capacidad de "escuchar en las caídas" de los enmascaradores fluctuantes no parece depender de las señales periódicas de TFS p . [123]
Papel en la percepción del sonido ambiental
Los sonidos ambientales se pueden definir en términos generales como sonidos no hablados y no musicales en el entorno del oyente que pueden transmitir información significativa sobre los objetos y eventos circundantes. [124] Los sonidos ambientales son muy heterogéneos en términos de sus características acústicas y tipos de fuentes, y pueden incluir vocalizaciones de humanos y animales, eventos relacionados con el agua y el clima, sonidos de señales mecánicas y electrónicas. Dada una gran variedad de fuentes de sonido que dan lugar a sonidos ambientales, tanto ENV p como TFS p juegan un papel importante en su percepción. Sin embargo, las contribuciones relativas de ENV p y TFS p pueden diferir considerablemente para sonidos ambientales específicos. Esto se refleja en la variedad de medidas acústicas que se correlacionan con diferentes características perceptivas de objetos y eventos. [125] [126] [127]
Los primeros estudios destacaron la importancia de los patrones temporales basados en envolventes en la percepción de los eventos ambientales. Por ejemplo, Warren & Verbrugge, demostraron que los sonidos construidos de una botella de vidrio caída al suelo se percibían como rebotando cuando las regiones de alta energía en cuatro bandas de frecuencia diferentes se alineaban temporalmente, produciendo picos de amplitud en la envolvente. [128] Por el contrario, cuando la misma energía espectral se distribuyó aleatoriamente a través de bandas, los sonidos se escucharon como rompiéndose. Estudios más recientes que utilizaron simulaciones de codificador de voz del procesamiento de implantes cocleares demostraron que muchos sonidos con patrones temporales se pueden percibir con poca información espectral original, basada principalmente en señales temporales. [126] [127] Sonidos como pisadas, caballos al galope, helicópteros volando, ping-pong, aplausos, mecanografía se identificaron con una alta precisión del 70% o más con un solo canal de ruido de banda ancha modulado por envolvente o con solo dos canales de frecuencia. En estos estudios, las medidas acústicas basadas en la envolvente, como el número de ráfagas y picos en la envolvente, predecían la capacidad de los oyentes para identificar los sonidos basándose principalmente en las señales de ENV p . Por otro lado, la identificación de sonidos ambientales breves sin un patrón temporal fuerte en ENV p puede requerir un número mucho mayor de canales de frecuencia para percibir. Los sonidos como la bocina de un coche o el silbato de un tren se identificaron mal incluso con hasta 32 canales de frecuencia. [126] Los oyentes con implantes cocleares, que transmiten información de envolvente para bandas de frecuencia específicas, pero no transmiten TFS p , tienen capacidades considerablemente reducidas en la identificación de sonidos ambientales comunes. [129] [130] [131]
Además, los sonidos ambientales individuales generalmente se escuchan dentro del contexto de escenas auditivas más grandes donde los sonidos de múltiples fuentes pueden superponerse en el tiempo y la frecuencia. Cuando se escuchan dentro de una escena auditiva, la identificación precisa de los sonidos ambientales individuales depende de la capacidad de segregarlos de otras fuentes de sonido o corrientes auditivas en la escena auditiva, lo que implica una mayor dependencia de las señales de ENV p y TFS p (ver Papel en la escena auditiva análisis ).
Papel en el análisis de la escena auditiva
El análisis de la escena auditiva se refiere a la capacidad de percibir por separado los sonidos que provienen de diferentes fuentes. Cualquier diferencia acústica puede potencialmente conducir a una segregación auditiva, [132] y por lo tanto, cualquier señal basada en ENV p o TFS p probablemente ayude a segregar fuentes de sonido en competencia. [133] Tales señales involucran percepciones como el tono. [134] [135] [136] [137] Las señales binaurales de TFS p que producen diferencias de tiempo interaural no siempre han resultado en una clara segregación de la fuente, particularmente con fuentes presentadas simultáneamente, aunque se ha logrado una segregación exitosa de los sonidos secuenciales, como el ruido o el habla. informó. [138]
Efectos de la edad y la pérdida auditiva en el procesamiento de la envolvente temporal
Aspectos de desarrollo
En la infancia, los umbrales conductuales de detección de la MA [139] y los umbrales de enmascaramiento hacia adelante o hacia atrás [139] [140] [141] observados en bebés de 3 meses son similares a los observados en adultos. Los estudios electrofisiológicos realizados en bebés de 1 mes con tonos puros AM de 2000 Hz indican cierta inmadurez en la respuesta de seguimiento de la envolvente (EFR). Aunque los bebés que duermen y los adultos sedados muestran el mismo efecto de la tasa de modulación sobre la EFR, las estimaciones de los bebés fueron generalmente más deficientes que las de los adultos. [142] [143] Esto concuerda con los estudios de comportamiento realizados con niños en edad escolar que muestran diferencias en los umbrales de detección de MA en comparación con los adultos. Los niños muestran sistemáticamente umbrales de detección de MA peores que los adultos hasta los 10-11 años. Sin embargo, la forma del TMTF (el límite) es similar a la de los adultos para los niños más pequeños de 5 años. [144] [145] Aún se debaten los factores sensoriales versus no sensoriales para esta larga maduración, [146] pero los resultados en general parecen depender más de la tarea o de la complejidad del sonido para bebés y niños que para adultos. [147] Con respecto al desarrollo del procesamiento ENV p del habla , los estudios de codificador de voz sugieren que los bebés de tan solo 3 meses pueden discriminar un cambio en las consonantes cuando se conserva la información ENV p más rápida de las sílabas (<256 Hz), pero menos cuando sólo está disponible el ENV p más lento (<8 Hz). [148] Los niños mayores de 5 años muestran habilidades similares a las de los adultos para discriminar los cambios de consonantes en función de las señales de ENV p (<64 Hz). [149]
Aspectos neurofisiológicos
En general, se cree que los efectos de la pérdida auditiva y la edad sobre la codificación neural son menores para las respuestas de envolvente que varían lentamente (es decir, ENV n ) que para la estructura fina temporal que varía rápidamente (es decir, TFS n ). [150] [151] Se ha observado una codificación mejorada de ENV n después de una pérdida auditiva inducida por ruido en las respuestas auditivas periféricas de neuronas individuales [152] y en las respuestas evocadas centrales del mesencéfalo auditivo. [153] La mejora en la codificación ENV n de los sonidos de banda estrecha se produce en todo el rango de frecuencias de modulación codificadas por neuronas individuales. [154] Para los sonidos de banda ancha, el rango de frecuencias de modulación codificadas en las respuestas deterioradas es más amplio de lo normal (extendiéndose a frecuencias más altas), como se esperaba de la selectividad de frecuencia reducida asociada con la disfunción de las células ciliadas externas. [155] La mejora observada en las respuestas de la envoltura neural es consistente con la percepción auditiva mejorada de las modulaciones después del daño coclear, que comúnmente se cree que es el resultado de la pérdida de la compresión coclear que ocurre con la disfunción de las células ciliadas externas debido a la edad o la sobreexposición al ruido. [156] Sin embargo, la influencia de la disfunción de las células ciliadas internas (p. Ej., Crecimiento de respuesta más superficial para daño leve a moderado y crecimiento más pronunciado para daño severo) puede confundir los efectos de la disfunción de las células ciliadas externas en el crecimiento de respuesta general y, por lo tanto, ENV n codificación. [152] [157] Por lo tanto, no es sorprendente que los efectos relativos de la disfunción de las células ciliadas externas e internas se hayan predicho con modelos para crear diferencias individuales en la inteligibilidad del habla basadas en la fuerza de la codificación de la envolvente del habla en relación con el ruido. .
Aspectos psicoacústicos
Para las portadoras sinusoidales, que no tienen fluctuaciones de envolvente intrínseca (ENV p ), el TMTF es aproximadamente plano para las tasas de AM de 10 a 120 Hz, pero aumenta (es decir, el umbral empeora) para las tasas de AM más altas, [51] [158] siempre que el espectro espectral las bandas laterales no son audibles. La forma del TMTF para portadores sinusoidales es similar para personas jóvenes y mayores con umbrales audiométricos normales, pero las personas mayores tienden a tener umbrales de detección más altos en general, lo que sugiere una “eficiencia de detección” más pobre para las señales ENV n en personas mayores. [159] [160] Siempre que la portadora sea completamente audible, la capacidad de detectar la MA no suele verse afectada negativamente por la pérdida auditiva coclear y, a veces, puede ser mejor de lo normal, tanto para las portadoras de ruido [161] [162] como para las portadoras sinusoidales, [158] [163] quizás porque el reclutamiento de sonoridad (un crecimiento anormalmente rápido de la sonoridad con el aumento del nivel de sonido) "magnifica" la cantidad percibida de AM (es decir, señales de ENV n ). De acuerdo con esto, cuando el AM es claramente audible, un sonido con una profundidad de AM fija parece fluctuar más para un oído dañado que para un oído normal. Sin embargo, la capacidad de detectar cambios en la profundidad de la mañana puede verse afectada por la pérdida auditiva coclear. [163] El habla que se procesa con el codificador de voz de ruido de manera que principalmente la información de la envolvente se entrega en múltiples canales espectrales también se utilizó en la investigación del procesamiento de la envolvente en la discapacidad auditiva. En este caso, las personas con problemas de audición no podían hacer uso de dicha información del sobre tan bien como las personas con audición normal, incluso después de tener en cuenta los factores de audibilidad. [164] Experimentos adicionales sugieren que la edad afecta negativamente el procesamiento binaural de ENV p al menos en audiofrecuencias bajas. [165]
Modelos de procesamiento de envolvente temporal deteriorado
El modelo de percepción del procesamiento ENV [63] que incorpora filtros AM selectivos (de paso de banda) explica muchas consecuencias perceptivas de la disfunción coclear, incluida la sensibilidad mejorada a AM para portadores sinusoidales y de ruido, [166] [167] enmascaramiento directo anormal (la tasa de recuperación desde que el enmascaramiento hacia adelante es generalmente más lento de lo normal para los oyentes con discapacidad), [168] efectos de interferencia más fuertes entre AM y FM [82] y una integración temporal mejorada de AM. [167] El modelo de Torsten Dau [63] se ha ampliado para tener en cuenta la discriminación de patrones complejos de AM por parte de personas con discapacidad auditiva y los efectos de los sistemas de reducción de ruido. [169] El rendimiento de las personas con discapacidad auditiva se captó mejor cuando el modelo combinó la pérdida de compresión de amplitud periférica resultante de la pérdida del mecanismo activo en la cóclea [166] [167] [168] con un aumento del ruido interno en el dominio ENVn. [166] [167] [82] Los modelos fenomenológicos que simulan la respuesta del sistema auditivo periférico mostraron que el deterioro de la sensibilidad a la MA en individuos que experimentan tinnitus crónico con audiogramas clínicamente normales podría predecirse por una pérdida sustancial de fibras del nervio auditivo con tasas espontáneas bajas y algunos pérdida de fibras del nervio auditivo con altas tasas espontáneas. [170]
Efectos de la edad y la pérdida auditiva en el procesamiento de TFS
Aspectos de desarrollo
Muy pocos estudios han evaluado sistemáticamente el procesamiento de TFS en bebés y niños. La respuesta de seguimiento de frecuencia (FFR), que se cree que refleja la actividad neuronal bloqueada en fase, parece ser similar a la de un adulto en bebés de 1 mes cuando se usa un tono puro (centrado en 500, 1000 o 2000 Hz) modulado a 80 Hz con un 100% de profundidad de modulación. [142]
En cuanto a los datos de comportamiento, los bebés de seis meses requieren transiciones de frecuencia más grandes para detectar un cambio de FM en un tono de 1 kHz en comparación con los adultos. [171] Sin embargo, los bebés de 4 meses pueden discriminar dos barridos de FM diferentes, [172] y son más sensibles a las señales de FM barridas de 150 Hz a 550 Hz que a frecuencias más bajas. [173] En los niños en edad escolar, el rendimiento en la detección del cambio de FM mejora entre los 6 y los 10 años y la sensibilidad a la tasa de modulación baja (2 Hz) es deficiente hasta los 9 años. [174]
Para los sonidos del habla, solo un estudio de codificador de voz ha explorado la capacidad de los niños en edad escolar para confiar en las señales de TFSp para detectar cambios de consonantes, mostrando las mismas habilidades para los niños de 5 años que para los adultos. [149]
Aspectos neurofisiológicos
Los estudios psicofísicos han sugerido que el procesamiento de TFS degradado debido a la edad y la pérdida de audición puede ser la base de algunos déficits supraumbrales, como la percepción del habla; [10] sin embargo, persiste el debate sobre los correlatos neuronales subyacentes. [150] [151] La fuerza del bloqueo de fase en la estructura fina temporal de las señales (TFS n ) en condiciones de escucha silenciosa sigue siendo normal en las respuestas de neurona única periférica después de una pérdida auditiva coclear. [152] Aunque estos datos sugieren que la capacidad fundamental de las fibras del nervio auditivo para seguir las fluctuaciones rápidas del sonido permanece intacta después de la pérdida auditiva coclear, los déficits en la fuerza de bloqueo de fase surgen en el ruido de fondo. [175] Este hallazgo, que es consistente con la observación común de que los oyentes con pérdida auditiva coclear tienen más dificultad en condiciones ruidosas, es el resultado de una selectividad de frecuencia coclear reducida asociada con la disfunción de las células ciliadas externas. [156] Aunque solo se han observado efectos limitados de la edad y la pérdida auditiva en términos de la fuerza de codificación de TFS n de los sonidos de banda estrecha, se han observado déficits más dramáticos en la calidad de codificación de TFS n en respuesta a los sonidos de banda ancha, que son más relevantes para la escucha diaria . Puede ocurrir una pérdida dramática de tonotopicidad después de una pérdida auditiva inducida por ruido, donde las fibras del nervio auditivo que deberían responder a las frecuencias medias (p. Ej., 2-4 kHz) tienen respuestas TFS dominantes a frecuencias más bajas (p. Ej., 700 Hz). [176] En particular, la pérdida de tonotopicidad generalmente ocurre solo para la codificación de TFS n pero no para la codificación de ENV n , lo cual es consistente con mayores déficits de percepción en el procesamiento de TFS. [10] Es probable que esta degradación tonotópica tenga implicaciones importantes para la percepción del habla y puede explicar la codificación degradada de las vocales después de una pérdida auditiva inducida por ruido en la que la mayor parte de la cóclea responde solo al primer formante, eliminando la representación tonotópica normal de la segundo y tercer formantes.
Aspectos psicoacústicos
Varios estudios psicofísicos han demostrado que las personas mayores con audición normal y las personas con pérdida auditiva neurosensorial a menudo muestran un rendimiento deficiente para las tareas auditivas que se supone que dependen de la capacidad del sistema auditivo monoaural y binaural para codificar y utilizar señales de TFS n , tales como: discriminación de la frecuencia del sonido, [76] [177] [178] discriminación de la frecuencia fundamental de los sonidos armónicos, [76] [177] [178] [179] detección de FM a frecuencias inferiores a 5 Hz, [180] [181] [91] reconocimiento de melodías para secuencias de tonos puros y sonidos complejos, [182] lateralización y localización de tonos puros y tonos complejos, [78] [183] [165] y segregación de sonidos armónicos concurrentes (como los sonidos del habla). [79] Sin embargo, no está claro en qué medida los déficits asociados con la pérdida auditiva reflejan un procesamiento de TFS n más deficiente o una selectividad de frecuencia coclear reducida. [182]
Modelos de procesamiento deteriorado
La calidad de la representación de un sonido en el nervio auditivo está limitada por la refractariedad, la adaptación, la saturación y la sincronización reducida (bloqueo de fase) a altas frecuencias, así como por la naturaleza estocástica de los potenciales de acción. [184] Sin embargo, el nervio auditivo contiene miles de fibras. Por lo tanto, a pesar de estos factores limitantes, las propiedades de los sonidos están razonablemente bien representadas en la respuesta nerviosa de la población en una amplia gama de niveles [185] y frecuencias de audio (ver Teoría de Volley ).
La codificación de la información temporal en el nervio auditivo puede verse interrumpida por dos mecanismos principales: sincronía reducida y pérdida de sinapsis y / o fibras del nervio auditivo. [186] El impacto de la codificación temporal interrumpida en la percepción auditiva humana se ha explorado utilizando herramientas de procesamiento de señales de inspiración fisiológica. La reducción de la sincronía neuronal se ha simulado alterando las fases de los componentes de frecuencia múltiple en el habla, [187] aunque esto tiene efectos no deseados en el dominio espectral. La pérdida de fibras nerviosas auditivas o sinapsis se ha simulado asumiendo (i) que cada fibra aferente opera como un muestreador estocástico de la forma de onda del sonido, con mayor probabilidad de disparar para características de sonido sostenidas y de mayor intensidad que para las de menor intensidad o transitorias. características, y (ii) que la desaferenciación puede modelarse reduciendo el número de muestreadores. [184] Sin embargo, esto también tiene efectos no deseados en el dominio espectral. Tanto el jittering como el submuestreo estocástico degradan la representación del TFS n más que la representación del ENV n . Tanto el jittering como el submuestreo estocástico perjudican el reconocimiento del habla en entornos ruidosos sin degradar el reconocimiento en silencio, respaldan el argumento de que TFS n es importante para reconocer el habla en entornos ruidosos . [3] Tanto el jittering como el submuestreo estocástico imitan los efectos del envejecimiento en la percepción del habla. [188]
Transmisión por audífonos e implantes cocleares
Transmisión de envolvente temporal
Las personas con pérdida auditiva coclear suelen tener un rango dinámico más pequeño de lo normal entre el nivel del sonido detectable más débil y el nivel en el que los sonidos se vuelven incómodamente altos. [189] [190] Para comprimir el amplio rango de niveles de sonido que se encuentran en la vida cotidiana en el pequeño rango dinámico de la persona con discapacidad auditiva, los audífonos aplican compresión de amplitud , que también se denomina control automático de ganancia (AGC). El principio básico de dicha compresión es que la cantidad de amplificación aplicada al sonido entrante disminuye progresivamente a medida que aumenta el nivel de entrada. Por lo general, el sonido se divide en varios “canales” de frecuencia y el AGC se aplica de forma independiente en cada canal. Como resultado de comprimir el nivel, AGC reduce la cantidad de fluctuación de la envolvente en la señal de entrada (ENV p ) en una cantidad que depende de la tasa de fluctuación y la velocidad con la que cambia la amplificación en respuesta a los cambios en el nivel de sonido de entrada. [191] [192] AGC también puede cambiar la forma de la envolvente de la señal. [193] Los implantes cocleares son dispositivos que estimulan eléctricamente el nervio auditivo, creando así la sensación de sonido en una persona que de otra manera sería profunda o totalmente sorda. El rango eléctrico dinámico es muy pequeño, [194] por lo que los implantes cocleares generalmente incorporan AGC antes de que la señal se filtre en múltiples canales de frecuencia. [195] Las señales del canal se someten a una compresión instantánea para asignarlas al rango dinámico limitado de cada canal. [196]
Los implantes cocleares se diferencian de los audífonos en que toda la audición acústica se reemplaza con estimulación eléctrica directa del nervio auditivo, que se logra mediante una matriz de electrodos colocada dentro de la cóclea. Por lo tanto, aquí, otros factores además del procesamiento de la señal del dispositivo también contribuyen en gran medida a la audición general, como la etiología, la salud de los nervios, la configuración de los electrodos y la proximidad al nervio, y el proceso de adaptación general a un modo de audición completamente nuevo. [197] [198] [199] [200] Casi toda la información de los implantes cocleares se transmite por las fluctuaciones de la envolvente en los diferentes canales. Esto es suficiente para brindar una percepción razonable del habla en condiciones silenciosas, pero no ruidosas o reverberantes. [201] [202] [203] [204] [121] [110] [205] [206] [207] [208] El procesamiento en implantes cocleares es tal que el TFSp se descarta en favor de trenes de pulsos de frecuencia fija amplitud modulada por el ENVp dentro de cada banda de frecuencia. Los usuarios de implantes son sensibles a estas modulaciones ENVp, pero el rendimiento varía según el sitio de estimulación, el nivel de estimulación y entre los individuos. [209] [210] El TMTF muestra una forma de filtro de paso bajo similar a la observada en oyentes con audición normal. [210] [211] [212] El tono de la voz o la información del tono musical, transmitida principalmente a través de señales de periodicidad débiles en el ENVp, da como resultado una sensación de tono que no es lo suficientemente prominente para apoyar la percepción musical, [213] [214] identificación del sexo del hablante , [215] [216] tonos léxicos, [217] [218] o señales prosódicas. [219] [220] [221] Los oyentes con implantes cocleares son susceptibles a la interferencia en el dominio de modulación [222] [223], lo que probablemente contribuya a las dificultades para escuchar con ruido.
Transmisión temporal de estructura fina
Los audífonos generalmente procesan los sonidos filtrándolos en múltiples canales de frecuencia y aplicando AGC en cada canal. Otro procesamiento de señales en audífonos, como la reducción de ruido, también implica filtrar la entrada en múltiples canales. [224] El filtrado en canales puede afectar el TFS p de los sonidos dependiendo de características como la respuesta de fase y el retardo de grupo de los filtros. Sin embargo, estos efectos suelen ser pequeños. Los implantes cocleares también filtran la señal de entrada en canales de frecuencia. Normalmente, el ENV p de la señal en cada canal se transmite a los electrodos implantados en forma de pulsos eléctricos de frecuencia fija que se modulan en amplitud o duración. La información sobre TFS p se descarta. Esto se justifica por la observación de que las personas con implantes cocleares tienen una capacidad muy limitada para procesar la información de TFS p , incluso si se transmite a los electrodos, [225] tal vez debido a un desajuste entre la información temporal y el lugar en la cóclea para que se entrega [76] La reducción de este desajuste puede mejorar la capacidad de utilizar la información de TFS p y, por lo tanto, conducir a una mejor percepción del tono. [226] Algunos sistemas de implantes cocleares transmiten información sobre TFS p en los canales de los implantes cocleares que están sintonizados en frecuencias de audio bajas, y esto puede mejorar la percepción del tono de los sonidos de frecuencia baja. [227]
Efectos de entrenamiento y plasticidad del procesamiento de envoltura temporal
Se ha informado sobre el aprendizaje perceptivo resultante del entrenamiento para varias tareas de detección o discriminación de MA auditiva, [228] [229] [230] lo que sugiere que las respuestas de las neuronas auditivas centrales a las señales de ENV p son plásticas y que la práctica puede modificar los circuitos de ENV n Procesando. [230] [231]
La plasticidad del procesamiento de ENV n se ha demostrado de varias formas. Por ejemplo, la capacidad de las neuronas de la corteza auditiva para discriminar las señales de tiempo de inicio de la voz para los fonemas se degrada después de una pérdida auditiva moderada (20-40 dB HL) inducida por un trauma acústico. [232] Curiosamente, la pérdida de la audición del desarrollo reduce las respuestas corticales a los estímulos AM lentos, pero no rápidos (100 Hz), en paralelo con el rendimiento conductual. [233] De hecho, una pérdida auditiva transitoria (15 días) durante el "período crítico" es suficiente para elevar los umbrales de MA en jerbos adultos. [234] Incluso la exposición al ruido no traumático reduce la capacidad de bloqueo de fase de las neuronas corticales, así como la capacidad de comportamiento de los animales para discriminar entre diferentes sonidos AM. [235] El entrenamiento conductual o los protocolos de emparejamiento que involucran neuromoduladores también alteran la capacidad de las neuronas corticales para sincronizarse en fase con los sonidos de la mañana. [236] [237] En humanos, la pérdida auditiva puede resultar en una representación desequilibrada de las señales del habla: las señales ENV n se mejoran a costa de las señales TFS n (ver: Efectos de la edad y la pérdida auditiva en el procesamiento de la envolvente temporal). El entrenamiento auditivo puede reducir la representación de las señales ENV n del habla para los oyentes de edad avanzada con pérdida auditiva, que luego pueden alcanzar niveles comparables a los observados para los oyentes de edad avanzada con audición normal. [238] Por último, el entrenamiento musical intensivo induce efectos conductuales como una mayor sensibilidad a las variaciones de tono (para el tono lingüístico del mandarín) y una mejor sincronización de las respuestas del tronco cerebral al contorno f0 de los tonos léxicos para los músicos en comparación con los no músicos. [239]
Evaluación clínica de la sensibilidad de TFS
Se han desarrollado pruebas psicofísicas rápidas y fáciles de administrar para ayudar a los médicos en la detección de las capacidades de procesamiento de TFS y el diagnóstico de los déficits de procesamiento auditivo temporal supraumbral asociados con el daño coclear y el envejecimiento. Estas pruebas también pueden ser útiles para que los audiólogos y los fabricantes de audífonos expliquen y / o predigan el resultado de la adaptación de audífonos en términos de calidad percibida, inteligibilidad del habla o audición espacial. [240] [241] Estas pruebas pueden eventualmente usarse para recomendar la velocidad de compresión más apropiada en audífonos [242] o el uso de micrófonos direccionales. La necesidad de tales pruebas se ve corroborada por las fuertes correlaciones entre los umbrales de detección de modulación espectro-temporal o de FM lenta y la inteligibilidad del habla asistida en entornos competitivos para personas con discapacidad auditiva. [90] [243] Las pruebas clínicas se pueden dividir en dos grupos: las que evalúan las capacidades de procesamiento de TFS monoaural (prueba TFS1) y las que evalúan las capacidades binaurales (tono binaural, TFS-LF, TFS-AF).
TFS1: esta prueba evalúa la capacidad de discriminar entre un tono complejo armónico y su versión con transposición de frecuencia (y por lo tanto, inarmónica). [244] [245] [246] [159] Tono binaural: estas pruebas evalúan la capacidad para detectar y discriminar el tono binaural y el reconocimiento de melodías utilizando diferentes tipos de tono binaural. [182] [247] TFS-LF: esta prueba evalúa la capacidad de discriminar tonos puros de baja frecuencia que son idénticos en los dos oídos de los mismos tonos que difieren en la fase interaural. [248] [249] TFS AF: esta prueba evalúa la frecuencia de audio más alta de un tono puro hasta la cual se puede discriminar un cambio en la fase interaural. [250]
Medidas objetivas utilizando señales envolventes y TFS
La distorsión de la señal, el ruido aditivo, la reverberación y las estrategias de procesamiento de audio, como la supresión de ruido y la compresión de rango dinámico, pueden afectar la inteligibilidad del habla y la calidad de la voz y la música. [251] [252] [253] [254] [255] Estos cambios en la percepción de la señal a menudo pueden predecirse midiendo los cambios asociados en la envolvente de la señal y / o la estructura fina temporal (TFS). Las medidas objetivas de los cambios de señal, cuando se combinan con procedimientos que asocian los cambios de señal con diferencias en la percepción auditiva, dan lugar a métricas de rendimiento auditivo para predecir la inteligibilidad y la calidad del habla.
Los cambios en el TFS pueden estimarse pasando las señales a través de un banco de filtros y calculando la coherencia [256] entre la entrada y salida del sistema en cada banda. La inteligibilidad predicha a partir de la coherencia es precisa para algunas formas de ruido aditivo y distorsión no lineal, [251] [255] pero funciona mal para la supresión de ruido de máscara binaria ideal (IBM). [253] La calidad de la voz y la música para señales sujetas a ruido y distorsión de recorte también se ha modelado utilizando la coherencia [257] o utilizando la coherencia promediada en segmentos de señal cortos. [258]
Los cambios en la envolvente de la señal se pueden medir utilizando varios procedimientos diferentes. La presencia de ruido o reverberación reducirá la profundidad de modulación de una señal, y la medición multibanda de la profundidad de modulación de envolvente de la salida del sistema se usa en el índice de transmisión de voz (STI) para estimar la inteligibilidad. [259] Si bien es preciso para aplicaciones de ruido y reverberación, el STI funciona mal para el procesamiento no lineal, como la compresión de rango dinámico. [260] Una extensión de la STI estima el cambio de modulación mediante la correlación cruzada de las envolventes de las señales de entrada y salida de voz. [261] [262] Un procedimiento relacionado, que también utiliza correlaciones cruzadas de envolvente, es la medida de inteligibilidad objetiva a corto plazo (STOI), [253] que funciona bien para su aplicación prevista en la evaluación de la supresión de ruido, pero que es menos precisa para distorsión no lineal. [263] Las métricas de inteligibilidad basadas en envolventes también se han derivado utilizando bancos de filtros de modulación [67] y utilizando patrones de modulación de tiempo-frecuencia de envolvente. [264] La correlación cruzada de envolvente también se utiliza para estimar la calidad de la voz y la música. [265] [266]
Las mediciones de envolvente y TFS también se pueden combinar para formar métricas de inteligibilidad y calidad. Se ha derivado una familia de métricas para la inteligibilidad del habla, [263] calidad del habla [267] [268] y calidad de la música [269] utilizando un modelo compartido de la periferia auditiva [270] que puede representar la pérdida auditiva. El uso de un modelo de la periferia dañada conduce a predicciones más precisas para los oyentes con discapacidad auditiva que el uso de un modelo de audición normal, y la métrica combinada de envolvente / TFS es generalmente más precisa que una métrica que utiliza solo modulación de envolvente. [263] [267]
Ver también
- Sobre (ondas)
- Teoría del lugar
- Teoría temporal
Referencias
- ^ Viemeister NF, Plack CJ (1993). Psicofísica humana . Springer Handbook of Auditory Research. Springer, Nueva York, NY. págs. 116-154. doi : 10.1007 / 978-1-4612-2728-1_4 . ISBN 978-1-4612-7644-9.
- ^ a b c Rosen S (junio de 1992). "Información temporal en el habla: aspectos acústicos, auditivos y lingüísticos". Transacciones filosóficas de la Royal Society de Londres. Serie B, Ciencias Biológicas . 336 (1278): 367–73. Código Bibliográfico : 1992RSPTB.336..367R . doi : 10.1098 / rstb.1992.0070 . PMID 1354376 .
- ^ a b Drullman R (enero de 1995). "Envolvente temporal y señales de estructura fina para la inteligibilidad del habla". La Revista de la Sociedad Estadounidense de Acústica . 97 (1): 585–92. Código bibliográfico : 1995ASAJ ... 97..585D . doi : 10.1121 / 1.413112 . PMID 7860835 .
- ^ a b c d e Moore BC (diciembre de 2008). "El papel del procesamiento de estructura fina temporal en la percepción de tono, enmascaramiento y percepción del habla para personas con audición normal y con discapacidad auditiva" . Revista de la Asociación para la Investigación en Otorrinolaringología . 9 (4): 399–406. doi : 10.1007 / s10162-008-0143-x . PMC 2580810 . PMID 18855069 .
- ^ De Boer E (septiembre de 1956). "Tono de señales inarmónicas". Naturaleza . 178 (4532): 535–6. Código Bibliográfico : 1956Natur.178..535B . doi : 10.1038 / 178535a0 . PMID 13358790 .
- ^ Zeng FG, Nie K, Liu S, Stickney G, Del Rio E, Kong YY, Chen H (septiembre de 2004). "Sobre la dicotomía en la percepción auditiva entre envoltura temporal y señales de estructura fina" . La Revista de la Sociedad Estadounidense de Acústica . 116 (3): 1351–4. Código Bib : 2004ASAJ..116.1351Z . doi : 10.1121 / 1.1777938 . PMID 15478399 .
- ^ a b Plomp R (1983). "Percepción del habla como señal modulada". Actas del X Congreso Internacional de Ciencias Fonéticas, Utrecht : 19–40.
- ^ Hilbert D (1912). Grundzüge einer allgemeinen theorie der linearen integralgleichungen . Bibliotecas de la Universidad de California. Leipzig, BG Teubner.
- ^ Ruggero MA (julio de 1973). "Respuesta al ruido de las fibras del nervio auditivo en el mono ardilla" . Revista de neurofisiología . 36 (4): 569–87. doi : 10.1152 / jn.1973.36.4.569 . PMID 4197339 .
- ^ a b c d Moore BC (4 de mayo de 2014). Procesamiento auditivo de la estructura fina temporal: efectos de la edad y la hipoacusia . Nueva Jersey: World Scientific Publishing Company. ISBN 9789814579650.
- ^ a b Joris PX, Louage DH, Cardoen L, van der Heijden M (junio de 2006). "Índice de correlación: una nueva métrica para cuantificar la codificación temporal". Investigación auditiva . 216–217: 19–30. doi : 10.1016 / j.heares.2006.03.010 . PMID 16644160 .
- ^ Heinz MG, Swaminathan J (septiembre de 2009). "Cuantificación de envolvente y codificación de estructura fina en respuestas del nervio auditivo al habla quimérica" . Revista de la Asociación para la Investigación en Otorrinolaringología . 10 (3): 407–23. doi : 10.1007 / s10162-009-0169-8 . PMC 3084379 . PMID 19365691 .
- ^ Søndergaard PL, Decorsière R, Dau T (15 de diciembre de 2011). "Sobre la relación entre envolvente multicanal y estructura fina temporal" . Actas del Simposio Internacional de Investigación Auditiva y Audiológica . 3 : 363–370.
- ^ Shamma S, Lorenzi C (mayo de 2013). "Sobre el equilibrio de la envolvente y la estructura fina temporal en la codificación del habla en el sistema auditivo temprano" . La Revista de la Sociedad Estadounidense de Acústica . 133 (5): 2818–33. Código bibliográfico : 2013ASAJ..133.2818S . doi : 10.1121 / 1.4795783 . PMC 3663870 . PMID 23654388 .
- ^ Joris PX, Schreiner CE, Rees A (abril de 2004). "Procesamiento neuronal de sonidos modulados en amplitud". Revisiones fisiológicas . 84 (2): 541–77. doi : 10.1152 / physrev.00029.2003 . PMID 15044682 .
- ^ Frisina RD (agosto de 2001). "Mecanismos de codificación neural subcortical para el procesamiento temporal auditivo". Investigación auditiva . 158 (1–2): 1–27. doi : 10.1016 / S0378-5955 (01) 00296-9 . PMID 11506933 .
- ^ Pressnitzer D, Meddis R, Delahaye R, Winter IM (agosto de 2001). "Correlatos fisiológicos de liberación de enmascaramiento de comodulación en el núcleo coclear ventral de mamíferos" . La Revista de Neurociencia . 21 (16): 6377–86. doi : 10.1523 / JNEUROSCI.21-16-06377.2001 . PMC 6763188 . PMID 11487661 .
- ^ a b Hall JW, Haggard MP, Fernandes MA (julio de 1984). "Detección en ruido por análisis de patrones espectro-temporales". La Revista de la Sociedad Estadounidense de Acústica . 76 (1): 50–6. Código bibliográfico : 1984ASAJ ... 76R..50H . doi : 10.1121 / 1.391005 . PMID 6747111 .
- ^ Eggermont JJ (abril de 1994). "Funciones de transferencia de modulación temporal para estímulos AM y FM en la corteza auditiva del gato. Efectos del tipo de portador, forma de onda e intensidad de modulación". Investigación auditiva . 74 (1–2): 51–66. doi : 10.1016 / 0378-5955 (94) 90175-9 . PMID 8040099 .
- ^ Bieser A, Müller-Preuss P (1996). "Corteza de respuesta auditiva en el mono ardilla: respuestas neuronales a sonidos modulados en amplitud". Exp Brain Res . 108 (2): 273–84. doi : 10.1007 / BF00228100 . PMID 8815035 .
- ^ Liang L, Lu T, Wang X (mayo de 2002). "Representaciones neuronales de modulaciones de frecuencia y amplitud sinusoidal en la corteza auditiva primaria de primates despiertos". Revista de neurofisiología . 87 (5): 2237–61. doi : 10.1152 / jn.2002.87.5.2237 . PMID 11976364 .
- ^ Schreiner CE, Urbas JV (enero de 1988). "Representación de la modulación de amplitud en la corteza auditiva del gato. II. Comparación entre campos corticales". Investigación auditiva . 32 (1): 49–63. doi : 10.1016 / 0378-5955 (88) 90146-3 . PMID 3350774 .
- ^ Lu T, Liang L, Wang X (noviembre de 2001). "Representaciones temporales y de velocidad de señales variables en el tiempo en la corteza auditiva de primates despiertos". Neurociencia de la naturaleza . 4 (11): 1131–8. doi : 10.1038 / nn737 . PMID 11593234 .
- ^ Eggermont JJ (noviembre de 1991). "Medidas de frecuencia y sincronización de la codificación de periodicidad en la corteza auditiva primaria de gato". Investigación auditiva . 56 (1–2): 153–67. doi : 10.1016 / 0378-5955 (91) 90165-6 . PMID 1769910 .
- ^ Baumann S, Joly O, Rees A, Petkov CI, Sun L, Thiele A, Griffiths TD (enero de 2015). "La topografía de la representación de frecuencia y tiempo en las cortezas auditivas de primates" . eLife . 4 . doi : 10.7554 / eLife.03256 . PMC 4398946 . PMID 25590651 .
- ^ Depireux DA, Elhilali M, eds. (15 de enero de 2014). Manual de técnicas modernas en corteza auditiva (primera ed.). Nova Science Pub Inc. ISBN 9781628088946.
- ^ Kowalski N, Depireux DA, Shamma SA (noviembre de 1996). "Análisis de espectros dinámicos en la corteza auditiva primaria de hurón. I. Características de las respuestas de una sola unidad a los espectros de ondulación en movimiento" (PDF) . Revista de neurofisiología . 76 (5): 3503–23. doi : 10.1152 / jn.1996.76.5.3503 . hdl : 1903/5688 . PMID 8930289 .
- ^ Mesgarani N, Chang EF (mayo de 2012). "Representación cortical selectiva del hablante asistido en la percepción del habla de varios hablantes" . Naturaleza . 485 (7397): 233–6. Código Bibliográfico : 2012Natur.485..233M . doi : 10.1038 / nature11020 . PMC 3870007 . PMID 22522927 .
- ^ John MS, Picton TW (marzo de 2000). "Respuestas de estado estable auditivo humano a tonos modulados en amplitud: mediciones de fase y latencia". Investigación auditiva . 141 (1–2): 57–79. doi : 10.1016 / S0378-5955 (99) 00209-9 . PMID 10713496 .
- ^ Atiani S, David SV, Elgueda D, Locastro M, Radtke-Schuller S, Shamma SA, Fritz JB (abril de 2014). "Selectividad emergente para estímulos relevantes para la tarea en la corteza auditiva de orden superior" . Neurona . 82 (2): 486–99. doi : 10.1016 / j.neuron.2014.02.029 . PMC 4048815 . PMID 24742467 .
- ^ Schreiner CE, Urbas JV (1986). "Representación de la modulación de amplitud en la corteza auditiva del gato. I. El campo auditivo anterior (AAF)". Investigación auditiva . 21 (3): 227–41. doi : 10.1016 / 0378-5955 (86) 90221-2 . PMID 3013823 .
- ^ Giraud AL, Lorenzi C, Ashburner J, Wable J, Johnsrude I, Frackowiak R, Kleinschmidt A (septiembre de 2000). "Representación de la envolvente temporal de los sonidos en el cerebro humano". Revista de neurofisiología . 84 (3): 1588–98. doi : 10.1152 / jn.2000.84.3.1588 . PMID 10980029 .
- ^ Liégeois-Chauvel C, Lorenzi C, Trébuchon A, Régis J, Chauvel P (julio de 2004). "Procesamiento de la envolvente temporal en las cortezas auditivas izquierda y derecha humanas" . Corteza cerebral . 14 (7): 731–40. doi : 10.1093 / cercor / bhh033 . PMID 15054052 .
- ^ Herdener M, Esposito F, Scheffler K, Schneider P, Logothetis NK, Uludag K, Kayser C (noviembre de 2013). "Representaciones espaciales de señales sonoras temporales y espectrales en la corteza auditiva humana". Corteza; Una revista dedicada al estudio del sistema nervioso y la conducta . 49 (10): 2822–33. doi : 10.1016 / j.cortex.2013.04.003 . PMID 23706955 .
- ^ Schönwiesner M, Zatorre RJ (agosto de 2009). "Función de transferencia de modulación espectro-temporal de vóxeles únicos en la corteza auditiva humana medida con fMRI de alta resolución" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (34): 14611–6. Código bibliográfico : 2009PNAS..10614611S . doi : 10.1073 / pnas.0907682106 . PMC 2732853 . PMID 19667199 .
- ^ Griffiths TD, Penhune V, Peretz I, Dean JL, Patterson RD, Green GG (abril de 2000). "Procesamiento frontal y percepción auditiva". NeuroReport . 11 (5): 919-22. doi : 10.1097 / 00001756-200004070-00004 . PMID 10790855 .
- ^ Hullett PW, Hamilton LS, Mesgarani N, Schreiner CE, Chang EF (febrero de 2016). "Organización de la circunvolución temporal superior humana de la sintonización de la modulación espectrotemporal derivada de los estímulos del habla" . La Revista de Neurociencia . 36 (6): 2014–26. doi : 10.1523 / JNEUROSCI.1779-15.2016 . PMC 4748082 . PMID 26865624 .
- ^ a b c d e f Elhilali M, Fritz JB, Klein DJ, Simon JZ, Shamma SA (febrero de 2004). "Dinámica de la sincronización puntual precisa en la corteza auditiva primaria" . La Revista de Neurociencia . 24 (5): 1159–72. doi : 10.1523 / JNEUROSCI.3825-03.2004 . PMC 6793586 . PMID 14762134 .
- ^ Boer, E. de (1985). "Constantes de tiempo auditivo: ¿una paradoja?". Resolución de tiempos en sistemas auditivos . Proceedings in Life Sciences. Springer, Berlín, Heidelberg. págs. 141-158. doi : 10.1007 / 978-3-642-70622-6_9 . ISBN 9783642706240.
- ^ a b Bair W, Koch C (agosto de 1996). "Precisión temporal de los trenes de púas en la corteza extraestriada del comportamiento del mono macaco" (PDF) . Computación neuronal . 8 (6): 1185–202. doi : 10.1162 / neco.1996.8.6.1185 . PMID 8768391 .
- ^ Simon JZ, Depireux DA, Klein DJ, Fritz JB, Shamma SA (marzo de 2007). "Simetría temporal en la corteza auditiva primaria: implicaciones para la conectividad cortical". Computación neuronal . 19 (3): 583–638. arXiv : q-bio / 0608027 . doi : 10.1162 / neco.2007.19.3.583 . PMID 17298227 .
- ^ Theunissen FE, Sen K, Doupe AJ (marzo de 2000). "Campos receptivos espectral-temporales de neuronas auditivas no lineales obtenidos mediante sonidos naturales" . La Revista de Neurociencia . 20 (6): 2315–31. doi : 10.1523 / JNEUROSCI.20-06-02315.2000 . PMC 6772498 . PMID 10704507 .
- ^ David SV, Mesgarani N, Fritz JB, Shamma SA (marzo de 2009). "La depresión sináptica rápida explica la modulación no lineal de la sintonización espectro-temporal en la corteza auditiva primaria por estímulos naturales" . La Revista de Neurociencia . 29 (11): 3374–86. doi : 10.1523 / JNEUROSCI.5249-08.2009 . PMC 2774136 . PMID 19295144 .
- ^ Bieser A, Müller-Preuss P (marzo de 1996). "Corteza de respuesta auditiva en el mono ardilla: respuestas neuronales a sonidos modulados en amplitud". Investigación experimental del cerebro . 108 (2): 273–84. doi : 10.1007 / bf00228100 . PMID 8815035 .
- ^ Fast H (2007). Psicoacústica: hechos y modelos . Saltador. ISBN 9783540231592.[ página necesaria ]
- ^ Burns EM, Viemeister NF (diciembre de 1981). "Reproducido de nuevo SAM: más observaciones sobre el tono del ruido de amplitud modulada". La Revista de la Sociedad Estadounidense de Acústica . 70 (6): 1655-1660. Código Bibliográfico : 1981ASAJ ... 70.1655B . doi : 10.1121 / 1.387220 .
- ^ McDermott JH, Simoncelli EP (septiembre de 2011). "Percepción de la textura del sonido a través de las estadísticas de la periferia auditiva: evidencia de la síntesis de sonido" . Neurona . 71 (5): 926–40. doi : 10.1016 / j.neuron.2011.06.032 . PMC 4143345 . PMID 21903084 .
- ^ McWalter R, Dau T (11 de septiembre de 2017). "Modulaciones de amplitud en cascada en la percepción de la textura del sonido" . Fronteras en neurociencia . 11 : 485. doi : 10.3389 / fnins.2017.00485 . PMC 5601004 . PMID 28955191 .
- ^ a b c d Viemeister NF (noviembre de 1979). "Funciones de transferencia de modulación temporal basadas en umbrales de modulación". La Revista de la Sociedad Estadounidense de Acústica . 66 (5): 1364–80. Código Bib : 1979ASAJ ... 66.1364V . doi : 10.1121 / 1.383531 . PMID 500975 .
- ^ Sheft S, Yost WA (agosto de 1990). "Integración temporal en la detección de modulación de amplitud". La Revista de la Sociedad Estadounidense de Acústica . 88 (2): 796–805. Código Bibliográfico : 1990ASAJ ... 88..796S . doi : 10.1121 / 1.399729 . PMID 2212305 .
- ^ a b Kohlrausch A, Fassel R, Dau T (agosto de 2000). "La influencia del nivel de la portadora y la frecuencia en la modulación y los umbrales de detección de latidos para las portadoras sinusoidales". La Revista de la Sociedad Estadounidense de Acústica . 108 (2): 723–34. Código Bibliográfico : 2000ASAJ..108..723K . doi : 10.1121 / 1.429605 . PMID 10955639 .
- ^ Bacon SP, Grantham DW (junio de 1989). "Enmascaramiento de modulación: efectos de frecuencia, profundidad y fase de modulación". La Revista de la Sociedad Estadounidense de Acústica . 85 (6): 2575–80. Código bibliográfico : 1989ASAJ ... 85.2575B . doi : 10.1121 / 1.397751 . PMID 2745880 .
- ^ a b Houtgast T (abril de 1989). "Selectividad de frecuencia en la detección de modulación de amplitud". La Revista de la Sociedad Estadounidense de Acústica . 85 (4): 1676–80. Código Bibliográfico : 1989ASAJ ... 85.1676H . doi : 10.1121 / 1.397956 . PMID 2708683 .
- ^ Yost WA, Sheft S (febrero de 1989). "Procesamiento a través de bandas críticas de tonos modulados en amplitud". La Revista de la Sociedad Estadounidense de Acústica . 85 (2): 848–57. Código Bibliográfico : 1989ASAJ ... 85..848Y . doi : 10.1121 / 1.397556 . PMID 2925999 .
- ^ Kay RH, Matthews DR (septiembre de 1972). "Sobre la existencia en las vías auditivas humanas de canales sintonizados selectivamente a la modulación presente en tonos modulados en frecuencia" . La revista de fisiología . 225 (3): 657–77. doi : 10.1113 / jphysiol.1972.sp009962 . PMC 1331136 . PMID 5076392 .
- ^ Tansley BW, Suffield JB (septiembre de 1983). "Evolución temporal de la adaptación y recuperación de canales selectivamente sensibles a la modulación de frecuencia y amplitud". La Revista de la Sociedad Estadounidense de Acústica . 74 (3): 765–75. Código bibliográfico : 1983ASAJ ... 74..765T . doi : 10.1121 / 1.389864 . PMID 6630734 .
- ^ Wojtczak M, Viemeister NF (agosto de 2003). "Efectos supraumbrales de adaptación producidos por modulación de amplitud". La Revista de la Sociedad Estadounidense de Acústica . 114 (2): 991–7. Código bibliográfico : 2003ASAJ..114..991W . doi : 10.1121 / 1.1593067 . PMID 12942978 .
- ^ Lorenzi C, Simpson MI, Millman RE, Griffiths TD, Woods WP, Rees A, Green GG (noviembre de 2001). "Umbrales de detección de modulación de segundo orden para portadores de ruido de tono puro y de banda estrecha". La Revista de la Sociedad Estadounidense de Acústica . 110 (5 Pt 1): 2470–8. Código Bibliográfico : 2001ASAJ..110.2470L . doi : 10.1121 / 1.1406160 . PMID 11757936 .
- ^ Ewert SD, Verhey JL, Dau T (diciembre de 2002). "Procesamiento espectro-temporal en el dominio de frecuencia de envolvente". La Revista de la Sociedad Estadounidense de Acústica . 112 (6): 2921–31. Código bibliográfico : 2002ASAJ..112.2921E . doi : 10.1121 / 1.1515735 . PMID 12509013 .
- ^ Füllgrabe C, Moore BC, Demany L, Ewert SD, Sheft S, Lorenzi C (abril de 2005). "Enmascaramiento de modulación producido por moduladores de segundo orden" . La Revista de la Sociedad Estadounidense de Acústica . 117 (4 Pt 1): 2158–68. Código bibliográfico : 2005ASAJ..117.2158F . doi : 10.1121 / 1.1861892 . PMC 2708918 . PMID 15898657 .
- ^ Klein-Hennig M, Dietz M, Hohmann V, Ewert SD (junio de 2011). "La influencia de diferentes segmentos de la envolvente en curso sobre la sensibilidad a los retrasos de tiempo interaural". La Revista de la Sociedad Estadounidense de Acústica . 129 (6): 3856–72. Código bibliográfico : 2011ASAJ..129.3856K . doi : 10.1121 / 1.3585847 . PMID 21682409 .
- ^ Strickland EA, Viemeister NF (junio de 1996). "Señales de discriminación de sobres". La Revista de la Sociedad Estadounidense de Acústica . 99 (6): 3638–46. Código bibliográfico : 1996ASAJ ... 99.3638S . doi : 10.1121 / 1.414962 . PMID 8655796 .
- ^ a b c Dau T, Kollmeier B, Kohlrausch A (noviembre de 1997). "Modelado del procesamiento auditivo de la modulación de amplitud. I. Detección y enmascaramiento con portadoras de banda estrecha" . La Revista de la Sociedad Estadounidense de Acústica . 102 (5 Pt 1): 2892–905. Código Bibliográfico : 1997ASAJ..102.2892D . doi : 10.1121 / 1.420344 . PMID 9373976 .
- ^ Piechowiak T, Ewert SD, Dau T (abril de 2007). "Modelado de liberación de enmascaramiento de comodulación utilizando un mecanismo de cancelación de ecualización" (PDF) . La Revista de la Sociedad Estadounidense de Acústica . 121 (4): 2111-26. Código Bibliográfico : 2007ASAJ..121.2111P . doi : 10.1121 / 1.2534227 . PMID 17471726 .
- ^ Ewert SD, Dau T (septiembre de 2000). "Caracterización de la selectividad de frecuencia para las fluctuaciones de envolvente". La Revista de la Sociedad Estadounidense de Acústica . 108 (3 Pt 1): 1181–96. Código Bibliográfico : 2000ASAJ..108.1181E . doi : 10.1121 / 1.1288665 . PMID 11008819 .
- ^ Wakefield GH, Viemeister NF (septiembre de 1990). "Discriminación de la profundidad de modulación del ruido de modulación de amplitud sinusoidal (SAM)". La Revista de la Sociedad Estadounidense de Acústica . 88 (3): 1367–73. Código Bibliográfico : 1990ASAJ ... 88.1367W . doi : 10.1121 / 1.399714 . PMID 2229672 .
- ^ a b Jørgensen S, Ewert SD, Dau T (julio de 2013). "Un modelo basado en potencia de envolvente de resolución múltiple para la inteligibilidad del habla". La Revista de la Sociedad Estadounidense de Acústica . 134 (1): 436–46. Código bibliográfico : 2013ASAJ..134..436J . doi : 10.1121 / 1.4807563 . PMID 23862819 .
- ^ Biberger T, Ewert SD (agosto de 2016). "Predicción basada en envolvente e intensidad de enmascaramiento psicoacústico e inteligibilidad del habla". La Revista de la Sociedad Estadounidense de Acústica . 140 (2): 1023–1038. Código bibliográfico : 2016ASAJ..140.1023B . doi : 10.1121 / 1.4960574 . PMID 27586734 .
- ^ Nelson PC, Carney LH (agosto de 2006). "Señales para la detección de modulación de amplitud enmascarada" . La Revista de la Sociedad Estadounidense de Acústica . 120 (2): 978–90. Código bibliográfico : 2006ASAJ..120..978N . doi : 10.1121 / 1.2213573 . PMC 2572864 . PMID 16938985 .
- ^ Verschooten E, Robles L, Joris PX (febrero de 2015). "Evaluación de los límites del bloqueo de fase neural utilizando potenciales de masa" . La Revista de Neurociencia . 35 (5): 2255–68. doi : 10.1523 / JNEUROSCI.2979-14.2015 . PMC 6705351 . PMID 25653380 .
- ^ Palmer AR, Russell IJ (1986). "Bloqueo de fase en el nervio coclear del conejillo de indias y su relación con el potencial receptor de las células ciliadas internas". Investigación auditiva . 24 (1): 1-15. doi : 10.1016 / 0378-5955 (86) 90002-X . PMID 3759671 .
- ^ Weiss TF, Rose C (mayo de 1988). "Una comparación de filtros de sincronización en diferentes órganos receptores auditivos". Investigación auditiva . 33 (2): 175–9. doi : 10.1016 / 0378-5955 (88) 90030-5 . PMID 3397327 .
- ^ a b c Paraouty N, Stasiak A, Lorenzi C, Varnet L, Winter IM (abril de 2018). "Codificación dual de modulación de frecuencia en el núcleo coclear ventral" . La Revista de Neurociencia . 38 (17): 4123–4137. doi : 10.1523 / JNEUROSCI.2107-17.2018 . PMC 6596033 . PMID 29599389 .
- ^ a b Moore BC (septiembre de 1973). "Límites de frecuencia para tonos de corta duración". La Revista de la Sociedad Estadounidense de Acústica . 54 (3): 610–9. Código bibliográfico : 1973ASAJ ... 54..610M . doi : 10.1121 / 1.1913640 . PMID 4754385 .
- ^ a b c Moore B (5 de abril de 2013). Introducción a la psicología de la audición: sexta edición (sexta ed.). Leiden: BRILL. ISBN 9789004252424.
- ^ a b c d e f Plack CJ (2005). Tono: codificación y percepción neuronales . Springer Handbook of Auditory Research. Saltador. ISBN 9780387234724.
- ^ a b c d Moore BC, Sek A (octubre de 1996). "Detección de modulación de frecuencia a bajas tasas de modulación: evidencia de un mecanismo basado en bloqueo de fase". La Revista de la Sociedad Estadounidense de Acústica . 100 (4 Pt 1): 2320–31. Código Bibliográfico : 1996ASAJ..100.2320M . doi : 10.1121 / 1.417941 . PMID 8865639 .
- ^ a b Lacher-Fougère S, Demany L (octubre de 2005). "Consecuencias del daño coclear para la detección de diferencias de fase interaural" . La Revista de la Sociedad Estadounidense de Acústica . 118 (4): 2519-26. Código Bibliográfico : 2005ASAJ..118.2519L . doi : 10.1121 / 1.2032747 . PMID 16266172 . S2CID 1218899 .
- ^ a b Hopkins K, Moore BC, Stone MA (febrero de 2008). "Efectos de la pérdida auditiva coclear moderada sobre la capacidad de beneficiarse de la información de estructura fina temporal en el habla" . La Revista de la Sociedad Estadounidense de Acústica . 123 (2): 1140–53. Código bibliográfico : 2008ASAJ..123.1140H . doi : 10.1121 / 1.2824018 . PMC 2688774 . PMID 18247914 .
- ^ Oxenham AJ, Bernstein JG, Penagos H (febrero de 2004). "La representación tonotópica correcta es necesaria para una percepción de tono compleja" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 101 (5): 1421–5. doi : 10.1073 / pnas.0306958101 . PMC 337068 . PMID 14718671 .
- ^ Oxenham AJ, Micheyl C, Keebler MV, Loper A, Santurette S (mayo de 2011). "Percepción del tono más allá de la región de existencia tradicional del tono" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 108 (18): 7629–34. doi : 10.1073 / pnas.1015291108 . PMC 3088642 . PMID 21502495 .
- ^ a b c Paraouty N, Ewert SD, Wallaert N, Lorenzi C (julio de 2016). "Interacciones entre la modulación de amplitud y el procesamiento de modulación de frecuencia: efectos de la edad y la pérdida auditiva". La Revista de la Sociedad Estadounidense de Acústica . 140 (1): 121-131. Código Bib : 2016ASAJ..140..121P . doi : 10.1121 / 1.4955078 . PMID 27475138 .
- ^ Demany L, Semal C (marzo de 1989). "Umbrales de detección para modulación de frecuencia sinusoidal". La Revista de la Sociedad Estadounidense de Acústica . 85 (3): 1295–301. Código Bibliográfico : 1989ASAJ ... 85.1295D . doi : 10.1121 / 1.397460 . PMID 2708671 .
- ^ a b Ernst SM, Moore BC (diciembre de 2010). "Mecanismos subyacentes a la detección de modulación de frecuencia". La Revista de la Sociedad Estadounidense de Acústica . 128 (6): 3642–8. Código bibliográfico : 2010ASAJ..128.3642E . doi : 10.1121 / 1.3506350 . PMID 21218896 .
- ^ Zwicker, E (1 de enero de 1956). "Die elementaren Grundlagen zur Bestimmung der Informationskapazität des Gehörs" . Acta Acustica United con Acustica . 6 (4): 365–381.
- ^ Maiwald, D (1967). "Ein Funktionsschema des Gehors zur Beschreibung der Erkennbarkeit kleiner Frequenz und Amplitudenanderungen" . Acustica . 18 : 81–92.
- ^ Saberi K, Hafter ER (abril de 1995). "Un código neuronal común para sonidos modulados en frecuencia y amplitud". Naturaleza . 374 (6522): 537–9. Código Bibliográfico : 1995Natur.374..537S . doi : 10.1038 / 374537a0 . PMID 7700378 .
- ^ Ruggles D, Bharadwaj H, Shinn-Cunningham BG (septiembre de 2011). "La audición normal no es suficiente para garantizar una codificación robusta de características supraumbrales importantes en la comunicación diaria" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 108 (37): 15516–21. Código Bibliográfico : 2011PNAS..10815516R . doi : 10.1073 / pnas.1108912108 . PMC 3174666 . PMID 21844339 .
- ^ Johannesen PT, Pérez-González P, Kalluri S, Blanco JL, Lopez-Poveda EA (septiembre de 2016). "La influencia de la disfunción mecánica coclear, los déficits de procesamiento temporal y la edad en la inteligibilidad del habla audible en ruido para oyentes con discapacidad auditiva" . Tendencias en la audición . 20 : 233121651664105. doi : 10.1177 / 2331216516641055 . PMC 5017567 . PMID 27604779 .
- ^ a b Lopez-Poveda EA, Johannesen PT, Pérez-González P, Blanco JL, Kalluri S, Edwards B (enero de 2017). "Predictores de los resultados de los audífonos" . Tendencias en la audición . 21 : 2331216517730526. doi : 10.1177 / 2331216517730526 . PMC 5613846 . PMID 28929903 .
- ^ a b Buss E, Hall JW, Grose JH (junio de 2004). "Señales temporales de estructura fina para el habla y modulación de tono puro en observadores con pérdida auditiva neurosensorial". Oído y audición . 25 (3): 242–50. doi : 10.1097 / 01.AUD.0000130796.73809.09 . PMID 15179115 .
- ^ a b Strelcyk O, Dau T (mayo de 2009). "Relaciones entre la selectividad de frecuencia, el procesamiento temporal de estructura fina y la recepción del habla en personas con problemas de audición" (PDF) . La Revista de la Sociedad Estadounidense de Acústica . 125 (5): 3328–45. Código bibliográfico : 2009ASAJ..125.3328S . doi : 10.1121 / 1.3097469 . PMID 19425674 .
- ^ Ewert SD, Paraouty N, Lorenzi C (enero de 2018). "Un modelo de dos vías de detección de modulación auditiva utilizando señales de envolvente y estructura fina temporal". La Revista Europea de Neurociencia . 51 (5): 1265-1278. doi : 10.1111 / ejn.13846 . PMID 29368797 .
- ^ Zilany MS, Bruce IC, Nelson PC, Carney LH (noviembre de 2009). "Un modelo fenomenológico de la sinapsis entre la célula pilosa interna y el nervio auditivo: adaptación a largo plazo con la dinámica de la ley de potencia" . La Revista de la Sociedad Estadounidense de Acústica . 126 (5): 2390–412. Código bibliográfico : 2009ASAJ..126.2390Z . doi : 10.1121 / 1.3238250 . PMC 2787068 . PMID 19894822 .
- ^ Zilany MS, Bruce IC, Carney LH (enero de 2014). "Parámetros actualizados y opciones de simulación ampliadas para un modelo de la periferia auditiva" . La Revista de la Sociedad Estadounidense de Acústica . 135 (1): 283–6. Código Bib : 2014ASAJ..135..283Z . doi : 10.1121 / 1.4837815 . PMC 3985897 . PMID 24437768 .
- ^ Wirtzfeld MR, Ibrahim RA, Bruce IC (octubre de 2017). "Predicciones de la inteligibilidad de la quimera del habla utilizando señales neuronales de frecuencia media y sincronización de picos del nervio auditivo" . Revista de la Asociación para la Investigación en Otorrinolaringología . 18 (5): 687–710. doi : 10.1007 / s10162-017-0627-7 . PMC 5612921 . PMID 28748487 .
- ^ Moon IJ, Won JH, Park MH, Ives DT, Nie K, Heinz MG, Lorenzi C, Rubinstein JT (septiembre de 2014). "Combinación óptima de envolvente temporal neuronal y señales de estructura fina para explicar la identificación del habla en ruido de fondo" . La Revista de Neurociencia . 34 (36): 12145–54. doi : 10.1523 / JNEUROSCI.1025-14.2014 . PMC 4152611 . PMID 25186758 .
- ^ a b Lorenzi C, Gilbert G, Carn H, Garnier S, Moore BC (diciembre de 2006). "Los problemas de percepción del habla de las personas con discapacidad auditiva reflejan la incapacidad para utilizar la estructura fina temporal" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 103 (49): 18866–9. Código Bibliográfico : 2006PNAS..10318866L . doi : 10.1073 / pnas.0607364103 . PMC 1693753 . PMID 17116863 .
- ^ a b Hopkins K, Moore BC (julio de 2011). "Los efectos de la edad y la pérdida auditiva coclear sobre la sensibilidad de la estructura fina temporal, la selectividad de frecuencia y la recepción del habla en el ruido". La Revista de la Sociedad Estadounidense de Acústica . 130 (1): 334–49. Código bibliográfico : 2011ASAJ..130..334H . doi : 10.1121 / 1.3585848 . PMID 21786903 .
- ^ Heinz MG, Colburn HS, Carney LH (octubre de 2001). "Evaluación de los límites de rendimiento auditivo: i. Discriminación de un parámetro mediante un modelo computacional para el nervio auditivo". Computación neuronal . 13 (10): 2273–316. doi : 10.1162 / 089976601750541804 . PMID 11570999 .
- ^ Heinz MG, Colburn HS, Carney LH (octubre de 2001). "Evaluación de los límites de rendimiento auditivo: II. Discriminación de un parámetro con variación de nivel aleatorio". Computación neuronal . 13 (10): 2317–38. doi : 10.1162 / 089976601750541813 . PMID 11571000 .
- ^ Carney, Laurel H .; Heinzy, Michael G .; Evilsizer, Mary E .; Gilkeyz, Robert H .; Colburn, H. Steven (2002). "Oponencia de fase auditiva: un modelo temporal para la detección enmascarada en bajas frecuencias" . Acta Acustica United con Acustica . 88 (3): 334–47.
- ^ Deng L, Geisler CD (diciembre de 1987). "Un modelo auditivo compuesto para procesar los sonidos del habla". La Revista de la Sociedad Estadounidense de Acústica . 82 (6): 2001–12. Código Bibliográfico : 1987ASAJ ... 82.2001D . doi : 10.1121 / 1.395644 . PMID 3429735 .
- ^ Loeb GE, White MW, Merzenich MM (1983). "Correlación cruzada espacial. Un mecanismo propuesto para la percepción de tono acústico". Cibernética biológica . 47 (3): 149–63. doi : 10.1007 / BF00337005 . PMID 6615914 .
- ^ Shamma S, Klein D (mayo de 2000). "El caso de las plantillas de tono que faltan: cómo surgen las plantillas armónicas en el sistema auditivo temprano". La Revista de la Sociedad Estadounidense de Acústica . 107 (5 Pt 1): 2631–44. Código bibliográfico : 2000ASAJ..107.2631S . doi : 10.1121 / 1.428649 . hdl : 1903/6017 . PMID 10830385 .
- ^ Shamma SA (noviembre de 1985). "Procesamiento del habla en el sistema auditivo. II: Inhibición lateral y el procesamiento central de la actividad evocada del habla en el nervio auditivo". La Revista de la Sociedad Estadounidense de Acústica . 78 (5): 1622–32. Código Bibliográfico : 1985ASAJ ... 78.1622S . doi : 10.1121 / 1.392800 . PMID 3840813 .
- ^ a b c Varnet L, Ortiz-Barajas MC, Erra RG, Gervain J, Lorenzi C (octubre de 2017). "Un estudio translingüístico de los espectros de modulación del habla" (PDF) . La Revista de la Sociedad Estadounidense de Acústica . 142 (4): 1976–1989. Código Bib : 2017ASAJ..142.1976V . doi : 10.1121 / 1.5006179 . PMID 29092595 .
- ^ Van Tasell DJ, Soli SD, Kirby VM, Widin GP (octubre de 1987). "Señales de envolvente de forma de onda de voz para el reconocimiento de consonantes". La Revista de la Sociedad Estadounidense de Acústica . 82 (4): 1152–61. Código Bibliográfico : 1987ASAJ ... 82.1152V . doi : 10.1121 / 1.395251 . PMID 3680774 .
- ^ a b Ghitza O (septiembre de 2001). "En la frecuencia de corte superior de los detectores de envolvente de banda crítica auditiva en el contexto de la percepción del habla". La Revista de la Sociedad Estadounidense de Acústica . 110 (3 Pt 1): 1628–40. Código bibliográfico : 2001ASAJ..110.1628G . doi : 10.1121 / 1.1396325 . PMID 11572372 .
- ^ a b Shannon RV, Zeng FG, Kamath V, Wygonski J, Ekelid M (octubre de 1995). "Reconocimiento de voz con señales principalmente temporales". Ciencia . 270 (5234): 303–4. Código Bibliográfico : 1995Sci ... 270..303S . doi : 10.1126 / science.270.5234.303 . PMID 7569981 .
- ^ Smith ZM, Delgutte B, Oxenham AJ (marzo de 2002). "Los sonidos quiméricos revelan dicotomías en la percepción auditiva" . Naturaleza . 416 (6876): 87–90. Código Bibliográfico : 2002Natur.416 ... 87S . doi : 10.1038 / 416087a . PMC 2268248 . PMID 11882898 .
- ^ Drullman R, Festen JM, Plomp R (febrero de 1994). "Efecto de la mancha de envolvente temporal en la recepción del habla". La Revista de la Sociedad Estadounidense de Acústica . 95 (2): 1053–64. Código bibliográfico : 1994ASAJ ... 95.1053D . doi : 10.1121 / 1.408467 . PMID 8132899 .
- ^ Singh NC, Theunissen FE (diciembre de 2003). "Espectros de modulación de sonidos naturales y teorías etológicas del procesamiento auditivo". La Revista de la Sociedad Estadounidense de Acústica . 114 (6 Pt 1): 3394–411. Código Bibliográfico : 2003ASAJ..114.3394S . doi : 10.1121 / 1.1624067 . PMID 14714819 .
- ^ Iverson P, Krumhansl CL (noviembre de 1993). "Aislando los atributos dinámicos del timbre musical" . La Revista de la Sociedad Estadounidense de Acústica . 94 (5): 2595–603. Código Bibliográfico : 1993ASAJ ... 94.2595I . doi : 10.1121 / 1.407371 . PMID 8270737 . S2CID 16374075 .
- ^ Cheveigné, Alain de (2005). "Modelos de percepción de tono". Pitch . Springer Handbook of Auditory Research. 24 . Springer, Nueva York, NY. págs. 169–233. doi : 10.1007 / 0-387-28958-5_6 . ISBN 9780387234724.
- ^ Moore BC, Glasberg BR, Low KE, Cope T, Cope W (agosto de 2006). "Efectos de nivel y frecuencia sobre la audibilidad de parciales en tonos complejos inarmónicos". La Revista de la Sociedad Estadounidense de Acústica . 120 (2): 934–44. Código bibliográfico : 2006ASAJ..120..934M . doi : 10.1121 / 1.2216906 . PMID 16938981 .
- ^ Terhardt E (mayo de 1974). "Tono, consonancia y armonía". La Revista de la Sociedad Estadounidense de Acústica . 55 (5): 1061–9. Código bibliográfico : 1974ASAJ ... 55.1061T . doi : 10.1121 / 1.1914648 . PMID 4833699 .
- ^ Santurette S, Dau T (enero de 2011). "El papel de la información de estructura fina temporal para el tono bajo de tonos complejos de alta frecuencia". La Revista de la Sociedad Estadounidense de Acústica . 129 (1): 282–92. Código bibliográfico : 2011ASAJ..129..282S . doi : 10.1121 / 1.3518718 . PMID 21303009 .
- ^ Santurette S, Dau T, Oxenham AJ (diciembre de 2012). "Sobre la posibilidad de un código de lugar para el tono bajo de tonos complejos de alta frecuencia" . La Revista de la Sociedad Estadounidense de Acústica . 132 (6): 3883–95. Código bibliográfico : 2012ASAJ..132.3883S . doi : 10.1121 / 1.4764897 . PMC 3528728 . PMID 23231119 .
- ^ Gfeller K, Turner C, Oleson J, Zhang X, Gantz B, Froman R, Olszewski C (junio de 2007). "Precisión de los receptores de implantes cocleares en la percepción del tono, el reconocimiento de melodías y la recepción del habla en ruido". Oído y audición . 28 (3): 412-23. doi : 10.1097 / AUD.0b013e3180479318 . PMID 17485990 .
- ^ a b Zeng FG, Nie K, Stickney GS, Kong YY, Vongphoe M, Bhargave A, Wei C, Cao K (febrero de 2005). "Reconocimiento de voz con modulaciones de amplitud y frecuencia" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (7): 2293–8. Código Bibliográfico : 2005PNAS..102.2293Z . doi : 10.1073 / pnas.0406460102 . PMC 546014 . PMID 15677723 .
- ^ Apoux F, Yoho SE, Youngdahl CL, Healy EW (septiembre de 2013). "Papel y contribución relativa de la envolvente temporal y las señales de estructura fina en el reconocimiento de oraciones por oyentes con audición normal" . La Revista de la Sociedad Estadounidense de Acústica . 134 (3): 2205–12. Código bibliográfico : 2013ASAJ..134.2205A . doi : 10.1121 / 1.4816413 . PMC 3765279 . PMID 23967950 .
- ^ Freyman RL, Griffin AM, Oxenham AJ (octubre de 2012). "Inteligibilidad del habla susurrada en enmascaradores de ruido estacionarios y modulados" . La Revista de la Sociedad Estadounidense de Acústica . 132 (4): 2514-23. Código Bib : 2012ASAJ..132.2514F . doi : 10.1121 / 1.4747614 . PMC 3477190 . PMID 23039445 .
- ^ Dick, Frederic; Krishnan, Saloni; Leech, Robert; Saygin, Ayşe Pinar (2016). "Sonidos ambientales". Neurobiología del lenguaje . págs. 1121-1138. doi : 10.1016 / b978-0-12-407794-2.00089-4 . ISBN 978-0-12-407794-2.
- ^ Lemaitre, Guillaume; Grimault, Nicolas; Suied, Clara (2018). "Acústica y psicoacústica de escenas sonoras y eventos". Análisis computacional de eventos y escenas sonoras . págs. 41–67. doi : 10.1007 / 978-3-319-63450-0_3 . ISBN 978-3-319-63449-4.
- ^ a b c Shafiro, Valeriy (junio de 2008). "Identificación de sonidos ambientales con resolución espectral variable". Oído y audición . 29 (3): 401–420. doi : 10.1097 / AUD.0b013e31816a0cf1 . PMID 18344871 .
- ^ a b Gygi, Brian; Kidd, Gary R .; Watson, Charles S. (marzo de 2004). "Factores espectral-temporales en la identificación de sonidos ambientales". La Revista de la Sociedad Estadounidense de Acústica . 115 (3): 1252–1265. Código bibliográfico : 2004ASAJ..115.1252G . doi : 10.1121 / 1.1635840 . PMID 15058346 .
- ^ Warren, William H .; Verbrugge, Robert R. (1984). "Percepción auditiva de eventos de rotura y rebote: un estudio de caso en acústica ecológica". Revista de psicología experimental: percepción y rendimiento humanos . 10 (5): 704–712. doi : 10.1037 / 0096-1523.10.5.704 . PMID 6238128 .
- ^ Inverso, grito; Limb, Charles J. (agosto de 2010). "Percepción de sonidos no lingüísticos mediada por implantes cocleares". Oído y audición . 31 (4): 505–514. doi : 10.1097 / AUD.0b013e3181d99a52 . PMID 20588119 .
- ^ Shafiro, Valeriy; Gygi, Brian; Cheng, Min-Yu; Vachhani, Jay; Mulvey, Megan (julio de 2011). "Percepción de los sonidos ambientales por pacientes experimentados en implantes cocleares" . Oído y audición . 32 (4): 511–523. doi : 10.1097 / AUD.0b013e3182064a87 . PMC 3115425 . PMID 21248643 .
- ^ Harris, Michael S .; Boyce, Lauren; Pisoni, David B .; Shafiro, Valeriy; Moberly, Aaron C. (octubre de 2017). "La relación entre la conciencia del sonido ambiental y las habilidades de reconocimiento del habla en usuarios experimentados de implantes cocleares" . Otología y Neurotología . 38 (9): e308 – e314. doi : 10.1097 / MAO.0000000000001514 . PMC 6205294 . PMID 28731964 .
- ^ Moore BC, Gockel HE (abril de 2012). "Propiedades de la formación de la corriente auditiva" . Transacciones filosóficas de la Royal Society de Londres. Serie B, Ciencias Biológicas . 367 (1591): 919–31. doi : 10.1098 / rstb.2011.0355 . PMC 3282308 . PMID 22371614 .
- ^ Cusack R, Roberts B (julio de 2004). "Efectos de las diferencias en el patrón de envolventes de amplitud a través de armónicos en la segregación del flujo auditivo". Investigación auditiva . 193 (1–2): 95–104. doi : 10.1016 / j.heares.2004.03.009 . PMID 15219324 .
- ^ Vliegen J, Oxenham AJ (enero de 1999). "Segregación secuencial de la corriente en ausencia de señales espectrales". La Revista de la Sociedad Estadounidense de Acústica . 105 (1): 339–46. Código bibliográfico : 1999ASAJ..105..339V . doi : 10.1121 / 1.424503 . PMID 9921660 .
- ^ Grimault N, Micheyl C, Carlyon RP, Arthaud P, Collet L (julio de 2000). "Influencia de la resolubilidad periférica en la segregación perceptiva de tonos complejos armónicos que difieren en la frecuencia fundamental". La Revista de la Sociedad Estadounidense de Acústica . 108 (1): 263–71. Código bibliográfico : 2000ASAJ..108..263G . doi : 10.1121 / 1.429462 . PMID 10923890 .
- ^ Grimault N, Bacon SP, Micheyl C (marzo de 2002). "Segregación de flujo auditivo sobre la base de la tasa de modulación de amplitud". La Revista de la Sociedad Estadounidense de Acústica . 111 (3): 1340–8. Código Bibliográfico : 2002ASAJ..111.1340G . doi : 10.1121 / 1.1452740 . PMID 11931311 .
- ^ Yamagishi S, Otsuka S, Furukawa S, Kashino M (julio de 2017). "Comparación de propiedades perceptivas de transmisión auditiva entre dominios de modulación espectral y de amplitud" . Investigación auditiva . 350 : 244–250. doi : 10.1016 / j.heares.2017.03.006 . PMID 28323019 .
- ^ David M, Lavandier M, Grimault N, Oxenham AJ (septiembre de 2017). "Discriminación y transmisión de sonidos del habla basados en diferencias en señales interaurales y espectrales" . La Revista de la Sociedad Estadounidense de Acústica . 142 (3): 1674–1685. Código Bib : 2017ASAJ..142.1674D . doi : 10.1121 / 1.5003809 . PMC 5617732 . PMID 28964066 .
- ^ a b Levi EC, Werner LA (1996). "Detección de modulación de amplitud en la infancia: actualización sobre bebés de 3 meses". Assoc. Res. Otorrinolaringol . 19 : 142.
- ^ Werner LA (octubre de 1996). "El desarrollo de la conducta auditiva (o lo que los anatomistas y fisiólogos tienen que explicar)". Oído y audición . 17 (5): 438–46. doi : 10.1097 / 00003446-199610000-00010 . PMID 8909892 .
- ^ Werner LA (abril de 1999). "Enmascaramiento hacia adelante entre oyentes de bebés y adultos". La Revista de la Sociedad Estadounidense de Acústica . 105 (4): 2445–53. Código bibliográfico : 1999ASAJ..105.2445W . doi : 10.1121 / 1.426849 . PMID 10212425 .
- ^ a b Levi EC, Folsom RC, Dobie RA (septiembre de 1995). "Análisis de coherencia de respuestas de seguimiento de envolvente (EFR) y respuestas de seguimiento de frecuencia (FFR) en bebés y adultos". Investigación auditiva . 89 (1–2): 21–7. doi : 10.1016 / 0378-5955 (95) 00118-3 . PMID 8600128 .
- ^ Levi EC, Folsom RC, Dobie RA (junio de 1993). "Respuesta siguiente de modulación de amplitud (AMFR): efectos de la tasa de modulación, frecuencia portadora, edad y estado". Investigación auditiva . 68 (1): 42–52. doi : 10.1016 / 0378-5955 (93) 90063-7 . PMID 8376214 .
- ^ Hall JW, Grose JH (julio de 1994). "Desarrollo de la resolución temporal en niños medida por la función de transferencia de modulación temporal". La Revista de la Sociedad Estadounidense de Acústica . 96 (1): 150–4. Código bibliográfico : 1994ASAJ ... 96..150H . doi : 10.1121 / 1.410474 . PMID 7598757 .
- ^ Peter V, Wong K, Narne VK, Sharma M, Purdy SC, McMahon C (febrero de 2014). "Evaluación del procesamiento espectral y temporal en niños y adultos mediante la función de transferencia de modulación temporal (TMTF), percepción de ruido de ondulación iterada (IRN) y discriminación de ondulación espectral (SRD)". Revista de la Academia Estadounidense de Audiología . 25 (2): 210–8. doi : 10.3766 / jaaa.25.2.9 . PMID 24828221 .
- ^ Werner LA (2007). "Problemas en el desarrollo auditivo humano" . Revista de trastornos de la comunicación . 40 (4): 275–83. doi : 10.1016 / j.jcomdis.2007.03.004 . PMC 1975821 . PMID 17420028 .
- ^ Buss E, Hall JW, Grose JH, Dev MB (agosto de 1999). "Desarrollo de la actuación adulta en enmascaramiento hacia atrás, simultáneo y hacia adelante". Revista de investigación del habla, el lenguaje y la audición . 42 (4): 844–9. doi : 10.1044 / jslhr.4204.844 . PMID 10450905 .
- ^ Cabrera L, Werner L (July 2017). "Infants' and Adults' Use of Temporal Cues in Consonant Discrimination" (PDF). Ear and Hearing. 38 (4): 497–506. doi:10.1097/AUD.0000000000000422. PMC 5482774. PMID 28338496.
- ^ a b Bertoncini J, Serniclaes W, Lorenzi C (June 2009). "Discrimination of speech sounds based upon temporal envelope versus fine structure cues in 5- to 7-year-old children". Journal of Speech, Language, and Hearing Research. 52 (3): 682–95. doi:10.1044/1092-4388(2008/07-0273). PMID 18952853.
- ^ a b Le Prell CG (2012). Noise-Induced Hearing Loss - Scientific Advances. Springer Handbook of Auditory Research. Springer. ISBN 9781441995223.
- ^ a b Manley GA (2017). Understanding the Cochlea. Springer Handbook of Auditory Research. Springer. ISBN 9783319520711.
- ^ a b c Kale S, Heinz MG (December 2010). "Envelope coding in auditory nerve fibers following noise-induced hearing loss". Journal of the Association for Research in Otolaryngology. 11 (4): 657–73. doi:10.1007/s10162-010-0223-6. PMC 2975881. PMID 20556628.
- ^ Zhong Z, Henry KS, Heinz MG (March 2014). "Sensorineural hearing loss amplifies neural coding of envelope information in the central auditory system of chinchillas". Hearing Research. 309: 55–62. doi:10.1016/j.heares.2013.11.006. PMC 3922929. PMID 24315815.
- ^ Kale S, Heinz MG (April 2012). "Temporal modulation transfer functions measured from auditory-nerve responses following sensorineural hearing loss". Hearing Research. 286 (1–2): 64–75. doi:10.1016/j.heares.2012.02.004. PMC 3326227. PMID 22366500.
- ^ Henry KS, Kale S, Heinz MG (2014-02-17). "Noise-induced hearing loss increases the temporal precision of complex envelope coding by auditory-nerve fibers". Frontiers in Systems Neuroscience. 8: 20. doi:10.3389/fnsys.2014.00020. PMC 3925834. PMID 24596545.
- ^ a b Ruggero MA, Rich NC (April 1991). "Furosemide alters organ of corti mechanics: evidence for feedback of outer hair cells upon the basilar membrane". The Journal of Neuroscience. 11 (4): 1057–67. doi:10.1523/JNEUROSCI.11-04-01057.1991. PMC 3580957. PMID 2010805.
- ^ Heinz MG, Young ED (February 2004). "Response growth with sound level in auditory-nerve fibers after noise-induced hearing loss". Journal of Neurophysiology. 91 (2): 784–95. doi:10.1152/jn.00776.2003. PMC 2921373. PMID 14534289.
- ^ a b Moore BC, Glasberg BR (August 2001). "Temporal modulation transfer functions obtained using sinusoidal carriers with normally hearing and hearing-impaired listeners". The Journal of the Acoustical Society of America. 110 (2): 1067–73. Bibcode:2001ASAJ..110.1067M. doi:10.1121/1.1385177. PMID 11519575.
- ^ a b Füllgrabe C, Moore BC, Stone MA (2014). "Age-group differences in speech identification despite matched audiometrically normal hearing: contributions from auditory temporal processing and cognition". Frontiers in Aging Neuroscience. 6: 347. doi:10.3389/fnagi.2014.00347. PMC 4292733. PMID 25628563.
- ^ Wallaert N, Moore BC, Lorenzi C (June 2016). "Comparing the effects of age on amplitude modulation and frequency modulation detection". The Journal of the Acoustical Society of America. 139 (6): 3088–3096. Bibcode:2016ASAJ..139.3088W. doi:10.1121/1.4953019. PMID 27369130.
- ^ Bacon SP, Gleitman RM (June 1992). "Modulation detection in subjects with relatively flat hearing losses". Journal of Speech and Hearing Research. 35 (3): 642–53. doi:10.1044/jshr.3503.642. PMID 1608256.
- ^ Moore BC, Shailer MJ, Schooneveldt GP (August 1992). "Temporal modulation transfer functions for band-limited noise in subjects with cochlear hearing loss". British Journal of Audiology. 26 (4): 229–37. doi:10.3109/03005369209076641. PMID 1446186.
- ^ a b Schlittenlacher J, Moore BC (November 2016). "Discrimination of amplitude-modulation depth by subjects with normal and impaired hearing". The Journal of the Acoustical Society of America. 140 (5): 3487–3495. Bibcode:2016ASAJ..140.3487S. doi:10.1121/1.4966117. PMID 27908066.
- ^ Başkent D (November 2006). "Speech recognition in normal hearing and sensorineural hearing loss as a function of the number of spectral channels". The Journal of the Acoustical Society of America. 120 (5): 2908–2925. Bibcode:2006ASAJ..120.2908B. doi:10.1121/1.2354017. PMID 17139748.
- ^ a b King A, Hopkins K, Plack CJ (January 2014). "The effects of age and hearing loss on interaural phase difference discrimination". The Journal of the Acoustical Society of America. 135 (1): 342–51. Bibcode:2014ASAJ..135..342K. doi:10.1121/1.4838995. PMID 24437774.
- ^ a b c Derleth RP, Dau T, Kollmeier B (September 2001). "Modeling temporal and compressive properties of the normal and impaired auditory system". Hearing Research. 159 (1–2): 132–49. doi:10.1016/S0378-5955(01)00322-7. PMID 11520641.
- ^ a b c d Wallaert N, Moore BC, Ewert SD, Lorenzi C (February 2017). "Sensorineural hearing loss enhances auditory sensitivity and temporal integration for amplitude modulation". The Journal of the Acoustical Society of America. 141 (2): 971–980. Bibcode:2017ASAJ..141..971W. doi:10.1121/1.4976080. PMID 28253641.
- ^ a b Jepsen ML, Dau T (January 2011). "Characterizing auditory processing and perception in individual listeners with sensorineural hearing loss". The Journal of the Acoustical Society of America. 129 (1): 262–81. Bibcode:2011ASAJ..129..262J. doi:10.1121/1.3518768. PMID 21303008.
- ^ Ives DT, Kalluri S, Strelcyk O, Sheft S, Miermont F, Coez A, Bizaguet E, Lorenzi C (October 2014). "Effects of noise reduction on AM perception for hearing-impaired listeners". Journal of the Association for Research in Otolaryngology. 15 (5): 839–48. doi:10.1007/s10162-014-0466-8. PMC 4164688. PMID 24899379.
- ^ Paul BT, Bruce IC, Roberts LE (February 2017). "Evidence that hidden hearing loss underlies amplitude modulation encoding deficits in individuals with and without tinnitus". Hearing Research. 344: 170–182. doi:10.1016/j.heares.2016.11.010. PMID 27888040.
- ^ Aslin RN (August 1989). "Discrimination of frequency transitions by human infants". The Journal of the Acoustical Society of America. 86 (2): 582–90. Bibcode:1989ASAJ...86..582A. doi:10.1121/1.398237. PMID 2768673.
- ^ Colombo J, Horowitz FD (April 1986). "Infants' attentional responses to frequency modulated sweeps". Child Development. 57 (2): 287–91. doi:10.2307/1130583. JSTOR 1130583. PMID 3956313.
- ^ Leibold LJ, Werner LA (2007-09-01). "Infant Auditory Sensitivity to Pure Tones and Frequency-Modulated Tones". Infancy. 12 (2): 225–233. CiteSeerX 10.1.1.525.6267. doi:10.1111/j.1532-7078.2007.tb00241.x. PMID 33412743.
- ^ Dawes P, Bishop DV (August 2008). "Maturation of visual and auditory temporal processing in school-aged children". Journal of Speech, Language, and Hearing Research. 51 (4): 1002–15. doi:10.1044/1092-4388(2008/073). PMID 18658067. S2CID 13953101.
- ^ Henry KS, Heinz MG (October 2012). "Diminished temporal coding with sensorineural hearing loss emerges in background noise". Nature Neuroscience. 15 (10): 1362–4. doi:10.1038/nn.3216. PMC 3458164. PMID 22960931.
- ^ Henry KS, Kale S, Heinz MG (February 2016). "Distorted Tonotopic Coding of Temporal Envelope and Fine Structure with Noise-Induced Hearing Loss". The Journal of Neuroscience. 36 (7): 2227–37. doi:10.1523/JNEUROSCI.3944-15.2016. PMC 4756156. PMID 26888932.
- ^ a b Moore BC, Peters RW (May 1992). "Pitch discrimination and phase sensitivity in young and elderly subjects and its relationship to frequency selectivity". The Journal of the Acoustical Society of America. 91 (5): 2881–93. Bibcode:1992ASAJ...91.2881M. doi:10.1121/1.402925. PMID 1629481.
- ^ a b Moore BC (2008). Moore BC (ed.). Cochlear Hearing Loss: Physiological, Psychological and Technical Issues (Second ed.). Wiley Online Library. doi:10.1002/9780470987889. ISBN 9780470987889.
- ^ Hopkins K, Moore BC (August 2007). "Moderate cochlear hearing loss leads to a reduced ability to use temporal fine structure information". The Journal of the Acoustical Society of America. 122 (2): 1055–68. Bibcode:2007ASAJ..122.1055H. doi:10.1121/1.2749457. PMID 17672653.
- ^ Moore BC, Skrodzka E (January 2002). "Detection of frequency modulation by hearing-impaired listeners: effects of carrier frequency, modulation rate, and added amplitude modulation". The Journal of the Acoustical Society of America. 111 (1 Pt 1): 327–35. Bibcode:2002ASAJ..111..327M. doi:10.1121/1.1424871. PMID 11833538.
- ^ Grose JH, Mamo SK (December 2012). "Frequency modulation detection as a measure of temporal processing: age-related monaural and binaural effects". Hearing Research. 294 (1–2): 49–54. doi:10.1016/j.heares.2012.09.007. PMC 3505233. PMID 23041187.
- ^ a b c Santurette S, Dau T (January 2007). "Binaural pitch perception in normal-hearing and hearing-impaired listeners". Hearing Research. 223 (1–2): 29–47. doi:10.1016/j.heares.2006.09.013. PMID 17107767.
- ^ Grose JH, Mamo SK (December 2010). "Processing of temporal fine structure as a function of age". Ear and Hearing. 31 (6): 755–60. doi:10.1097/AUD.0b013e3181e627e7. PMC 2966515. PMID 20592614.
- ^ a b Lopez-Poveda EA, Barrios P (2013-07-16). "Perception of stochastically undersampled sound waveforms: a model of auditory deafferentation". Frontiers in Neuroscience. 7: 124. doi:10.3389/fnins.2013.00124. PMC 3712141. PMID 23882176.
- ^ Young ED, Sachs MB (November 1979). "Representation of steady-state vowels in the temporal aspects of the discharge patterns of populations of auditory-nerve fibers". The Journal of the Acoustical Society of America. 66 (5): 1381–1403. Bibcode:1979ASAJ...66.1381Y. doi:10.1121/1.383532. PMID 500976.
- ^ Zeng FG, Kong YY, Michalewski HJ, Starr A (June 2005). "Perceptual consequences of disrupted auditory nerve activity". Journal of Neurophysiology. 93 (6): 3050–63. doi:10.1152/jn.00985.2004. PMID 15615831.
- ^ Pichora-Fuller MK, Schneider BA, Macdonald E, Pass HE, Brown S (January 2007). "Temporal jitter disrupts speech intelligibility: a simulation of auditory aging". Hearing Research. 223 (1–2): 114–21. doi:10.1016/j.heares.2006.10.009. PMID 17157462.
- ^ Lopez-Poveda EA (2014-10-30). "Why do I hear but not understand? Stochastic undersampling as a model of degraded neural encoding of speech". Frontiers in Neuroscience. 8: 348. doi:10.3389/fnins.2014.00348. PMC 4214224. PMID 25400543.
- ^ Fowler EP (1936-12-01). "A method for the early detection of otosclerosis: a study of sounds well above threshold". Archives of Otolaryngology–Head & Neck Surgery. 24 (6): 731–741. doi:10.1001/archotol.1936.00640050746005.
- ^ Moore BC (June 2004). "Testing the concept of softness imperception: loudness near threshold for hearing-impaired ears". The Journal of the Acoustical Society of America. 115 (6): 3103–11. Bibcode:2004ASAJ..115.3103M. doi:10.1121/1.1738839. PMID 15237835.
- ^ Stone MA, Moore BC (December 1992). "Syllabic compression: effective compression ratios for signals modulated at different rates". British Journal of Audiology. 26 (6): 351–61. doi:10.3109/03005369209076659. PMID 1292819.
- ^ Plomp R (June 1988). "The negative effect of amplitude compression in multichannel hearing aids in the light of the modulation-transfer function". The Journal of the Acoustical Society of America. 83 (6): 2322–7. Bibcode:1988ASAJ...83.2322P. doi:10.1121/1.396363. PMID 3411024.
- ^ Stone MA, Moore BC (March 2007). "Quantifying the effects of fast-acting compression on the envelope of speech". The Journal of the Acoustical Society of America. 121 (3): 1654–64. Bibcode:2007ASAJ..121.1654S. doi:10.1121/1.2434754. PMID 17407902.
- ^ Bacon S (2004). Compression: From Cochlea to Cochlear Implants. Springer Handbook of Auditory Research. Springer. ISBN 9780387004969.
- ^ Boyle PJ, Büchner A, Stone MA, Lenarz T, Moore BC (April 2009). "Comparison of dual-time-constant and fast-acting automatic gain control (AGC) systems in cochlear implants". International Journal of Audiology. 48 (4): 211–21. doi:10.1080/14992020802581982. PMID 19363722.
- ^ Clark GM, Blamey PJ, Brown AM, Gusby PA, Dowell RC, Franz BK, Pyman BC, Shepherd RK, Tong YC, Webb RL (1987). "The University of Melbourne--nucleus multi-electrode cochlear implant". Advances in Oto-Rhino-Laryngology. 38: V–IX, 1–181. doi:10.1159/000414597. PMID 3318305.
- ^ Başkent D, Gaudrain E, Tamati TN, Wagner A (2016). "Chapter 12: Perception and Psychoacoustics of Speech in Cochlear Implant Users". In Cacace AT, de Kleine E, Holt AG, van Dijk P (eds.). Scientific foundations of Audiology: Perspectives from Physics, Biology, Modeling, and Medicine. San Diego, CA: Plural Publishing, Inc. pp. 285–319. ISBN 978-1-59756-652-0.
- ^ Bierer JA, Faulkner KF (April 2010). "Identifying cochlear implant channels with poor electrode-neuron interface: partial tripolar, single-channel thresholds and psychophysical tuning curves". Ear and Hearing. 31 (2): 247–58. doi:10.1097/AUD.0b013e3181c7daf4. PMC 2836401. PMID 20090533.
- ^ Lazard DS, Vincent C, Venail F, Van de Heyning P, Truy E, Sterkers O, et al. (November 2012). "Pre-, per- and postoperative factors affecting performance of postlinguistically deaf adults using cochlear implants: a new conceptual model over time". PLOS ONE. 7 (11): e48739. Bibcode:2012PLoSO...748739L. doi:10.1371/journal.pone.0048739. PMC 3494723. PMID 23152797.
- ^ Holden LK, Firszt JB, Reeder RM, Uchanski RM, Dwyer NY, Holden TA (December 2016). "Factors Affecting Outcomes in Cochlear Implant Recipients Implanted With a Perimodiolar Electrode Array Located in Scala Tympani". Otology & Neurotology. 37 (10): 1662–1668. doi:10.1097/MAO.0000000000001241. PMC 5113723. PMID 27755365.
- ^ Boyle PJ, Nunn TB, O'Connor AF, Moore BC (March 2013). "STARR: a speech test for evaluation of the effectiveness of auditory prostheses under realistic conditions". Ear and Hearing. 34 (2): 203–12. doi:10.1097/AUD.0b013e31826a8e82. PMID 23135616.
- ^ Won JH, Drennan WR, Nie K, Jameyson EM, Rubinstein JT (July 2011). "Acoustic temporal modulation detection and speech perception in cochlear implant listeners". The Journal of the Acoustical Society of America. 130 (1): 376–88. Bibcode:2011ASAJ..130..376W. doi:10.1121/1.3592521. PMC 3155593. PMID 21786906.
- ^ Fu QJ (September 2002). "Temporal processing and speech recognition in cochlear implant users". NeuroReport. 13 (13): 1635–9. doi:10.1097/00001756-200209160-00013. PMID 12352617.
- ^ Friesen LM, Shannon RV, Baskent D, Wang X (August 2001). "Speech recognition in noise as a function of the number of spectral channels: comparison of acoustic hearing and cochlear implants". The Journal of the Acoustical Society of America. 110 (2): 1150–63. Bibcode:2001ASAJ..110.1150F. doi:10.1121/1.1381538. PMID 11519582.
- ^ Moore DR, Shannon RV (June 2009). "Beyond cochlear implants: awakening the deafened brain". Nature Neuroscience. 12 (6): 686–91. doi:10.1038/nn.2326. PMID 19471266.
- ^ Stickney GS, Zeng FG, Litovsky R, Assmann P (August 2004). "Cochlear implant speech recognition with speech maskers". The Journal of the Acoustical Society of America. 116 (2): 1081–91. Bibcode:2004ASAJ..116.1081S. doi:10.1121/1.1772399. PMID 15376674.
- ^ Blamey P, Artieres F, Başkent D, Bergeron F, Beynon A, Burke E, et al. (2013). "Factors affecting auditory performance of postlinguistically deaf adults using cochlear implants: an update with 2251 patients" (PDF). Audiology & Neuro-Otology. 18 (1): 36–47. doi:10.1159/000343189. PMID 23095305.
- ^ Başkent D, Clarke J, Pals C, Benard MR, Bhargava P, Saija J, Sarampalis A, Wagner A, Gaudrain E (October 2016). "Cognitive compensation of speech perception with hearing impairment, cochlear implants, and aging". Trends in Hearing. 20: 233121651667027. doi:10.1177/2331216516670279. PMC 5056620.
- ^ Pfingst BE, Burkholder-Juhasz RA, Xu L, Thompson CS (February 2008). "Across-site patterns of modulation detection in listeners with cochlear implants". The Journal of the Acoustical Society of America. 123 (2): 1054–62. Bibcode:2008ASAJ..123.1054P. doi:10.1121/1.2828051. PMC 2431465. PMID 18247907.
- ^ a b Chatterjee M, Oberzut C (September 2011). "Detection and rate discrimination of amplitude modulation in electrical hearing". The Journal of the Acoustical Society of America. 130 (3): 1567–80. Bibcode:2011ASAJ..130.1567C. doi:10.1121/1.3621445. PMC 3188971. PMID 21895095.
- ^ Shannon RV (April 1992). "Temporal modulation transfer functions in patients with cochlear implants". The Journal of the Acoustical Society of America. 91 (4 Pt 1): 2156–64. Bibcode:1992ASAJ...91.2156S. doi:10.1121/1.403807. PMID 1597606.
- ^ Cazals Y, Pelizzone M, Saudan O, Boex C (October 1994). "Low-pass filtering in amplitude modulation detection associated with vowel and consonant identification in subjects with cochlear implants". The Journal of the Acoustical Society of America. 96 (4): 2048–54. Bibcode:1994ASAJ...96.2048C. doi:10.1121/1.410146. PMID 7963020.
- ^ Cooper WB, Tobey E, Loizou PC (August 2008). "Music perception by cochlear implant and normal hearing listeners as measured by the Montreal Battery for Evaluation of Amusia". Ear and Hearing. 29 (4): 618–26. doi:10.1097/AUD.0b013e318174e787. PMC 2676841. PMID 18469714.
- ^ Galvin JJ, Fu QJ, Nogaki G (June 2007). "Melodic contour identification by cochlear implant listeners". Ear and Hearing. 28 (3): 302–19. doi:10.1097/01.aud.0000261689.35445.20. PMC 3627492. PMID 17485980.
- ^ Fu QJ, Chinchilla S, Nogaki G, Galvin JJ (September 2005). "Voice gender identification by cochlear implant users: the role of spectral and temporal resolution". The Journal of the Acoustical Society of America. 118 (3 Pt 1): 1711–8. Bibcode:2005ASAJ..118.1711F. doi:10.1121/1.1985024. PMID 16240829.
- ^ Fuller CD, Gaudrain E, Clarke JN, Galvin JJ, Fu QJ, Free RH, Başkent D (December 2014). "Gender categorization is abnormal in cochlear implant users". Journal of the Association for Research in Otolaryngology. 15 (6): 1037–48. doi:10.1007/s10162-014-0483-7. PMC 4389960. PMID 25172111.
- ^ Peng SC, Lu HP, Lu N, Lin YS, Deroche ML, Chatterjee M (May 2017). "Processing of Acoustic Cues in Lexical-Tone Identification by Pediatric Cochlear-Implant Recipients". Journal of Speech, Language, and Hearing Research. 60 (5): 1223–1235. doi:10.1044/2016_JSLHR-S-16-0048. PMC 5755546. PMID 28388709.
- ^ Wang W, Zhou N, Xu L (April 2011). "Musical pitch and lexical tone perception with cochlear implants". International Journal of Audiology. 50 (4): 270–8. doi:10.3109/14992027.2010.542490. PMC 5662112. PMID 21190394.
- ^ Chatterjee M, Peng SC (January 2008). "Processing F0 with cochlear implants: Modulation frequency discrimination and speech intonation recognition". Hearing Research. 235 (1–2): 143–56. doi:10.1016/j.heares.2007.11.004. PMC 2237883. PMID 18093766.
- ^ Fu QJ, Galvin JJ (December 2007). "Vocal emotion recognition by normal-hearing listeners and cochlear implant users". Trends in Amplification. 11 (4): 301–15. doi:10.1177/1084713807305301. PMC 4111530. PMID 18003871.
- ^ Chatterjee M, Zion DJ, Deroche ML, Burianek BA, Limb CJ, Goren AP, Kulkarni AM, Christensen JA (April 2015). "Voice emotion recognition by cochlear-implanted children and their normally-hearing peers". Hearing Research. 322: 151–62. doi:10.1016/j.heares.2014.10.003. PMC 4615700. PMID 25448167.
- ^ Chatterjee M, Oba SI (December 2004). "Across- and within-channel envelope interactions in cochlear implant listeners". Journal of the Association for Research in Otolaryngology. 5 (4): 360–75. doi:10.1007/s10162-004-4050-5. PMC 2504569. PMID 15675001.
- ^ Chatterjee M, Kulkarni AM (February 2018). "Modulation detection interference in cochlear implant listeners under forward masking conditions". The Journal of the Acoustical Society of America. 143 (2): 1117–1127. Bibcode:2018ASAJ..143.1117C. doi:10.1121/1.5025059. PMC 5821512. PMID 29495705.
- ^ Alcántara JL, Moore BC, Kühnel V, Launer S (January 2003). "Evaluation of the noise reduction system in a commercial digital hearing aid". International Journal of Audiology. 42 (1): 34–42. doi:10.3109/14992020309056083. PMID 12564514.
- ^ Moore BC (March 2003). "Coding of sounds in the auditory system and its relevance to signal processing and coding in cochlear implants". Otology & Neurotology. 24 (2): 243–54. doi:10.1097/00129492-200303000-00019. PMID 12621339.
- ^ Rader T, Döge J, Adel Y, Weissgerber T, Baumann U (September 2016). "Place dependent stimulation rates improve pitch perception in cochlear implantees with single-sided deafness". Hearing Research. 339: 94–103. doi:10.1016/j.heares.2016.06.013. PMID 27374479.
- ^ Roy AT, Carver C, Jiradejvong P, Limb CJ (October 2015). "Musical Sound Quality in Cochlear Implant Users: A Comparison in Bass Frequency Perception Between Fine Structure Processing and High-Definition Continuous Interleaved Sampling Strategies". Ear and Hearing. 36 (5): 582–90. doi:10.1097/AUD.0000000000000170. PMID 25906173.
- ^ Fitzgerald MB, Wright BA (February 2011). "Perceptual learning and generalization resulting from training on an auditory amplitude-modulation detection task". The Journal of the Acoustical Society of America. 129 (2): 898–906. Bibcode:2011ASAJ..129..898F. doi:10.1121/1.3531841. PMC 3070992. PMID 21361447.
- ^ Fitzgerald MB, Wright BA (December 2005). "A perceptual learning investigation of the pitch elicited by amplitude-modulated noise". The Journal of the Acoustical Society of America. 118 (6): 3794–803. Bibcode:2005ASAJ..118.3794F. doi:10.1121/1.2074687. PMID 16419824.
- ^ a b Sabin AT, Eddins DA, Wright BA (May 2012). "Perceptual learning evidence for tuning to spectrotemporal modulation in the human auditory system". The Journal of Neuroscience. 32 (19): 6542–9. doi:10.1523/JNEUROSCI.5732-11.2012. PMC 3519395. PMID 22573676.
- ^ Joosten ER, Shamma SA, Lorenzi C, Neri P (July 2016). "Dynamic Reweighting of Auditory Modulation Filters". PLOS Computational Biology. 12 (7): e1005019. Bibcode:2016PLSCB..12E5019J. doi:10.1371/journal.pcbi.1005019. PMC 4939963. PMID 27398600.
- ^ Aizawa N, Eggermont JJ (March 2006). "Effects of noise-induced hearing loss at young age on voice onset time and gap-in-noise representations in adult cat primary auditory cortex". Journal of the Association for Research in Otolaryngology. 7 (1): 71–81. doi:10.1007/s10162-005-0026-3. PMC 2504589. PMID 16408166.
- ^ Rosen MJ, Sarro EC, Kelly JB, Sanes DH (2012-07-26). "Diminished behavioral and neural sensitivity to sound modulation is associated with moderate developmental hearing loss". PLOS ONE. 7 (7): e41514. Bibcode:2012PLoSO...741514R. doi:10.1371/journal.pone.0041514. PMC 3406049. PMID 22848517.
- ^ Caras ML, Sanes DH (July 2015). "Sustained Perceptual Deficits from Transient Sensory Deprivation". The Journal of Neuroscience. 35 (30): 10831–42. doi:10.1523/JNEUROSCI.0837-15.2015. PMC 4518056. PMID 26224865.
- ^ Zhou X, Merzenich MM (May 2012). "Environmental noise exposure degrades normal listening processes". Nature Communications. 3: 843. Bibcode:2012NatCo...3..843Z. doi:10.1038/ncomms1849. PMID 22588305.
- ^ Bao S, Chang EF, Woods J, Merzenich MM (September 2004). "Temporal plasticity in the primary auditory cortex induced by operant perceptual learning". Nature Neuroscience. 7 (9): 974–81. doi:10.1038/nn1293. PMID 15286790.
- ^ Kilgard MP, Merzenich MM (December 1998). "Plasticity of temporal information processing in the primary auditory cortex". Nature Neuroscience. 1 (8): 727–31. doi:10.1038/3729. PMC 2948964. PMID 10196590.
- ^ Anderson S, White-Schwoch T, Choi HJ, Kraus N (2013). "Training changes processing of speech cues in older adults with hearing loss". Frontiers in Systems Neuroscience. 7: 97. doi:10.3389/fnsys.2013.00097. PMC 3842592. PMID 24348347.
- ^ Wong PC, Skoe E, Russo NM, Dees T, Kraus N (April 2007). "Musical experience shapes human brainstem encoding of linguistic pitch patterns". Nature Neuroscience. 10 (4): 420–2. doi:10.1038/nn1872. PMC 4508274. PMID 17351633.
- ^ Perez E, McCormack A, Edmonds BA (2014). "Sensitivity to temporal fine structure and hearing-aid outcomes in older adults". Frontiers in Neuroscience. 8: 7. doi:10.3389/fnins.2014.00007. PMC 3914396. PMID 24550769.
- ^ Rönnberg J, Lunner T, Ng EH, Lidestam B, Zekveld AA, Sörqvist P, Lyxell B, Träff U, Yumba W, Classon E, Hällgren M, Larsby B, Signoret C, Pichora-Fuller MK, Rudner M, Danielsson H, Stenfelt S (November 2016). "Hearing impairment, cognition and speech understanding: exploratory factor analyses of a comprehensive test battery for a group of hearing aid users, the n200 study". International Journal of Audiology. 55 (11): 623–42. doi:10.1080/14992027.2016.1219775. PMC 5044772. PMID 27589015.
- ^ Moore BC, Sęk A (September 2016). "Preferred Compression Speed for Speech and Music and Its Relationship to Sensitivity to Temporal Fine Structure". Trends in Hearing. 20: 233121651664048. doi:10.1177/2331216516640486. PMC 5017572. PMID 27604778.
- ^ Bernstein JG, Danielsson H, Hällgren M, Stenfelt S, Rönnberg J, Lunner T (November 2016). "Spectrotemporal Modulation Sensitivity as a Predictor of Speech-Reception Performance in Noise With Hearing Aids". Trends in Hearing. 20: 233121651667038. doi:10.1177/2331216516670387. PMC 5098798. PMID 27815546.
- ^ Sęk A, Moore BC (January 2012). "Implementation of two tests for measuring sensitivity to temporal fine structure". International Journal of Audiology. 51 (1): 58–63. doi:10.3109/14992027.2011.605808. PMID 22050366.
- ^ Moore BC, Vickers DA, Mehta A (October 2012). "The effects of age on temporal fine structure sensitivity in monaural and binaural conditions". International Journal of Audiology. 51 (10): 715–21. doi:10.3109/14992027.2012.690079. PMID 22998412.
- ^ Füllgrabe C (December 2013). "Age-dependent changes in temporal-fine-structure processing in the absence of peripheral hearing loss". American Journal of Audiology. 22 (2): 313–5. doi:10.1044/1059-0889(2013/12-0070). PMID 23975124.
- ^ Santurette S, Dau T (April 2012). "Relating binaural pitch perception to the individual listener's auditory profile" (PDF). The Journal of the Acoustical Society of America. 131 (4): 2968–86. Bibcode:2012ASAJ..131.2968S. doi:10.1121/1.3689554. PMID 22501074.
- ^ Hopkins K, Moore BC (December 2010). "Development of a fast method for measuring sensitivity to temporal fine structure information at low frequencies". International Journal of Audiology. 49 (12): 940–6. doi:10.3109/14992027.2010.512613. PMID 20874427.
- ^ Füllgrabe C, Harland AJ, Sęk AP, Moore BC (December 2017). "Development of a method for determining binaural sensitivity to temporal fine structure" (PDF). International Journal of Audiology. 56 (12): 926–935. doi:10.1080/14992027.2017.1366078. PMID 28859494.
- ^ Füllgrabe C, Moore BC (January 2017). "Evaluation of a Method for Determining Binaural Sensitivity to Temporal Fine Structure (TFS-AF Test) for Older Listeners With Normal and Impaired Low-Frequency Hearing". Trends in Hearing. 21: 2331216517737230. doi:10.1177/2331216517737230. PMC 5669320. PMID 29090641.
- ^ a b Kates JM, Arehart KH (April 2005). "Coherence and the speech intelligibility index". The Journal of the Acoustical Society of America. 117 (4 Pt 1): 2224–37. Bibcode:2005ASAJ..117.2224K. doi:10.1121/1.1862575. PMID 15898663.
- ^ Arehart KH, Kates JM, Anderson MC (June 2010). "Effects of noise, nonlinear processing, and linear filtering on perceived speech quality". Ear and Hearing. 31 (3): 420–36. doi:10.1097/AUD.0b013e3181d3d4f3. PMID 20440116.
- ^ a b c Taal CH, Hendriks RC, Heusdens R, Jensen J (September 2011). "An Algorithm for Intelligibility Prediction of Time–Frequency Weighted Noisy Speech". IEEE Transactions on Audio, Speech, and Language Processing. 19 (7): 2125–2136. doi:10.1109/tasl.2011.2114881.
- ^ Croghan NB, Arehart KH, Kates JM (September 2014). "Music preferences with hearing aids: effects of signal properties, compression settings, and listener characteristics". Ear and Hearing. 35 (5): e170–84. doi:10.1097/AUD.0000000000000056. PMID 25010635.
- ^ a b Arehart K, Souza P, Kates J, Lunner T, Pedersen MS (2015). "Relationship Among Signal Fidelity, Hearing Loss, and Working Memory for Digital Noise Suppression". Ear and Hearing. 36 (5): 505–16. doi:10.1097/aud.0000000000000173. PMC 4549215. PMID 25985016.
- ^ Carter, G.; Knapp, C.; Nuttall, A. (August 1973). "Estimation of the magnitude-squared coherence function via overlapped fast Fourier transform processing". IEEE Transactions on Audio and Electroacoustics. 21 (4): 337–344. doi:10.1109/TAU.1973.1162496.
- ^ Arehart KH, Kates JM, Anderson MC, Harvey LO (August 2007). "Effects of noise and distortion on speech quality judgments in normal-hearing and hearing-impaired listeners". The Journal of the Acoustical Society of America. 122 (2): 1150–64. Bibcode:2007ASAJ..122.1150A. doi:10.1121/1.2754061. PMID 17672661.
- ^ Tan CT, Moore BC (May 2008). "Perception of nonlinear distortion by hearing-impaired people". International Journal of Audiology. 47 (5): 246–56. doi:10.1080/14992020801945493. PMID 18465409.
- ^ Houtgast, T.; Steeneken, H. J. M. (March 1985). "A review of the MTF concept in room acoustics and its use for estimating speech intelligibility in auditoria". The Journal of the Acoustical Society of America. 77 (3): 1069–1077. Bibcode:1985ASAJ...77.1069H. doi:10.1121/1.392224.
- ^ Hohmann V, Kollmeier B (February 1995). "The effect of multichannel dynamic compression on speech intelligibility". The Journal of the Acoustical Society of America. 97 (2): 1191–5. Bibcode:1995ASAJ...97.1191H. doi:10.1121/1.413092. PMID 7876441.
- ^ Goldsworthy RL, Greenberg JE (December 2004). "Analysis of speech-based Speech Transmission Index methods with implications for nonlinear operations". The Journal of the Acoustical Society of America. 116 (6): 3679–89. Bibcode:2004ASAJ..116.3679G. doi:10.1121/1.1804628. PMID 15658718.
- ^ Ludvigsen C, Elberling C, Keidser G, Poulsen T (1990). "Prediction of intelligibility of non-linearly processed speech". Acta Oto-Laryngologica. Supplementum. 469: 190–5. doi:10.1080/00016489.1990.12088428. PMID 2356726.
- ^ a b c Kates, James M.; Arehart, Kathryn H. (November 2014). "The Hearing-Aid Speech Perception Index (HASPI)". Speech Communication. 65: 75–93. doi:10.1016/j.specom.2014.06.002.
- ^ Chi T, Gao Y, Guyton MC, Ru P, Shamma S (November 1999). "Spectro-temporal modulation transfer functions and speech intelligibility". The Journal of the Acoustical Society of America. 106 (5): 2719–32. Bibcode:1999ASAJ..106.2719C. doi:10.1121/1.428100. hdl:1903/6121. PMID 10573888.
- ^ Huber, R.; Kollmeier, B. (November 2006). "PEMO-Q—A New Method for Objective Audio Quality Assessment Using a Model of Auditory Perception". IEEE Transactions on Audio, Speech, and Language Processing. 14 (6): 1902–1911. doi:10.1109/TASL.2006.883259.
- ^ Huber R, Parsa V, Scollie S (2014-11-17). "Predicting the perceived sound quality of frequency-compressed speech". PLOS ONE. 9 (11): e110260. Bibcode:2014PLoSO...9k0260H. doi:10.1371/journal.pone.0110260. PMC 4234248. PMID 25402456.
- ^ a b Kates J, Arehart K (2014-03-20). "The Hearing-Aid Speech Quality Index (HASQI) Version 2". Journal of the Audio Engineering Society. 62 (3): 99–117. doi:10.17743/jaes.2014.0006. ISSN 1549-4950.
- ^ Kates J, Arehart K (20 March 2014). "The Hearing-Aid Speech Quality Index (HASQI) Version 2". Journal of the Audio Engineering Society. 62 (3): 99–117. doi:10.17743/jaes.2014.0006.
- ^ Kates JM, Arehart KH (February 2016). "The Hearing-Aid Audio Quality Index (HAAQI)". IEEE/ACM Transactions on Audio, Speech, and Language Processing. 24 (2): 354–365. doi:10.1109/taslp.2015.2507858. PMC 4849486. PMID 27135042.
- ^ Kates J (2013). An auditory model for intelligibility and quality predictions. Proceedings of Meetings on Acoustics. 133. Acoustical Society of America. p. 050184. Bibcode:2013ASAJ..133.3560K. doi:10.1121/1.4799223.