Transformada de Fourier de corta duración


De Wikipedia, la enciclopedia libre
  (Redirigido desde la transformada de Fourier de corta duración )
Saltar a navegación Saltar a búsqueda

La transformada de Fourier de corta duración ( STFT ) es una transformada relacionada con Fourier que se utiliza para determinar la frecuencia sinusoidal y el contenido de fase de las secciones locales de una señal a medida que cambia con el tiempo. [1] En la práctica, el procedimiento para calcular STFT es dividir una señal de tiempo más largo en segmentos más cortos de igual longitud y luego calcular la transformada de Fourier por separado en cada segmento más corto. Esto revela el espectro de Fourier en cada segmento más corto. Por lo general, se trazan los espectros cambiantes en función del tiempo, lo que se conoce como espectrograma o gráfico de cascada, como el que se usa comúnmente en la radio definida por software.(SDR) pantallas de espectro basadas en. Las pantallas de ancho de banda completo que cubren todo el rango de un SDR comúnmente usan Transformadas Rápidas de Fourier (FFT) con 2 ^ 24 puntos en computadoras de escritorio.

Ejemplo de transformadas de Fourier de corta duración utilizadas para determinar el tiempo de impacto de la señal de audio

Adelante STFT

STFT de tiempo continuo

Simplemente, en el caso de tiempo continuo, la función que se va a transformar se multiplica por una función de ventana que es distinta de cero durante un breve período de tiempo. La transformada de Fourier (una función unidimensional) de la señal resultante se toma cuando la ventana se desliza a lo largo del eje del tiempo, lo que da como resultado una representación bidimensional de la señal. Matemáticamente, esto se escribe como:

donde está la función de ventana , comúnmente una ventana de Hann o ventana gaussiana centrada alrededor de cero, y es la señal que se va a transformar (observe la diferencia entre la función de ventana y la frecuencia ). es esencialmente la transformada de Fourier de , una función compleja que representa la fase y la magnitud de la señal en el tiempo y la frecuencia. A menudo , el desenvolvimiento de fase se emplea a lo largo de uno o ambos ejes de tiempo , y eje de frecuencia , para suprimir cualquier discontinuidad de salto del resultado de fase del STFT. El índice de tiempo normalmente se considera " lento"tiempo y, por lo general, no se expresa en una resolución tan alta como el tiempo .

STFT de tiempo discreto

En el caso del tiempo discreto, los datos que se van a transformar se pueden dividir en fragmentos o fotogramas (que normalmente se superponen entre sí para reducir los artefactos en el límite). Cada fragmento se transforma de Fourier y el resultado complejo se agrega a una matriz, que registra la magnitud y la fase para cada punto en el tiempo y la frecuencia. Esto se puede expresar como:

asimismo, con la señal x [ n ] y la ventana w [ n ]. En este caso, m es discreta y ω es continua, pero en la mayoría de las aplicaciones típicas, la STFT se realiza en una computadora usando la transformada rápida de Fourier , por lo que ambas variables son discretas y cuantificadas .

La magnitud al cuadrado de la STFT produce la representación del espectrograma de la densidad espectral de potencia de la función:

Véase también la transformada de coseno discreta modificada (MDCT), que también es una transformada relacionada con Fourier que utiliza ventanas superpuestas.

DFT deslizante

Si sólo se desea un pequeño número de ω, o si se desea evaluar el STFT para cada turno m de la ventana, entonces el STFT puede evaluarse de manera más eficiente utilizando un algoritmo DFT deslizante . [2]

STFT inverso

El STFT es invertible , es decir, la señal original se puede recuperar de la transformada mediante el STFT inverso. La forma más aceptada de invertir el STFT es mediante el método de superposición-adición (OLA) , que también permite modificaciones en el espectro complejo de STFT. Esto lo convierte en un método de procesamiento de señales versátil, [3] denominado método de superposición y adición con modificaciones .

STFT de tiempo continuo

Dado el ancho y la definición de la función de ventana w ( t ), inicialmente requerimos que el área de la función de ventana sea escalada de modo que

Se sigue fácilmente que

y

La transformada de Fourier continua es

Sustituyendo x ( t ) de arriba:

Intercambio de orden de integración:

Entonces, la transformada de Fourier puede verse como una especie de suma coherente de fase de todas las STFT de x ( t ). Dado que la transformada de Fourier inversa es

entonces x ( t ) se puede recuperar de X (τ, ω) como

o

Se puede ver, en comparación con lo anterior, que el "grano" o la "ondícula" con ventana de x ( t ) es

la transformada inversa de Fourier de X (τ, ω) para τ fijo.

Problemas de resolución

Uno de los inconvenientes del STFT es que tiene una resolución fija. El ancho de la función de ventana se relaciona con la forma en que se representa la señal; determina si hay una buena resolución de frecuencia (los componentes de frecuencia muy próximos pueden separarse) o una buena resolución de tiempo (el momento en el que cambian las frecuencias). Una ventana amplia proporciona una mejor resolución de frecuencia pero una resolución de tiempo deficiente. Una ventana más estrecha proporciona una buena resolución de tiempo pero una resolución de frecuencia deficiente. Se denominan transformadas de banda estrecha y de banda ancha, respectivamente.

Comparación de resolución STFT. La izquierda tiene una mejor resolución de tiempo y la derecha tiene una mejor resolución de frecuencia.

Esta es una de las razones para la creación de la transformada de ondículas y el análisis multirresolución , que puede dar una buena resolución de tiempo para eventos de alta frecuencia y una buena resolución de frecuencia para eventos de baja frecuencia, la combinación más adecuada para muchas señales reales.

Esta propiedad está relacionada con el principio de incertidumbre de Heisenberg , pero no directamente; consulte el límite de Gabor para su discusión. El producto de la desviación estándar en el tiempo y la frecuencia es limitado. El límite del principio de incertidumbre (la mejor resolución simultánea de ambos) se alcanza con una función de ventana gaussiana, ya que la gaussiana minimiza el principio de incertidumbre de Fourier . Esto se llama la transformada de Gabor (y con modificaciones para multirresolución se convierte en la transformada de ondas de Morlet ).

Se puede considerar el STFT para variar el tamaño de la ventana como un dominio bidimensional (tiempo y frecuencia), como se ilustra en el siguiente ejemplo, que se puede calcular variando el tamaño de la ventana. Sin embargo, esto ya no es una representación estrictamente de tiempo-frecuencia: el kernel no es constante en toda la señal.

Ejemplo

Usando la siguiente señal de muestra que se compone de un conjunto de cuatro formas de onda sinusoidales unidas en secuencia. Cada forma de onda está compuesta únicamente por una de cuatro frecuencias (10, 25, 50, 100 Hz ). La definición de es:

Luego se muestrea a 400 Hz. Se produjeron los siguientes espectrogramas:

La ventana de 25 ms nos permite identificar un momento preciso en el que cambian las señales, pero las frecuencias precisas son difíciles de identificar. En el otro extremo de la escala, la ventana de 1000 ms permite ver las frecuencias con precisión, pero el tiempo entre cambios de frecuencia es borroso.

Explicación

También se puede explicar con referencia al muestreo y la frecuencia de Nyquist .

Tome una ventana de N muestras de una señal arbitraria de valor real a una frecuencia de muestreo f s . Tomar la transformada de Fourier produce N coeficientes complejos. De estos coeficientes, sólo la mitad son útiles (el último N / 2 es el complejo conjugado del primer N / 2 en orden inverso, ya que se trata de una señal de valor real).

Estos coeficientes N / 2 representan las frecuencias 0 af s / 2 (Nyquist) y dos coeficientes consecutivos están separados por f s / N Hz.

Para aumentar la resolución de frecuencia de la ventana, es necesario reducir el espaciado de frecuencia de los coeficientes. Solo hay dos variables, pero disminuir f s (y mantener N constante) hará que el tamaño de la ventana aumente, ya que ahora hay menos muestras por unidad de tiempo. La otra alternativa es aumentar N , pero esto nuevamente hace que aumente el tamaño de la ventana. Por tanto, cualquier intento de aumentar la resolución de frecuencia provoca un tamaño de ventana más grande y, por tanto, una reducción en la resolución de tiempo, y viceversa.

Frecuencia de Rayleigh

Como la frecuencia de Nyquist es una limitación en la frecuencia máxima que se puede analizar de manera significativa, la frecuencia de Rayleigh es una limitación en la frecuencia mínima.

La frecuencia de Rayleigh es la frecuencia mínima que puede resolverse mediante una ventana de tiempo de duración finita. [4] [5]

Dada una ventana de tiempo de Τ segundos de duración, la frecuencia mínima que se puede resolver es 1 / Τ Hz.

La frecuencia de Rayleigh es una consideración importante en las aplicaciones de la transformada de Fourier de corta duración (STFT), así como en cualquier otro método de análisis armónico en una señal de longitud de registro finita. [6] [7]

Solicitud

Un STFT que se utiliza para analizar una señal de audio a lo largo del tiempo.

Los STFT, así como las transformadas estándar de Fourier y otras herramientas, se utilizan con frecuencia para analizar música. El espectrograma puede, por ejemplo, mostrar la frecuencia en el eje horizontal, con las frecuencias más bajas a la izquierda y las más altas a la derecha. La altura de cada barra (aumentada por color) representa la amplitud de las frecuencias dentro de esa banda. La dimensión de profundidad representa el tiempo, donde cada nueva barra era una transformación distinta separada. Los ingenieros de audio utilizan este tipo de visual para obtener información sobre una muestra de audio, por ejemplo, para ubicar las frecuencias de ruidos específicos (especialmente cuando se usan con mayor resolución de frecuencia) o para encontrar frecuencias que pueden ser más o menos resonantes en el espacio donde el se grabó la señal. Esta información se puede utilizar para la ecualización o sintonizar otros efectos de audio.

Implementación

Función original

Conversión a la forma discreta:

Suponer que

Entonces podemos escribir la función original en

Implementación directa

Restricciones

un. Criterio de Nyquist (evitar el efecto de aliasing):

, donde esta el ancho de banda de

Método basado en FFT

Restricción

un. , donde es un entero

B.

C. Criterio de Nyquist (evitar el efecto de aliasing):

, es el ancho de banda de

Método recursivo

Restricción

un. , donde es un entero

B.

C. Criterio de Nyquist (evitar el efecto de aliasing):

, es el ancho de banda de

D. Solo para implementar el STFT rectangular

La ventana rectangular impone la restricción.

La sustitución da:

Cambio de variable n -1 por n :

Calcular por la FFT de N puntos:

donde

Aplicar la fórmula recursiva para calcular

Transformación Chirp Z

Restricción

asi que

Comparación de implementación

Ver también

  • Estimación de densidad espectral
  • Análisis de frecuencia de tiempo
  • Representación de frecuencia de tiempo
  • Método de reasignación

Otras transformaciones de frecuencia de tiempo:

  • Función de distribución en forma de cono
  • Transformada Q constante
  • Transformada fraccional de Fourier
  • Transformada de Gabor
  • Transformación de Newland
  • S transforma
  • Transformada wavelet
  • Transformación de chirplet

Referencias

  1. ^ Sejdić E .; Djurović I .; Jiang J. (2009). "Representación de la función de frecuencia de tiempo utilizando la concentración de energía: una visión general de los avances recientes". Procesamiento de señales digitales . 19 (1): 153–183. doi : 10.1016 / j.dsp.2007.12.004 .
  2. ^ E. Jacobsen y R. Lyons, La DFT deslizante , Revista de procesamiento de señales ,vol. 20, número 2, págs. 74–80 (marzo de 2003).
  3. ^ Jont B. Allen (junio de 1977). "Análisis espectral a corto plazo, síntesis y modificación por transformada discreta de Fourier". Transacciones IEEE sobre acústica, habla y procesamiento de señales . ASSP-25 (3): 235–238. doi : 10.1109 / TASSP.1977.1162950 .
  4. ^ https://physics.ucsd.edu/neurophysics/publications/Cold%20Spring%20Harb%20Protoc-2014-Kleinfeld-pdb.top081075.pdf
  5. ^ "¿Qué significa" relleno no suficiente para la resolución de frecuencia solicitada "? - Caja de herramientas FieldTrip" .
  6. Zeitler M, Fries P, Gielen S (2008). "Competencia sesgada a través de variaciones en la amplitud de las oscilaciones gamma" . J Comput Neurosci . 25 (1): 89–107. doi : 10.1007 / s10827-007-0066-2 . PMC 2441488 . PMID 18293071 .  
  7. Wingerden, Marijn van; Vinck, Martin; Lankelma, Jan; Pennartz, Cyriel MA (19 de mayo de 2010). "Bloqueo de fase de Theta-Band de las neuronas orbitofrontales durante la expectativa de recompensa" . Revista de neurociencia . 30 (20): 7078–7087. doi : 10.1523 / JNEUROSCI.3860-09.2010 . ISSN 0270-6474 . PMC 6632657 . PMID 20484650 .   

enlaces externos

  • DiscreteTFDs: software para calcular la transformada de Fourier de corta duración y otras distribuciones de tiempo-frecuencia
  • Singular Spectral Analysis - MultiTaper Method Toolkit - un programa de software gratuito para analizar series de tiempo cortas y ruidosas
  • kSpectra Toolkit para Mac OS X de SpectraWorks
  • Transformada de Fourier de tiempo corto extendido para el análisis de frecuencia de tiempo de señales de banda ultra ancha
  • Una clase de Matlab con licencia BSD para realizar STFT y STFT inverso
  • LTFAT: una caja de herramientas Matlab / Octave gratuita (GPL) para trabajar con transformadas de Fourier de corta duración y análisis de tiempo-frecuencia
  • Sonogram visible speech: un software gratuito (GPL) gratuito para transformadas de Fourier de corta duración y análisis de tiempo-frecuencia
Obtenido de " https://en.wikipedia.org/w/index.php?title=Short-time_Fourier_transform&oldid=1035110534 "