La prueba de datos sustitutos [1] (o el método de datos sustitutos ) es una prueba estadística por técnica de contradicción y similar al bootstrapping paramétrico utilizado para detectar la no linealidad en una serie de tiempo . [2] La técnica básicamente consiste en especificar una hipótesis nula. describir un proceso lineal y luego generar varios conjuntos de datos sustitutos de acuerdo conutilizando métodos de Monte Carlo . A continuación, se calcula una estadística discriminatoria para la serie de tiempo original y todo el conjunto sustituto. Si el valor del estadístico es significativamente diferente para la serie original que para el conjunto sustituto, se rechaza la hipótesis nula y se asume la no linealidad. [2]
El método particular de prueba de datos sustitutos que se utilizará está directamente relacionado con la hipótesis nula. Por lo general, esto es similar a lo siguiente: Los datos son una realización de un sistema lineal estacionario, cuya salida posiblemente ha sido medida por una función posiblemente no lineal (pero estática) que aumenta monótonamente . [1] Aquí lineal significa que cada valor depende linealmente de valores pasados o de valores pasados y presentes de algún proceso independiente distribuido idénticamente (iid), generalmente también gaussiano. Esto equivale a decir que el proceso es de tipo ARMA . En el caso de flujos (asignaciones continuas), la linealidad del sistema significa que puede expresarse mediante una ecuación diferencial lineal. En esta hipótesis, la función de medición estática es aquella que depende solo del valor presente de su argumento, no de los pasados.
Métodos
Se han propuesto muchos algoritmos para generar datos sustitutos. Por lo general, se clasifican en dos grupos: [3]
- Realizaciones típicas : las series de datos se generan como salidas de un modelo bien ajustado a los datos originales.
- Realizaciones restringidas : las series de datos se crean directamente a partir de los datos originales, generalmente mediante alguna transformación adecuada de los mismos.
Los últimos métodos de datos sustitutos no dependen de un modelo en particular, ni de ningún parámetro, por lo que son métodos no paramétricos. Estos métodos de datos sustitutos generalmente se basan en la preservación de la estructura lineal de la serie original (por ejemplo, preservando la función de autocorrelación o, de manera equivalente, el periodograma , una estimación del espectro de la muestra). [4] Entre los métodos de realización restringidos, los más utilizados (y por lo tanto podrían llamarse métodos clásicos ) son:
- Algoritmo 0, o RS (para Random Shuffle ): [1] [5] Los nuevos datos se crean simplemente mediante permutaciones aleatorias de la serie original. Las permutaciones garantizan la misma distribución de amplitud que la serie original, pero destruyen cualquier correlación lineal. Este método está asociado a la hipótesis nula de que los datos son ruido no correlacionado (posiblemente gaussiano y medido por una función estática no lineal).
- Algoritmo 1, o RP (para Fases Aleatorias ; también conocido como FT, para Transformada de Fourier ): [1] [6] Para preservar la correlación lineal (el periodograma) de la serie, los datos sustitutos son creados por la Transformada de Fourier inversa de los módulos de la Transformada de Fourier de los datos originales con nuevas fases (uniformemente aleatorias). Si los sustitutos deben ser reales, las fases de Fourier deben ser antisimétricas con respecto al valor central de los datos.
- Algoritmo 2, o AAFT (para Transformada de Fourier ajustada por amplitud ): [1] [3] Este método tiene aproximadamente las ventajas de los dos anteriores: intenta preservar tanto la estructura lineal como la distribución de amplitud. Este método consta de estos pasos:
- Escalar los datos a una distribución gaussiana ( gaussianización ).
- Realización de una transformación RP de los nuevos datos.
- Finalmente haciendo una transformación inversa a la primera ( desgaussianización ).
- El inconveniente de este método es precisamente que el último paso cambia algo la estructura lineal.
- Algoritmo iterativo 2, o IAAFT (para Transformada de Fourier ajustada de amplitud iterativa ): [7] Este algoritmo es una versión iterativa de AAFT. Los pasos se repiten hasta que la función de autocorrelación sea lo suficientemente similar a la original, o hasta que no haya cambios en las amplitudes.
Se han propuesto muchos otros métodos de datos sustitutos, algunos basados en optimizaciones para lograr una autocorrelación cercana a la original, [8] [9] [10] algunos basados en la transformada wavelet [11] [12] [13] y algunos capaces de tratar con algunos tipos de datos no estacionarios. [14] [15] [16]
Ver también
Referencias
- ^ a b c d e J. Theiler; S. Eubank; A. Longtin; B. Galdrikian; J. Doyne Farmer (1992). "Prueba de no linealidad en series de tiempo: el método de datos sustitutos" (PDF) . Physica D . 58 (1–4): 77–94. Código Bibliográfico : 1992PhyD ... 58 ... 77T . doi : 10.1016 / 0167-2789 (92) 90102-S .
- ^ a b Andreas Galka (2000). Temas en el análisis de series de tiempo no lineal: con implicaciones para el análisis de EEG . River Edge, Nueva Jersey: World Scientific. págs. 222-223. ISBN 9789810241483.
- ^ a b J. Theiler; D. Prichard (1996). "Método de Monte-Carlo de realización restringida para la prueba de hipótesis". Physica D . 94 (4): 221–235. arXiv : comp-gas / 9603001 . Código Bibliográfico : 1996PhyD ... 94..221T . doi : 10.1016 / 0167-2789 (96) 00050-4 .
- ^ A. Galka; T. Ozaki (2001). "Prueba de no linealidad en series de tiempo de alta dimensión de dinámica continua". Physica D . 158 (1–4): 32–44. Código Bibliográfico : 2001PhyD..158 ... 32G . CiteSeerX 10.1.1.379.7641 . doi : 10.1016 / s0167-2789 (01) 00318-9 .
- ^ JA Scheinkman; B. LeBaron (1989). "Dinámica no lineal y rentabilidad de las acciones" . El diario de negocios . 62 (3): 311. doi : 10.1086 / 296465 .
- ^ AR Osborne; AD Kirwan Jr .; A. provenzale; L. Bergamasco (1986). "Una búsqueda de comportamiento caótico en movimientos grandes y de mesoescala en el Océano Pacífico". Physica D . 23 (1-3): 75-83. Código Bibliográfico : 1986PhyD ... 23 ... 75O . doi : 10.1016 / 0167-2789 (86) 90113-2 .
- ^ T. Schreiber; A. Schmitz (1996). "Datos sustitutos mejorados para pruebas de no linealidad". Phys. Rev. Lett . 77 (4): 635–638. arXiv : chao-dyn / 9909041 . Código Bibliográfico : 1996PhRvL..77..635S . doi : 10.1103 / PhysRevLett.77.635 . PMID 10062864 .
- ^ T. Schreiber; A. Schmitz (2000). "Serie temporal sustituta". Physica D . 142 (3–4): 346–382. Código Bibliográfico : 2000PhyD..142..346S . doi : 10.1016 / S0167-2789 (00) 00043-9 .
- ^ T. Schreiber (1998). "Aleatorización restringida de datos de series de tiempo". Phys. Rev. Lett . 80 (4): 2105–2108. arXiv : chao-dyn / 9909042 . Código Bibliográfico : 1998PhRvL..80.2105S . doi : 10.1103 / PhysRevLett.80.2105 .
- ^ R. Engbert (2002). "Prueba de no linealidad: el papel de los datos sustitutos". Caos, solitones y fractales . 13 (1): 79–84. Código bibliográfico : 2002CSF .... 13 ... 79E . doi : 10.1016 / S0960-0779 (00) 00236-8 .
- ^ M. Breakspear; M. Brammer; PA Robinson (2003). "Construcción de conjuntos sustitutos multivariados a partir de datos no lineales utilizando la transformada wavelet". Physica D . 182 (1): 1–22. Código Bibliográfico : 2003PhyD..182 .... 1B . doi : 10.1016 / S0167-2789 (03) 00136-2 .
- ^ CJ Keylock (2006). "Serie temporal sustitutiva restringida con preservación de la estructura de la media y la varianza". Phys. Rev. E . 73 (3): 036707. Código Bibliográfico : 2006PhRvE..73c6707K . doi : 10.1103 / PhysRevE.73.036707 .
- ^ CJ Keylock (2007). "Un método basado en ondículas para la generación de datos sustitutos". Physica D . 225 (2): 219-228. Código Bibliográfico : 2007PhyD..225..219K . doi : 10.1016 / j.physd.2006.10.012 .
- ^ T. Nakamura; M. Pequeño (2005). "Datos sustitutos de reproducción aleatoria pequeña: prueba de la dinámica en datos fluctuantes con tendencias". Phys. Rev. E . 72 (5): 056216. doi : 10.1103 / PhysRevE.72.056216 . hdl : 10397/4826 .
- ^ T. Nakamura; M. Pequeño; Y. Hirata (2006). "Prueba de no linealidad en fluctuaciones irregulares con tendencias a largo plazo". Phys. Rev. E . 74 (2): 026205. Código Bibliográfico : 2006PhRvE..74b6205N . doi : 10.1103 / PhysRevE.74.026205 . hdl : 10397/7633 .
- ^ JH Lucio; R. Valdés; LR Rodríguez (2012). "Mejoras en los métodos de datos sustitutos para series de tiempo no estacionarias". Phys. Rev. E . 85 (5): 056202. Código Bibliográfico : 2012PhRvE..85e6202L . doi : 10.1103 / PhysRevE.85.056202 . PMID 23004838 .