De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Serie de tiempo: datos aleatorios más tendencia, con la línea de mejor ajuste y diferentes filtros aplicados

En matemáticas , una serie de tiempo es una serie de puntos de datos indexados (o enumerados o graficados) en orden de tiempo. Más comúnmente, una serie de tiempo es una secuencia tomada en puntos sucesivos igualmente espaciados en el tiempo. Por tanto, es una secuencia de datos en tiempo discreto . Ejemplos de series de tiempo son las alturas de las mareas oceánicas , el recuento de manchas solares y el valor de cierre diario del Dow Jones Industrial Average .

Las series de tiempo se trazan con mucha frecuencia a través de gráficos de ejecución (un gráfico de líneas temporales ). Las series de tiempo se utilizan en estadística , procesamiento de señales , reconocimiento de patrones , econometría , finanzas matemáticas , pronóstico del tiempo , predicción de terremotos , electroencefalografía , ingeniería de control , astronomía , ingeniería de comunicaciones y, en gran medida, en cualquier dominio de la ciencia y la ingeniería aplicadas que involucran mediciones temporales .

El análisis de series de tiempo comprende métodos para analizar datos de series de tiempo con el fin de extraer estadísticas significativas y otras características de los datos. El pronóstico de series de tiempo es el uso de un modelo para predecir valores futuros basados ​​en valores previamente observados. Si bien el análisis de regresión a menudo se emplea para probar las relaciones entre una serie de tiempo más diferente, este tipo de análisis no se suele llamar "análisis de series de tiempo", que se refiere en particular a las relaciones entre diferentes puntos en el tiempo dentro de una sola serie. . Serie temporal interrumpida El análisis se utiliza para detectar cambios en la evolución de una serie temporal desde antes hasta después de alguna intervención que puedan afectar a la variable subyacente.

Los datos de series de tiempo tienen un orden temporal natural. Esto hace que el análisis de series de tiempo sea distinto de los estudios transversales , en los que no existe un orden natural de las observaciones (por ejemplo, explicar los salarios de las personas con referencia a sus respectivos niveles de educación, donde los datos de las personas pueden ingresarse en cualquier orden). El análisis de series de tiempo también es distinto del análisis de datos espaciales donde las observaciones se relacionan típicamente con ubicaciones geográficas (por ejemplo, contabilizando los precios de la vivienda por la ubicación, así como las características intrínsecas de las casas). Un estocásticoEl modelo para una serie de tiempo generalmente reflejará el hecho de que las observaciones cercanas en el tiempo estarán más estrechamente relacionadas que las observaciones más separadas. Además, los modelos de series de tiempo a menudo harán uso del orden natural unidireccional del tiempo, de modo que los valores para un período dado se expresen como derivados de alguna manera de valores pasados, en lugar de valores futuros (ver reversibilidad del tiempo ).

El análisis de series de tiempo se puede aplicar a datos continuos de valor real , datos numéricos discretos o datos simbólicos discretos (es decir, secuencias de caracteres, como letras y palabras en el idioma inglés [1] ).

Métodos de análisis [ editar ]

Los métodos para el análisis de series de tiempo pueden dividirse en dos clases: métodos en el dominio de la frecuencia y métodos en el dominio del tiempo . Los primeros incluyen análisis espectral y análisis de ondículas ; los últimos incluyen auto-correlación y de correlación cruzada análisis. En el dominio del tiempo, la correlación y el análisis se pueden realizar a modo de filtro usando correlación escalada , mitigando así la necesidad de operar en el dominio de la frecuencia.

Además, las técnicas de análisis de series de tiempo se pueden dividir en métodos paramétricos y no paramétricos . Los enfoques paramétricos asumen que el proceso estocástico estacionario subyacente tiene una cierta estructura que puede describirse usando una pequeña cantidad de parámetros (por ejemplo, usando un modelo autorregresivo o de media móvil ). En estos enfoques, la tarea es estimar los parámetros del modelo que describe el proceso estocástico. Por el contrario, los enfoques no paramétricos estiman explícitamente la covarianza o el espectro del proceso sin asumir que el proceso tiene una estructura particular.

Los métodos de análisis de series de tiempo también se pueden dividir en lineales y no lineales , y univariados y multivariados .

Datos del panel [ editar ]

Una serie de tiempo es un tipo de datos de panel . Los datos de panel son la clase general, un conjunto de datos multidimensionales, mientras que un conjunto de datos de series de tiempo es un panel unidimensional (al igual que un conjunto de datos de sección transversal ). Un conjunto de datos puede exhibir características tanto de datos de panel como de datos de series de tiempo. Una forma de saberlo es preguntar qué hace que un registro de datos sea único de los demás registros. Si la respuesta es el campo de datos de tiempo, entonces este es un candidato de conjunto de datos de series de tiempo. Si la determinación de un registro único requiere un campo de datos de tiempo y un identificador adicional que no está relacionado con el tiempo (ID de estudiante, símbolo de cotización, código de país), entonces es un candidato de datos de panel. Si la diferenciación radica en el identificador no temporal, entonces el conjunto de datos es un candidato de conjunto de datos de sección transversal.

Análisis [ editar ]

Hay varios tipos de análisis de datos y motivación disponibles para series de tiempo que son apropiados para diferentes propósitos.

Motivación [ editar ]

En el contexto de la estadística , la econometría , las finanzas cuantitativas , la sismología , la meteorología y la geofísica, el objetivo principal del análisis de series de tiempo es la predicción . En el contexto del procesamiento de señales , la ingeniería de control y la ingeniería de comunicaciones , se utiliza para la detección de señales. Otras aplicaciones son la minería de datos , el reconocimiento de patrones y el aprendizaje automático , donde el análisis de series de tiempo se puede utilizar para la agrupación , [2] [3] clasificación, [4] consulta por contenido, [5] detección de anomalías y previsión . [ cita requerida ]

Análisis exploratorio [ editar ]

Incidencia de tuberculosis en EE. UU. 1953-2009

Una forma sencilla de examinar una serie de tiempo regular es manualmente con un gráfico de líneas . A la derecha se muestra un gráfico de ejemplo para la incidencia de tuberculosis en los Estados Unidos, elaborado con un programa de hoja de cálculo. El número de casos se estandarizó a una tasa por 100.000 y se calculó el cambio porcentual por año en esta tasa. La línea descendente casi constante muestra que la incidencia de TB disminuyó en la mayoría de los años, pero el cambio porcentual en esta tasa varió hasta en +/- 10%, con 'aumentos repentinos' en 1975 y alrededor de principios de la década de 1990. El uso de ambos ejes verticales permite comparar dos series de tiempo en un gráfico.

Otras técnicas incluyen:

  • Análisis de autocorrelación para examinar la dependencia serial
  • Análisis espectral para examinar el comportamiento cíclico que no necesita estar relacionado con la estacionalidad . Por ejemplo, la actividad de las manchas solares varía en ciclos de 11 años. [6] [7] Otros ejemplos comunes incluyen los fenómenos celestes, los patrones climáticos, la actividad neuronal, los precios de los productos básicos y la actividad económica.
  • Separación en componentes que representan tendencia, estacionalidad, variación lenta y rápida e irregularidad cíclica: ver estimación de tendencias y descomposición de series de tiempo

Ajuste de curva [ editar ]

El ajuste de curvas [8] [9] es el proceso de construir una curva , o función matemática , que tiene el mejor ajuste a una serie de puntos de datos , [10] posiblemente sujeta a restricciones. [11] [12] El ajuste de curvas puede implicar interpolación , [13] [14] cuando se requiere un ajuste exacto a los datos, o suavizado , [15] [16] en el que se construye una función "suave" que se ajusta aproximadamente los datos. Un tema relacionado es el análisis de regresión , [17] [18] que se centra más en cuestiones deinferencia estadística , como cuánta incertidumbre está presente en una curva que se ajusta a los datos observados con errores aleatorios. Las curvas ajustadas se pueden utilizar como ayuda para la visualización de datos, [19] [20] para inferir valores de una función cuando no hay datos disponibles, [21] y para resumir las relaciones entre dos o más variables. [22] La extrapolación se refiere al uso de una curva ajustada más allá del rango de los datos observados, [23] y está sujeta a un grado de incertidumbre [24] ya que puede reflejar el método utilizado para construir la curva tanto como refleja los datos observados.

La construcción de series de tiempo económicas implica la estimación de algunos componentes para algunas fechas mediante la interpolación entre valores ("puntos de referencia") para fechas anteriores y posteriores. La interpolación es la estimación de una cantidad desconocida entre dos cantidades conocidas (datos históricos) o sacar conclusiones sobre la información faltante de la información disponible ("lectura entre líneas"). [25] La interpolación es útil cuando los datos que rodean los datos faltantes están disponibles y se conocen su tendencia, estacionalidad y ciclos a más largo plazo. Esto se hace a menudo mediante el uso de una serie relacionada conocida por todas las fechas relevantes. [26] Alternativamente, se usa la interpolación polinomial o la interpolación spline cuando por parteslas funciones polinomiales se ajustan a intervalos de tiempo de modo que encajen entre sí sin problemas. Un problema diferente que está estrechamente relacionado con la interpolación es la aproximación de una función complicada por una función simple (también llamada regresión ) .La principal diferencia entre la regresión y la interpolación es que la regresión polinomial da un único polinomio que modela todo el conjunto de datos. La interpolación spline, sin embargo, produce una función continua por partes compuesta de muchos polinomios para modelar el conjunto de datos.

La extrapolación es el proceso de estimar, más allá del rango de observación original, el valor de una variable sobre la base de su relación con otra variable. Es similar a la interpolación , que produce estimaciones entre observaciones conocidas, pero la extrapolación está sujeta a una mayor incertidumbre y un mayor riesgo de producir resultados sin sentido.

Aproximación de funciones [ editar ]

En general, un problema de aproximación de funciones nos pide que seleccionemos una función entre una clase bien definida que se asemeje mucho (se "aproxime") a una función objetivo de una manera específica de la tarea. Se pueden distinguir dos clases principales de problemas de aproximación de funciones: Primero, para funciones objetivo conocidas, la teoría de aproximación es la rama del análisis numérico que investiga cómo ciertas funciones conocidas (por ejemplo, funciones especiales ) pueden aproximarse mediante una clase específica de funciones (por ejemplo , polinomios o funciones racionales ) que a menudo tienen propiedades deseables (cálculo económico, continuidad, valores integrales y límite, etc.).

En segundo lugar, la función objetivo, llámela g , puede ser desconocida; en lugar de una fórmula explícita, solo se proporciona un conjunto de puntos (una serie de tiempo) de la forma ( x , g ( x )). Dependiendo de la estructura del dominio y codominio de g , pueden ser aplicables varias técnicas para aproximar g . Por ejemplo, si g es una operación con números reales , se pueden utilizar técnicas de interpolación , extrapolación , análisis de regresión y ajuste de curvas . Si el codominio(rango o conjunto objetivo) de g es un conjunto finito, en su lugar, se está tratando con un problema de clasificación . Un problema relacionado con la aproximación de series de tiempo en línea [27] es resumir los datos en una sola pasada y construir una representación aproximada que pueda soportar una variedad de consultas de series de tiempo con límites en el error del peor de los casos.

Hasta cierto punto, los diferentes problemas ( regresión , clasificación , aproximación de aptitud ) han recibido un tratamiento unificado en la teoría del aprendizaje estadístico , donde se consideran problemas de aprendizaje supervisado .

Predicción y previsión [ editar ]

En estadística , la predicción es parte de la inferencia estadística . Un enfoque particular de tal inferencia se conoce como inferencia predictiva , pero la predicción se puede realizar dentro de cualquiera de los varios enfoques de inferencia estadística. De hecho, una descripción de las estadísticas es que proporciona un medio para transferir conocimientos sobre una muestra de una población a toda la población y a otras poblaciones relacionadas, lo que no es necesariamente lo mismo que la predicción a lo largo del tiempo. Cuando la información se transfiere a lo largo del tiempo, a menudo a puntos específicos en el tiempo, el proceso se conoce como pronóstico .

  • Modelos estadísticos completamente formados para fines de simulación estocástica , a fin de generar versiones alternativas de la serie de tiempo, que representen lo que podría suceder en períodos de tiempo no específicos en el futuro.
  • Modelos estadísticos simples o completamente formados para describir el resultado probable de la serie de tiempo en el futuro inmediato, dado el conocimiento de los resultados más recientes (pronóstico).
  • La predicción de series de tiempo generalmente se realiza utilizando paquetes de software estadístico automatizados y lenguajes de programación, como Julia , Python , R , SAS , SPSS y muchos otros.
  • La previsión de datos a gran escala se puede realizar con Apache Spark utilizando la biblioteca Spark-TS, un paquete de terceros. [28]

Clasificación [ editar ]

Asignar un patrón de series de tiempo a una categoría específica, por ejemplo, identificar una palabra basada en una serie de movimientos de la mano en el lenguaje de señas .

Estimación de señal [ editar ]

Este enfoque se basa en el análisis armónico y el filtrado de señales en el dominio de la frecuencia utilizando la transformada de Fourier y la estimación de la densidad espectral , cuyo desarrollo se aceleró significativamente durante la Segunda Guerra Mundial por el matemático Norbert Wiener , los ingenieros eléctricos Rudolf E. Kálmán , Dennis Gabor y otros para filtrar señales del ruido y predecir los valores de las señales en un momento determinado. Consulte el filtro de Kalman , la teoría de la estimación y el procesamiento de señales digitales.

Segmentación [ editar ]

Dividir una serie de tiempo en una secuencia de segmentos. A menudo ocurre que una serie de tiempo se puede representar como una secuencia de segmentos individuales, cada uno con sus propias propiedades características. Por ejemplo, la señal de audio de una conferencia telefónica se puede dividir en partes correspondientes a los tiempos durante los cuales cada persona estuvo hablando. En la segmentación de series de tiempo, el objetivo es identificar los puntos límite del segmento en la serie de tiempo y caracterizar las propiedades dinámicas asociadas con cada segmento. Se puede abordar este problema utilizando la detección del punto de cambio o modelando la serie temporal como un sistema más sofisticado, como un sistema lineal de salto de Markov.

Modelos [ editar ]

Los modelos de datos de series de tiempo pueden tener muchas formas y representar diferentes procesos estocásticos . Cuando se modelan variaciones en el nivel de un proceso, tres grandes clases de importancia práctica son los modelos autorregresivos (AR), los modelos integrados (I) y los modelos de media móvil (MA). Estas tres clases dependen linealmente de puntos de datos anteriores. [29] Las combinaciones de estas ideas producen modelos de media móvil autorregresiva (ARMA) y media móvil integrada autorregresiva (ARIMA). La media móvil autorregresiva fraccionalmente integrada(ARFIMA) generaliza los tres primeros. Las extensiones de estas clases para tratar con datos con valores vectoriales están disponibles bajo el título de modelos multivariados de series de tiempo y, a veces, los acrónimos anteriores se amplían al incluir una "V" inicial para "vector", como en VAR para la autorregresión vectorial . Un conjunto adicional de extensiones de estos modelos está disponible para su uso cuando la serie de tiempo observada es impulsada por alguna serie de tiempo "forzada" (que puede no tener un efecto causal en la serie observada): la distinción del caso multivariado es que la serie forzada puede ser determinista o estar bajo el control del experimentador. Para estos modelos, las siglas se amplían con una "X" final para "exógeno".

Es de interés la dependencia no lineal del nivel de una serie en puntos de datos anteriores, en parte debido a la posibilidad de producir una serie de tiempo caótica . Sin embargo, lo que es más importante, las investigaciones empíricas pueden indicar la ventaja de utilizar predicciones derivadas de modelos no lineales, sobre las de modelos lineales, como por ejemplo en modelos exógenos autorregresivos no lineales . Más referencias sobre análisis de series de tiempo no lineales: (Kantz y Schreiber), [30] y (Abarbanel) [31]

Entre otros tipos de modelos de series de tiempo no lineales, existen modelos para representar los cambios de varianza a lo largo del tiempo ( heterocedasticidad ). Estos modelos representan la heterocedasticidad condicional autorregresiva (ARCH) y la colección comprende una amplia variedad de representaciones ( GARCH , TARCH, EGARCH, FIGARCH, CGARCH, etc.). Aquí los cambios en la variabilidad están relacionados con, o son predichos por, valores pasados ​​recientes de la serie observada. Esto contrasta con otras posibles representaciones de variabilidad localmente variable, donde la variabilidad podría modelarse como impulsada por un proceso independiente que varía en el tiempo, como en un modelo doblemente estocástico .

En un trabajo reciente sobre análisis sin modelo, los métodos basados ​​en la transformada de ondas (por ejemplo, ondas localmente estacionarias y redes neuronales descompuestas de ondas) han ganado popularidad. Las técnicas de múltiples escalas (a menudo denominadas multirresolución) descomponen una serie de tiempo dada, intentando ilustrar la dependencia del tiempo en múltiples escalas. Consulte también las técnicas multifractales de conmutación de Markov (MSMF) para modelar la evolución de la volatilidad.

Un modelo de Markov oculto (HMM) es un modelo de Markov estadístico en el que se supone que el sistema que se está modelando es un proceso de Markov con estados no observados (ocultos). Un HMM puede considerarse como la red bayesiana dinámica más simple . Los modelos HMM se utilizan ampliamente en el reconocimiento de voz , para traducir una serie temporal de palabras habladas en texto.

Notación [ editar ]

Se utilizan varias notaciones diferentes para el análisis de series de tiempo. Se escribe una notación común que especifica una serie de tiempo X que está indexada por los números naturales

X = ( X 1 , X 2 , ...).

Otra notación común es

Y = ( Y t : tT ),

donde T es el conjunto de índices .

Condiciones [ editar ]

Hay dos conjuntos de condiciones bajo las cuales se construye gran parte de la teoría:

  • Proceso estacionario
  • Proceso ergódico

Sin embargo, las ideas de estacionariedad deben ampliarse para considerar dos ideas importantes: estacionariedad estricta y estacionariedad de segundo orden . Tanto los modelos como las aplicaciones pueden desarrollarse en cada una de estas condiciones, aunque los modelos en el último caso pueden considerarse como especificados sólo en parte.

Además, el análisis de series de tiempo se puede aplicar cuando las series son estacionales estacionalmente o no estacionarias. Las situaciones en las que las amplitudes de los componentes de frecuencia cambian con el tiempo pueden tratarse en un análisis de tiempo-frecuencia que hace uso de una representación de tiempo-frecuencia de una serie de tiempo o señal. [32]

Herramientas [ editar ]

Las herramientas para investigar datos de series de tiempo incluyen:

  • Consideración de la función de autocorrelación y la función de densidad espectral (también funciones de correlación cruzada y funciones de densidad espectral cruzada)
  • Scaled funciones cruzadas y auto-correlación para eliminar contribuciones de componentes lentos [33]
  • Realización de una transformada de Fourier para investigar la serie en el dominio de la frecuencia
  • Uso de un filtro para eliminar ruidos no deseados
  • Análisis de componentes principales (o análisis empírico de funciones ortogonales )
  • Análisis de espectro singular
  • Modelos "estructurales":
    • Modelos de espacio de estado general
    • Modelos de componentes no observados
  • Aprendizaje automático
    • Redes neuronales artificiales
    • Máquinas de vectores soporte
    • Lógica difusa
    • Proceso gaussiano
    • Modelo de Markov oculto
  • Análisis de la teoría de colas
  • Tabla de control
    • Gráfico de control de individuos de Shewhart
    • Gráfico CUSUM
    • Gráfico EWMA
  • Análisis de fluctuación sin tendencia
  • Modelado no lineal de efectos mixtos
  • Deformación de tiempo dinámica [34]
  • Correlación cruzada [35]
  • Red bayesiana dinámica
  • Técnicas de análisis de frecuencia de tiempo:
    • Transformada rápida de Fourier
    • Transformada de ondícula continua
    • Transformada de Fourier de corta duración
    • Transformación de chirplet
    • Transformada fraccional de Fourier
  • Análisis caótico
    • Dimensión de correlación
    • Gráficos de recurrencia
    • Análisis de cuantificación de recurrencia
    • Exponentes de Lyapunov
    • Codificación de entropía

Medidas [ editar ]

Métricas o características de series de tiempo que se pueden utilizar para la clasificación de series de tiempo o el análisis de regresión : [36]

  • Medidas lineales univariadas
    • Momento (matemáticas)
    • Potencia de banda espectral
    • Frecuencia de borde espectral
    • Energía acumulada (procesamiento de señales)
    • Características de la función de autocorrelación
    • Parámetros de Hjorth
    • Parámetros de FFT
    • Parámetros del modelo autorregresivo
    • Prueba de Mann-Kendall
  • Medidas univariadas no lineales
    • Medidas basadas en la suma de correlaciones
    • Dimensión de correlación
    • Integral de correlación
    • Densidad de correlación
    • Entropía de correlación
    • Entropía aproximada [37]
    • Entropía de muestra
    • Entropía de Fourier Reino Unido
    • Entropía wavelet
    • Entropía de Rényi
    • Métodos de orden superior
    • Predicibilidad marginal
    • Índice de similitud dinámica
    • Medidas de disimilitud del espacio de estados
    • Exponente de Lyapunov
    • Métodos de permutación
    • Flujo local
  • Otras medidas univariadas
    • Complejidad algorítmica
    • Estimaciones de complejidad de Kolmogorov
    • Ocultos de Markov Model estados
    • Firma de ruta aproximada [38]
    • Serie temporal sustituta y corrección sustituta
    • Pérdida de recurrencia (grado de no estacionariedad)
  • Medidas lineales bivariadas
    • Correlación cruzada lineal máxima
    • Coherencia lineal (procesamiento de señales)
  • Medidas no lineales bivariadas
    • Interdependencia no lineal
    • Arrastre dinámico (física)
    • Medidas para la sincronización de fases
    • Medidas para el bloqueo de fase
  • Medidas de similitud : [39]
    • Correlación cruzada
    • Deformación de tiempo dinámica [34]
    • Modelos ocultos de Markov
    • Editar distancia
    • Correlación total
    • Estimador de Newey-West
    • Transformación de Prais-Winsten
    • Datos como vectores en un espacio metrizable
      • Distancia de Minkowski
      • Distancia de Mahalanobis
    • Datos como series de tiempo con envolventes
      • Desviación estándar global
      • Desviación estándar local
      • Desviación estándar en ventana
    • Datos interpretados como series estocásticas
      • Coeficiente de correlación producto-momento de Pearson
      • Coeficiente de correlación de rango de Spearman
    • Datos interpretados como una función de distribución de probabilidad
      • Prueba de Kolmogorov-Smirnov
      • Criterio de Cramér – von Mises

Visualización [ editar ]

Las series de tiempo se pueden visualizar con dos categorías de gráficos: gráficos superpuestos y gráficos separados. Los gráficos superpuestos muestran series de todos los tiempos en el mismo diseño, mientras que los gráficos separados los presentan en diferentes diseños (pero alineados para fines de comparación) [40]

Gráficos superpuestos [ editar ]

  • Gráficos trenzados
  • Gráficos de líneas
  • Gráficos de pendiente
  • GapChart fr

Gráficos separados [ editar ]

  • Gráficos de horizonte
  • Gráfico de líneas reducidas (múltiplos pequeños)
  • Gráfico de silueta
  • Gráfico de silueta circular

Ver también [ editar ]

  • Serie temporal de anomalías
  • Chirrido
  • Descomposición de series de tiempo
  • Análisis de fluctuación sin tendencia
  • Procesamiento de señales digitales
  • Retraso distribuido
  • Teoría de la estimación
  • Previsión
  • Exponente de Hurst
  • Método de Montecarlo
  • Análisis de panel
  • Caminata aleatoria
  • Correlación escalada
  • Ajuste estacional
  • Análisis de secuencia
  • Procesamiento de la señal
  • Base de datos de series de tiempo (TSDB)
  • Estimación de tendencias
  • Series de tiempo desigualmente espaciadas

Referencias [ editar ]

  1. ^ Lin, Jessica; Keogh, Eamonn; Lonardi, Stefano; Chiu, Bill (2003). "Una representación simbólica de series de tiempo, con implicaciones para los algoritmos de transmisión". Actas del 8º taller de ACM SIGMOD sobre cuestiones de investigación en minería de datos y descubrimiento de conocimientos . Nueva York: ACM Press. págs. 2-11. CiteSeerX  10.1.1.14.5597 . doi : 10.1145 / 882082.882086 . S2CID  6084733 .
  2. ^ Liao, T. Warren (2005). "Agrupación de datos de series de tiempo - una encuesta". Reconocimiento de patrones . Elsevier. 38 (11): 1857–1874. doi : 10.1016 / j.patcog.2005.01.025 . - a través de ScienceDirect (se requiere suscripción)
  3. ^ Aghabozorgi, Saeed; Shirkhorshidi, Ali S .; Wah, Teh Y. (2015). "Agrupación de series de tiempo - revisión de una década". Sistemas de información . Elsevier. 53 : 16–38. doi : 10.1016 / j.is.2015.04.007 . - a través de ScienceDirect (se requiere suscripción)
  4. ^ Keogh, Eamonn J. (2003). "Sobre la necesidad de pruebas comparativas de minería de datos de series de tiempo". Minería de datos y descubrimiento de conocimientos . Kluwer. 7 : 349–371. doi : 10.1145 / 775047.775062 . ISBN 158113567X. - a través de la biblioteca digital ACM (se requiere suscripción)
  5. ^ Agrawal, Rakesh; Faloutsos, Christos; Swami, Arun (octubre de 1993). "Búsqueda eficiente de similitudes en bases de datos de secuencia". Actas de la IV Conferencia Internacional sobre Fundamentos de la Organización de Datos y Algoritmos . Congreso Internacional sobre Fundamentos de la Organización de Datos y Algoritmos. 730 . págs. 69–84. doi : 10.1007 / 3-540-57301-1_5 . - a través de SpringerLink (se requiere suscripción)
  6. ^ Bloomfield, P. (1976). Análisis de Fourier de series de tiempo: una introducción . Nueva York: Wiley. ISBN 978-0471082569.
  7. ^ Shumway, RH (1988). Análisis estadístico aplicado de series de tiempo . Englewood Cliffs, Nueva Jersey: Prentice Hall. ISBN 978-0130415004.
  8. ^ Sandra Lach Arlinghaus, PHB Manual práctico de ajuste de curvas. Prensa CRC, 1994.
  9. ^ William M. Kolb. Ajuste de curvas para calculadoras programables. Syntec, Incorporated, 1984.
  10. ^ SS Halli, KV Rao. 1992. Técnicas avanzadas de análisis de población. ISBN 0306439972 Página 165 ( cf. ... las funciones se cumplen si tenemos un ajuste de bueno a moderado para los datos observados). 
  11. ^ La señal y el ruido : por qué fallan tantas predicciones, pero algunas no. Por Nate Silver
  12. ^ Preparación de datos para minería de datos : texto. Por Dorian Pyle.
  13. ^ Métodos numéricos en ingeniería con MATLAB®. Por Jaan Kiusalaas . Página 24.
  14. ^ Métodos numéricos en ingeniería con Python 3 . Por Jaan Kiusalaas. Página 21.
  15. ^ Métodos numéricos de ajuste de curvas . Por PG Guest, Philip George Guest. Página 349.
  16. ^ Véase también: Mollifier
  17. ^ Ajuste de modelos a datos biológicos mediante regresión lineal y no lineal . Por Harvey Motulsky, Arthur Christopoulos.
  18. ^ Análisis de regresión por Rudolf J. Freund, William J. Wilson, Ping Sa. Página 269.
  19. ^ Informática visual. Editado por Halimah Badioze Zaman, Peter Robinson, Maria Petrou, Patrick Olivier, Heiko Schröder. Página 689.
  20. ^ Métodos numéricos para modelos de ingeniería no lineales . Por John R. Hauser. Página 227.
  21. ^ Métodos de física experimental: espectroscopia, volumen 13, parte 1. Por Claire Marton. Página 150.
  22. ^ Enciclopedia de diseño de investigación, volumen 1. Editado por Neil J. Salkind. Página 266.
  23. ^ Técnicas de planificación y análisis de la comunidad . Por Richard E. Klosterman. Página 1.
  24. ^ Una introducción al riesgo y la incertidumbre en la evaluación de inversiones ambientales. Editorial DIANE. Pág. 69
  25. ^ Hamming, Richard. Métodos numéricos para científicos e ingenieros. Corporación de mensajería, 2012.
  26. ^ Friedman, Milton. " La interpolación de series de tiempo por series relacionadas ". Revista de la Asociación Estadounidense de Estadística 57.300 (1962): 729–757.
  27. ^ Gandhi, Sorabh, Luca Foschini y Subhash Suri. " Aproximación en línea con uso eficiente del espacio de datos de series de tiempo: corrientes, amnesia y fuera de orden ". Ingeniería de datos (ICDE), 2010 IEEE 26th International Conference on. IEEE, 2010.
  28. Sandy Ryza (18 de marzo de 2020). "Análisis de series de tiempo con Spark" (diapositivas de una charla en Spark Summit East 2016) . Databricks . Consultado el 12 de enero de 2021 .
  29. ^ Gershenfeld, N. (1999). La naturaleza del modelado matemático . Nueva York: Cambridge University Press. pp.  205 -208. ISBN 978-0521570954.
  30. ^ Kantz, Holger; Thomas, Schreiber (2004). Análisis de series de tiempo no lineal . Londres: Cambridge University Press. ISBN 978-0521529020.
  31. ^ Abarbanel, Henry (25 de noviembre de 1997). Análisis de datos caóticos observados . Nueva York: Springer. ISBN 978-0387983721.
  32. ^ Boashash, B. (ed.), (2003) Análisis y procesamiento de señales de frecuencia de tiempo: una referencia completa , Elsevier Science, Oxford, 2003 ISBN 0-08-044335-4 
  33. Nikolić, D .; Muresan, RC; Feng, W .; Cantante, W. (2012). "Análisis de correlación a escala: una mejor manera de calcular un correlograma cruzado" . Revista europea de neurociencia . 35 (5): 742–762. doi : 10.1111 / j.1460-9568.2011.07987.x . PMID 22324876 . S2CID 4694570 .  
  34. ^ a b Sakoe, Hiroaki; Chiba, Seibi (1978). "Optimización del algoritmo de programación dinámica para el reconocimiento de palabras habladas" . Transacciones IEEE sobre acústica, habla y procesamiento de señales . 26 . págs. 43–49. doi : 10.1109 / TASSP.1978.1163055 . S2CID 17900407 .  Falta o vacío |title=( ayuda )
  35. ^ Goutte, Cyril; Toft, Peter; Rostrup, Egill; Nielsen, Finn Å .; Hansen, Lars Kai (1999). "Sobre la agrupación de series de tiempo de fMRI" . NeuroImage . 9 . págs. 298-310. doi : 10.1006 / nimg.1998.0391 . PMID 10075900 . S2CID 14147564 .   Falta o vacío |title=( ayuda )
  36. ^ Mormann, Florian; Andrzejak, Ralph G .; Elger, Christian E .; Lehnertz, Klaus (2007). "Predicción de convulsiones: el camino largo y sinuoso" . Cerebro . 130 (2): 314–333. doi : 10.1093 / cerebro / awl241 . PMID 17008335 . 
  37. ^ Tierra, Bruce; Elías, Damián. "Medir la 'complejidad' de una serie de tiempo" .
  38. ^ [1] Chevyrev, I., Kormilitzin, A. (2016) "Introducción al método exclusivo en el aprendizaje automático , arXiv: 1603.03788v1"
  39. ^ Ropella, GEP; Nag, DA; Hunt, CA (2003). "Medidas de similitud para la comparación automatizada de resultados experimentales in silico e in vitro". Sociedad de Ingeniería en Medicina y Biología . 3 : 2933-2936. doi : 10.1109 / IEMBS.2003.1280532 . ISBN 978-0-7803-7789-9. S2CID  17798157 .
  40. ^ Tominski, Christian; Aigner, Wolfgang. "El navegador TimeViz: una encuesta visual de técnicas de visualización para datos orientados al tiempo" . Consultado el 1 de junio de 2014 .

Lectura adicional [ editar ]

  • Caja, George ; Jenkins, Gwilym (1976), Análisis de series de tiempo: pronóstico y control, rev. ed. , Oakland, California: Holden-Day
  • Durbin J. , Koopman SJ (2001), Análisis de series de tiempo por métodos de espacio de estados , Oxford University Press .
  • Gershenfeld, Neil (2000), La naturaleza del modelado matemático , Cambridge University Press , ISBN 978-0-521-57095-4, OCLC  174825352
  • Hamilton, James (1994), Análisis de series de tiempo , Princeton University Press , ISBN 978-0-691-04289-3
  • Priestley, MB (1981), Análisis espectral y series de tiempo , Academic Press . ISBN 978-0-12-564901-8 
  • Shasha, D. (2004), Descubrimiento de alto rendimiento en series temporales , Springer , ISBN 978-0-387-00857-8
  • Shumway RH, Stoffer DS (2017), Análisis de series de tiempo y sus aplicaciones: con ejemplos de R (ed.4) , Springer, ISBN 978-3-319-52451-1 
  • Weigend AS, Gershenfeld NA (Eds.) (1994), Predicción de series de tiempo: pronóstico del futuro y comprensión del pasado . Actas del Taller de investigación avanzada de la OTAN sobre análisis comparativo de series de tiempo (Santa Fe, mayo de 1992), Addison-Wesley .
  • Wiener, N. (1949), Extrapolación, interpolación y suavizado de series temporales estacionarias , MIT Press .
  • Woodward, WA, Gray, HL y Elliott, AC (2012), Análisis de series de tiempo aplicado , CRC Press .

Enlaces externos [ editar ]

  • Introducción al análisis de series de tiempo (Manual de estadísticas de ingeniería) : una guía práctica para el análisis de series de tiempo.