En la teoría de la estimación , el filtro de Kalman extendido ( EKF ) es la versión no lineal del filtro de Kalman que linealiza alrededor de una estimación de la media y la covarianza actuales . En el caso de modelos de transición bien definidos, el EKF se ha considerado [1] el estándar de facto en la teoría de estimación de estado no lineal, sistemas de navegación y GPS . [2]
Historia
Los artículos que establecen las bases matemáticas de los filtros tipo Kalman se publicaron entre 1959 y 1961. [3] [4] [5] El filtro Kalman es el estimador lineal óptimo para modelos de sistemas lineales con ruido blanco independiente aditivo tanto en la transición como en la medición. sistemas. Desafortunadamente, en ingeniería, la mayoría de los sistemas no son lineales , por lo que se intentó aplicar este método de filtrado a sistemas no lineales; La mayor parte de este trabajo se realizó en NASA Ames . [6] [7] El EKF adaptó técnicas de cálculo , a saber , expansiones de series de Taylor multivariadas , para linealizar un modelo alrededor de un punto de trabajo. Si el modelo del sistema (como se describe a continuación) no es bien conocido o es inexacto, entonces se emplean métodos de Monte Carlo , especialmente filtros de partículas , para la estimación. Las técnicas de Monte Carlo son anteriores a la existencia del EKF, pero son más costosas desde el punto de vista computacional para cualquier espacio de estado de dimensiones moderadas .
Formulación
En el filtro de Kalman extendido, los modelos de observación y transición de estado no necesitan ser funciones lineales del estado, sino que pueden ser funciones diferenciables .
Aquí w k y v k son los ruidos de proceso y de observación que se supone que son ruidos gaussianos multivariados de media cero con covarianza Q k y R k respectivamente. u k es el vector de control.
La función f puede usarse para calcular el estado predicho a partir de la estimación anterior y, de manera similar, la función h puede usarse para calcular la medición predicha a partir del estado predicho. Sin embargo, f y h no se pueden aplicar directamente a la covarianza. En su lugar, se calcula una matriz de derivadas parciales (el jacobiano ).
En cada paso de tiempo, el jacobiano se evalúa con los estados predichos actuales. Estas matrices se pueden utilizar en las ecuaciones de filtro de Kalman. Este proceso esencialmente linealiza la función no lineal alrededor de la estimación actual.
Consulte el artículo del Filtro de Kalman para obtener comentarios sobre la notación.
Predicción y actualización de ecuaciones en tiempo discreto
Notación representa la estimación de en el momento n observaciones dadas hasta e incluso en el momento m ≤ n .
Predecir
Estimación del estado previsto | |
Estimación de la covarianza prevista |
Actualizar
Innovación o medición residual | |
Covarianza de innovación (o residual) | |
Ganancia de Kalman casi óptima | |
Estimación estatal actualizada | |
Estimación de covarianza actualizada |
donde las matrices de observación y transición de estado se definen como los siguientes jacobianos
Desventajas
A diferencia de su contraparte lineal, el filtro de Kalman extendido en general no es un estimador óptimo (es óptimo si la medición y el modelo de transición de estado son lineales, ya que en ese caso el filtro de Kalman extendido es idéntico al regular). Además, si la estimación inicial del estado es incorrecta o si el proceso se modela incorrectamente, el filtro puede divergir rápidamente debido a su linealización. Otro problema con el filtro de Kalman extendido es que la matriz de covarianza estimada tiende a subestimar la matriz de covarianza verdadera y, por lo tanto, corre el riesgo de volverse inconsistente en el sentido estadístico sin la adición de "ruido estabilizador" [8] .
Habiendo dicho esto, el filtro Kalman extendido puede ofrecer un rendimiento razonable y posiblemente sea el estándar de facto en los sistemas de navegación y GPS.
Generalizaciones
Filtro de Kalman extendido de tiempo continuo
Modelo
Inicializar
Predecir-Actualizar
A diferencia del filtro de Kalman extendido de tiempo discreto, los pasos de predicción y actualización están acoplados en el filtro de Kalman extendido de tiempo continuo. [9]
Medidas de tiempo discreto
La mayoría de los sistemas físicos se representan como modelos de tiempo continuo, mientras que las mediciones de tiempo discreto se toman con frecuencia para la estimación del estado a través de un procesador digital. Por lo tanto, el modelo del sistema y el modelo de medición vienen dados por
dónde .
Inicializar
Predecir
dónde
Actualizar
dónde
Las ecuaciones de actualización son idénticas a las del filtro de Kalman extendido en tiempo discreto.
Filtros Kalman extendidos de orden superior
La recursividad anterior es un filtro de Kalman extendido de primer orden (EKF). Se pueden obtener EKF de orden superior conservando más términos de las expansiones de la serie de Taylor. Por ejemplo, se han descrito EKF de segundo y tercer orden. [10] Sin embargo, los EKF de orden superior tienden a proporcionar beneficios de rendimiento solo cuando el ruido de medición es pequeño.
Formulación y ecuaciones de ruido no aditivo
La formulación típica del EKF implica el supuesto de proceso aditivo y ruido de medición. Sin embargo, esta suposición no es necesaria para la implementación de EKF . [11] En su lugar, considere un sistema más general de la forma:
Aquí w k y v k son los ruidos de proceso y de observación que se supone que son ruidos gaussianos multivariados de media cero con covarianza Q k y R k respectivamente. Entonces las ecuaciones de innovación y predicción de covarianza se convierten en
donde las matrices y son matrices jacobianas:
La estimación del estado pronosticado y el residuo de medición se evalúan en la media de los términos de ruido de proceso y medición, que se supone que es cero. De lo contrario, la formulación de ruido no aditivo se implementa de la misma manera que el ruido aditivo EKF .
Filtro de Kalman extendido implícito
En ciertos casos, el modelo de observación de un sistema no lineal no se puede resolver para , pero puede expresarse mediante la función implícita :
dónde son las ruidosas observaciones.
El filtro de Kalman extendido convencional se puede aplicar con las siguientes sustituciones: [12] [13]
dónde:
Aquí la matriz de covarianza de observación original se transforma, y la innovación se define de manera diferente. La matriz jacobiana se define como antes, pero se determina a partir del modelo de observación implícito .
Modificaciones
Filtro de Kalman extendido iterado
El filtro de Kalman extendido iterado mejora la linealización del filtro de Kalman extendido modificando recursivamente el punto central de la expansión de Taylor. Esto reduce el error de linealización a costa de mayores requisitos computacionales. [13]
Filtro Kalman extendido robusto
El filtro de Kalman extendido surge al linealizar el modelo de señal sobre la estimación del estado actual y al utilizar el filtro de Kalman lineal para predecir la siguiente estimación. Esto intenta producir un filtro localmente óptimo, sin embargo, no es necesariamente estable porque no se garantiza que las soluciones de la ecuación de Riccati subyacente sean positivas definidas. Una forma de mejorar el rendimiento es la falsa técnica algebraica de Riccati [14] que intercambia la optimización por la estabilidad. La estructura familiar del filtro de Kalman extendido se conserva, pero la estabilidad se logra seleccionando una solución definida positiva a una ecuación de Riccati algebraica falsa para el diseño de ganancia.
Otra forma de mejorar el rendimiento del filtro Kalman extendido es emplear los resultados H-infinity de un control robusto. Los filtros robustos se obtienen agregando un término definido positivo a la ecuación de diseño de Riccati. [15] El término adicional se parametriza mediante un escalar que el diseñador puede modificar para lograr un equilibrio entre los criterios de rendimiento de error cuadrático medio y error máximo.
Filtro de Kalman extendido invariante
El filtro de Kalman extendido invariante (IEKF) es una versión modificada del EKF para sistemas no lineales que poseen simetrías (o invariancias ). Combina las ventajas tanto del EKF como de los filtros que preservan la simetría recientemente introducidos . En lugar de usar un término de corrección lineal basado en un error de salida lineal, el IEKF usa un término de corrección adaptado geométricamente basado en un error de salida invariante; de la misma manera, la matriz de ganancia no se actualiza a partir de un error de estado lineal, sino a partir de un error de estado invariante. El principal beneficio es que las ecuaciones de ganancia y covarianza convergen a valores constantes en un conjunto de trayectorias mucho mayor que los puntos de equilibrio, como es el caso del EKF, lo que da como resultado una mejor convergencia de la estimación.
Filtros Kalman sin perfume
Un filtro Kalman no lineal que se muestra prometedor como una mejora con respecto al EKF es el filtro Kalman sin aroma (UKF). En el UKF, la densidad de probabilidad se aproxima mediante un muestreo determinista de puntos que representan la distribución subyacente como gaussiana . La transformación no lineal de estos puntos pretende ser una estimación de la distribución posterior, cuyos momentos se pueden derivar de las muestras transformadas. La transformación se conoce como la transformación sin aroma . El UKF tiende a ser más robusto y más preciso que el EKF en su estimación del error en todas las direcciones.
"El filtro de Kalman extendido (EKF) es probablemente el algoritmo de estimación más utilizado para sistemas no lineales. Sin embargo, más de 35 años de experiencia en la comunidad de estimación han demostrado que es difícil de implementar, difícil de ajustar y solo confiable para sistemas que son casi lineales en la escala de tiempo de las actualizaciones. Muchas de estas dificultades surgen de su uso de la linealización ". [1]
Un artículo de 2012 incluye resultados de simulación que sugieren que algunas variantes publicadas del UKF no son tan precisas como el filtro Kalman extendido de segundo orden (SOEKF), también conocido como filtro Kalman aumentado. [16] El SOEKF es anterior al UKF en aproximadamente 35 años con la dinámica de momento descrita por primera vez por Bass et al. [17] La dificultad de implementar filtros de tipo Kalman para transiciones de estado no lineales se debe a los problemas de estabilidad numérica requeridos para la precisión, [18] sin embargo, el UKF no escapa a esta dificultad ya que también utiliza la linealización, es decir, la regresión lineal. Los problemas de estabilidad para el UKF generalmente provienen de la aproximación numérica a la raíz cuadrada de la matriz de covarianza, mientras que los problemas de estabilidad tanto para el EKF como para el SOEKF provienen de posibles problemas en la aproximación de la serie Taylor a lo largo de la trayectoria.
Conjunto de filtro de Kalman
De hecho, el UKF fue precedido por el filtro Ensemble Kalman, inventado por Evensen en 1994, el filtro Ensemble Kalman . Tiene la ventaja sobre el UKF de que el número de miembros del conjunto utilizados puede ser mucho menor que la dimensión estatal, lo que permite aplicaciones en sistemas de muy alta dimensión, como la predicción meteorológica, con tamaños de espacio de estados de mil millones o más.
Ver también
- Filtro de Kalman
- Filtro de conjunto de Kalman
- Filtro de Kalman rápido
- Filtro de Kalman extendido invariante
- Estimación de horizonte móvil
- Filtro de partículas
- Filtro Kalman sin perfume
Referencias
- ^ a b Julier, SJ; Uhlmann, JK (2004). "Filtrado sin perfume y estimación no lineal" (PDF) . Actas del IEEE . 92 (3): 401–422. doi : 10.1109 / jproc.2003.823141 . S2CID 9614092 .
- ^ Cursos, E .; Encuestas, T. (2006). Filtros Sigma-Point: una descripción general con aplicaciones para la navegación integrada y el control asistido por visión . Taller de procesamiento de señales estadísticas no lineales, 2006 IEEE . págs. 201–202. doi : 10.1109 / NSSPW.2006.4378854 . ISBN 978-1-4244-0579-4. S2CID 18535558 .
- ^ RE Kalman (1960). "Contribuciones a la teoría del control óptimo". Bol. Soc. Estera. Mexicana : 102-119. CiteSeerX 10.1.1.26.4070 .
- ^ RE Kalman (1960). "Un nuevo enfoque para problemas de predicción y filtrado lineal" (PDF) . Revista de Ingeniería Básica . 82 : 35–45. doi : 10.1115 / 1.3662552 .
- ^ RE Kalman; RS Bucy (1961). "Nuevos resultados en la teoría de predicción y filtrado lineal" (PDF) . Revista de Ingeniería Básica . 83 : 95-108. doi : 10.1115 / 1.3658902 .
- ^ Bruce A. McElhoe (1966). "Una evaluación de las correcciones de navegación y curso para un sobrevuelo tripulado de Marte o Venus". Transacciones IEEE en sistemas electrónicos y aeroespaciales . 2 (4): 613–623. Código Bibliográfico : 1966ITAES ... 2..613M . doi : 10.1109 / TAES.1966.4501892 . S2CID 51649221 .
- ^ GL Smith; SF Schmidt y LA McGee (1962). "Aplicación de la teoría del filtro estadístico a la estimación óptima de la posición y la velocidad a bordo de un vehículo circunlunar" . Administración Nacional de Aeronáutica y Espacio. Cite journal requiere
|journal=
( ayuda ) - ^ Huang, Guoquan P; Mourikis, Anastasios I; Roumeliotis, Stergios I (2008). "Análisis y mejora de la consistencia de SLAM basado en filtro de Kalman extendido". Robótica y Automatización, 2008. ICRA 2008. IEEE International Conference on . págs. 473–479. doi : 10.1109 / ROBOT.2008.4543252 .
- ^ Brown, Robert Grover; Hwang, Patrick YC (1997). Introducción a las señales aleatorias y el filtrado de Kalman aplicado (3 ed.). Nueva York: John Wiley & Sons. pp. 289 -293. ISBN 978-0-471-12839-7.
- ^ Einicke, GA (2019). Suavizado, filtrado y predicción: estimación del pasado, el presente y el futuro (2ª ed.) . Publicación de Amazon Prime. ISBN 978-0-6485115-0-2.
- ^ Simon, Dan (2006). Estimación de estado óptimo . Hoboken, Nueva Jersey: John Wiley & Sons. ISBN 978-0-471-70858-2.
- ^ Quan, Quan (2017). Introducción al diseño y control de multicópteros . Singapur: Springer. ISBN 978-981-10-3382-7.
- ^ a b Zhang, Zhengyou (1997). "Técnicas de estimación de parámetros: un tutorial con aplicación al ajuste cónico" (PDF) . Computación de imagen y visión . 15 (1): 59–76. doi : 10.1016 / s0262-8856 (96) 01112-2 . ISSN 0262-8856 .
- ^ Einicke, GA; Blanco, LB; Bitmead, RR (septiembre de 2003). "El uso de ecuaciones de Riccati algebraicas falsas para la demodulación cocanal". IEEE Trans. Proceso de señal . 51 (9): 2288–2293. Código Bibliográfico : 2003ITSP ... 51.2288E . doi : 10.1109 / tsp.2003.815376 . hdl : 2440/2403 .
- ^ Einicke, GA; White, LB (septiembre de 1999). "Filtrado de Kalman extendido robusto". IEEE Trans. Proceso de señal . 47 (9): 2596-2599. Código Bibliográfico : 1999ITSP ... 47.2596E . doi : 10.1109 / 78.782219 .
- ^ Gustafsson, F .; Hendeby, G .; , "Algunas relaciones entre los filtros Kalman extendidos y sin perfume", procesamiento de señales, transacciones IEEE en, vol.60, no.2, pp.545-555, febrero de 2012
- ^ R. Bass, V. Norum y L. Schwartz, "Filtrado no lineal multicanal óptimo (problema de filtrado no lineal multicanal óptimo de estimación de la varianza mínima del estado de un sistema no lineal n-dimensional sujeto a perturbación estocástica)", J. Análisis y aplicaciones matemáticos , vol. 16, págs. 152-164, 1966
- ^ Mohinder S. Grewal; Angus P. Andrews (2 de febrero de 2015). Filtrado de Kalman: teoría y práctica con MATLAB . John Wiley e hijos. ISBN 978-1-118-98496-3.
Otras lecturas
- Anderson, BDO; Moore, JB (1979). Filtrado óptimo . Englewood Cliffs, Nueva Jersey: Prentice – Hall.
- Gelb, A. (1974). Estimación óptima aplicada . MIT Press.
- Jazwinski, Andrew H. (1970). Procesos estocásticos y filtrado . Matemáticas en Ciencias e Ingeniería. Nueva York: Academic Press . págs. 376 . ISBN 978-0-12-381550-7.
- Maybeck, Peter S. (1979). Modelos estocásticos, estimación y control . Matemáticas en Ciencias e Ingeniería. 141–1. Nueva York: Academic Press . pag. 423. ISBN 978-0-12-480701-3.
enlaces externos
- Estimación de la posición de un robot de rueda diferencial basada en odometría y puntos de referencia