Ecuación algebraica de Riccati

Una ecuación algebraica de Riccati es un tipo de ecuación no lineal que surge en el contexto de problemas de control óptimo de horizonte infinito en tiempo continuo o tiempo discreto .

Una ecuación algebraica típica de Riccati es similar a una de las siguientes:

la ecuación de Riccati algebraica de tiempo continuo (CARE):

{\ Displaystyle A ^ {T} P + PA-PBR ^ {- 1} B ^ {T} P + Q = 0 \,}

o la ecuación de Riccati algebraica de tiempo discreto (DARE):

{\ displaystyle P = A ^ {T} PA- (A ^ {T} PB) (R + B ^ {T} PB) ^ {- 1} (B ^ {T} PA) + Q. \,}

P es la matriz simétrica desconocida de n por n y A , B , Q , R son matrices de coeficientes reales conocidas .

Aunque generalmente esta ecuación puede tener muchas soluciones, generalmente se especifica que queremos obtener la única solución estabilizadora, si existe tal solución.

Origen del nombre

El nombre Riccati se le da a estas ecuaciones debido a su relación con la ecuación diferencial de Riccati . De hecho, el CARE se verifica mediante las soluciones invariantes en el tiempo de la matriz asociada valorada en la ecuación diferencial de Riccati. En cuanto al DARE, se verifica mediante las soluciones invariantes en el tiempo de la ecuación en diferencias de Riccati con valores matriciales (que es análoga a la ecuación diferencial de Riccati en el contexto de tiempo discreto LQR).

Contexto de la ecuación algebraica de Riccati en tiempo discreto

En los problemas de control óptimo de horizonte infinito , uno se preocupa por el valor de alguna variable de interés arbitrariamente en el futuro y debe elegir de manera óptima un valor de una variable controlada en este momento, sabiendo que también se comportará de manera óptima en todo momento en el futuro. futuro. Los valores actuales óptimos de las variables de control del problema en cualquier momento se pueden encontrar utilizando la solución de la ecuación de Riccati y las observaciones actuales sobre las variables de estado en evolución. Con múltiples variables de estado y múltiples variables de control, la ecuación de Riccati será una ecuación matricial .

La ecuación algebraica de Riccati determina la solución del problema del regulador lineal-cuadrático invariante en el tiempo (LQR) de horizonte infinito, así como la del problema de control lineal-cuadrático-gaussiano invariante en el tiempo (LQG) del horizonte infinito . Estos son dos de los problemas más fundamentales de la teoría del control .

Una especificación típica del problema de control cuadrático lineal en tiempo discreto es minimizar

{\ Displaystyle \ sum _ {t = 1} ^ {T} (y_ {t} ^ {T} Qy_ {t} + u_ {t} ^ {T} Ru_ {t})}

sujeto a la ecuación estatal

{\ Displaystyle y_ {t} = Ay_ {t-1} + Bu_ {t},}

donde y es un vector n × 1 de variables de estado, u es un vector k × 1 de variables de control, A es la matriz de transición de estado n × n , B es la matriz n × k de multiplicadores de control, Q ( n × n ) es una matriz de costos de estado semidefinida positiva simétrica , y R ( k × k ) es una matriz de costos de control definida positiva simétrica.

La inducción hacia atrás en el tiempo se puede utilizar para obtener la solución de control óptima en cada momento, ^[1]

{\ Displaystyle u_ {t} ^ {*} = - (B ^ {T} P_ {t} B + R) ^ {- 1} (B ^ {T} P_ {t} A) y_ {t-1} ,}

con la matriz de costo para llevar definida positiva simétrica P evolucionando hacia atrás en el tiempo desde ${\ Displaystyle P_ {T} = Q}$ de acuerdo a

{\ Displaystyle P_ {t-1} = Q + A ^ {T} P_ {t} AA ^ {T} P_ {t} B (B ^ {T} P_ {t} B + R) ^ {- 1} B ^ {T} P_ {t} A, \,}

que se conoce como la ecuación dinámica de Riccati en tiempo discreto de este problema. La caracterización de estado estable de P , relevante para el problema del horizonte infinito en el que T va al infinito, se puede encontrar iterando la ecuación dinámica repetidamente hasta que converja; entonces P se caracteriza por eliminar los subíndices de tiempo de la ecuación dinámica.

Solución

Por lo general, los solucionadores intentan encontrar la solución estabilizadora única, si existe. Una solución es estabilizar si su uso para controlar el sistema LQR asociado hace que el sistema de circuito cerrado sea estable.

Para el CARE, el control es

{\ Displaystyle K = R ^ {- 1} B ^ {T} P}

y la matriz de transferencia de estado de bucle cerrado es

{\ Displaystyle A-BK = A-BR ^ {- 1} B ^ {T} P}

que es estable si y solo si todos sus valores propios tienen una parte real estrictamente negativa.

Para el DARE, el control es

{\ Displaystyle K = (R + B ^ {T} PB) ^ {- 1} B ^ {T} PA}

y la matriz de transferencia de estado de bucle cerrado es

{\ Displaystyle A-BK = AB (R + B ^ {T} PB) ^ {- 1} B ^ {T} PA}

que es estable si y solo si todos sus valores propios están estrictamente dentro del círculo unitario del plano complejo.

Se puede obtener una solución a la ecuación algebraica de Riccati mediante factorizaciones matriciales o iterando sobre la ecuación de Riccati. Se puede obtener un tipo de iteración en el caso de tiempo discreto utilizando la ecuación dinámica de Riccati que surge en el problema de horizonte finito: en el último tipo de problema, cada iteración del valor de la matriz es relevante para la elección óptima en cada período que es una distancia finita en el tiempo desde un período de tiempo final, y si se itera infinitamente hacia atrás en el tiempo, converge a la matriz específica que es relevante para la elección óptima un período de tiempo infinito antes de un período final, es decir, para cuando hay un horizonte infinito.

También es posible encontrar la solución encontrando la descomposición propia de un sistema más grande. Para el CARE, definimos la matriz hamiltoniana

{\ Displaystyle Z = {\ begin {pmatrix} A & -BR ^ {- 1} B ^ {T} \\ - Preguntas y respuestas ^ {T} \ end {pmatrix}}}

Desde ${\ Displaystyle Z}$ es hamiltoniano, si no tiene valores propios en el eje imaginario, entonces exactamente la mitad de sus valores propios tienen una parte real negativa. Si denotamos el ${\ Displaystyle 2n \ times n}$ matriz cuyas columnas forman una base del subespacio correspondiente, en notación de matriz de bloques, como

{\ displaystyle {\ begin {pmatrix} U_ {1,1} \\ U_ {2,1} \ end {pmatrix}}}

luego

{\ Displaystyle P = U_ {2,1} U_ {1,1} ^ {- 1}}

es una solución de la ecuación de Riccati; Además, los valores propios de ${\ Displaystyle A-BR ^ {- 1} B ^ {T} P}$ son los valores propios de ${\ Displaystyle Z}$ con parte real negativa.

Para el DARE, cuando ${\ Displaystyle A}$ es invertible, definimos la matriz simpléctica

{\ Displaystyle Z = {\ begin {pmatrix} A + BR ^ {- 1} B ^ {T} (A ^ {- 1}) ^ {T} Q & -BR ^ {- 1} B ^ {T} ( A ^ {- 1}) ^ {T} \\ - (A ^ {- 1}) ^ {T} Preguntas y respuestas (A ^ {- 1}) ^ {T} \ end {pmatrix}}}

Desde ${\ Displaystyle Z}$ es simpléctica, si no tiene valores propios en el círculo unitario, entonces exactamente la mitad de sus valores propios están dentro del círculo unitario. Si denotamos el ${\ Displaystyle 2n \ times n}$ matriz cuyas columnas forman una base del subespacio correspondiente, en notación de matriz de bloques, como

{\ displaystyle {\ begin {pmatrix} U_ {1,1} \\ U_ {2,1} \ end {pmatrix}}}

dónde ${\ Displaystyle U_ {1,1}}$ y ${\ Displaystyle U_ {2,1}}$ resultado de la descomposición ^[2]

{\ Displaystyle Z = {\ begin {pmatrix} U_ {1,1} & U_ {1,2} \\ U_ {2,1} & U_ {2,2} \ end {pmatrix}} {\ begin {pmatrix} \ Lambda _ {1,1} & \ Lambda _ {1,2} \\ 0 & \ Lambda _ {2,2} \ end {pmatrix}} {\ begin {pmatrix} U_ {1,1} ^ {T} & U_ {2,1} ^ {T} \\ U_ {1,2} ^ {T} & U_ {2,2} ^ {T} \ end {pmatrix}}}

luego

{\ Displaystyle P = U_ {2,1} U_ {1,1} ^ {- 1}}

es una solución de la ecuación de Riccati; Además, los valores propios de ${\ displaystyle AB (R + B ^ {T} PB) ^ {- 1} B ^ {T} PA}$ son los valores propios de ${\ Displaystyle Z}$ que están dentro del círculo unitario.

Ver también

Referencias

^ Chow, Gregory (1975). Análisis y control de sistemas económicos dinámicos . Nueva York: John Wiley & Sons. ISBN 0-471-15616-7.
^ William Arnold; Alan Laub (1984). "Algoritmos generalizados de problemas propios y software para ecuaciones algebraicas de Riccati" .

Peter Lancaster; Leiba Rodman (1995), ecuaciones algebraicas de Riccati , Oxford University Press , pág. 504, ISBN 0-19-853795-6
Alan J. Laub, un método de Schur para resolver ecuaciones algebraicas de Riccati

enlaces externos

Ayuda del solucionador CARE de la caja de herramientas MATLAB Control.
Ayuda del solucionador DARE de la caja de herramientas MATLAB Control.
Solucionador de CARE en línea para matrices de tamaño arbitrario.
Solucionadores de Python CARE y DARE.
Función de Mathematica para resolver la ecuación algebraica de Riccati en tiempo continuo.
Función de Mathematica para resolver la ecuación algebraica de Riccati en tiempo discreto.

[1] Chow, Gregory (1975). Análisis y control de sistemas económicos dinámicos . Nueva York: John Wiley & Sons. ISBN 0-471-15616-7.

[2] William Arnold; Alan Laub (1984). "Algoritmos generalizados de problemas propios y software para ecuaciones algebraicas de Riccati" .

[1]