Regulador lineal-cuadrático

La teoría del control óptimo se ocupa de operar un sistema dinámico a un costo mínimo. El caso en el que la dinámica del sistema se describe mediante un conjunto de ecuaciones diferenciales lineales y el costo se describe mediante una función cuadrática se denomina problema LQ. Uno de los principales resultados de la teoría es que la solución la proporciona el regulador lineal cuadrático ( LQR ), un controlador de retroalimentación cuyas ecuaciones se dan a continuación. El LQR es una parte importante de la solución al problema LQG (lineal-cuadrático-gaussiano) . Al igual que el problema de LQR en sí, el problema de LQG es uno de los problemas más fundamentales en la teoría de control .

Descripción general

La configuración de un controlador (regulador) que gobierna una máquina o un proceso (como un avión o un reactor químico) se encuentra utilizando un algoritmo matemático que minimiza una función de costo con factores de ponderación proporcionados por un humano (ingeniero). La función de costo a menudo se define como una suma de las desviaciones de las mediciones clave, como la altitud o la temperatura del proceso, de sus valores deseados. Por tanto, el algoritmo encuentra los ajustes del controlador que minimizan las desviaciones no deseadas. La magnitud de la acción de control en sí misma también puede incluirse en la función de costos.

El algoritmo LQR reduce la cantidad de trabajo realizado por el ingeniero de sistemas de control para optimizar el controlador. Sin embargo, el ingeniero aún necesita especificar los parámetros de la función de costo y comparar los resultados con los objetivos de diseño especificados. A menudo, esto significa que la construcción del controlador será un proceso iterativo en el que el ingeniero juzga los controladores "óptimos" producidos a través de la simulación y luego ajusta los parámetros para producir un controlador más consistente con los objetivos del diseño.

El algoritmo LQR es esencialmente una forma automatizada de encontrar un controlador de retroalimentación de estado apropiado . Como tal, no es raro que los ingenieros de control prefieran métodos alternativos, como la retroalimentación de estado completo , también conocida como colocación de polos, en la que existe una relación más clara entre los parámetros del controlador y el comportamiento del controlador. La dificultad para encontrar los factores de ponderación correctos limita la aplicación de la síntesis de controlador basada en LQR.

LQR de horizonte finito, tiempo continuo

Para un sistema lineal de tiempo continuo, definido en ${\ Displaystyle t \ in [t_ {0}, t_ {1}]}$ , descrito por:

{\ Displaystyle {\ dot {x}} = Ax + Bu}

con una función de costo cuadrática definida como:

{\ Displaystyle J = x ^ {T} (t_ {1}) F (t_ {1}) x (t_ {1}) + \ int \ limits _ {t_ {0}} ^ {t_ {1}} \ izquierda (x ^ {T} Qx + u ^ {T} Ru + 2x ^ {T} Nu \ right) dt}

la ley de control de retroalimentación que minimiza el valor del costo es:

{\ Displaystyle u = -Kx \,}

dónde ${\ Displaystyle K}$ es dado por:

{\ Displaystyle K = R ^ {- 1} (B ^ {T} P (t) + N ^ {T}) \,}

y ${\ Displaystyle P}$ se encuentra resolviendo la ecuación diferencial de Riccati en tiempo continuo :

{\ Displaystyle A ^ {T} P (t) + P (t) A- (P (t) B + N) R ^ {- 1} (B ^ {T} P (t) + N ^ {T} ) + Q = - {\ dot {P}} (t) \,}

con la condición de contorno:

{\ Displaystyle P (t_ {1}) = F (t_ {1}).}

Las condiciones de primer orden para J _min son:

1) Ecuación de estado

{\ Displaystyle {\ dot {x}} = Ax + Bu}

2) Ecuación de co-estado

{\ Displaystyle - {\ dot {\ lambda}} = Qx + Nu + A ^ {T} \ lambda}

3) Ecuación estacionaria

{\ Displaystyle 0 = Ru + N ^ {T} x + B ^ {T} \ lambda}

4) Condiciones de contorno

{\ Displaystyle x (t_ {0}) = x_ {0}}

y ${\ Displaystyle \ lambda (t_ {1}) = F (t_ {1}) x (t_ {1})}$

LQR de horizonte infinito y tiempo continuo

Para un sistema lineal de tiempo continuo descrito por:

{\ Displaystyle {\ dot {x}} = Ax + Bu}

con una función de costo definida como:

{\ Displaystyle J = \ int _ {0} ^ {\ infty} \ left (x ^ {T} Qx + u ^ {T} Ru + 2x ^ {T} Nu \ right) dt}

la ley de control de retroalimentación que minimiza el valor del costo es:

{\ Displaystyle u = -Kx \,}

dónde ${\ Displaystyle K}$ es dado por:

{\ Displaystyle K = R ^ {- 1} (B ^ {T} P + N ^ {T}) \,}

y ${\ Displaystyle P}$ se encuentra resolviendo la ecuación algebraica de Riccati en tiempo continuo :

{\ Displaystyle A ^ {T} P + PA- (PB + N) R ^ {- 1} (B ^ {T} P + N ^ {T}) + Q = 0 \,}

Esto también se puede escribir como:

{\ Displaystyle {\ mathcal {A}} ^ {T} P + P {\ mathcal {A}} - PBR ^ {- 1} B ^ {T} P + {\ mathcal {Q}} = 0 \,}

con

{\ Displaystyle {\ mathcal {A}} = A-BR ^ {- 1} N ^ {T} \ qquad {\ mathcal {Q}} = Q-NR ^ {- 1} N ^ {T} \,}

LQR de horizonte finito, tiempo discreto

Para un sistema lineal de tiempo discreto descrito por: ^[1]

{\ Displaystyle x_ {k + 1} = Ax_ {k} + Bu_ {k} \,}

con un índice de rendimiento definido como:

{\ Displaystyle J = x_ {N} ^ {T} Qx_ {N} + \ sum \ limits _ {k = 0} ^ {N-1} \ left (x_ {k} ^ {T} Qx_ {k} + u_ {k} ^ {T} Ru_ {k} + 2x_ {k} ^ {T} Nu_ {k} \ right)}

la secuencia de control óptima que minimiza el índice de rendimiento viene dada por:

{\ Displaystyle u_ {k} = - F_ {k} x_ {k} \,}

dónde:

{\ Displaystyle F_ {k} = (R + B ^ {T} P_ {k + 1} B) ^ {- 1} (B ^ {T} P_ {k + 1} A + N ^ {T}) \ ,}

y ${\ Displaystyle P_ {k}}$ se encuentra iterativamente hacia atrás en el tiempo por la ecuación dinámica de Riccati:

{\ Displaystyle P_ {k-1} = A ^ {T} P_ {k} A- (A ^ {T} P_ {k} B + N) \ left (R + B ^ {T} P_ {k} B \ right) ^ {- 1} (B ^ {T} P_ {k} A + N ^ {T}) + Q}

de condición terminal ${\ Displaystyle P_ {N} = Q}$ . Tenga en cuenta que ${\ Displaystyle u_ {N}}$ no está definido, ya que ${\ Displaystyle x}$ es conducido a su estado final ${\ Displaystyle x_ {N}}$ por ${\ Displaystyle Ax_ {N-1} + Bu_ {N-1}}$ .

LQR de horizonte infinito y tiempo discreto

Para un sistema lineal de tiempo discreto descrito por:

{\ Displaystyle x_ {k + 1} = Ax_ {k} + Bu_ {k} \,}

con un índice de rendimiento definido como:

{\ Displaystyle J = \ sum \ limits _ {k = 0} ^ {\ infty} \ left (x_ {k} ^ {T} Qx_ {k} + u_ {k} ^ {T} Ru_ {k} + 2x_ {k} ^ {T} Nu_ {k} \ right)}

la secuencia de control óptima que minimiza el índice de rendimiento viene dada por:

{\ Displaystyle u_ {k} = - Fx_ {k} \,}

dónde:

{\ displaystyle F = (R + B ^ {T} PB) ^ {- 1} (B ^ {T} PA + N ^ {T}) \,}

y ${\ Displaystyle P}$ es la única solución positiva definida para la ecuación de Riccati algebraica de tiempo discreto (DARE):

{\ displaystyle P = A ^ {T} PA- (A ^ {T} PB + N) \ left (R + B ^ {T} PB \ right) ^ {- 1} (B ^ {T} PA + N ^ {T}) + Q}

.

Esto también se puede escribir como:

{\ displaystyle P = {\ mathcal {A}} ^ {T} P {\ mathcal {A}} - {\ mathcal {A}} ^ {T} PB \ left (R + B ^ {T} PB \ right ) ^ {- 1} B ^ {T} P {\ mathcal {A}} + {\ mathcal {Q}}}

con:

{\ Displaystyle {\ mathcal {A}} = A-BR ^ {- 1} N ^ {T} \ qquad {\ mathcal {Q}} = Q-NR ^ {- 1} N ^ {T}}

.

Tenga en cuenta que una forma de resolver la ecuación algebraica de Riccati es iterando la ecuación dinámica de Riccati del caso del horizonte finito hasta que converja.

Referencias

^ Chow, Gregory C. (1986). Análisis y control de sistemas económicos dinámicos . Krieger Publ. Co. ISBN 0-89874-969-7.

Kwakernaak, Huibert y Sivan, Raphael (1972). Sistemas de control lineales óptimos. Primera edición . Wiley-Interscience. ISBN 0-471-51110-2.

Sontag, Eduardo (1998). Teoría del control matemático: sistemas deterministas de dimensión finita. Segunda edición . Saltador. ISBN 0-387-98489-5.

enlaces externos

Función MATLAB para el diseño de regulador cuadrático lineal
Función de Mathematica para el diseño de reguladores cuadráticos lineales

[1] Chow, Gregory C. (1986). Análisis y control de sistemas económicos dinámicos . Krieger Publ. Co. ISBN 0-89874-969-7.

[1]