Ecuaciones de proyección óptimas

En la teoría de control , las ecuaciones de proyección óptimas ^[1]^[2]^[3] constituyen condiciones necesarias y suficientes para un controlador LQG de orden reducido localmente óptimo. ^[4]

El problema de control lineal cuadrático-gaussiano (LQG) es uno de los problemas de control óptimo más fundamentales . Se trata de sistemas lineales inciertos perturbados por ruido gaussiano blanco aditivo , información de estado incompleta (es decir, no todas las variables de estado se miden y están disponibles para retroalimentación) también perturbada por ruido gaussiano blanco aditivo y costos cuadráticos . Además, la solución es única y constituye una ley de control de retroalimentación dinámica lineal que se calcula e implementa fácilmente. Finalmente, el controlador LQG también es fundamental para el control óptimo de perturbaciones de sistemas no lineales. ^[5]

El controlador LQG en sí es un sistema dinámico como el sistema que controla. Ambos sistemas tienen la misma dimensión de estado. Por lo tanto, implementar el controlador LQG puede resultar problemático si la dimensión del estado del sistema es grande. El problema de LQG de orden reducido ( problema de LQG de orden fijo) lo supera fijando a priori el número de estados del controlador LQG. Este problema es más difícil de resolver porque ya no es separable. Además, la solución ya no es única. A pesar de estos hechos, se dispone de algoritmos numéricos ^[4]^[6]^[7]^[8] para resolver las ecuaciones de proyección óptimas asociadas.

Formulación y solución de problemas matemáticos

Tiempo continuo

El problema de control de LQG de orden reducido es casi idéntico al problema de control de LQG de orden completo convencional . Dejar ${\ Displaystyle {\ hat {\ mathbf {x}}} _ {r} (t)}$ representan el estado del controlador LQG de orden reducido. Entonces la única diferencia es que la dimensión estatal ${\ Displaystyle n_ {r} = dim ({\ hat {\ mathbf {x}}} _ {r} (t))}$ del controlador LQG está fijado a priori para ser más pequeño que ${\ Displaystyle n = dim ({\ mathbf {x}} (t))}$ , la dimensión de estado del sistema controlado.

El controlador LQG de orden reducido está representado por las siguientes ecuaciones:

{\ Displaystyle {\ dot {\ hat {\ mathbf {x}}}} _ {r} (t) = A_ {r} (t) {\ hat {\ mathbf {x}}} _ {r} (t ) + B_ {r} (t) {\ mathbf {u}} (t) + K_ {r} (t) \ left ({\ mathbf {y}} (t) -C_ {r} (t) {\ sombrero {\ mathbf {x}}} _ {r} (t) \ right), {\ hat {\ mathbf {x}}} _ {r} (0) = {\ mathbf {x}} _ {r} (0),}

{\ Displaystyle {\ mathbf {u}} (t) = - L_ {r} (t) {\ hat {\ mathbf {x}}} _ {r} (t).}

Estas ecuaciones se expresan deliberadamente en un formato que es igual al del controlador LQG de orden completo convencional . Para el problema de control LQG de orden reducido, es conveniente reescribirlos como

{\ Displaystyle {\ dot {\ hat {\ mathbf {x}}}} _ {r} (t) = F_ {r} (t) {\ hat {\ mathbf {x}}} _ {r} (t ) + K_ {r} (t) {\ mathbf {y}} (t), {\ hat {\ mathbf {x}}} _ {r} (0) = {\ mathbf {x}} _ {r} (0),}

{\ Displaystyle {\ mathbf {u}} (t) = - L_ {r} (t) {\ hat {\ mathbf {x}}} _ {r} (t),}

dónde

{\ Displaystyle F_ {r} (t) = A_ {r} (t) -B_ {r} (t) L_ {r} (t) -K_ {r} (t) C_ {r} (t).}

Las matrices ${\ Displaystyle F_ {r} (t), K_ {r} (t), L_ {r} (t)}$ y ${\ displaystyle {\ mathbf {x}} _ {r} (0)}$ del controlador LQG de orden reducido se determinan mediante las denominadas ecuaciones de proyección óptima ( OPE ). ^[3]

La matriz de proyección óptima cuadrada ${\ Displaystyle \ tau (t)}$ con dimensión ${\ Displaystyle n}$ es fundamental para la OPE . El rango de esta matriz es casi en todas partes igual a ${\ Displaystyle n_ {r}.}$ La proyección asociada es una proyección oblicua: ${\ Displaystyle \ tau ^ {2} (t) = \ tau (t).}$ Los OPE constituyen cuatro ecuaciones diferenciales matriciales. Las dos primeras ecuaciones enumeradas a continuación son generalizaciones de las ecuaciones diferenciales matriciales de Riccati asociadas al controlador LQG de orden completo convencional . En estas ecuaciones ${\ Displaystyle \ tau _ {\ perp} (t)}$ denota ${\ Displaystyle I_ {n} - \ tau (t)}$ dónde ${\ Displaystyle I_ {n}}$ es la matriz de identidad de la dimensión ${\ Displaystyle n}$ .

{\ Displaystyle {\ begin {alineado} {\ dot {P}} (t) = {} & A (t) P (t) + P (t) A '(t) -P (t) C' (t) W ^ {- 1} (t) C (t) P (t) + V (t) \\ [6pt] & {} + \ tau _ {\ perp} (t) P (t) C '(t) W ^ {- 1} (t) C (t) P (t) \ tau '_ {\ perp} (t), \\ [6pt] P (0) = {} & E \ left ({\ mathbf {x }} (0) {\ mathbf {x}} '(0) \ right), \\ [6pt] & {} - {\ dot {S}} (t) = A' (t) S (t) + S (t) A (t) -S (t) B (t) R ^ {- 1} (t) B '(t) S (t) + Q (t) \\ [6pt] & {} + \ tau '_ {\ perp} (t) S (t) B (t) R ^ {- 1} (t) B' (t) S (t) \ tau _ {\ perp} (t), \ end { alineado}}}

{\ Displaystyle S (T) = F.}

Si la dimensión del controlador LQG no se reduce, eso es si ${\ Displaystyle n = n_ {r}}$ , luego ${\ Displaystyle \ tau (t) = I_ {n}, \ tau _ {\ perp} (t) = 0}$ y las dos ecuaciones anteriores se convierten en las ecuaciones diferenciales de Riccati matriciales desacopladas asociadas al controlador LQG de orden completo convencional . Si ${\ Displaystyle n_ {r} }>$ las dos ecuaciones están acopladas por la proyección oblicua ${\ Displaystyle \ tau (t).}$ Esto revela por qué el problema de LQG de orden reducido no es separable . La proyección oblicua ${\ Displaystyle \ tau (t)}$ se determina a partir de dos ecuaciones diferenciales matriciales adicionales que involucran condiciones de rango . Junto con las dos ecuaciones diferenciales matriciales anteriores, estas son las OPE . Para enunciar las dos ecuaciones diferenciales matriciales adicionales es conveniente introducir las siguientes dos matrices:

{\ Displaystyle \ Psi _ {1} (t) = (A (t) -B (t) R ^ {- 1} (t) B '(t) S (t)) {\ hat {P}} ( t) + {\ hat {P}} (t) (A (t) -B (t) R ^ {- 1} (t) B '(t) S (t))'}

{\ Displaystyle {} + P (t) Do '(t) W ^ {- 1} (t) Do (t) P (t),}

{\ Displaystyle \ Psi _ {2} (t) = (A (t) -P (t) C '(t) W ^ {- 1} (t) C (t))' {\ hat {S}} (t) + {\ hat {S}} (t) (A (t) -P (t) C '(t) W ^ {- 1} (t) C (t))}

{\ Displaystyle {} + S (t) segundo (t) R ^ {- 1} (t) segundo (t) S (t).}

Entonces, las dos ecuaciones diferenciales matriciales adicionales que completan el OPE son las siguientes:

{\ Displaystyle {\ dot {\ hat {P}}} (t) = 1/2 \ left (\ tau (t) \ Psi _ {1} (t) + \ Psi _ {1} (t) \ tau '(t) \ right), {\ hat {P}} (0) = E ({\ mathbf {x}} (0)) E ({\ mathbf {x}} (0))', \ operatorname { rango} ({\ hat {P}} (t)) = n_ {r}}

Casi en cualquier parte,

{\ Displaystyle - {\ dot {\ hat {S}}} (t) = 1/2 \ left (\ tau '(t) \ Psi _ {2} (t) + \ Psi _ {2} (t) \ tau (t) \ right), {\ hat {S}} (T) = 0, \ operatorname {rank} ({\ hat {S}} (t)) = n_ {r}}

Casi en cualquier parte,

con

{\ Displaystyle \ tau (t) = {\ hat {P}} (t) {\ hat {S}} (t) \ left ({\ hat {P}} (t) {\ hat {S}} ( t) \ derecha) ^ {*}.}

Aquí * denota el grupo inverso generalizado o inverso de Drazin que es único y está dado por

{\ Displaystyle A ^ {*} = A (A ^ {3}) ^ {+} A.}

donde + denota el pseudoinverso de Moore-Penrose .

Las matrices ${\ Displaystyle P (t), S (t), {\ hat {P}} (t), {\ hat {S}} (t)}$ todos deben ser simétricos no negativos . Entonces constituyen una solución del OPE que determina las matrices de controlador LQG de orden reducido ${\ Displaystyle F_ {r} (t), K_ {r} (t), L_ {r} (t)}$ y ${\ displaystyle {\ mathbf {x}} _ {r} (0)}$ :

{\ Displaystyle F_ {r} (t) = H (t) \ left (A (t) -P (t) C '(t) W ^ {- 1} (t) C (t) -B (t) R ^ {- 1} (t) B '(t) S (t) \ right) G (t) + {\ dot {H}} (t) G' (t),}

{\ Displaystyle K_ {r} (t) = H (t) P (t) C '(t) W ^ {- 1} (t),}

{\ Displaystyle L_ {r} (t) = R ^ {- 1} (t) B '(t) S (t) G' (t),}

{\ displaystyle {\ mathbf {x}} _ {r} (0) = H (0) E ({\ mathbf {x}} (0)).}

En las ecuaciones por encima de las matrices ${\ Displaystyle G (t), H (t)}$ son dos matrices con las siguientes propiedades:

{\ Displaystyle G '(t) H (t) = \ tau (t), G (t) H' (t) = I_ {n_ {r}}}

Casi en cualquier parte.

Pueden obtenerse de una factorización proyectiva de ${\ Displaystyle {\ hat {P}} (t) {\ hat {S}} (t)}$ . ^[4]

El OPE puede expresarse de muchas formas diferentes que son todas equivalentes. Para identificar las representaciones equivalentes, las siguientes identidades son especialmente útiles:

{\ Displaystyle \ tau (t) {\ hat {P}} (t) = {\ hat {P}} (t) \ tau '(t) = {\ hat {P}} (t), \ tau' (t) {\ hat {S}} (t) = {\ hat {S}} (t) \ tau (t) = {\ hat {S}} (t)}

Usando estas identidades, uno puede, por ejemplo, reescribir las dos primeras de las ecuaciones de proyección óptimas de la siguiente manera:

{\ Displaystyle {\ dot {P}} (t) = A (t) P (t) + P (t) A '(t) -P (t) C' (t) W ^ {- 1} (t ) C (t) P (t) + V (t) + \ tau _ {\ perp} (t) \ Psi _ {1} (t) \ tau '_ {\ perp} (t),}

{\ displaystyle P (0) = E \ left ({\ mathbf {x}} (0) {\ mathbf {x}} '(0) \ right),}

{\ Displaystyle - {\ dot {S}} (t) = A '(t) S (t) + S (t) A (t) -S (t) B (t) R ^ {- 1} (t ) B '(t) S (t) + Q (t) + \ tau' _ {\ perp} \ Psi _ {2} (t) \ tau _ {\ perp} (t),}

{\ Displaystyle S (T) = F.}

Esta representación es relativamente simple y adecuada para cálculos numéricos.

Si todas las matrices en la formulación del problema de LQG de orden reducido son invariantes en el tiempo y si el horizonte ${\ Displaystyle T}$ tiende al infinito, el controlador LQG óptimo de orden reducido se vuelve invariante en el tiempo y también lo hace el OPE . ^[1] En ese caso, las derivadas del lado izquierdo del OPE son cero.

Tiempo discreto

Similar al caso de tiempo continuo, en el caso de tiempo discreto la diferencia con el problema de LQG de orden completo de tiempo discreto convencional es el orden reducido fijo a priori ${\ Displaystyle n_ {r} }>$ de la dimensión de estado del controlador LQG. Al igual que en tiempo continuo, para enunciar el OPE en tiempo discreto conviene introducir las siguientes dos matrices:

{\ Displaystyle \ Psi _ {i} ^ {1} = \ left (A_ {i} -B_ {i} (B '_ {i} S_ {i + 1} B_ {i} + R_ {i}) ^ {-1} B '_ {i} S_ {i + 1} A_ {i}) \ right) {\ hat {P}} _ {i} \ left (A_ {i} -B_ {i} (B' _ {i} S_ {i + 1} B_ {i} + R_ {i}) ^ {- 1} B '_ {i} S_ {i + 1} A_ {i}) \ right)'}

{\ Displaystyle {} + A_ {i} P_ {i} C '_ {i} (C_ {i} P_ {i} C' _ {i} + W_ {i}) ^ {- 1} C_ {i} P_ {i} A '_ {i}}

{\ Displaystyle \ Psi _ {i + 1} ^ {2} = \ left (A_ {i} -A_ {i} P_ {i} C '_ {i} (C_ {i} P_ {i} C'_ {i} + W_ {i}) ^ {- 1} C_ {i} \ right) '{\ hat {S}} _ {i + 1} \ left (A_ {i} -A_ {i} P_ {i } C '_ {i} (C_ {i} P_ {i} C' _ {i} + W_ {i}) ^ {- 1} C_ {i} \ right)}

{\ Displaystyle {} + A '_ {i} S_ {i + 1} B_ {i} (B' _ {i} S_ {i + 1} B_ {i} + R_ {i}) ^ {- 1} B '_ {i} S_ {i + 1} A_ {i}}

Entonces el OPE de tiempo discreto es

{\ Displaystyle P_ {i + 1} = A_ {i} \ left (P_ {i} -P_ {i} C '_ {i} \ left (C_ {i} P_ {i} C' _ {i} + W_ {i} \ right) ^ {- 1} C_ {i} P_ {i} \ right) A '_ {i} + V_ {i} + \ tau _ {\ perp i + 1} \ Psi _ {i } ^ {1} \ tau '_ {\ perp i + 1}, P_ {0} = E \ left ({\ mathbf {x}} _ {0} {\ mathbf {x'}} _ {0} \ derecho)}

.

{\ Displaystyle S_ {i} = A '_ {i} \ left (S_ {i + 1} -S_ {i + 1} B_ {i} \ left (B' _ {i} S_ {i + 1} B_ {i} + R_ {i} \ right) ^ {- 1} B '_ {i} S_ {i + 1} \ right) A_ {i} + Q_ {i} + \ tau' _ {\ perp i} \ Psi _ {i + 1} ^ {2} \ tau _ {\ perp i}, S_ {N} = F}

.

{\ Displaystyle {\ hat {P}} _ {i + 1} = 1/2 (\ tau _ {i + 1} \ Psi _ {i} ^ {1} + \ Psi _ {i} ^ {1} \ tau '_ {i + 1}), {\ hat {P}} _ {0} = E ({\ mathbf {x}} (0)) E ({\ mathbf {x}} (0))' , \ operatorname {rango} ({\ hat {P}} _ {i}) = n_ {r}}

Casi en cualquier parte,

{\ Displaystyle {\ hat {S}} _ {i} = 1/2 (\ tau '_ {i} \ Psi _ {i + 1} ^ {2} + \ Psi _ {i + 1} ^ {2 } \ tau _ {i}), {\ hat {S}} _ {N} = 0, \ operatorname {rank} ({\ hat {S}} _ {i}) = n_ {r}}

Casi en cualquier parte.

La matriz de proyección oblicua está dada por

{\ Displaystyle \ tau _ {i} = {\ hat {P}} _ {i} {\ hat {S}} _ {i} \ left ({\ hat {P}} _ {i} {\ hat { S}} _ {i} \ right) ^ {*}.}

Las matrices simétricas no negativas ${\ Displaystyle P_ {i}, S_ {i}, {\ hat {P}} _ {i}, {\ hat {S}} _ {i}}$ que resuelven el OPE en tiempo discreto determinan las matrices del controlador LQG de orden reducido ${\ Displaystyle F_ {i} ^ {r}, K_ {i} ^ {r}, L_ {i} ^ {r}}$ y ${\ displaystyle {\ mathbf {x}} _ {0} ^ {r}}$ :

{\ Displaystyle F_ {i} ^ {r} = H_ {i + 1} \ left (A_ {i} -P_ {i} C '_ {i} \ left (C_ {i} P_ {i} C'_ {i} + W_ {i} \ right) ^ {- 1} C_ {i} -B_ {i} \ left (B '_ {i} S_ {i + 1} B_ {i} + R_ {i} \ derecha) ^ {- 1} B '_ {i} S_ {i + 1} \ derecha) G' _ {i},}

{\ Displaystyle K_ {i} ^ {r} = H_ {i + 1} P_ {i} C '_ {i} \ left (C_ {i} P_ {i} C' _ {i} + W_ {i} \ right) ^ {- 1},}

{\ Displaystyle L_ {i} ^ {r} = \ left (B '_ {i} S_ {i + 1} B_ {i} + R_ {i} \ right) ^ {- 1} B' _ {i} S_ {i + 1} G '_ {i},}

{\ displaystyle {\ mathbf {x}} _ {0} ^ {r} = H_ {0} E ({\ mathbf {x}} _ {0}).}

En las ecuaciones por encima de las matrices ${\ Displaystyle G_ {i}, H_ {i}}$ son dos matrices con las siguientes propiedades:

{\ Displaystyle G '_ {i} H_ {i} = \ tau _ {i}, G_ {i} H' _ {i} = I_ {n_ {r}}}

Casi en cualquier parte.

Pueden obtenerse de una factorización proyectiva de ${\ Displaystyle {\ hat {P}} _ {i} {\ hat {S}} _ {i}}$ . ^[4] Para identificar representaciones equivalentes de la OPE en tiempo discreto, las siguientes identidades son especialmente útiles:

{\ Displaystyle \ tau _ {i} {\ hat {P}} _ {i} = {\ hat {P}} _ {i} \ tau '_ {i} = {\ hat {P}} _ {i }, \ tau '_ {i} {\ hat {S}} _ {i} = {\ hat {S}} _ {i} \ tau _ {i} = {\ hat {S}} _ {i} }

Como en el caso de tiempo continuo, si todas las matrices en la formulación del problema son invariantes en el tiempo y si el horizonte ${\ Displaystyle N}$ tiende al infinito, el controlador LQG de orden reducido se vuelve invariante en el tiempo. Luego, los OPE de tiempo discreto convergen en una solución de estado estable que determina el controlador LQG de orden reducido invariante en el tiempo. ^[2]

El OPE de tiempo discreto se aplica también a los sistemas de tiempo discreto con dimensiones variables de estado, entrada y salida (sistemas de tiempo discreto con dimensiones variables en el tiempo). ^[6] Estos sistemas surgen en el caso del diseño de controladores digitales si el muestreo se produce de forma asincrónica.

Referencias

^ ^a ^b Hyland DC; Bernstein DS (1984). "Las ecuaciones de proyección óptimas para la compensación dinámica de orden fijo". Transacciones IEEE sobre control automático . AC-29 (11): 1034–1037. doi : 10.1109 / TAC.1984.1103418 . hdl : 2027,42 / 57875 .
^ ^a ^b Bernstein DS; Davis LD; Hyland DC (1986). "Las ecuaciones de proyección óptimas para la estimación y el control de modelos de tiempo discreto de orden reducido" (PDF) . Revista de Control y Dinámica de la Orientación . 9 (3): 288-293. Código bibliográfico : 1986JGCD .... 9..288B . doi : 10.2514 / 3.20105 . hdl : 2027,42 / 57880 .
^ ^a ^b Haddad WM; Tadmor G. (1993). "Controladores LQG de orden reducido para plantas lineales variables en el tiempo". Sistemas y cartas de control . 20 (2): 87–97. doi : 10.1016 / 0167-6911 (93) 90020-7 .
^ ^a ^b c d Van Willigenburg LG; De Koning WL (2000). "Algoritmos numéricos y cuestiones relativas a las ecuaciones de proyección óptima en tiempo discreto". Revista europea de control . 6 (1): 93–100. doi : 10.1016 / s0947-3580 (00) 70917-4 . Descarga de software asociado desde Matlab Central .
^ Athans M. (1971). "El papel y uso del problema estocástico lineal-cuadrático-gaussiano en el diseño de sistemas de control". Transacciones IEEE sobre control automático . AC-16 (6): 529–552. doi : 10.1109 / TAC.1971.1099818 .
^ a b Van Willigenburg LG; De Koning WL (1999). "Compensadores óptimos de orden reducido para sistemas de tiempo discreto variables en el tiempo con parámetros deterministas y blancos". Automatica . 35 : 129-138. doi : 10.1016 / S0005-1098 (98) 00138-1 . Descarga de software asociado desde Matlab Central .
^ Zigic D .; Watson LT; Collins EG; Haddad WM; Ying S. (1996). "Métodos de homotopía para resolver las ecuaciones de proyección óptimas para el problema del modelo de orden reducido H2". Revista Internacional de Control . 56 (1): 173-191. doi : 10.1080 / 00207179208934308 .
^ Collins Jr. EG; Haddad WM; Ying S. (1996). "Un algoritmo de homotopía para la compensación dinámica de orden reducido utilizando las ecuaciones de proyección óptima de Hyland-Bernstein". Revista de control y dinámica de la orientación . 19 (2): 407–417. doi : 10,2514 / 3,21633 .

[Bern1-1] Hyland DC; Bernstein DS (1984). "Las ecuaciones de proyección óptimas para la compensación dinámica de orden fijo". Transacciones IEEE sobre control automático . AC-29 (11): 1034–1037. doi : 10.1109 / TAC.1984.1103418 . hdl : 2027,42 / 57875 .

[Bern2-2] Bernstein DS; Davis LD; Hyland DC (1986). "Las ecuaciones de proyección óptimas para la estimación y el control de modelos de tiempo discreto de orden reducido" (PDF) . Revista de Control y Dinámica de la Orientación . 9 (3): 288-293. Código bibliográfico : 1986JGCD .... 9..288B . doi : 10.2514 / 3.20105 . hdl : 2027,42 / 57880 .

[Haddad1-3] Haddad WM; Tadmor G. (1993). "Controladores LQG de orden reducido para plantas lineales variables en el tiempo". Sistemas y cartas de control . 20 (2): 87–97. doi : 10.1016 / 0167-6911 (93) 90020-7 .

[Wil1-4] Van Willigenburg LG; De Koning WL (2000). "Algoritmos numéricos y cuestiones relativas a las ecuaciones de proyección óptima en tiempo discreto". Revista europea de control . 6 (1): 93–100. doi : 10.1016 / s0947-3580 (00) 70917-4 . Descarga de software asociado desde Matlab Central .

[Athans-5] Athans M. (1971). "El papel y uso del problema estocástico lineal-cuadrático-gaussiano en el diseño de sistemas de control". Transacciones IEEE sobre control automático . AC-16 (6): 529–552. doi : 10.1109 / TAC.1971.1099818 .

[Wil2-6] Van Willigenburg LG; De Koning WL (1999). "Compensadores óptimos de orden reducido para sistemas de tiempo discreto variables en el tiempo con parámetros deterministas y blancos". Automatica . 35 : 129-138. doi : 10.1016 / S0005-1098 (98) 00138-1 . Descarga de software asociado desde Matlab Central .

[Bern3-7] Zigic D .; Watson LT; Collins EG; Haddad WM; Ying S. (1996). "Métodos de homotopía para resolver las ecuaciones de proyección óptimas para el problema del modelo de orden reducido H2". Revista Internacional de Control . 56 (1): 173-191. doi : 10.1080 / 00207179208934308 .

[Had1-8] Collins Jr. EG; Haddad WM; Ying S. (1996). "Un algoritmo de homotopía para la compensación dinámica de orden reducido utilizando las ecuaciones de proyección óptima de Hyland-Bernstein". Revista de control y dinámica de la orientación . 19 (2): 407–417. doi : 10,2514 / 3,21633 .

[1]