Principio de separacion

En la teoría de control , un principio de separación , más formalmente conocido como principio de separación de estimación y control , establece que bajo algunos supuestos el problema de diseñar un controlador de retroalimentación óptimo para un sistema estocástico puede resolverse diseñando un observador óptimo para el estado de el sistema, que alimenta un controlador determinista óptimo para el sistema. Por lo tanto, el problema se puede dividir en dos partes separadas, lo que facilita el diseño.

La primera instancia de tal principio es en el contexto de sistemas lineales deterministas, a saber, que si un observador estable y una retroalimentación de estado estable están diseñados para un sistema lineal invariante en el tiempo (en adelante, el sistema LTI), entonces el observador y la retroalimentación combinados son estables. . El principio de separación no se aplica en general a los sistemas no lineales.

Otro ejemplo del principio de separación surge en la configuración de sistemas estocásticos lineales, a saber, que la estimación del estado (posiblemente no lineal) junto con un controlador de retroalimentación de estado óptimo diseñado para minimizar un costo cuadrático, es óptimo para el problema de control estocástico con mediciones de salida. Cuando el ruido de proceso y de observación son gaussianos, la solución óptima se separa en un filtro de Kalman y un regulador lineal cuadrático . Esto se conoce como control lineal-cuadrático-gaussiano . De manera más general, en condiciones adecuadas y cuando el ruido es una martingala (con posibles saltos), de nuevo se aplica un principio de separación y se conoce como principio de separación en control estocástico ^[1]^[2]^[3]^[4]^[5] . ^[6]

El principio de separación también se aplica a los observadores de alta ganancia utilizados para la estimación del estado de una clase de sistemas no lineales ^[7] y el control de sistemas cuánticos.

Prueba del principio de separación para sistemas LTI deterministas

Considere un sistema LTI determinista:

${\ Displaystyle {\ begin {alineado} {\ dot {x}} (t) & = Ax (t) + Bu (t) \\ y (t) & = Cx (t) \ end {alineado}}}$

dónde

{\ Displaystyle u (t)}

representa la señal de entrada,

{\ Displaystyle y (t)}

representa la señal de salida, y

{\ Displaystyle x (t)}

representa el estado interno del sistema.

Podemos diseñar un observador de la forma

{\ Displaystyle {\ dot {\ hat {x}}} = (A-LC) {\ hat {x}} + Bu + Ly \,}

y comentarios del estado

{\ Displaystyle u (t) = - K {\ hat {x}} \ ,.}

Defina el error e :

{\ Displaystyle e = x - {\ hat {x}} \ ,.}

Luego

{\ Displaystyle {\ dot {e}} = (A-LC) e \,}

{\ Displaystyle u (t) = - K (xe) \ ,.}

Ahora podemos escribir la dinámica de ciclo cerrado como

{\ displaystyle {\ begin {bmatrix} {\ dot {x}} \\ {\ dot {e}} \\\ end {bmatrix}} = {\ begin {bmatrix} A-BK & BK \\ 0 & A-LC \\ \ end {bmatrix}} {\ begin {bmatrix} x \\ e \\\ end {bmatrix}}.}

Dado que es triangular , los valores propios son solo los de A - BK junto con los de A - LC . ^[8] Por tanto, la estabilidad del observador y la retroalimentación son independientes .

Referencias

^ Karl Johan Astrom (1970). Introducción a la teoría del control estocástico . 58 . Prensa académica. ISBN 0-486-44531-3..
^ Tyrone Duncan y Pravin Varaiya (1971). "Sobre las soluciones de un sistema de control estocástico". SIAM J. Control . 9 (3): 354–371. doi : 10.1137 / 0309026 . hdl : 1808/16692 ..
^ MHA Davis y P. Varaiya (1972). "Estados de información para sistemas estocásticos". J. Math. Anal. Aplicaciones . 37 : 384–402. doi : 10.1016 / 0022-247X (72) 90281-8 ..
^ Anders Lindquist (1973). "Sobre el control de retroalimentación de sistemas estocásticos lineales". Revista SIAM de Control . 11 (2): 323–343. doi : 10.1137 / 0311025 ..
^ A. Bensoussan (1992). Control estocástico de sistemas parcialmente observables . Prensa de la Universidad de Cambridge..
^ Tryphon T. Georgiou y Anders Lindquist (2013). "El principio de separación en el control estocástico, Redux". Transacciones IEEE sobre control automático . 58 (10): 2481–2494. arXiv : 1103.3005 . doi : 10.1109 / TAC.2013.2259207 . S2CID 12623187 ..
^ Atassi, AN; Khalil, HK (1998). "Un principio de separación para el control de una clase de sistemas no lineales" . Actas de la 37ª Conferencia IEEE sobre Decisión y Control (Cat. No.98CH36171) . IEEE. 1 : 855–860. doi : 10.1109 / cdc.1998.760800 . ISBN 0-7803-4394-8. S2CID 126270534 .
^ La prueba se puede encontrar en este math.stackexchange [1] .

Brezinski, Claude. Aspectos Computacionales del Control Lineal (Métodos Numéricos y Algoritmos) . Springer, 2002.

[astrom-1] Karl Johan Astrom (1970). Introducción a la teoría del control estocástico . 58 . Prensa académica. ISBN 0-486-44531-3..

[duncanvaraiya-2] Tyrone Duncan y Pravin Varaiya (1971). "Sobre las soluciones de un sistema de control estocástico". SIAM J. Control . 9 (3): 354–371. doi : 10.1137 / 0309026 . hdl : 1808/16692 ..

[davisvaraiya-3] MHA Davis y P. Varaiya (1972). "Estados de información para sistemas estocásticos". J. Math. Anal. Aplicaciones . 37 : 384–402. doi : 10.1016 / 0022-247X (72) 90281-8 ..

[lindquist-4] Anders Lindquist (1973). "Sobre el control de retroalimentación de sistemas estocásticos lineales". Revista SIAM de Control . 11 (2): 323–343. doi : 10.1137 / 0311025 ..

[Bensoussan-5] A. Bensoussan (1992). Control estocástico de sistemas parcialmente observables . Prensa de la Universidad de Cambridge..

[GL2013-6] Tryphon T. Georgiou y Anders Lindquist (2013). "El principio de separación en el control estocástico, Redux". Transacciones IEEE sobre control automático . 58 (10): 2481–2494. arXiv : 1103.3005 . doi : 10.1109 / TAC.2013.2259207 . S2CID 12623187 ..

[7] Atassi, AN; Khalil, HK (1998). "Un principio de separación para el control de una clase de sistemas no lineales" . Actas de la 37ª Conferencia IEEE sobre Decisión y Control (Cat. No.98CH36171) . IEEE. 1 : 855–860. doi : 10.1109 / cdc.1998.760800 . ISBN 0-7803-4394-8. S2CID 126270534 .

[8] ^ La prueba se puede encontrar en este math.stackexchange [1] .

[1]