En la teoría de control , las ecuaciones de proyección óptimas [1] [2] [3] constituyen condiciones necesarias y suficientes para un controlador LQG de orden reducido localmente óptimo. [4]
El problema de control lineal cuadrático-gaussiano (LQG) es uno de los problemas de control óptimo más fundamentales . Se trata de sistemas lineales inciertos perturbados por ruido gaussiano blanco aditivo , información de estado incompleta (es decir, no todas las variables de estado se miden y están disponibles para retroalimentación) también perturbada por ruido gaussiano blanco aditivo y costos cuadráticos . Además, la solución es única y constituye una ley de control de retroalimentación dinámica lineal que se calcula e implementa fácilmente. Finalmente, el controlador LQG también es fundamental para el control óptimo de perturbaciones de sistemas no lineales. [5]
El controlador LQG en sí es un sistema dinámico como el sistema que controla. Ambos sistemas tienen la misma dimensión de estado. Por lo tanto, implementar el controlador LQG puede resultar problemático si la dimensión del estado del sistema es grande. El problema de LQG de orden reducido ( problema de LQG de orden fijo) lo supera fijando a priori el número de estados del controlador LQG. Este problema es más difícil de resolver porque ya no es separable. Además, la solución ya no es única. A pesar de estos hechos, se dispone de algoritmos numéricos [4] [6] [7] [8] para resolver las ecuaciones de proyección óptimas asociadas.
Tiempo continuo
El problema de control de LQG de orden reducido es casi idéntico al problema de control de LQG de orden completo convencional . Dejarrepresentan el estado del controlador LQG de orden reducido. Entonces la única diferencia es que la dimensión estatal del controlador LQG está fijado a priori para ser más pequeño que , la dimensión de estado del sistema controlado.
El controlador LQG de orden reducido está representado por las siguientes ecuaciones:
Estas ecuaciones se expresan deliberadamente en un formato que es igual al del controlador LQG de orden completo convencional . Para el problema de control LQG de orden reducido, es conveniente reescribirlos como
dónde
Las matrices y del controlador LQG de orden reducido se determinan mediante las denominadas ecuaciones de proyección óptima ( OPE ). [3]
La matriz de proyección óptima cuadrada con dimensión es fundamental para la OPE . El rango de esta matriz es casi en todas partes igual a La proyección asociada es una proyección oblicua: Los OPE constituyen cuatro ecuaciones diferenciales matriciales. Las dos primeras ecuaciones enumeradas a continuación son generalizaciones de las ecuaciones diferenciales matriciales de Riccati asociadas al controlador LQG de orden completo convencional . En estas ecuaciones denota dónde es la matriz de identidad de la dimensión .
Si la dimensión del controlador LQG no se reduce, eso es si , luego y las dos ecuaciones anteriores se convierten en las ecuaciones diferenciales de Riccati matriciales desacopladas asociadas al controlador LQG de orden completo convencional . Si las dos ecuaciones están acopladas por la proyección oblicua Esto revela por qué el problema de LQG de orden reducido no es separable . La proyección oblicuase determina a partir de dos ecuaciones diferenciales matriciales adicionales que involucran condiciones de rango . Junto con las dos ecuaciones diferenciales matriciales anteriores, estas son las OPE . Para enunciar las dos ecuaciones diferenciales matriciales adicionales es conveniente introducir las siguientes dos matrices:
Entonces, las dos ecuaciones diferenciales matriciales adicionales que completan el OPE son las siguientes:
- Casi en cualquier parte,
- Casi en cualquier parte,
con
Aquí * denota el grupo inverso generalizado o inverso de Drazin que es único y está dado por
donde + denota el pseudoinverso de Moore-Penrose .
Las matrices todos deben ser simétricos no negativos . Entonces constituyen una solución del OPE que determina las matrices de controlador LQG de orden reducido y :
En las ecuaciones por encima de las matrices son dos matrices con las siguientes propiedades:
- Casi en cualquier parte.
Pueden obtenerse de una factorización proyectiva de . [4]
El OPE puede expresarse de muchas formas diferentes que son todas equivalentes. Para identificar las representaciones equivalentes, las siguientes identidades son especialmente útiles:
Usando estas identidades, uno puede, por ejemplo, reescribir las dos primeras de las ecuaciones de proyección óptimas de la siguiente manera:
Esta representación es relativamente simple y adecuada para cálculos numéricos.
Si todas las matrices en la formulación del problema de LQG de orden reducido son invariantes en el tiempo y si el horizonte tiende al infinito, el controlador LQG óptimo de orden reducido se vuelve invariante en el tiempo y también lo hace el OPE . [1] En ese caso, las derivadas del lado izquierdo del OPE son cero.
Tiempo discreto
Similar al caso de tiempo continuo, en el caso de tiempo discreto la diferencia con el problema de LQG de orden completo de tiempo discreto convencional es el orden reducido fijo a prioride la dimensión de estado del controlador LQG. Al igual que en tiempo continuo, para enunciar el OPE en tiempo discreto conviene introducir las siguientes dos matrices:
Entonces el OPE de tiempo discreto es
- .
- .
- Casi en cualquier parte,
- Casi en cualquier parte.
La matriz de proyección oblicua está dada por
Las matrices simétricas no negativas que resuelven el OPE en tiempo discreto determinan las matrices del controlador LQG de orden reducido y :
En las ecuaciones por encima de las matrices son dos matrices con las siguientes propiedades:
- Casi en cualquier parte.
Pueden obtenerse de una factorización proyectiva de . [4] Para identificar representaciones equivalentes de la OPE en tiempo discreto, las siguientes identidades son especialmente útiles:
Como en el caso de tiempo continuo, si todas las matrices en la formulación del problema son invariantes en el tiempo y si el horizonte tiende al infinito, el controlador LQG de orden reducido se vuelve invariante en el tiempo. Luego, los OPE de tiempo discreto convergen en una solución de estado estable que determina el controlador LQG de orden reducido invariante en el tiempo. [2]
El OPE de tiempo discreto se aplica también a los sistemas de tiempo discreto con dimensiones variables de estado, entrada y salida (sistemas de tiempo discreto con dimensiones variables en el tiempo). [6] Estos sistemas surgen en el caso del diseño de controladores digitales si el muestreo se produce de forma asincrónica.