Los sistemas de control basados en datos son una amplia familia de sistemas de control , en los que la identificación del modelo de proceso y / o el diseño del controlador se basan completamente en datos experimentales recopilados de la planta. [1]
En muchas aplicaciones de control, tratar de escribir un modelo matemático de la planta se considera una tarea difícil, que requiere esfuerzos y tiempo para los ingenieros de proceso y control. Este problema se supera mediante métodos basados en datos , que permiten ajustar un modelo de sistema a los datos experimentales recopilados, eligiéndolo en una clase de modelos específica. El ingeniero de control puede entonces aprovechar este modelo para diseñar un controlador adecuado para el sistema. Sin embargo, todavía es difícil encontrar un modelo simple pero confiable para un sistema físico, que incluya solo aquellas dinámicas del sistema que son de interés para las especificaciones de control. El directoLos métodos basados en datos permiten ajustar un controlador, perteneciente a una clase determinada, sin la necesidad de un modelo identificado del sistema. De esta manera, también se puede simplemente ponderar las dinámicas de proceso de interés dentro de la función de control de costos y excluir aquellas dinámicas que no son de interés.
Descripción general
El enfoque estándar para el diseño de sistemas de control se organiza en dos pasos:
- La identificación del modelo tiene como objetivo estimar un modelo nominal del sistema. , dónde es el operador de retardo unitario (para la representación de funciones de transferencia en tiempo discreto) y es el vector de parámetros de identificado en un conjunto de datos. Entonces, la validación consiste en construir el conjunto de incertidumbres que contiene el verdadero sistema a un cierto nivel de probabilidad.
- El diseño del controlador tiene como objetivo encontrar un controlador lograr la estabilidad de circuito cerrado y cumplir con el rendimiento requerido con .
Los objetivos típicos de la identificación del sistema son tener lo más cerca posible de y tener tan pequeño como sea posible. Sin embargo, desde la perspectiva de la identificación para el control , lo que realmente importa es el rendimiento logrado por el controlador, no la calidad intrínseca del modelo.
Una forma de lidiar con la incertidumbre es diseñar un controlador que tenga un rendimiento aceptable con todos los modelos en , incluyendo . Esta es la idea principal detrás del procedimiento de diseño de control robusto , que tiene como objetivo construir descripciones de incertidumbre en el dominio de la frecuencia del proceso. Sin embargo, al basarse en supuestos del peor de los casos en lugar de en la idea de promediar el ruido, este enfoque generalmente conduce a conjuntos de incertidumbre conservadores . Más bien, las técnicas basadas en datos tratan con la incertidumbre trabajando con datos experimentales y evitando el conservadurismo excesivo.
A continuación, se presentan las principales clasificaciones de los sistemas de control basados en datos.
Métodos directos e indirectos
Hay muchos métodos disponibles para controlar los sistemas. La distinción fundamental es entre los métodos de diseño de controladores directos e indirectos . El primer grupo de técnicas aún conserva el enfoque estándar de dos pasos, es decir , primero se identifica un modelo y luego se ajusta un controlador en base a dicho modelo. El problema principal al hacerlo es que el controlador se calcula a partir del modelo estimado(según el principio de certidumbre de equivalencia ), pero en la práctica. Para superar este problema, la idea detrás del último grupo de técnicas es mapear los datos experimentales directamente en el controlador, sin ningún modelo que se identifique en el medio.
Métodos iterativos y no iterativos
Otra distinción importante es entre métodos iterativos y no iterativos (o de una sola vez ). En el primer grupo, se necesitan iteraciones repetidas para estimar los parámetros del controlador, durante las cuales se realiza el problema de optimización en función de los resultados de la iteración anterior, y se espera que la estimación sea cada vez más precisa en cada iteración. Este enfoque también es propenso a implementaciones en línea (ver más abajo). En el último grupo, la parametrización (óptima) del controlador se proporciona con un único problema de optimización. Esto es particularmente importante para aquellos sistemas en los que las iteraciones o repeticiones de experimentos de recopilación de datos son limitadas o incluso no están permitidas (por ejemplo, debido a aspectos económicos). En tales casos, se debe seleccionar una técnica de diseño capaz de entregar un controlador en un solo conjunto de datos. Este enfoque a menudo se implementa fuera de línea (ver más abajo).
Métodos en línea y fuera de línea
Dado que, en aplicaciones industriales prácticas, los datos de bucle abierto o de bucle cerrado a menudo están disponibles de forma continua, las técnicas basadas en datos en línea utilizan esos datos para mejorar la calidad del modelo identificado y / o el rendimiento del controlador cada vez que hay nueva información. se recoge en la planta. En cambio, los enfoques fuera de línea funcionan en lotes de datos, que pueden recopilarse solo una o varias veces en un intervalo de tiempo regular (pero bastante largo).
Ajuste de la retroalimentación iterativa
El método de ajuste de retroalimentación iterativa (IFT) se introdujo en 1994, [2] a partir de la observación de que, en la identificación para el control, cada iteración se basa en el principio de equivalencia de certeza (errónea).
IFT es una técnica sin modelo para la optimización iterativa directa de los parámetros de un controlador de orden fijo; dichos parámetros pueden actualizarse sucesivamente utilizando información procedente del funcionamiento del sistema estándar (circuito cerrado).
Dejar ser una salida deseada a la señal de referencia ; el error entre la respuesta lograda y la deseada es. El objetivo de diseño de control se puede formular como la minimización de la función objetivo:
Dada la función objetivo de minimizar, se puede aplicar el método cuasi-Newton , es decir, una minimización basada en gradientes utilizando una búsqueda de gradientes del tipo:
El valor es el tamaño del paso, es una matriz definida positiva apropiada y es una aproximación del gradiente; el verdadero valor del gradiente viene dado por lo siguiente:
El valor de se obtiene mediante la siguiente metodología de tres pasos:
- Experimento normal: realice un experimento en el sistema de circuito cerrado con como controlador y como referencia; recopilar N mediciones de la salida, denotado como .
- Experimento de gradiente: realice un experimento en el sistema de circuito cerrado con como controlador y 0 como referencia ; inyectar la señal tal que se suma a la salida de la variable de control por , yendo como entrada a la planta. Recopile la salida, denotada como.
- Tome lo siguiente como aproximación de gradiente: .
Un factor crucial para la velocidad de convergencia del algoritmo es la elección de ; Cuándo es pequeña, una buena elección es la aproximación dada por la dirección Gauss-Newton:
Ajuste basado en correlación no iterativo
El ajuste no iterativo basado en correlación (nCbT) es un método no iterativo para el ajuste basado en datos de un controlador de estructura fija. [3] Proporciona un método de una sola vez para sintetizar directamente un controlador basado en un solo conjunto de datos.
Suponer que denota una planta SISO estable de LTI desconocida, un modelo de referencia definido por el usuario y una función de ponderación definida por el usuario. Un controlador de orden fijo LTI se indica como, dónde , y es un vector de funciones base LTI. Finalmente, es un controlador LTI ideal de cualquier estructura, garantizando una función de circuito cerrado cuando se aplica a .
El objetivo es minimizar la siguiente función objetivo:
es una aproximación convexa de la función objetivo obtenida a partir de un problema de referencia modelo, suponiendo que .
Cuándo es estable y de fase mínima, el problema de referencia del modelo aproximado es equivalente a la minimización de la norma de en el esquema de la figura.
La señal de entrada se supone que es una señal de entrada persistentemente excitante y que se genere mediante un mecanismo estable de generación de datos. Por tanto, las dos señales no están correlacionadas en un experimento de bucle abierto; de ahí el error ideal no está correlacionado con . El objetivo de control consiste, pues, en encontrar tal que y no están correlacionados.
El vector de variables instrumentales Se define como:
dónde es lo suficientemente grande y , dónde es un filtro apropiado.
La función de correlación es:
y el problema de optimización se convierte en:
Denotando con el espectro de , se puede demostrar que, bajo algunos supuestos, si se selecciona como:
entonces, lo siguiente es válido:
Restricción de estabilidad
No hay garantía de que el controlador que minimiza es estable. La inestabilidad puede ocurrir en los siguientes casos:
- Si es una fase no mínima, puede dar lugar a cancelaciones en el plano complejo de la mitad derecha.
- Si (incluso si la estabilización) no se puede lograr, puede que no se estabilice.
- Debido al ruido de la medición, incluso si se está estabilizando, con datos estimados puede que no sea así.
Considere un controlador estabilizador y la función de transferencia de bucle cerrado . Definir:
- Teorema
- El controlador estabiliza la planta Si
- es estable
- S t
La condición 1. se aplica cuando:
- es estable
- contiene un integrador (está cancelado).
El diseño de referencia del modelo con restricción de estabilidad se convierte en:
Una estimación convexa basada en datos dese puede obtener mediante la transformada discreta de Fourier .
Defina lo siguiente:
Para plantas estables de fase mínima , se da el siguiente problema de optimización convexa impulsada por datos :
Ajuste de retroalimentación de referencia virtual
El ajuste de retroalimentación de referencia virtual (VRFT) es un método no literario para el ajuste basado en datos de un controlador de estructura fija. Proporciona un método de una sola vez para sintetizar directamente un controlador basado en un solo conjunto de datos.
VRFT se propuso por primera vez en [4] y luego se extendió a los sistemas LPV. [5] VRFT también se basa en ideas dadas en [6] como.
La idea principal es definir un modelo de circuito cerrado deseado. y utilizar su dinámica inversa para obtener una referencia virtual de la señal de salida medida .
Las señales virtuales son y
El controlador óptimo se obtiene a partir de datos silenciosos resolviendo el siguiente problema de optimización:
donde la función de optimización se da de la siguiente manera:
Referencias
- ^ Bazanella, AS, Campestrini, L., Eckhard, D. (2012). Diseño de controlador basado en datos: elAcercarse. Springer, ISBN 978-94-007-2300-9 , 208 páginas.
- ^ Hjalmarsson, H. , Gevers, M., Gunnarsson, S. y Lequin, O. (1998). Ajuste de la retroalimentación iterativa: teoría y aplicaciones. Sistemas de control IEEE, 18 (4), 26–41.
- ^ van Heusden, K., Karimi, A. y Bonvin, D. (2011), Control de referencia de modelo basado en datos con estabilidad asintóticamente garantizada. En t. J. Adapt. Proceso de señal de control., 25: 331–351. doi : 10.1002 / acs.1212
- ^ Campi, Marco C., Andrea Lecchini y Sergio M. Savaresi. "Ajuste de retroalimentación de referencia virtual: un método directo para el diseño de controladores de retroalimentación". Automatica 38.8 (2002): 1337-1346.
- ^ Formentin, S., Piga, D., Tóth, R. y Savaresi, SM (2016). Aprendizaje directo de controladores LPV a partir de datos. Automatica, 65, 98-110.
- ^ Guardabassi, Guido O. y Sergio M. Savaresi. "Linealización de retroalimentación aproximada de sistemas no lineales de tiempo discreto utilizando diseño directo de entrada virtual". Systems & Control Letters 32.2 (1997): 63–74.