Hamiltoniano (teoría de control)

El hamiltoniano es una función que se utiliza para resolver un problema de control óptimo de un sistema dinámico . Puede entenderse como un incremento instantáneo de la expresión lagrangiana del problema que se va a optimizar durante un determinado período de tiempo. ^[1] Inspirado por, pero distinto del hamiltoniano de la mecánica clásica , el hamiltoniano de la teoría del control óptimo fue desarrollado por Lev Pontryagin como parte de su principio máximo . ^[2]^[3]Pontryagin demostró que una condición necesaria para resolver el problema de control óptimo es que el control debe elegirse para optimizar el hamiltoniano. ^[4]

Enunciado del problema y definición del hamiltoniano

Considere un sistema dinámico de ${\ Displaystyle n}$ ecuaciones diferenciales de primer orden

{\ Displaystyle {\ dot {\ mathbf {x}}} (t) = \ mathbf {f} (\ mathbf {x} (t), \ mathbf {u} (t), t)}

dónde ${\ Displaystyle \ mathbf {x} (t) = \ left [x_ {1} (t), x_ {2} (t), \ ldots, x_ {n} (t) \ right] ^ {\ mathsf {T }}}$ denota un vector de variables de estado, y ${\ Displaystyle \ mathbf {u} (t) = \ left [u_ {1} (t), u_ {2} (t), \ ldots, u_ {r} (t) \ right] ^ {\ mathsf {T }}}$ un vector de variables de control. Una vez que las condiciones iniciales ${\ Displaystyle \ mathbf {x} (t_ {0}) = \ mathbf {x} _ {0}}$ y controles ${\ Displaystyle \ mathbf {u} (t)}$ se especifican, una solución a las ecuaciones diferenciales, llamada trayectoria ${\ Displaystyle \ mathbf {x} (t; \ mathbf {x} _ {0}, t_ {0})}$ , puede ser encontrado. El problema del control óptimo es elegir ${\ Displaystyle \ mathbf {u} (t)}$ (de un conjunto compacto y convexo ${\ Displaystyle {\ mathcal {U}} \ subseteq \ mathbb {R} ^ {r}}$ ) así que eso ${\ Displaystyle \ mathbf {x} (t)}$ maximiza o minimiza una determinada función objetivo entre un tiempo inicial ${\ Displaystyle t = t_ {0}}$ y un tiempo terminal ${\ Displaystyle t = t_ {1}}$ (dónde ${\ Displaystyle t_ {1}}$ puede ser infinito ). Específicamente, el objetivo es optimizar un índice de rendimiento. ${\ Displaystyle I (\ mathbf {x} (t), \ mathbf {u} (t), t)}$ en cada momento,

{\ Displaystyle \ max _ {\ mathbf {u} (t)} J = \ int _ {t_ {0}} ^ {t_ {1}} I (\ mathbf {x} (t), \ mathbf {u} (t), t) \, \ mathrm {d} t}

sujeto a las ecuaciones de movimiento anteriores de las variables de estado. El método de solución implica definir una función auxiliar conocida como control hamiltoniano ^[2]

${\ Displaystyle H (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t), t) \ equiv I (\ mathbf {x} (t), \ mathbf {u} (t), t) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t) \ mathbf {f} (\ mathbf {x} (t), \ mathbf {u} (t) , t)}$

que combina la función objetivo y las ecuaciones de estado como un Lagrangiano en un problema de optimización estática, solo que los multiplicadores ${\ Displaystyle \ mathbf {\ lambda} (t)}$ , denominadas variables de costate , son funciones del tiempo más que constantes.

El objetivo es encontrar una función de política de control óptima ${\ Displaystyle \ mathbf {u} ^ {\ ast} (t)}$ y, con ello, una trayectoria óptima de la variable de estado ${\ Displaystyle \ mathbf {x} ^ {\ ast} (t)}$ , que según el principio máximo de Pontryagin son los argumentos que maximizan el hamiltoniano,

{\ Displaystyle H (\ mathbf {x} ^ {\ ast} (t), \ mathbf {u} ^ {\ ast} (t), \ mathbf {\ lambda} (t), t) \ geq H (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t), t)}

para todos

{\ Displaystyle \ mathbf {u} (t) \ in {\ mathcal {U}}}

Las condiciones necesarias de primer orden para un máximo están dadas por

{\ Displaystyle {\ frac {\ H parcial (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t), t)} {\ parcial \ mathbf {\ lambda }}} = {\ dot {\ mathbf {x}}}}

que genera la función de transición de estado

{\ Displaystyle \ mathbf {f} (\ mathbf {x} (t), \ mathbf {u} (t), t) = {\ dot {\ mathbf {x}}}}

,

{\ Displaystyle {\ frac {\ H parcial (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t), t)} {\ parcial \ mathbf {x} }} = - {\ dot {\ mathbf {\ lambda}}} (t)}

que genera

{\ displaystyle {\ dot {\ mathbf {\ lambda}}} (t) = - \ left [I _ {\ mathbf {x}} (\ mathbf {x} (t), \ mathbf {u} (t), t) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t) \ mathbf {f} _ {\ mathbf {x}} (\ mathbf {x} (t), \ mathbf {u} (t ), t) \ derecha]}

las últimas de las cuales se conocen como ecuaciones de costada . Juntas, las ecuaciones de estado y de costa describen el sistema dinámico hamiltoniano (de nuevo análogo pero distinto del sistema hamiltoniano en física), cuya solución implica un problema de valor de frontera de dos puntos , dado que hay ${\ Displaystyle 2n}$ condiciones de contorno que involucran dos puntos diferentes en el tiempo, el tiempo inicial (el ${\ Displaystyle n}$ ecuaciones diferenciales para las variables de estado), y el tiempo terminal (el ${\ Displaystyle n}$ ecuaciones diferenciales para las variables de costa; a menos que se especifique una función final, las condiciones de contorno son ${\ Displaystyle \ mathbf {\ lambda} (t_ {1}) = 0}$ , o ${\ Displaystyle \ lim _ {t_ {1} \ to \ infty} \ mathbf {\ lambda} (t_ {1}) = 0}$ para horizontes de tiempo infinitos). ^[5]

Una condición suficiente para un máximo es la concavidad del hamiltoniano evaluado en la solución, es decir

{\ Displaystyle H _ {\ mathbf {uu}} (\ mathbf {x} ^ {\ ast} (t), \ mathbf {u} ^ {\ ast} (t), \ mathbf {\ lambda} (t), t) \ leq 0}

dónde ${\ Displaystyle \ mathbf {u} ^ {\ ast} (t)}$ es el control óptimo, y ${\ Displaystyle \ mathbf {x} ^ {\ ast} (t)}$ es la trayectoria óptima resultante para la variable de estado. ^[6] Alternativamente, por un resultado debido a Olvi L. Mangasarian , las condiciones necesarias son suficientes si las funciones ${\ Displaystyle I (\ mathbf {x} (t), \ mathbf {u} (t), t)}$ y ${\ Displaystyle \ mathbf {f} (\ mathbf {x} (t), \ mathbf {u} (t), t)}$ son cóncavos en ${\ Displaystyle \ mathbf {x} (t)}$ y ${\ Displaystyle \ mathbf {u} (t)}$ . ^[7]

Derivación del Lagrangiano

Un problema de optimización restringido como el que se indicó anteriormente generalmente sugiere una expresión lagrangiana, específicamente

{\ Displaystyle L = \ int _ {t_ {0}} ^ {t_ {1}} I (\ mathbf {x} (t), \ mathbf {u} (t), t) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t) \ left [\ mathbf {f} (\ mathbf {x} (t), \ mathbf {u} (t), t) - {\ dot {\ mathbf {x} }} (t) \ derecha] \, \ mathrm {d} t}

donde el ${\ Displaystyle \ mathbf {\ lambda} (t)}$ comparar con el multiplicador de Lagrange en un problema de optimización estática pero ahora, como se señaló anteriormente, son una función del tiempo. Continuando con una transformación de Legendre , el último término en el lado derecho se puede reescribir usando la integración por partes , de modo que

{\ Displaystyle - \ int _ {t_ {0}} ^ {t_ {1}} \ mathbf {\ lambda} ^ {\ mathsf {T}} (t) {\ dot {\ mathbf {x}}} (t ) \, \ mathrm {d} t = - \ mathbf {\ lambda} ^ {\ mathsf {T}} (t_ {1}) \ mathbf {x} (t_ {1}) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t_ {0}) \ mathbf {x} (t_ {0}) + \ int _ {t_ {0}} ^ {t_ {1}} {\ dot {\ mathbf {\ lambda }}} ^ {\ mathsf {T}} (t) \ mathbf {x} (t) \, \ mathrm {d} t}

que puede sustituirse de nuevo en la expresión lagrangiana para dar

{\ Displaystyle L = \ int _ {t_ {0}} ^ {t_ {1}} \ left [I (\ mathbf {x} (t), \ mathbf {u} (t), t) + \ mathbf { \ lambda} ^ {\ mathsf {T}} (t) \ mathbf {f} (\ mathbf {x} (t), \ mathbf {u} (t), t) + {\ dot {\ mathbf {\ lambda }}} ^ {\ mathsf {T}} (t) \ mathbf {x} (t) \ right] \, \ mathrm {d} t- \ mathbf {\ lambda} ^ {\ mathsf {T}} (t_ {1}) \ mathbf {x} (t_ {1}) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t_ {0}) \ mathbf {x} (t_ {0})}

Para derivar las condiciones de primer orden para un óptimo, suponga que se ha encontrado la solución y que el Lagrangiano está maximizado. Entonces cualquier cambio a ${\ Displaystyle \ mathbf {x} (t)}$ o ${\ Displaystyle \ mathbf {u} (t)}$ debe hacer que el valor del lagrangiano disminuya. Específicamente, la derivada total de ${\ Displaystyle L}$ obedece

{\ Displaystyle \ mathrm {d} L = \ int _ {t_ {0}} ^ {t_ {1}} \ left [\ left (I _ {\ mathbf {u}} (\ mathbf {x} (t), \ mathbf {u} (t), t) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t) \ mathbf {f} _ {\ mathbf {u}} (\ mathbf {x} (t ), \ mathbf {u} (t), t) \ right) \ mathrm {d} \ mathbf {u} (t) + \ left (I _ {\ mathbf {x}} (\ mathbf {x} (t) , \ mathbf {u} (t), t) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t) \ mathbf {f} _ {\ mathbf {x}} (\ mathbf {x} ( t), \ mathbf {u} (t), t) + {\ dot {\ mathbf {\ lambda}}} (t) \ right) \ mathrm {d} \ mathbf {x} (t) \ right] \ mathrm {d} t- \ mathbf {\ lambda} ^ {\ mathsf {T}} (t_ {1}) \ mathrm {d} \ mathbf {x} (t_ {1}) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t_ {0}) \ mathrm {d} \ mathbf {x} (t_ {0}) \ leq 0}

Para que esta expresión sea igual a cero, se necesitan las siguientes condiciones de optimización:

{\ Displaystyle {\ begin {alineado} I _ {\ mathbf {u}} (\ mathbf {x} (t), \ mathbf {u} (t), t) + \ mathbf {\ lambda} ^ {\ mathsf { T}} (t) \ mathbf {f} _ {\ mathbf {u}} (\ mathbf {x} (t), \ mathbf {u} (t), t) & = 0 \\ I _ {\ mathbf { x}} (\ mathbf {x} (t), \ mathbf {u} (t), t) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t) \ mathbf {f} _ {\ mathbf {x}} (\ mathbf {x} (t), \ mathbf {u} (t), t) + {\ dot {\ mathbf {\ lambda} (t)}} & = 0 \ end {alineado} }}

Si tanto el valor inicial ${\ Displaystyle \ mathbf {x} (t_ {0})}$ y valor terminal ${\ Displaystyle \ mathbf {x} (t_ {1})}$ son fijos, es decir ${\ Displaystyle \ mathrm {d} \ mathbf {x} (t_ {0}) = \ mathrm {d} \ mathbf {x} (t_ {1}) = 0}$ , sin condiciones en ${\ Displaystyle \ mathbf {\ lambda} (t_ {0})}$ y ${\ Displaystyle \ mathbf {\ lambda} (t_ {1})}$ Se necesitan. Si el valor terminal es libre, como suele ser el caso, la condición adicional ${\ Displaystyle \ mathbf {\ lambda} (t_ {1}) = 0}$ es necesario para la optimización. Esta última se denomina condición de transversalidad para un problema de horizonte fijo. ^[8]

Se puede ver que las condiciones necesarias son idénticas a las indicadas anteriormente para el hamiltoniano. Así, el hamiltoniano puede entenderse como un dispositivo para generar las condiciones necesarias de primer orden. ^[9]

El hamiltoniano en tiempo discreto

Cuando el problema se formula en tiempo discreto, el hamiltoniano se define como:

{\ Displaystyle H (x_ {t}, u_ {t}, \ lambda _ {t}, t) = \ lambda _ {t + 1} ^ {T} f (x_ {t}, u_ {t}, t ) + I (x_ {t}, u_ {t}, t) \,}

y las ecuaciones de las costas son

{\ Displaystyle \ lambda _ {t + 1} ^ {\ top} = - {\ frac {\ parcial H} {\ parcial x_ {t}}} + \ lambda _ {t} ^ {\ top}}

(Tenga en cuenta que el Hamiltoniano de tiempo discreto en el momento ${\ Displaystyle t}$ involucra la variable costate en el momento ${\ Displaystyle t + 1.}$ ^[10] Este pequeño detalle es fundamental para que cuando diferenciamos con respecto a ${\ Displaystyle x}$ obtenemos un término que involucra ${\ Displaystyle \ lambda (t + 1)}$ en el lado derecho de las ecuaciones de la costate. El uso de una convención incorrecta aquí puede conducir a resultados incorrectos, es decir, una ecuación de costada que no es una ecuación en diferencias al revés).

Comportamiento del hamiltoniano a lo largo del tiempo

Del principio máximo de Pontryagin, se pueden derivar condiciones especiales para el hamiltoniano. ^[11] Cuando la última vez ${\ Displaystyle t_ {1}}$ es fijo y el hamiltoniano no depende explícitamente del tiempo ${\ estilo de visualización \ izquierda ({\ tfrac {\ parcial H} {\ parcial t}} = 0 \ derecha)}$ , luego:

{\ Displaystyle H (x ^ {*} (t), u ^ {*} (t), \ lambda ^ {*} (t)) = \ mathrm {constante} \,}

o si el tiempo terminal es libre, entonces:

{\ Displaystyle H (x ^ {*} (t), u ^ {*} (t), \ lambda ^ {*} (t)) = 0. \,}

Además, si el tiempo terminal tiende al infinito , se aplica una condición de transversalidad en el hamiltoniano. ^[12]

{\ Displaystyle \ lim _ {t \ to \ infty} H (t) = 0}

El hamiltoniano del control comparado con el hamiltoniano de la mecánica

William Rowan Hamilton definió al hamiltoniano para describir la mecánica de un sistema. Es una función de tres variables:

{\ Displaystyle {\ mathcal {H}} = {\ mathcal {H}} (p, q, t) = \ langle p, {\ dot {q}} \ rangle -L (q, {\ dot {q} }, t)}

dónde ${\ Displaystyle L}$ es el Lagrangiano , cuyo extremo determina la dinámica ( no el Lagrangiano definido anteriormente), ${\ Displaystyle q}$ es la variable de estado y ${\ Displaystyle {\ dot {q}}}$ es su derivada del tiempo.

${\ Displaystyle p}$ es el llamado " momento conjugado ", definido por

{\ Displaystyle p = {\ frac {\ parcial L} {\ parcial {\ dot {q}}}}}

Hamilton luego formuló sus ecuaciones para describir la dinámica del sistema como

{\ Displaystyle {\ frac {d} {dt}} p (t) = - {\ frac {\ parcial} {\ parcial q}} {\ mathcal {H}}}

{\ Displaystyle {\ frac {d} {dt}} q (t) = ~~ {\ frac {\ parcial} {\ parcial p}} {\ mathcal {H}}}

El hamiltoniano de la teoría del control describe no la dinámica de un sistema, sino las condiciones para extremizar alguna función escalar del mismo (la lagrangiana) con respecto a una variable de control. ${\ Displaystyle u}$ . Como se define normalmente, es una función de 4 variables

{\ Displaystyle H (q, u, p, t) = \ langle p, {\ dot {q}} \ rangle -L (q, u, t)}

dónde ${\ Displaystyle q}$ es la variable de estado y ${\ Displaystyle u}$ es la variable de control con respecto a lo que estamos extremando.

Las condiciones asociadas para un máximo son

{\ Displaystyle {\ frac {dp} {dt}} = - {\ frac {\ parcial H} {\ parcial q}}}

{\ Displaystyle {\ frac {dq} {dt}} = ~~ {\ frac {\ parcial H} {\ parcial p}}}

{\ Displaystyle {\ frac {\ parcial H} {\ parcial u}} = 0}

Esta definición concuerda con la dada por el artículo de Sussmann y Willems. ^[13] (ver p. 39, ecuación 14). Sussmann y Willems muestran cómo el control hamiltoniano se puede utilizar en dinámica, por ejemplo, para el problema de la braquistocrona , pero no mencionan el trabajo anterior de Carathéodory sobre este enfoque. ^[14]

Valor actual y valor actual Hamiltoniano

En economía , la función objetivo en los problemas de optimización dinámica a menudo depende directamente del tiempo solo a través del descuento exponencial , de modo que toma la forma

{\ Displaystyle I (\ mathbf {x} (t), \ mathbf {u} (t), t) = e ^ {- \ rho t} \ nu (\ mathbf {x} (t), \ mathbf {u } (t))}

dónde ${\ Displaystyle \ nu (\ mathbf {x} (t), \ mathbf {u} (t))}$ se conoce como función de utilidad instantánea o función de felicidad . ^[15] Esto permite una redefinición del hamiltoniano como ${\ Displaystyle H (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t), t) = e ^ {- \ rho t} {\ bar {H} } (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t))}$ dónde

{\ Displaystyle {\ begin {alineado} {\ bar {H}} (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t)) \ equiv & \, e ^ {\ rho t} \ left [I (\ mathbf {x} (t), \ mathbf {u} (t), t) + \ mathbf {\ lambda} ^ {\ mathsf {T}} (t) \ mathbf {f} (\ mathbf {x} (t), \ mathbf {u} (t), t) \ right] \\ = & \, \ nu (\ mathbf {x} (t), \ mathbf { u} (t), t) + \ mathbf {\ mu} ^ {\ mathsf {T}} (t) \ mathbf {f} (\ mathbf {x} (t), \ mathbf {u} (t), t) \ end {alineado}}}

que se conoce como el valor actual hamiltoniano, en contraste con el valor actual hamiltoniano ${\ Displaystyle H (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t), t)}$ definido en la primera sección. Más notablemente, las variables de costa se redefinen como ${\ Displaystyle \ mathbf {\ mu} (t) = e ^ {\ rho t} \ mathbf {\ lambda} (t)}$ , lo que conduce a condiciones de primer orden modificadas.

{\ Displaystyle {\ frac {\ parcial {\ bar {H}} (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t))} {\ parcial \ mathbf {u}}} = 0}

,

{\ Displaystyle {\ frac {\ parcial {\ bar {H}} (\ mathbf {x} (t), \ mathbf {u} (t), \ mathbf {\ lambda} (t))} {\ parcial \ mathbf {x}}} = - {\ dot {\ mathbf {\ mu}}} (t) + \ rho \ mathbf {\ mu} (t)}

que se deriva inmediatamente de la regla del producto . Económicamente, ${\ Displaystyle \ mathbf {\ mu} (t)}$ representar los precios sombra a valor corriente de los bienes de capital ${\ Displaystyle \ mathbf {x} (t)}$ .

Ejemplo: modelo de Ramsey – Cass – Koopmans

En economía , el modelo de Ramsey-Cass-Koopmans se utiliza para determinar un comportamiento de ahorro óptimo para una economía. La función objetivo ${\ Displaystyle J (c)}$ es la función de bienestar social ,

{\ Displaystyle J (c) = \ int _ {0} ^ {T} e ^ {- \ rho t} u (c (t)) dt}

para maximizar mediante la elección de una ruta de consumo óptima ${\ Displaystyle c (t)}$ . La función ${\ Displaystyle u (c (t))}$ indica la utilidad del agente representativo del consumidor ${\ Displaystyle c}$ en cualquier momento dado. El factor ${\ Displaystyle e ^ {- \ rho t}}$ representa descuento . El problema de maximización está sujeto a la siguiente ecuación diferencial de intensidad de capital , que describe la evolución temporal del capital por trabajador efectivo:

{\ Displaystyle {\ dot {k}} = {\ frac {\ parcial k} {\ parcial t}} = f (k (t)) - (n + \ delta) k (t) -c (t)}

dónde ${\ Displaystyle c (t)}$ es el período t consumo, ${\ Displaystyle k (t)}$ es el período t capital por trabajador (con ${\ Displaystyle k (0) = k_ {0}> 0}$ ), ${\ Displaystyle f (k (t))}$ es el período t de producción, ${\ Displaystyle n}$ es la tasa de crecimiento de la población, ${\ Displaystyle \ delta}$ es la tasa de depreciación del capital, el agente descuenta la utilidad futura a la tasa ${\ Displaystyle \ rho}$ , con ${\ Displaystyle u '> 0}$ y ${\ Displaystyle u '' <0}$ .

Aquí, ${\ Displaystyle k (t)}$ es la variable de estado que evoluciona de acuerdo con la ecuación anterior, y ${\ Displaystyle c (t)}$ es la variable de control. El hamiltoniano se convierte en

{\ Displaystyle H (k, c, \ mu, t) = e ^ {- \ rho t} u (c (t)) + \ mu (t) {\ dot {k}} = e ^ {- \ rho t} u (c (t)) + \ mu (t) [f (k (t)) - (n + \ delta) k (t) -c (t)]}

Las condiciones de optimalidad son

{\ Displaystyle {\ frac {\ parcial H} {\ parcial c}} = 0 \ Flecha derecha e ^ {- \ rho t} u '(c) = \ mu (t)}

{\ Displaystyle {\ frac {\ parcial H} {\ parcial k}} = - {\ frac {\ parcial \ mu} {\ parcial t}} = - {\ dot {\ mu}} \ Rightarrow \ mu (t ) [f '(k) - (n + \ delta)] = - {\ dot {\ mu}}}

además de la condición de transversalidad ${\ Displaystyle \ mu (T) k (T) = 0}$ . Si dejamos ${\ Displaystyle u (c) = \ log (c)}$ , luego diferenciando logarítmicamente la primera condición de optimalidad con respecto a ${\ Displaystyle t}$ rendimientos

{\ Displaystyle - \ rho - {\ frac {\ dot {c}} {c (t)}} = {\ frac {\ dot {\ mu}} {\ mu (t)}}}

Al insertar esta ecuación en la segunda condición de optimalidad se obtiene

{\ Displaystyle \ rho + {\ frac {\ dot {c}} {c (t)}} = f '(k) - (n + \ delta)}

que se conoce como la regla de Keynes-Ramsey , que da una condición para el consumo en cada período que, si se sigue, asegura la máxima utilidad de por vida.

Referencias

^ Ferguson, Brian S .; Lim, GC (1998). Introducción a los problemas económicos dinámicos . Manchester: Manchester University Press. págs. 166-167. ISBN 0-7190-4996-2.
^ a b Ross, MI (2009). Una introducción al principio de Pontryagin en control óptimo . Editores colegiados. ISBN 978-0-9843571-0-9. OCLC 625106088 .
^ Dixit, Avinash K. (1990). Optimización en Teoría Económica . Nueva York: Oxford University Press. págs. 145-161. ISBN 978-0-19-877210-1.
^ Kirk, Donald E. (1970). Teoría del control óptimo: una introducción . Acantilados de Englewood: Prentice Hall. pag. 232. ISBN 0-13-638098-0.
^ Gandolfo, Giancarlo (1996). Dinámica económica (Tercera ed.). Berlín: Springer. págs. 375–376. ISBN 3-540-60988-1.
^ Seierstad, Atle; Sydsæter, Knut (1987). Teoría de control óptimo con aplicaciones económicas . Amsterdam: Holanda Septentrional. págs. 107-110. ISBN 0-444-87923-4.
^ Mangasarian, OL (1966). "Condiciones suficientes para el control óptimo de sistemas no lineales". Revista SIAM de Control . 4 (1): 139-152. doi : 10.1137 / 0304013 .
^ Léonard, Daniel; Long, Ngo Van (1992). "Restricciones de punto final y condiciones de transversalidad" . Teoría de control óptimo y optimización estática en economía . Nueva York: Cambridge University Press. pag. 222 [Teorema 7.1.1]. ISBN 0-521-33158-7.
^ Kamien, Morton I .; Schwartz, Nancy L. (1991). Optimización dinámica: el cálculo de variaciones y el control óptimo en economía y gestión (Segunda ed.). Amsterdam: Holanda Septentrional. págs. 126-127. ISBN 0-444-01609-0.
^ Varaiya, P. (1998). "Lecture Notes on Optimization" (PDF) (2ª ed.). págs. 75–82. Archivado desde el original (PDF) el 10 de abril de 2003.
^ Naidu, Desineni S. (2003). Sistemas de control óptimos . Boca Ratón: CRC Press. págs. 259-260. ISBN 0-8493-0892-5.
^ Michel, Philippe (1982). "Sobre la condición de transversalidad en problemas óptimos de horizonte infinito" . Econometrica . 50 (4): 975–985. doi : 10.2307 / 1912772 . JSTOR 1912772 .
^ Sussmann; Willems (junio de 1997). "300 años de control óptimo" (PDF) . Revista IEEE Control Systems . Archivado desde el original (PDF) el 30 de julio de 2010.
^ Ver Pesch, HJ; Bulirsch, R. (1994). "El principio máximo, la ecuación de Bellman y la obra de Carathéodory". Revista de teoría y aplicaciones de la optimización . 80 (2): 199–225. doi : 10.1007 / BF02192933 .
^ Bævre, Kåre (primavera de 2005). "Econ 4350: Crecimiento e inversión: Nota de conferencia 7" (PDF) . Departamento de Economía, Universidad de Oslo.

Otras lecturas

Léonard, Daniel; Long, Ngo Van (1992). "El Principio Máximo" . Teoría de control óptimo y optimización estática en economía . Nueva York: Cambridge University Press. págs. 127-168. ISBN 0-521-33158-7.
Stengel, Robert F. (1994). "El Principio Mínimo". Optimal Control and Estimation , Nueva York: Publicaciones de Dover. págs. 216-218. ISBN 978-048668200-6
Takayama, Akira (1985). "Desarrollos de la teoría del control óptimo y sus aplicaciones" . Economía Matemática (2ª ed.). Nueva York: Cambridge University Press. págs. 600–719. ISBN 0-521-31498-4.
Wulwick, Nancy (1995). "El formalismo hamiltoniano y la teoría del crecimiento óptimo". En Rima, IH (ed.). Medición, cuantificación y análisis económico . Londres: Routledge. ISBN 978-0-415-08915-9.

[1] Ferguson, Brian S .; Lim, GC (1998). Introducción a los problemas económicos dinámicos . Manchester: Manchester University Press. págs. 166-167. ISBN 0-7190-4996-2.

[:0-2] Ross, MI (2009). Una introducción al principio de Pontryagin en control óptimo . Editores colegiados. ISBN 978-0-9843571-0-9. OCLC 625106088 .

[3] Dixit, Avinash K. (1990). Optimización en Teoría Económica . Nueva York: Oxford University Press. págs. 145-161. ISBN 978-0-19-877210-1.

[4] Kirk, Donald E. (1970). Teoría del control óptimo: una introducción . Acantilados de Englewood: Prentice Hall. pag. 232. ISBN 0-13-638098-0.

[5] Gandolfo, Giancarlo (1996). Dinámica económica (Tercera ed.). Berlín: Springer. págs. 375–376. ISBN 3-540-60988-1.

[6] Seierstad, Atle; Sydsæter, Knut (1987). Teoría de control óptimo con aplicaciones económicas . Amsterdam: Holanda Septentrional. págs. 107-110. ISBN 0-444-87923-4.

[7] Mangasarian, OL (1966). "Condiciones suficientes para el control óptimo de sistemas no lineales". Revista SIAM de Control . 4 (1): 139-152. doi : 10.1137 / 0304013 .

[8] Léonard, Daniel; Long, Ngo Van (1992). "Restricciones de punto final y condiciones de transversalidad" . Teoría de control óptimo y optimización estática en economía . Nueva York: Cambridge University Press. pag. 222 [Teorema 7.1.1]. ISBN 0-521-33158-7.

[9] Kamien, Morton I .; Schwartz, Nancy L. (1991). Optimización dinámica: el cálculo de variaciones y el control óptimo en economía y gestión (Segunda ed.). Amsterdam: Holanda Septentrional. págs. 126-127. ISBN 0-444-01609-0.

[10] Varaiya, P. (1998). "Lecture Notes on Optimization" (PDF) (2ª ed.). págs. 75–82. Archivado desde el original (PDF) el 10 de abril de 2003.

[11] Naidu, Desineni S. (2003). Sistemas de control óptimos . Boca Ratón: CRC Press. págs. 259-260. ISBN 0-8493-0892-5.

[12] Michel, Philippe (1982). "Sobre la condición de transversalidad en problemas óptimos de horizonte infinito" . Econometrica . 50 (4): 975–985. doi : 10.2307 / 1912772 . JSTOR 1912772 .

[13] Sussmann; Willems (junio de 1997). "300 años de control óptimo" (PDF) . Revista IEEE Control Systems . Archivado desde el original (PDF) el 30 de julio de 2010.

[14] Ver Pesch, HJ; Bulirsch, R. (1994). "El principio máximo, la ecuación de Bellman y la obra de Carathéodory". Revista de teoría y aplicaciones de la optimización . 80 (2): 199–225. doi : 10.1007 / BF02192933 .

[15] Bævre, Kåre (primavera de 2005). "Econ 4350: Crecimiento e inversión: Nota de conferencia 7" (PDF) . Departamento de Economía, Universidad de Oslo.

[1]