Condiciones de Karush – Kuhn – Tucker

En optimización matemática , las condiciones de Karush-Kuhn-Tucker (KKT) , también conocidas como condiciones de Kuhn-Tucker , son pruebas de primera derivada (a veces llamadas condiciones necesarias de primer orden ) para que una solución en programación no lineal sea óptima , siempre que algunos se cumplen las condiciones de regularidad .

Al permitir restricciones de desigualdad, el enfoque KKT para la programación no lineal generaliza el método de los multiplicadores de Lagrange , que solo permite restricciones de igualdad. Similar al enfoque de Lagrange, el problema de maximización restringida (minimización) se reescribe como una función de Lagrange cuyo punto óptimo es un punto silla , es decir, un máximo global (mínimo) sobre el dominio de las variables de elección y un mínimo global (máximo) sobre el multiplicadores, razón por la cual el teorema de Karush-Kuhn-Tucker a veces se denomina teorema del punto de silla de montar. ^[1]

Las condiciones del KKT fueron originalmente nombradas en honor a Harold W. Kuhn y Albert W. Tucker , quienes publicaron por primera vez las condiciones en 1951. ^{[2] Los} estudiosos posteriores descubrieron que las condiciones necesarias para este problema habían sido establecidas por William Karush en su tesis de maestría en 1939. . ^[3]^[4]

Problema de optimización no lineal

Considere el siguiente problema de minimización o maximización no lineal :

minimizar

{\ Displaystyle f (\ mathbf {x})}

sujeto a

{\ Displaystyle g_ {i} (\ mathbf {x}) \ leq 0,}

{\ Displaystyle h_ {j} (\ mathbf {x}) = 0.}

dónde ${\ Displaystyle \ mathbf {x} \ in \ mathbf {X}}$ es la variable de optimización elegida de un subconjunto convexo de ${\ Displaystyle \ mathbb {R} ^ {n}}$ , ${\ Displaystyle f}$ es la función objetivo o de utilidad , ${\ Displaystyle g_ {i} \ (i = 1, \ ldots, m)}$ son las funciones de restricción de desigualdad y ${\ Displaystyle h_ {j} \ (j = 1, \ ldots, \ ell)}$ son las funciones de restricción de igualdad . Los números de desigualdades e igualdades se denotan por ${\ Displaystyle m}$ y ${\ Displaystyle \ ell}$ respectivamente. En correspondencia con el problema de optimización restringida, se puede formar la función lagrangiana

{\ Displaystyle L (\ mathbf {x}, \ mathbf {\ mu}, \ mathbf {\ lambda}) = f (\ mathbf {x}) + \ mathbf {\ mu} ^ {\ top} \ mathbf {g } (\ mathbf {x}) + \ mathbf {\ lambda} ^ {\ top} \ mathbf {h} (\ mathbf {x})}

dónde ${\ Displaystyle \ mathbf {g} (\ mathbf {x}) = \ left (g_ {1} (\ mathbf {x}), \ ldots, g_ {m} (\ mathbf {x}) \ right) ^ { \cima }}$ , ${\ Displaystyle \ mathbf {h} (\ mathbf {x}) = \ left (h_ {1} (\ mathbf {x}), \ ldots, h _ {\ ell} (\ mathbf {x}) \ right) ^ {\cima }}$ . El teorema de Karush-Kuhn-Tucker establece lo siguiente.

Teorema. Si ${\ Displaystyle (\ mathbf {x} ^ {\ ast}, \ mathbf {\ mu} ^ {\ ast})}$ es un punto de silla de ${\ Displaystyle L (\ mathbf {x}, \ mathbf {\ mu})}$ en ${\ Displaystyle \ mathbf {x} \ in \ mathbf {X}}$ , ${\ Displaystyle \ mathbf {\ mu} \ geq \ mathbf {0}}$ , luego ${\ Displaystyle \ mathbf {x} ^ {\ ast}}$ es un vector óptimo para el problema de optimización anterior. Suponer que ${\ Displaystyle f (\ mathbf {x})}$ y ${\ Displaystyle g_ {i} (\ mathbf {x})}$ , ${\ Displaystyle i = 1, \ ldots, m}$ , son convexas en ${\ Displaystyle \ mathbf {x}}$ y que existe ${\ Displaystyle \ mathbf {x} _ {0} \ in \ mathbf {X}}$ tal que ${\ Displaystyle \ mathbf {g} (\ mathbf {x} _ {0}) <0}$ . Luego, con un vector óptimo ${\ Displaystyle \ mathbf {x} ^ {\ ast}}$ para el problema de optimización anterior hay asociado un vector no negativo ${\ Displaystyle \ mathbf {\ mu} ^ {\ ast}}$ tal que ${\ Displaystyle L (\ mathbf {x} ^ {\ ast}, \ mathbf {\ mu} ^ {\ ast})}$ es un punto de silla de ${\ Displaystyle L (\ mathbf {x}, \ mathbf {\ mu})}$ . ^[5]

Dado que la idea de este enfoque es encontrar un hiperplano de apoyo en el conjunto factible ${\ Displaystyle \ mathbf {\ Gamma} = \ left \ {\ mathbf {x} \ in \ mathbf {X}: g_ {i} (\ mathbf {x}) \ leq 0, i = 1, \ ldots, m \derecho\}}$ , la demostración del teorema de Karush-Kuhn-Tucker hace uso del teorema de separación de hiperplano . ^[6]

El sistema de ecuaciones y desigualdades correspondientes a las condiciones KKT generalmente no se resuelve directamente, excepto en los pocos casos especiales en los que se puede derivar analíticamente una solución de forma cerrada . En general, muchos algoritmos de optimización se pueden interpretar como métodos para resolver numéricamente el sistema de ecuaciones y desigualdades KKT. ^[7]

Condiciones necesarias

Supongamos que la función objetivo ${\ Displaystyle f: \ mathbb {R} ^ {n} \ rightarrow \ mathbb {R}}$ y las funciones de restricción ${\ Displaystyle g_ {i}: \, \! \ mathbb {R} ^ {n} \ rightarrow \ mathbb {R}}$ y ${\ Displaystyle h_ {j}: \, \! \ mathbb {R} ^ {n} \ rightarrow \ mathbb {R}}$ son continuamente diferenciables en un punto ${\ Displaystyle x ^ {*} \ in \ mathbb {R} ^ {n}}$ . Si ${\ Displaystyle x ^ {*}}$ es un óptimo local y el problema de optimización satisface algunas condiciones de regularidad (ver más abajo), entonces existen constantes ${\ Displaystyle \ mu _ {i} \ (i = 1, \ ldots, m)}$ y ${\ Displaystyle \ lambda _ {j} \ (j = 1, \ ldots, \ ell)}$ , llamados multiplicadores KKT, de modo que se cumplen los siguientes cuatro grupos de condiciones:

Diagrama de restricción de desigualdad para problemas de optimización

Estacionariedad: Para minimizar ${\ Displaystyle f (x)}$ : ${\ Displaystyle \ nabla f (x ^ {*}) + \ sum _ {i = 1} ^ {m} \ mu _ {i} \ nabla g_ {i} (x ^ {*}) + \ sum _ { j = 1} ^ {\ ell} \ lambda _ {j} \ nabla h_ {j} (x ^ {*}) = \ mathbf {0}}$; Para maximizar ${\ Displaystyle f (x)}$ : ${\ Displaystyle - \ nabla f (x ^ {*}) + \ sum _ {i = 1} ^ {m} \ mu _ {i} \ nabla g_ {i} (x ^ {*}) + \ sum _ {j = 1} ^ {\ ell} \ lambda _ {j} \ nabla h_ {j} (x ^ {*}) = \ mathbf {0}}$

Viabilidad primordial: ${\ Displaystyle g_ {i} (x ^ {*}) \ leq 0, {\ text {para}} i = 1, \ ldots, m}$; ${\ Displaystyle h_ {j} (x ^ {*}) = 0, {\ text {para}} j = 1, \ ldots, \ ell \, \!}$

Viabilidad dual: ${\ Displaystyle \ mu _ {i} \ geq 0, {\ text {for}} i = 1, \ ldots, m}$

Holgura complementaria: ${\ Displaystyle \ sum _ {i = 1} ^ {m} \ mu _ {i} g_ {i} (x ^ {*}) = 0.}$

La última condición a veces se escribe en forma equivalente: ${\ Displaystyle \ mu _ {i} g_ {i} (x ^ {*}) = 0, {\ text {for}} i = 1, \ ldots, m.}$

En el caso particular ${\ Displaystyle m = 0}$ , es decir, cuando no hay restricciones de desigualdad, las condiciones de KKT se convierten en las condiciones de Lagrange, y los multiplicadores de KKT se denominan multiplicadores de Lagrange .

Si algunas de las funciones no son diferenciables, hay disponibles versiones subdiferenciales de las condiciones de Karush-Kuhn-Tucker (KKT). ^[8]

Representación matricial

Las condiciones necesarias se pueden escribir con matrices jacobianas de las funciones de restricción. Dejar ${\ Displaystyle \ mathbf {g} (x): \, \! \ mathbb {R} ^ {n} \ rightarrow \ mathbb {R} ^ {m}}$ ser definido como ${\ Displaystyle \ mathbf {g} (x) = \ left (g_ {1} (x), \ ldots, g_ {m} (x) \ right) ^ {\ top}}$ y deja ${\ Displaystyle \ mathbf {h} (x): \, \! \ mathbb {R} ^ {n} \ rightarrow \ mathbb {R} ^ {\ ell}}$ ser definido como ${\ Displaystyle \ mathbf {h} (x) = \ left (h_ {1} (x), \ ldots, h _ {\ ell} (x) \ right) ^ {\ top}}$ . Dejar ${\ displaystyle {\ boldsymbol {\ mu}} = \ left (\ mu _ {1}, \ ldots, \ mu _ {m} \ right) ^ {\ top}}$ y ${\ displaystyle {\ boldsymbol {\ lambda}} = \ left (\ lambda _ {1}, \ ldots, \ lambda _ {\ ell} \ right) ^ {\ top}}$ . Entonces las condiciones necesarias se pueden escribir como:

Estacionariedad: Para maximizar ${\ Displaystyle f (x)}$ : ${\ Displaystyle \ nabla f (x ^ {*}) - D \ mathbf {g} (x ^ {*}) ^ {\ top} {\ boldsymbol {\ mu}} - D \ mathbf {h} (x ^ {*}) ^ {\ top} {\ boldsymbol {\ lambda}} = \ mathbf {0}}$; Para minimizar ${\ Displaystyle f (x)}$ : ${\ Displaystyle \ nabla f (x ^ {*}) + D \ mathbf {g} (x ^ {*}) ^ {\ top} {\ boldsymbol {\ mu}} + D \ mathbf {h} (x ^ {*}) ^ {\ top} {\ boldsymbol {\ lambda}} = \ mathbf {0}}$

Viabilidad primordial: ${\ Displaystyle \ mathbf {g} (x ^ {*}) \ leq \ mathbf {0}}$; ${\ Displaystyle \ mathbf {h} (x ^ {*}) = \ mathbf {0}}$

Viabilidad dual: ${\ displaystyle {\ boldsymbol {\ mu}} \ geq \ mathbf {0}}$

Holgura complementaria: ${\ displaystyle {\ boldsymbol {\ mu}} ^ {\ top} \ mathbf {g} (x ^ {*}) = 0.}$

Condiciones de regularidad (o calificaciones de restricción)

Uno puede preguntarse si un punto minimizador ${\ Displaystyle x ^ {*}}$ del problema de optimización restringido original (suponiendo que exista uno) tiene que satisfacer las condiciones de KKT anteriores. Esto es similar a preguntar bajo qué condiciones el minimizador ${\ Displaystyle x ^ {*}}$ de una función ${\ Displaystyle f (x)}$ en un problema sin restricciones tiene que satisfacer la condición ${\ Displaystyle \ nabla f (x ^ {*}) = 0}$ . Para el caso restringido, la situación es más complicada, y se pueden establecer una variedad de condiciones de "regularidad" (cada vez más complicadas) bajo las cuales un minimizador restringido también satisface las condiciones KKT. Algunos ejemplos comunes de condiciones que garantizan esto se tabulan a continuación, siendo el LICQ el más utilizado:

Restricción	Acrónimo	Declaración
Calificación de restricción de linealidad	LCQ	Si ${\ Displaystyle g_ {i}}$ y ${\ Displaystyle h_ {j}}$ son funciones afines , entonces no se necesita ninguna otra condición.
Calificación de restricción de independencia lineal	LICQ	Los gradientes de las restricciones de desigualdad activas y los gradientes de las restricciones de igualdad son linealmente independientes en ${\ Displaystyle x ^ {*}}$ .
Calificación de restricción de Mangasarian-Fromovitz	MFCQ	Los gradientes de las restricciones de igualdad son linealmente independientes en ${\ Displaystyle x ^ {}}$ y existe un vector ${\ Displaystyle d \ in \ mathbb {R} ^ {n}}$ tal que ${\ Displaystyle \ nabla g_ {i} (x ^ {}) ^ {\ top} d <0}$ para todas las restricciones de desigualdad activas y ${\ Displaystyle \ nabla h_ {j} (x ^ {*}) ^ {\ top} d = 0}$ para todas las restricciones de igualdad. ^[9]
Calificación de restricción de rango constante	CRCQ	Para cada subconjunto de los gradientes de las restricciones de desigualdad activas y los gradientes de las restricciones de igualdad, el rango en una vecindad de ${\ Displaystyle x ^ {*}}$ es constante.
Calificación de restricción de dependencia lineal positiva constante	CPLD	Para cada subconjunto de gradientes de restricciones de desigualdad activas y gradientes de restricciones de igualdad, si el subconjunto de vectores es linealmente dependiente en ${\ Displaystyle x ^ {}}$ con escalares no negativos asociados con las restricciones de desigualdad, entonces permanece linealmente dependiente en un vecindario de ${\ Displaystyle x ^ {}}$ .
Calificación de restricción de cuasi normalidad	QNCQ	Si los gradientes de las restricciones de desigualdad activas y los gradientes de las restricciones de igualdad son linealmente dependientes en ${\ Displaystyle x ^ {}}$ con multiplicadores asociados ${\ Displaystyle \ lambda _ {j}}$ por igualdad y ${\ Displaystyle \ mu _ {i} \ geq 0}$ para las desigualdades, entonces no hay secuencia ${\ Displaystyle x_ {k} \ to x ^ {}}$ tal que ${\ Displaystyle \ lambda _ {j} \ neq 0 \ Rightarrow \ lambda _ {j} h_ {j} (x_ {k})> 0}$ y ${\ Displaystyle \ mu _ {i} \ neq 0 \ Rightarrow \ mu _ {i} g_ {i} (x_ {k})> 0.}$
Condición de Slater	CAROLINA DEL SUR	Para un problema convexo (es decir, asumiendo minimización, ${\ Displaystyle f, g_ {i}}$ son convexos y ${\ Displaystyle h_ {j}}$ es afín), existe un punto ${\ Displaystyle x}$ tal que ${\ Displaystyle h (x) = 0}$ y ${\ Displaystyle g_ {i} (x) <0.}$

Se pueden mostrar las implicaciones estrictas

LICQ ⇒ MFCQ ⇒ CPLD ⇒ QNCQ

y

LICQ ⇒ CRCQ ⇒ CPLD ⇒ QNCQ

En la práctica, se prefieren las calificaciones de restricción más débiles, ya que se aplican a una selección más amplia de problemas.

Condiciones suficientes

En algunos casos, las condiciones necesarias también son suficientes para la optimización. En general, las condiciones necesarias no son suficientes para la optimización y se requiere información adicional, como las Condiciones Suficientes de Segundo Orden (SOSC). Para funciones suaves, SOSC involucra las segundas derivadas, lo que explica su nombre.

Las condiciones necesarias son suficientes para la optimización si la función objetivo ${\ Displaystyle f}$ de un problema de maximización es una función cóncava , las restricciones de desigualdad ${\ Displaystyle g_ {j}}$ son funciones convexas continuamente diferenciables y las restricciones de igualdad ${\ Displaystyle h_ {i}}$ son funciones afines . Del mismo modo, si la función objetivo ${\ Displaystyle f}$ de un problema de minimización es una función convexa , las condiciones necesarias también son suficientes para la optimización.

Martin demostró en 1985 que la clase más amplia de funciones en las que las condiciones KKT garantizan la optimización global son las llamadas funciones invex de Tipo 1 . ^[10]^[11]

Condiciones suficientes de segundo orden

Para problemas de optimización suaves y no lineales , se da una condición suficiente de segundo orden como sigue.

La solución ${\ Displaystyle x ^ {*}, \ lambda ^ {*}, \ mu ^ {*}}$ que se encuentra en la sección anterior es un mínimo local restringido si para el Lagrangiano,

{\ Displaystyle L (x, \ lambda, \ mu) = f (x) + \ sum _ {i = 1} ^ {m} \ mu _ {i} g_ {i} (x) + \ sum _ {j = 1} ^ {\ ell} \ lambda _ {j} h_ {j} (x)}

luego,

{\ Displaystyle s ^ {T} \ nabla _ {xx} ^ {2} L (x ^ {*}, \ lambda ^ {*}, \ mu ^ {*}) s \ geq 0}

dónde ${\ Displaystyle s \ neq 0}$ es un vector que satisface lo siguiente,

{\ Displaystyle \ left [\ nabla _ {x} g_ {i} (x ^ {*}), \ nabla _ {x} h_ {j} (x ^ {*}) \ right] ^ {T} s = 0}

donde solo esas restricciones de desigualdad activas ${\ Displaystyle g_ {i} (x)}$ correspondiente a la complementariedad estricta (es decir, donde ${\ Displaystyle \ mu _ {i}> 0}$ ) se aplican. La solución es un mínimo local estrictamente restringido en el caso de que la desigualdad también sea estricta.

Si ${\ Displaystyle s ^ {T} \ nabla _ {xx} ^ {2} L (x ^ {*}, \ lambda ^ {*}, \ mu ^ {*}) s = 0}$ , la expansión de Taylor de tercer orden del Lagrangiano debe usarse para verificar si ${\ Displaystyle x ^ {*}}$ es un mínimo local. La minimización de ${\ Displaystyle f (x_ {1}, x_ {2}) = (x_ {2} -x_ {1} ^ {2}) (x_ {2} -3x_ {1} ^ {2})}$ es un buen contraejemplo, véase también la superficie de Peano .

Ciencias económicas

A menudo, en economía matemática, el enfoque KKT se utiliza en modelos teóricos para obtener resultados cualitativos. Por ejemplo, ^[12] considere una empresa que maximiza sus ingresos por ventas sujeta a una restricción de beneficio mínimo. Dejando ${\ displaystyle Q}$ ser la cantidad de producción producida (a elegir), ${\ Displaystyle R (Q)}$ ser ingresos por ventas con una primera derivada positiva y con un valor cero con una producción cero, ${\ Displaystyle C (Q)}$ Ser costos de producción con una primera derivada positiva y con un valor no negativo a producción cero, y ${\ Displaystyle G _ {\ min}}$ sea el nivel de beneficio mínimo aceptable positivo , entonces el problema es significativo si la función de ingresos se estabiliza, por lo que eventualmente es menos empinada que la función de costos. El problema expresado en la forma de minimización dada anteriormente es

Minimizar

{\ Displaystyle -R (Q)}

sujeto a

{\ Displaystyle G _ {\ min} \ leq R (Q) -C (Q)}

{\ Displaystyle Q \ geq 0,}

y las condiciones KKT son

{\ Displaystyle {\ begin {alineado} & \ left ({\ frac {{\ text {d}} R} {{\ text {d}} Q}} \ right) (1+ \ mu) - \ mu \ izquierda ({\ frac {{\ text {d}} C} {{\ text {d}} Q}} \ right) \ leq 0, \\ [5pt] & Q \ geq 0, \\ [5pt] & Q \ izquierda [\ left ({\ frac {{\ text {d}} R} {{\ text {d}} Q}} \ right) (1+ \ mu) - \ mu \ left ({\ frac {{\ texto {d}} C} {{\ text {d}} Q}} \ right) \ right] = 0, \\ [5pt] & R (Q) -C (Q) -G _ {\ min} \ geq 0 , \\ [5pt] & \ mu \ geq 0, \\ [5pt] & \ mu [R (Q) -C (Q) -G _ {\ min}] = 0. \ end {alineado}}}

Desde ${\ Displaystyle Q = 0}$ violaría la restricción de beneficio mínimo, tenemos ${\ Displaystyle Q> 0}$ y por tanto, la tercera condición implica que la primera condición se cumple con la igualdad. Resolver que la igualdad da

{\ Displaystyle {\ frac {{\ text {d}} R} {{\ text {d}} Q}} = {\ frac {\ mu} {1+ \ mu}} \ left ({\ frac {{ \ text {d}} C} {{\ text {d}} Q}} \ right).}

Porque se le dio que ${\ displaystyle {\ text {d}} R / {\ text {d}} Q}$ y ${\ Displaystyle {\ text {d}} C / {\ text {d}} Q}$ son estrictamente positivas, esta desigualdad junto con la condición de no negatividad en ${\ Displaystyle \ mu}$ garantiza que ${\ Displaystyle \ mu}$ es positivo y, por lo tanto, la empresa que maximiza los ingresos opera a un nivel de producción en el que los ingresos marginales ${\ displaystyle {\ text {d}} R / {\ text {d}} Q}$ es menor que el costo marginal ${\ Displaystyle {\ text {d}} C / {\ text {d}} Q}$ - un resultado que es de interés porque contrasta con el comportamiento de una empresa maximizadora de beneficios , que opera a un nivel en el que son iguales.

Función de valor

Si reconsideramos el problema de optimización como un problema de maximización con restricciones de desigualdad constantes:

{\ displaystyle {\ text {Maximizar}} \; f (x)}

{\ displaystyle {\ text {sujeto a}} \}

{\ Displaystyle g_ {i} (x) \ leq a_ {i}, h_ {j} (x) = 0.}

La función de valor se define como

{\ Displaystyle V (a_ {1}, \ ldots, a_ {n}) = \ sup \ limits _ {x} f (x)}

{\ displaystyle {\ text {sujeto a}} \}

{\ Displaystyle g_ {i} (x) \ leq a_ {i}, h_ {j} (x) = 0}

{\ Displaystyle j \ in \ {1, \ ldots, \ ell \}, i \ in \ {1, \ ldots, m \},}

entonces el dominio de ${\ Displaystyle V}$ es ${\ Displaystyle \ {a \ in \ mathbb {R} ^ {m} \ mid {\ text {para algunos}} x \ in X, g_ {i} (x) \ leq a_ {i}, i \ in \ {1, \ ldots, m \} \}.}$

Dada esta definición, cada coeficiente ${\ Displaystyle \ mu _ {i}}$ es la tasa a la que aumenta la función de valor a medida que ${\ Displaystyle a_ {i}}$ aumenta. Por tanto, si cada ${\ Displaystyle a_ {i}}$ se interpreta como una restricción de recursos, los coeficientes le dicen cuánto aumentar un recurso aumentará el valor óptimo de nuestra función ${\ Displaystyle f}$ . Esta interpretación es especialmente importante en economía y se utiliza, por ejemplo, en problemas de maximización de la utilidad .

Generalizaciones

Con un multiplicador extra ${\ Displaystyle \ mu _ {0} \ geq 0}$ , que puede ser cero (siempre que ${\ Displaystyle (\ mu _ {0}, \ mu, \ lambda) \ neq 0}$ ), en frente de ${\ Displaystyle \ nabla f (x ^ {*})}$ las condiciones de estacionariedad del KKT se convierten en

{\ Displaystyle {\ begin {alineado} & \ mu _ {0} \, \ nabla f (x ^ {*}) + \ sum _ {i = 1} ^ {m} \ mu _ {i} \, \ nabla g_ {i} (x ^ {*}) + \ sum _ {j = 1} ^ {\ ell} \ lambda _ {j} \, \ nabla h_ {j} (x ^ {*}) = 0, \\ [4pt] & \ mu _ {j} g_ {i} (x ^ {*}) = 0, \ quad i = 1, \ dots, m, \ end {alineado}}}

que se denominan condiciones de Fritz John . Esta condición de optimalidad se mantiene sin calificaciones de restricción y es equivalente a la condición de optimalidad KKT o (no-MFCQ) .

Las condiciones KKT pertenecen a una clase más amplia de condiciones necesarias de primer orden (FONC), que permiten funciones no uniformes que utilizan subderivadas .

Ver también

Lema de Farkas
Multiplicador de Lagrange
El método Big M , para problemas lineales, que extiende el algoritmo simplex a problemas que contienen restricciones "mayor que".
Variable de holgura

Referencias

^ Tabak, Daniel; Kuo, Benjamin C. (1971). Control óptimo por programación matemática . Englewood Cliffs, Nueva Jersey: Prentice-Hall. págs. 19-20. ISBN 0-13-638106-5.
^ Kuhn, HW ; Tucker, AW (1951). "Programación no lineal" . Actas del 2º Simposio de Berkeley . Berkeley: Prensa de la Universidad de California. págs. 481–492. Señor 0047303 .
^ W. Karush (1939). Mínimos de funciones de varias variables con desigualdades como restricciones laterales (tesis de maestría). Departamento de Matemáticas, Univ. de Chicago, Chicago, Illinois.
^ Kjeldsen, Tinne Hoff (2000). "Un análisis histórico contextualizado del teorema de Kuhn-Tucker en programación no lineal: el impacto de la Segunda Guerra Mundial". Historia Math . 27 (4): 331–361. doi : 10.1006 / hmat.2000.2289 . Señor 1800317 .
^ Walsh, GR (1975). "Propiedad del punto de silla de montar de la función lagrangiana" . Métodos de optimización . Nueva York: John Wiley & Sons. págs. 39–44. ISBN 0-471-91922-5.
^ Kemp, Murray C .; Kimura, Yoshio (1978). Introducción a la Economía Matemática . Nueva York: Springer. págs. 38–44 . ISBN 0-387-90304-6.
^ Boyd, Stephen; Vandenberghe, Lieven (2004). Optimización convexa . Cambridge: Cambridge University Press . pag. 244. ISBN 0-521-83378-7. Señor 2061575 .
^ Ruszczyński, Andrzej (2006). Optimización no lineal . Princeton, Nueva Jersey: Princeton University Press . ISBN 978-0691119151. Señor 2199043 .
^ Dimitri Bertsekas (1999). Programación no lineal (2 ed.). Athena Scientific. págs. 329–330. ISBN 9781886529007.
^ Martin, DH (1985). "La Esencia de la Invexidad". J. Optim. Teoría Appl . 47 (1): 65–76. doi : 10.1007 / BF00941316 . S2CID 122906371 .
^ Hanson, MA (1999). "Invexidad y el teorema de Kuhn-Tucker". J. Math. Anal. Apl . 236 (2): 594–604. doi : 10.1006 / jmaa.1999.6484 .
^ Chiang, Alpha C. Métodos fundamentales de la economía matemática , 3ª edición, 1984, págs. 750–752.

Otras lecturas

Andreani, R .; Martínez, JM; Schuverdt, ML (2005). "Sobre la relación entre la condición de dependencia lineal positiva constante y la calificación de restricción de cuasinormalidad". Revista de teoría y aplicaciones de la optimización . 125 (2): 473–485. doi : 10.1007 / s10957-004-1861-9 . S2CID 122212394 .
Avriel, Mordecai (2003). Programación no lineal: análisis y métodos . Dover. ISBN 0-486-43227-0.
Boltyanski, V .; Martini, H .; Soltan, V. (1998). "El teorema de Kuhn-Tucker" . Métodos geométricos y problemas de optimización . Nueva York: Springer. págs. 78–92. ISBN 0-7923-5454-0.
Boyd, S .; Vandenberghe, L. (2004). "Condiciones óptimas" (PDF) . Optimización convexa . Prensa de la Universidad de Cambridge. págs. 241–249. ISBN 0-521-83378-7.
Kemp, Murray C .; Kimura, Yoshio (1978). Introducción a la Economía Matemática . Nueva York: Springer. págs. 38–73 . ISBN 0-387-90304-6.
Rau, Nicolás (1981). "Multiplicadores de Lagrange". Matrices y Programación Matemática . Londres: Macmillan. págs. 156-174. ISBN 0-333-27768-6.
Nocedal, J .; Wright, SJ (2006). Optimización numérica . Nueva York: Springer. ISBN 978-0-387-30303-1.
Sundaram, Rangarajan K. (1996). "Restricciones de desigualdad y el teorema de Kuhn y Tucker" . Un primer curso de teoría de la optimización . Nueva York: Cambridge University Press. págs. 145-171. ISBN 0-521-49770-1.

enlaces externos

Condiciones de Karush-Kuhn-Tucker con derivación y ejemplos
Ejemplos y tutoriales sobre las condiciones del KKT

[1] Tabak, Daniel; Kuo, Benjamin C. (1971). Control óptimo por programación matemática . Englewood Cliffs, Nueva Jersey: Prentice-Hall. págs. 19-20. ISBN 0-13-638106-5.

[2] Kuhn, HW ; Tucker, AW (1951). "Programación no lineal" . Actas del 2º Simposio de Berkeley . Berkeley: Prensa de la Universidad de California. págs. 481–492. Señor 0047303 .

[3] W. Karush (1939). Mínimos de funciones de varias variables con desigualdades como restricciones laterales (tesis de maestría). Departamento de Matemáticas, Univ. de Chicago, Chicago, Illinois.

[4] Kjeldsen, Tinne Hoff (2000). "Un análisis histórico contextualizado del teorema de Kuhn-Tucker en programación no lineal: el impacto de la Segunda Guerra Mundial". Historia Math . 27 (4): 331–361. doi : 10.1006 / hmat.2000.2289 . Señor 1800317 .

[Walsh1975-5] Walsh, GR (1975). "Propiedad del punto de silla de montar de la función lagrangiana" . Métodos de optimización . Nueva York: John Wiley & Sons. págs. 39–44. ISBN 0-471-91922-5.

[6] Kemp, Murray C .; Kimura, Yoshio (1978). Introducción a la Economía Matemática . Nueva York: Springer. págs. 38–44 . ISBN 0-387-90304-6.

[7] Boyd, Stephen; Vandenberghe, Lieven (2004). Optimización convexa . Cambridge: Cambridge University Press . pag. 244. ISBN 0-521-83378-7. Señor 2061575 .

[8] Ruszczyński, Andrzej (2006). Optimización no lineal . Princeton, Nueva Jersey: Princeton University Press . ISBN 978-0691119151. Señor 2199043 .

[9] Dimitri Bertsekas (1999). Programación no lineal (2 ed.). Athena Scientific. págs. 329–330. ISBN 9781886529007.

[10] Martin, DH (1985). "La Esencia de la Invexidad". J. Optim. Teoría Appl . 47 (1): 65–76. doi : 10.1007 / BF00941316 . S2CID 122906371 .

[11] Hanson, MA (1999). "Invexidad y el teorema de Kuhn-Tucker". J. Math. Anal. Apl . 236 (2): 594–604. doi : 10.1006 / jmaa.1999.6484 .

[12] Chiang, Alpha C. Métodos fundamentales de la economía matemática , 3ª edición, 1984, págs. 750–752.

[1]