Descomposición de Benders

La descomposición de Benders (o descomposición de Benders ) es una técnica en programación matemática que permite la solución de problemas de programación lineal muy grandes que tienen una estructura de bloques especial . Esta estructura de bloques a menudo ocurre en aplicaciones como la programación estocástica, ya que la incertidumbre generalmente se representa con escenarios. La técnica lleva el nombre de Jacques F. Benders .

La estrategia detrás de la descomposición de Benders se puede resumir como divide y vencerás . Es decir, en la descomposición de Benders, las variables del problema original se dividen en dos subconjuntos de modo que un problema maestro de la primera etapa se resuelve sobre el primer conjunto de variables, y los valores para el segundo conjunto de variables se determinan en un segundo conjunto. subproblema de etapa para una solución de primera etapa dada. Si el subproblema determina que las decisiones fijas de la primera etapa son de hecho inviables, entonces se generan los llamados cortes Benders y se agregan al problema maestro, que luego se resuelve hasta que no se puedan generar cortes. Dado que la descomposición de Benders agrega nuevas restricciones a medida que avanza hacia una solución, el enfoque se denomina " generación de filas ". Por el contrario, la descomposición de Dantzig-Wolfe utiliza " generación de columnas ".

Metodología

Suponga un problema que ocurre en dos o más etapas, donde las decisiones para las etapas posteriores se basan en los resultados de las anteriores. Se puede intentar tomar decisiones en la primera etapa sin un conocimiento previo de la optimización de acuerdo con las decisiones de la etapa posterior. Esta decisión de la primera etapa es el problema principal. Luego, las etapas posteriores pueden analizarse como subproblemas separados. La información de estos subproblemas se devuelve al problema principal. Si se infringieron las restricciones de un subproblema, se pueden volver a agregar al problema principal. A continuación, se resuelve de nuevo el problema principal.

El problema principal representa un conjunto convexo inicial que está aún más limitado por la información recopilada de los subproblemas. Debido a que el espacio factible solo se reduce a medida que se agrega información, el valor objetivo de la función maestra se puede considerar como un límite inferior en la función objetivo del problema general.

La descomposición de Bender es aplicable a problemas con una estructura en gran parte de bloques en diagonal.

Formulación matemática

Suponga un problema de la siguiente estructura:

{\ Displaystyle {\ begin {alineado} & {\ text {minimizar}} && \ mathbf {c} ^ {\ mathrm {T}} \ mathbf {x} + \ mathbf {d} ^ {\ mathrm {T}} \ mathbf {y} \\ & {\ text {sujeto a}} && A \ mathbf {x} + B \ mathbf {y} \ geq \ mathbf {b} \\ &&& y \ in Y \\ &&& \ mathbf {x} \ geq \ mathbf {0} \ end {alineado}}}

Dónde ${\ Displaystyle A, B}$ representan las restricciones compartidas por ambas etapas de variables y ${\ Displaystyle Y}$ representa el conjunto factible para ${\ Displaystyle \ mathbf {y}}$ . Tenga en cuenta que para cualquier ${\ Displaystyle \ mathbf {\ bar {y}} \ in Y}$ , el problema residual es

{\ Displaystyle {\ begin {alineado} & {\ text {minimizar}} && \ mathbf {c} ^ {\ mathrm {T}} \ mathbf {x} + \ mathbf {d} ^ {\ mathrm {T}} \ mathbf {\ bar {y}} \\ & {\ text {sujeto a}} && A \ mathbf {x} \ geq \ mathbf {b} -B \ mathbf {\ bar {y}} \\ &&& \ mathbf { x} \ geq \ mathbf {0} \ end {alineado}}}

El dual del problema residual es

{\ Displaystyle {\ begin {alineado} & {\ text {maximizar}} && (\ mathbf {b} -B \ mathbf {\ bar {y}}) ^ {\ mathrm {T}} \ mathbf {u} + \ mathbf {d} ^ {\ mathrm {T}} \ mathbf {\ bar {y}} \\ & {\ text {sujeto a}} && A ^ {\ mathrm {T}} \ mathbf {u} \ leq \ mathbf {c} \\ &&& \ mathbf {u} \ geq \ mathbf {0} \ end {alineado}}}

Usando la representación dual del problema residual, el problema original se puede reescribir como un problema minimax equivalente

{\ Displaystyle \ min _ {\ mathbf {y} \ in Y} \ left [\ mathbf {d} ^ {\ mathrm {T}} \ mathbf {y} + \ max _ {\ mathbf {u} \ geq \ mathbf {0}} \ left \ {(\ mathbf {b} -B \ mathbf {y}) ^ {\ mathrm {T}} \ mathbf {u} \ mid A ^ {\ mathrm {T}} \ mathbf { u} \ leq \ mathbf {c} \ right \} \ right].}

La descomposición de Benders se basa en un procedimiento iterativo que elige valores sucesivos de ${\ Displaystyle \ mathbf {y}}$ sin considerar el problema interno, excepto a través de un conjunto de restricciones de corte que se crean a través de un mecanismo de devolución del problema de maximización. Aunque la formulación minimax está escrita en términos de ${\ Displaystyle (\ mathbf {u}, \ mathbf {y})}$ , para un óptimo ${\ Displaystyle \ mathbf {\ bar {y}}}$ el correspondiente ${\ Displaystyle \ mathbf {\ bar {x}}}$ se puede encontrar resolviendo el problema original con ${\ Displaystyle \ mathbf {\ bar {y}}}$ reparado.

Formulación de problemas maestros

Las decisiones para el problema de la primera etapa pueden describirse mediante el problema de minimización más pequeño

{\ Displaystyle {\ begin {alineado} & {\ text {minimizar}} && \ mathbf {z} \\ & {\ text {sujeto a}} && \ {{\ text {cortes}} \} \\ &&& \ mathbf {y} \ in Y \\\ end {alineado}}}

Inicialmente, el conjunto de cortes está vacío. Resolver este problema principal constituirá una "primera suposición" en una solución óptima para el problema general, con el valor de ${\ Displaystyle \ mathbf {z}}$ ilimitado por debajo y ${\ Displaystyle \ mathbf {y}}$ asumiendo cualquier valor factible.

El conjunto de cortes se completará en una secuencia de iteraciones resolviendo el problema interno de maximización de la formulación minimax. Ambos cortes guían el problema maestro hacia un óptimo ${\ Displaystyle \ mathbf {y}}$ , si existe, y asegúrese de que ${\ Displaystyle \ mathbf {y}}$ es factible para el problema completo. El conjunto de cortes define la relación entre ${\ Displaystyle \ mathbf {y}}$ , ${\ Displaystyle \ mathbf {z}}$ , e implícitamente ${\ Displaystyle \ mathbf {x}}$ .

Dado que el valor de ${\ Displaystyle z}$ comienza sin restricciones y solo agregamos restricciones en cada iteración, lo que significa que el espacio factible solo puede reducirse, el valor del problema principal en cualquier iteración proporciona un límite inferior en la solución del problema general. Si por algunos ${\ Displaystyle \ mathbf {\ bar {y}}}$ el valor objetivo del problema principal es igual al valor del valor óptimo del problema interno, entonces, por la teoría de la dualidad, la solución es óptima.

Formulación de subproblemas

El subproblema considera la solución sugerida ${\ Displaystyle \ mathbf {\ bar {y}}}$ al problema principal y resuelve el problema interno de maximización de la formulación minimax. El problema interno se formula utilizando la representación dual

{\ Displaystyle {\ begin {alineado} & {\ text {maximizar}} && (\ mathbf {b} -B \ mathbf {\ bar {y}}) ^ {\ mathrm {T}} \ mathbf {u} + \ mathbf {d} ^ {\ mathrm {T}} \ mathbf {\ bar {y}} \\ & {\ text {sujeto a}} && A ^ {\ mathrm {T}} \ mathbf {u} \ leq \ mathbf {c} \\ &&& \ mathbf {u} \ geq \ mathbf {0} \ end {alineado}}}

Mientras que el problema principal proporciona un límite inferior al valor del problema, el subproblema se utiliza para obtener un límite superior. El resultado de resolver el subproblema para cualquier ${\ Displaystyle \ mathbf {\ bar {y}}}$ puede ser un valor óptimo finito para el que un punto extremo ${\ Displaystyle \ mathbf {\ bar {u}}}$ se puede encontrar, una solución ilimitada para la que un rayo extremo ${\ Displaystyle \ mathbf {\ bar {u}}}$ en el cono de recesión , o un hallazgo de que el subproblema es inviable.

Procedimiento

En un nivel alto, el procedimiento considerará iterativamente el problema principal y el subproblema. Cada iteración proporciona un límite superior e inferior actualizado en el valor objetivo óptimo. El resultado del subproblema proporciona una nueva restricción para agregar al problema principal o un certificado de que no existe una solución óptima finita para el problema. El procedimiento termina cuando se demuestra que no existe una solución óptima finita o cuando el espacio entre el límite superior e inferior es suficientemente pequeño. En tal caso, el valor de ${\ Displaystyle \ mathbf {\ bar {x}}}$ se determina resolviendo la solución del problema residual primario ${\ Displaystyle \ mathbf {\ bar {y}}}$ .

Formalmente, el procedimiento comienza con el límite inferior establecido en ${\ Displaystyle - \ inf}$ , el límite superior establecido en ${\ Displaystyle \ inf}$ , y los cortes en el problema maestro están vacíos. Se produce una solución inicial seleccionando cualquier ${\ Displaystyle \ mathbf {\ bar {y}} \ in Y}$ . Luego, el procedimiento iterativo comienza y continúa hasta que el espacio entre el límite superior e inferior es como máximo ${\ Displaystyle \ epsilon}$ o se muestra que no existe una solución óptima finita.

El primer paso de cada iteración comienza actualizando el límite superior resolviendo el subproblema dado el valor más reciente de ${\ Displaystyle \ mathbf {\ bar {y}}}$ . Hay tres posibles resultados al resolver el subproblema.

En el primer caso, el valor objetivo del subproblema es ilimitado arriba. Según la teoría de la dualidad , cuando un problema dual tiene un objetivo ilimitado, el problema primario correspondiente es inviable. Esto significa que la elección de ${\ Displaystyle \ mathbf {\ bar {y}}}$ no satisface ${\ Displaystyle A \ mathbf {x} + B \ mathbf {\ bar {y}} \ geq \ mathbf {b}}$ para cualquier ${\ Displaystyle \ mathbf {x} \ geq \ mathbf {0}}$ . Esta solución se puede eliminar del problema principal tomando un rayo extremo ${\ Displaystyle \ mathbf {\ bar {u}}}$ que certifica que el subproblema tiene un objetivo ilimitado y agrega una restricción al maestro afirmando que ${\ Displaystyle (\ mathbf {b} -B \ mathbf {y}) ^ {\ mathrm {T}} \ mathbf {\ bar {u}} \ leq \ mathbf {0}}$ .

En el segundo caso, el subproblema es inviable. Dado que el espacio factible dual del problema está vacío, el problema original no es factible o hay un rayo en el problema primario que certifica que el valor objetivo no está acotado por debajo. En cualquier caso, el procedimiento termina.

En el tercer caso, el subproblema tiene una solución óptima finita. Según la teoría de la dualidad para programas lineales, el valor óptimo del subproblema es igual al valor óptimo del problema original restringido a la elección de ${\ Displaystyle \ mathbf {\ bar {y}}}$ . Esto permite actualizar el límite superior al valor de la solución óptima del subproblema, si es mejor que el límite superior actual. Dado un punto extremo óptimo ${\ Displaystyle \ mathbf {\ bar {u}}}$ , también produce una nueva restricción que requiere que el problema principal considere el valor objetivo bajo esta solución particular al afirmar que ${\ Displaystyle z \ geq (\ mathbf {b} -B \ mathbf {y}) ^ {\ mathrm {T}} \ mathbf {\ bar {u}} + \ mathbf {d} ^ {\ mathrm {T} } \ mathbf {y}}$ . Esto aumentará estrictamente el valor de ${\ Displaystyle z}$ en la solucion ${\ Displaystyle \ mathbf {\ bar {y}}}$ en el problema maestro si la elección de ${\ Displaystyle \ mathbf {\ bar {y}}}$ fue subóptimo.

Finalmente, la última parte de cada iteración es crear una nueva solución al problema principal resolviendo el problema principal con la nueva restricción. La nueva solucion ${\ Displaystyle (\ mathbf {\ bar {y}}, z)}$ se utiliza para actualizar el límite inferior. Si la brecha entre el mejor límite superior e inferior es menor que ${\ Displaystyle \ epsilon}$ entonces el procedimiento termina y el valor de ${\ Displaystyle \ mathbf {\ bar {x}}}$ se determina resolviendo la solución del problema residual primario ${\ Displaystyle \ mathbf {\ bar {y}}}$ . De lo contrario, el procedimiento continúa con la siguiente iteración.

Ver también

El solucionador de FortSP utiliza la descomposición de Benders para resolver problemas de programación estocástica

Referencias

Benders, JF (septiembre de 1962), " Procedimientos de particionamiento para resolver problemas de programación de variables mixtas ", Numerische Mathematik 4 (3): 238–252.
Lasdon, Leon S. (2002), Optimization Theory for Large Systems (reimpresión de la edición de Macmillan de 1970), Mineola, Nueva York: Dover Publications , págs. Xiii + 523, MR 1888251.