Teoría del transporte (matemáticas)

En matemáticas y economía, la teoría del transporte o teoría del transporte es un nombre que se le da al estudio del transporte óptimo y la asignación de recursos . El problema fue formalizado por el matemático francés Gaspard Monge en 1781. ^[1]

En la década de 1920, AN Tolstoi fue uno de los primeros en estudiar matemáticamente el problema del transporte . En 1930, en la colección Transportation Planning Volume I para el Comisariado Nacional de Transporte de la Unión Soviética, publicó un artículo "Métodos para encontrar el kilometraje mínimo en el transporte de carga en el espacio". ^[2]^[3]

El matemático y economista soviético Leonid Kantorovich logró importantes avances en este campo durante la Segunda Guerra Mundial . ^[4] En consecuencia, el problema, tal como se afirma, a veces se conoce como el problema del transporte de Monge-Kantorovich . ^[5] La formulación de programación lineal del problema del transporte también se conoce como el problema del transporte de Hitchcock - Koopmans . ^[6]

Motivación

Minas y fabricas

Supongamos que tenemos una colección de m minas de extracción de mineral de hierro, y una colección de n fábricas que utilizan el mineral de hierro que las minas producen. Supongamos, por el bien del argumento de que estas minas y fábricas forman dos disjuntos subconjuntos M y F del plano euclidiano R ² . Supongamos también que tenemos una función de costo c : R ² × R ² → [0, ∞), de modo que c ( x , y ) es el coste del transporte de un envío de hierro de x a y . Por simplicidad, ignoramos el tiempo necesario para realizar el transporte. También asumimos que cada mina puede abastecer solo a una fábrica (sin dividir los envíos) y que cada fábrica requiere precisamente un envío para estar en operación (las fábricas no pueden trabajar a la mitad o al doble de capacidad). Después de haber hecho los supuestos anteriores, un plan de transporte es una biyección T : M → F . En otras palabras, cada mina m ∈ M suministra precisamente una fábrica objetivo T ( m ) ∈ F y cada fábrica es abastecida precisamente por una mina. Deseamos encontrar el plan de transporte óptimo , el plan T cuyo costo total

{\ Displaystyle c (T): = \ sum _ {m \ in M} c (m, T (m))}

es el menor de todos los posibles planes de transporte de M a F . Este caso especial motivador del problema del transporte es un ejemplo del problema de la asignación . Más específicamente, equivale a encontrar una coincidencia de peso mínima en un gráfico bipartito.

Mover libros: la importancia de la función de costes

El siguiente ejemplo simple ilustra la importancia de la función de costos para determinar el plan de transporte óptimo. Supongamos que tenemos n libros de igual ancho en un estante (la línea real ), dispuestos en un solo bloque contiguo. Deseamos reorganizarlos en otro bloque contiguo, pero desplazamos el ancho de un libro hacia la derecha. Se presentan dos candidatos obvios para el plan de transporte óptimo:

mover todos los n libros un libro de ancho a la derecha ("muchos movimientos pequeños");
mueva el libro más a la izquierda n anchos de libro hacia la derecha y deje todos los demás libros fijos ("un gran movimiento").

Si la función de coste es proporcional a la distancia euclidiana ( c ( x , y ) = α | x - y |), entonces estos dos candidatos son tanto óptima. Si, por otro lado, elegimos la función de costo estrictamente convexa proporcional al cuadrado de la distancia euclidiana ( c ( x , y ) = α | x - y | ² ), entonces la opción "muchos movimientos pequeños" se convierte en el minimizador único. .

Tenga en cuenta que las funciones de costo anteriores consideran solo la distancia horizontal recorrida por los libros, no la distancia horizontal recorrida por un dispositivo utilizado para levantar cada libro y mover el libro a su posición. Si se considera el último, entonces, de los dos planes de transporte, el segundo siempre es óptimo para la distancia euclidiana, mientras que, siempre que haya al menos 3 libros, el primer plan de transporte es óptimo para la distancia euclidiana al cuadrado.

Problema de Hitchcock

La siguiente formulación del problema de transporte se acredita a FL Hitchcock : ^[7]

Supongamos que hay m fuentes

{\ Displaystyle x_ {1}, \ ldots, x_ {m}}

para una mercancía, con

{\ Displaystyle a (x_ {i})}

unidades de suministro en x _i y n sumideros

{\ Displaystyle y_ {1}, \ ldots, y_ {n}}

para la mercancía, con la demanda

{\ Displaystyle b (y_ {j})}

en y _j . Si

{\ Displaystyle a (x_ {i}, \ y_ {j})}

es el costo unitario de envío desde x _i a y _j , encontrar un flujo que satisface la demanda de suministros y minimiza el coste de flujo. Este desafío logístico fue abordado por DR Fulkerson ^[8] y en el libro Flows in Networks (1962) escrito con LR Ford Jr .. ^[9]

A Tjalling Koopmans también se le atribuyen las formulaciones de la economía del transporte y la asignación de recursos.

Formulación abstracta del problema

Formulaciones de Monge y Kantorovich

El problema del transporte, tal como se plantea en la literatura moderna o más técnica, se ve algo diferente debido al desarrollo de la geometría y la teoría de la medida de Riemann . El ejemplo de las fábricas de minas, por simple que sea, es un punto de referencia útil cuando se piensa en el caso abstracto. En este contexto, permitimos la posibilidad de que no deseemos mantener abiertas todas las minas y fábricas, y permitir que las minas suministren más de una fábrica y que las fábricas acepten hierro de más de una mina.

Sean X e Y dos espacios métricos separables de modo que cualquier medida de probabilidad en X (o Y ) sea una medida de radón (es decir, son espacios de radón ). Sea c : X × Y → [0, ∞] una función medible de Borel . Dadas las medidas de probabilidad μ en X y ν en Y , la formulación de Monge del problema de transporte óptimo es encontrar un mapa de transporte T : X → Y que se dé cuenta del mínimo

{\ Displaystyle \ inf \ left \ {\ left. \ int _ {X} c (x, T (x)) \, \ mathrm {d} \ mu (x) \; \ right | \; T _ {*} (\ mu) = \ nu \ right \},}

donde T _* ( μ ) denota el impulso hacia adelante de μ por T . Un mapa T que alcanza este mínimo ( es decir, lo convierte en un mínimo en lugar de un mínimo) se denomina "mapa de transporte óptimo".

La formulación de Monge del problema de transporte óptimo puede estar mal planteada, porque a veces no hay T que satisfaga T _∗ ( μ ) = ν : esto sucede, por ejemplo, cuando μ es una medida de Dirac pero ν no lo es.

Podemos mejorar esto adoptando la formulación de Kantorovich del problema de transporte óptimo, que consiste en encontrar una medida de probabilidad γ en X × Y que alcance el mínimo

{\ Displaystyle \ inf \ left \ {\ left. \ int _ {X \ times Y} c (x, y) \, \ mathrm {d} \ gamma (x, y) \ right | \ gamma \ in \ Gamma (\ mu, \ nu) \ right \},}

donde Γ ( μ , ν ) denota la colección de todas las medidas de probabilidad sobre X × Y con marginales μ en X y ν en Y . Se puede demostrar ^[10] que siempre existe un minimizador para este problema cuando la función de costo c es semicontinua más baja y Γ ( μ , ν ) es una colección ajustada de medidas (que está garantizada para los espacios de radón X e Y ). (Compare esta formulación con la definición de la métrica de Wasserstein W ₁ en el espacio de medidas de probabilidad.) Sigurd Angenent , Steven Haker y Allen Tannenbaum dieron una fórmula de descenso de gradiente para la solución del problema de Monge-Kantorovich . ^[11]

Fórmula de dualidad

El mínimo del problema de Kantorovich es igual a

{\ Displaystyle \ sup \ left (\ int _ {X} \ varphi (x) \, \ mathrm {d} \ mu (x) + \ int _ {Y} \ psi (y) \, \ mathrm {d} \ nu (y) \ right),}

donde el supremo corre sobre todos los pares de funciones acotadas y continuas ${\ Displaystyle \ varphi: X \ rightarrow \ mathbf {R}}$ y ${\ Displaystyle \ psi: Y \ rightarrow \ mathbf {R}}$ tal que

{\ Displaystyle \ varphi (x) + \ psi (y) \ leq c (x, y).}

Interpretación económica

La interpretación económica es más clara si se invierten los signos. Dejar ${\ Displaystyle \ textstyle x \ en X}$ representan el vector de características de un trabajador, ${\ Displaystyle \ textstyle y \ in Y}$ para el vector de características de una empresa, y ${\ Displaystyle \ textstyle \ Phi \ left (x, y \ right) = - c \ left (x, y \ right)}$ para la producción económica generada por el trabajador ${\ Displaystyle \ textstyle x}$ emparejado con firme ${\ Displaystyle \ textstyle y}$ . Configuración ${\ Displaystyle \ textstyle u \ left (x \ right) = - \ varphi \ left (x \ right)}$ y ${\ Displaystyle \ textstyle v \ left (y \ right) = - \ psi \ left (y \ right)}$ , el problema de Monge-Kantorovich reescribe:

{\ Displaystyle \ sup \ left \ {\ int _ {X \ times Y} \ Phi \ left (x, y \ right) d \ gamma \ left (x, y \ right), \ gamma \ in \ Gamma \ left (\ mu, \ nu \ right) \ right \}}

que tiene dual :

{\ Displaystyle \ inf \ left \ {\ int _ {X} u \ left (x \ right) d \ mu \ left (x \ right) + \ int _ {Y} v \ left (y \ right) d \ nu \ left (y \ right): u \ left (x \ right) + v \ left (y \ right) \ geq \ Phi \ left (x, y \ right) \ right \}}

donde el infimum corre sobre la función acotada y continua

{\ Displaystyle \ textstyle u: X \ rightarrow \ mathbf {R}}

y

{\ Displaystyle \ textstyle v: Y \ rightarrow \ mathbf {R}}

. Si el problema dual tiene solución, se puede ver que:

{\ Displaystyle v \ left (y \ right) = \ sup _ {x} \ left \ {\ Phi \ left (x, y \ right) -u \ left (x \ right) \ right \}}

así que eso

{\ Displaystyle \ textstyle u \ left (x \ right)}

se interpreta como el salario de equilibrio de un trabajador de tipo

{\ Displaystyle \ textstyle x}

, y

{\ Displaystyle \ textstyle v \ left (y \ right)}

se interpreta como la ganancia de equilibrio de una empresa de tipo

{\ Displaystyle \ textstyle y}

. ^[12]

Solución del problema

Transporte óptimo en la línea real

Transporte óptimo continuo

Para ${\ Displaystyle 1 \ leq p <\ infty}$ , dejar ${\ Displaystyle {\ mathcal {P}} _ {p} (\ mathbf {R})}$ denotar la colección de medidas de probabilidad en ${\ Displaystyle \ mathbf {R}}$ que tienen finito ${\ Displaystyle p}$ -ésimo momento . Dejar ${\ Displaystyle \ mu, \ nu \ in {\ mathcal {P}} _ {p} (\ mathbf {R})}$ y deja ${\ Displaystyle c (x, y) = h (xy)}$ , dónde ${\ displaystyle h: \ mathbf {R} \ rightarrow [0, \ infty)}$ es una función convexa .

Si ${\ Displaystyle \ mu}$ no tiene átomo , es decir, si la función de distribución acumulativa ${\ displaystyle F _ {\ mu} = \ mathbf {R} \ rightarrow [0,1]}$ de ${\ Displaystyle \ mu}$ es una función continua , entonces ${\ Displaystyle F _ {\ nu} ^ {- 1} \ circ F _ {\ mu}: \ mathbf {R} \ to \ mathbf {R}}$ es un mapa de transporte óptimo. Es el mapa de transporte óptimo único si ${\ Displaystyle h}$ es estrictamente convexo.
Tenemos

{\ Displaystyle \ min _ {\ gamma \ in \ Gamma (\ mu, \ nu)} \ int _ {\ mathbf {R} ^ {2}} c (x, y) \, \ mathrm {d} \ gamma (x, y) = \ int _ {0} ^ {1} c \ left (F _ {\ mu} ^ {- 1} (s), F _ {\ nu} ^ {- 1} (s) \ right) \, \ mathrm {d} s.}

La prueba de esta solución aparece en Rachev & Rüschendorf (1998). ^[13]

Versión discreta y formulación de programación lineal

En el caso de que los márgenes ${\ Displaystyle \ textstyle \ mu}$ y ${\ Displaystyle \ textstyle \ nu}$ son discretos, deja ${\ Displaystyle \ textstyle \ mu _ {x}}$ y ${\ Displaystyle \ textstyle \ nu _ {y}}$ ser las masas de probabilidad asignadas respectivamente a ${\ Displaystyle \ textstyle x \ in \ mathbf {X}}$ y ${\ Displaystyle \ textstyle y \ in \ mathbf {Y}}$ , y deja ${\ Displaystyle \ textstyle \ gamma _ {xy}}$ ser la probabilidad de un ${\ Displaystyle \ textstyle xy}$ asignación. La función objetivo en el problema primordial de Kantorovich es entonces

${\ Displaystyle \ sum _ {x \ in \ mathbf {X}, y \ in \ mathbf {Y}} \ gamma _ {xy} c_ {xy}}$

y la restricción ${\ Displaystyle \ textstyle \ gamma \ in \ Gamma \ left (\ mu, \ nu \ right)}$ se expresa como

${\ Displaystyle \ sum _ {y \ in \ mathbf {Y}} \ gamma _ {xy} = \ mu _ {x}, \ forall x \ in \ mathbf {X}}$ y ${\ Displaystyle \ sum _ {x \ in \ mathbf {X}} \ gamma _ {xy} = \ nu _ {y}, \ forall y \ in \ mathbf {Y.}}$

Para ingresar esto en un problema de programación lineal , necesitamos vectorizar la matriz ${\ Displaystyle \ textstyle \ gamma _ {xy}}$ apilando sus columnas o sus filas , llamamos ${\ Displaystyle \ textstyle \ operatorname {vec}}$ esta operacion. En el orden de la columna principal , las restricciones anteriores se reescriben como

${\ Displaystyle \ left (1_ {1 \ times \ left \ vert \ mathbf {Y} \ right \ vert} \ otimes I _ {\ left \ vert \ mathbf {X} \ right \ vert} \ right) \ operatorname {vec } \ left (\ gamma \ right) = \ mu}$ y ${\ Displaystyle \ left (I _ {\ left \ vert \ mathbf {Y} \ right \ vert} \ otimes 1_ {1 \ times \ left \ vert \ mathbf {X} \ right \ vert} \ right) \ operatorname {vec } \ left (\ gamma \ right) = \ nu}$

dónde ${\ Displaystyle \ textstyle \ otimes}$ es el producto Kronecker , ${\ Displaystyle \ textstyle 1_ {n \ times m}}$ es una matriz de tamaño ${\ Displaystyle \ textstyle n \ times m}$ con todas las entradas de unos, y ${\ Displaystyle \ textstyle I_ {n}}$ es la matriz de identidad del tamaño ${\ Displaystyle \ textstyle n}$ . Como resultado, el establecimiento ${\ Displaystyle \ textstyle z = \ operatorname {vec} \ left (\ gamma \ right)}$ , la formulación de programación lineal del problema es

${\ Displaystyle \ min _ {z \ geq 0} \ operatorname {vec} \ left (c \ right) ^ {\ top} z}$

S t ${\ Displaystyle {\ begin {pmatrix} 1_ {1 \ times \ left \ vert \ mathbf {Y} \ right \ vert} \ otimes I _ {\ left \ vert \ mathbf {X} \ right \ vert} \\ I_ { \ left \ vert \ mathbf {Y} \ right \ vert} \ otimes 1_ {1 \ times \ left \ vert \ mathbf {X} \ right \ vert} \ end {pmatrix}}}$ ${\ Displaystyle z = {\ binom {\ mu} {\ nu}}}$

que se puede ingresar fácilmente en un solucionador de programación lineal a gran escala como Gurobi (consulte el capítulo 3.4 de Galichon (2016) ^[12] ).

Estuche semidiscreto

En el caso semidiscreto, ${\ Displaystyle \ textstyle X = Y = \ mathbf {R} ^ {d}}$ y ${\ Displaystyle \ textstyle \ mu}$ es una distribución continua sobre ${\ Displaystyle \ textstyle \ mathbf {R} ^ {d}}$ , tiempo ${\ Displaystyle \ textstyle \ nu = \ sum _ {j = 1} ^ {J} \ nu _ {j} \ delta _ {y_ {i}}}$ es una distribución discreta que asigna masa de probabilidad ${\ Displaystyle \ textstyle \ nu _ {j}}$ al sitio ${\ Displaystyle \ textstyle y_ {j} \ in \ mathbf {R} ^ {d}}$ . En este caso, podemos ver ^[14] que los problemas primarios y duales de Kantorovich se reducen respectivamente a:

{\ Displaystyle \ inf \ left \ {\ int _ {X} \ sum _ {j = 1} ^ {J} c \ left (x, y_ {j} \ right) d \ gamma _ {j} \ left ( x \ right), \ gamma \ in \ Gamma \ left (\ mu, \ nu \ right) \ right \}}

para lo primordial, donde

{\ Displaystyle \ textstyle \ gamma \ in \ Gamma \ left (\ mu, \ nu \ right)}

significa que

{\ Displaystyle \ textstyle \ int _ {X} d \ gamma _ {j} \ left (x \ right) = \ nu _ {j}}

y

{\ Displaystyle \ textstyle \ sum _ {j} d \ gamma _ {j} \ left (x \ right) = d \ mu \ left (x \ right)}

, y:

{\ Displaystyle \ sup \ left \ {\ int _ {X} \ varphi (x) d \ mu (x) + \ sum _ {j = 1} ^ {J} \ psi _ {j} \ nu _ {j }: \ psi _ {j} + \ varphi (x) \ leq c \ left (x, y_ {j} \ right) \ right \}}

para el dual, que se puede reescribir como:

{\ Displaystyle \ sup _ {\ psi \ in \ mathbf {R} ^ {J}} \ left \ {\ int _ {X} \ inf _ {j} \ left \ {c \ left (x, y_ {j } \ right) - \ psi _ {j} \ right \} d \ mu (x) + \ sum _ {j = 1} ^ {J} \ psi _ {j} \ nu _ {j} \ right \} }

que es un problema de optimización convexa de dimensión finita que puede resolverse mediante técnicas estándar, como el descenso de gradientes .

En el caso cuando ${\ Displaystyle \ textstyle c \ left (x, y \ right) = \ left \ vert xy \ right \ vert ^ {2} / 2}$ , se puede demostrar que el conjunto de ${\ Displaystyle \ textstyle x \ in \ mathbf {X}}$ asignado a un sitio en particular ${\ Displaystyle \ textstyle j}$ es un poliedro convexo. La configuración resultante se llama diagrama de potencia . ^[15]

Caso normal cuadrático

Asume el caso particular ${\ Displaystyle \ textstyle \ mu = {\ mathcal {N}} \ left (0, \ Sigma _ {X} \ right)}$ , ${\ Displaystyle \ textstyle \ nu = {\ mathcal {N}} \ left (0, \ Sigma _ {Y} \ right)}$ , y ${\ Displaystyle \ textstyle c \ left (x, y \ right) = \ left \ vert y-Ax \ right \ vert ^ {2} / 2}$ dónde ${\ Displaystyle \ textstyle A}$ es invertible. Entonces uno tiene

${\ Displaystyle \ varphi \ left (x \ right) = - x ^ {\ top} \ Sigma _ {X} ^ {- 1/2} \ left (\ Sigma _ {X} ^ {1/2} A ^ {\ top} \ Sigma _ {Y} A \ Sigma _ {X} ^ {1/2} \ right) ^ {1/2} \ Sigma _ {X} ^ {- 1/2} x / 2}$

${\ Displaystyle \ psi \ left (y \ right) = - y ^ {\ top} A \ Sigma _ {X} ^ {1/2} \ left (\ Sigma _ {X} ^ {1/2} A ^ {\ top} \ Sigma _ {Y} A \ Sigma _ {X} ^ {1/2} \ right) ^ {- 1/2} \ Sigma _ {X} ^ {1/2} Ay / 2}$

${\ Displaystyle T \ left (x \ right) = \ left (A ^ {\ top} \ right) ^ {- 1} \ Sigma _ {X} ^ {- 1/2} \ left (\ Sigma _ {X } ^ {1/2} A ^ {\ top} \ Sigma _ {Y} A \ Sigma _ {X} ^ {1/2} \ right) ^ {1/2} \ Sigma _ {X} ^ {- 1/2}}$

La prueba de esta solución aparece en Galichon (2016). ^[12]

Espacios Hilbert separables

Dejar ${\ Displaystyle X}$ ser un espacio Hilbert separable . Dejar ${\ Displaystyle {\ mathcal {P}} _ {p} (X)}$ denotar la colección de medidas de probabilidad en ${\ Displaystyle X}$ tales que tienen finito ${\ Displaystyle p}$ -ésimo momento; dejar ${\ Displaystyle {\ mathcal {P}} _ {p} ^ {r} (X)}$ denotar esos elementos ${\ Displaystyle \ mu \ in {\ mathcal {P}} _ {p} (X)}$ que son regulares gaussianos : si ${\ Displaystyle g}$ es cualquier medida gaussiana estrictamente positiva en ${\ Displaystyle X}$ y ${\ Displaystyle g (N) = 0}$ , luego ${\ Displaystyle \ mu (N) = 0}$ además.

Dejar ${\ Displaystyle \ mu \ in {\ mathcal {P}} _ {p} ^ {r} (X)}$ , ${\ Displaystyle \ nu \ in {\ mathcal {P}} _ {p} (X)}$ , ${\ Displaystyle c (x, y) = | xy | ^ {p} / p}$ por ${\ Displaystyle p \ in (1, \ infty), p ^ {- 1} + q ^ {- 1} = 1}$ . Entonces el problema de Kantorovich tiene una solución única. ${\ Displaystyle \ kappa}$ , y esta solución es inducida por un mapa de transporte óptimo: es decir, existe un mapa de Borel ${\ Displaystyle r \ en L ^ {p} (X, \ mu; X)}$ tal que

{\ Displaystyle \ kappa = (\ mathrm {id} _ {X} \ times r) _ {*} (\ mu) \ in \ Gamma (\ mu, \ nu).}

Además, si ${\ Displaystyle \ nu}$ tiene soporte limitado , entonces

{\ Displaystyle r (x) = x- | \ nabla \ varphi (x) | ^ {q-2} \, \ nabla \ varphi (x)}

por ${\ Displaystyle \ mu}$ -casi todos ${\ Displaystyle x \ in X}$ para algunos Lipschitz localmente , c- cóncavo y potencial máximo de Kantorovich ${\ Displaystyle \ varphi}$ . (Aquí ${\ Displaystyle \ nabla \ varphi}$ denota el derivado de Gateaux de ${\ Displaystyle \ varphi}$ .)

Regularización entrópica

Considere una variante del problema discreto anterior, donde hemos agregado un término de regularización entrópica a la función objetivo del problema primario.

${\ Displaystyle \ min _ {\ gamma \ geq 0} \ sum _ {x \ in \ mathbf {X}, y \ in \ mathbf {Y}} \ gamma _ {xy} c_ {xy} + \ epsilon \ gamma _ {xy} \ ln \ gamma _ {xy}}$

S t ${\ Displaystyle \ sum _ {y \ in \ mathbf {Y}} \ gamma _ {xy} = \ mu _ {x}, \ forall x \ in \ mathbf {X}}$ y ${\ Displaystyle \ sum _ {x \ in \ mathbf {X}} \ gamma _ {xy} = \ nu _ {y}, \ forall y \ in \ mathbf {Y}}$

Se puede demostrar que el problema de la regularización dual es

${\ Displaystyle \ max _ {\ varphi, \ psi} \ sum _ {x \ in \ mathbf {X}} \ varphi _ {x} \ mu _ {x} + \ sum _ {y \ in \ mathbf {Y }} \ psi _ {y} v_ {y} - \ epsilon \ sum _ {x \ in \ mathbf {X}, y \ in \ mathbf {Y}} \ exp \ left ({\ frac {\ varphi _ { x} + \ psi _ {y} -c_ {xy}} {\ epsilon}} \ right) + \ epsilon}$

donde, en comparación con la versión no regularizada, la restricción "dura" en la anterior dual ( ${\ Displaystyle \ textstyle \ varphi _ {x} + \ psi _ {y} -c_ {xy} \ geq 0}$ ) ha sido reemplazado por una penalización "suave" de esa restricción (la suma de las ${\ Displaystyle \ textstyle \ epsilon \ exp \ left ((\ varphi _ {x} + \ psi _ {y} -c_ {xy}) / \ epsilon \ right)}$ términos). Las condiciones de optimalidad en el problema dual se pueden expresar como

Eq. 5.1:

{\ Displaystyle \ mu _ {x} = \ sum _ {y \ in \ mathbf {Y}} \ exp \ left ({\ frac {\ varphi _ {x} + \ psi _ {y} -c_ {xy} } {\ epsilon}} \ derecha) ~ \ forall x \ in \ mathbf {X}}

Eq. 5.2:

{\ Displaystyle \ nu _ {y} = \ sum _ {x \ in \ mathbf {X}} \ exp \ left ({\ frac {\ varphi _ {x} + \ psi _ {y} -c_ {xy} } {\ epsilon}} \ right) ~ \ forall y \ in \ mathbf {Y}}

Denotando ${\ Displaystyle \ textstyle A}$ como el ${\ Displaystyle \ textstyle \ left \ vert \ mathbf {X} \ right \ vert \ times \ left \ vert \ mathbf {Y} \ right \ vert}$ matriz de término ${\ Displaystyle \ textstyle A_ {xy} = \ exp \ left (-c_ {xy} / \ epsilon \ right)}$ , resolver el dual es, por tanto, equivalente a buscar dos matrices positivas diagonales ${\ Displaystyle \ textstyle D_ {1}}$ y ${\ Displaystyle \ textstyle D_ {2}}$ de tamaños respectivos ${\ Displaystyle \ textstyle \ left \ vert \ mathbf {X} \ right \ vert}$ y ${\ Displaystyle \ textstyle \ left \ vert \ mathbf {Y} \ right \ vert}$ , tal que ${\ Displaystyle \ textstyle D_ {1} AD_ {2} 1 _ {\ left \ vert \ mathbf {Y} \ right \ vert} = \ mu}$ y ${\ Displaystyle \ textstyle \ left (D_ {1} AD_ {2} \ right) ^ {\ top} 1 _ {\ left \ vert \ mathbf {X} \ right \ vert} = \ nu}$ . La existencia de tales matrices generaliza el teorema de Sinkhorn y las matrices se pueden calcular utilizando el algoritmo de Sinkhorn-Knopp , ^[16] que simplemente consiste en buscar iterativamente ${\ Displaystyle \ textstyle \ varphi _ {x}}$ para resolver la Ecuación 5.1 , y ${\ Displaystyle \ textstyle \ psi _ {y}}$ para resolver la Ecuación 5.2 . El algoritmo de Sinkhorn-Knopp es, por tanto, un algoritmo de descenso de coordenadas en el problema dual regularizado.

Aplicaciones

El transporte óptimo de Monge-Kantorovich ha encontrado aplicaciones en una amplia gama en diferentes campos. Entre ellos están:

Registro y deformación de imágenes ^[17]
Diseño de reflector ^[18]
Recuperación de información de la sombragrafía y la radiografía de protones ^[19]
Tomografía sísmica y sismología de reflexión ^[20]

Ver también

Métrica de Wasserstein
Función de transporte
Algoritmo húngaro
Planificación del transporte
La distancia del motor de la tierra

Referencias

^ G. Monge. Mémoire sur la théorie des déblais et des remblais. Histoire de l'Académie Royale des Sciences de Paris, avec les Mémoires de Mathématique et de Physique pour la même année , páginas 666–704, 1781.
^ Schrijver, Alexander , Optimización combinatoria , Berlín; Nueva York: Springer, 2003. ISBN 3540443894 . Cf. p. 362
^ Ivor Grattan-Guinness, Ivor, Enciclopedia compañera de la historia y la filosofía de las ciencias matemáticas , Volumen 1, JHU Press, 2003. Cf. p.831
^ L. Kantorovich. Sobre la translocación de masas. CR (Doklady) Acad. Sci. URSS (NS), 37: 199-201, 1942.
^ Cédric Villani (2003). Temas en transporte óptimo . American Mathematical Soc. pag. 66. ISBN 978-0-8218-3312-4.
^ Singiresu S. Rao (2009). Optimización de la ingeniería: teoría y práctica (4ª ed.). John Wiley e hijos. pag. 221. ISBN 978-0-470-18352-6.
^ Frank L. Hitchcock (1941) "La distribución de un producto de varias fuentes a numerosas localidades", MIT Journal of Mathematics and Physics 20: 224-230 MR0004469 .
^ DR Fulkerson (1956) Problema de transporte de Hitchcock , corporación RAND.
^ LR Ford Jr. y DR Fulkerson (1962) § 3.1 en Flujos en redes , página 95, Princeton University Press
^ L. Ambrosio, N. Gigli y G. Savaré. Flujos de gradiente en espacios métricos y en el espacio de medidas de probabilidad . Conferencias de Matemáticas ETH Zürich, Birkhäuser Verlag, Basel. (2005)
^ Angenent, S .; Haker, S .; Tannenbaum, A. (2003). "Minimización de flujos para el problema Monge-Kantorovich". SIAM J. Math. Anal . 35 (1): 61–97. CiteSeerX 10.1.1.424.1064 . doi : 10.1137 / S0036141002410927 .
^ a b c Galichon, Alfred . Métodos de transporte óptimos en economía . Prensa de la Universidad de Princeton, 2016.
^ Rachev, Svetlozar T. y Ludger Rüschendorf. Problemas de transporte masivo: Volumen I: Teoría . Vol. 1. Springer, 1998.
↑ Santambrogio, Filippo. Transporte óptimo para matemáticos aplicados . Birkhäuser Basel, 2016. En particular, el capítulo 6, sección 4.2.
^ Aurenhammer, Franz (1987), "Diagramas de potencia: propiedades, algoritmos y aplicaciones", SIAM Journal on Computing , 16 (1): 78–96, doi : 10.1137 / 0216006 , MR 0873251.
^ Peyré, Gabriel y Marco Cuturi (2019), "Transporte óptimo computacional: con aplicaciones a la ciencia de datos", Fundamentos y tendencias en el aprendizaje automático: vol. 11: núm. 5-6, págs. 355-607. DOI: 10.1561 / 2200000073 .
^ Haker, Steven; Zhu, Lei; Tannenbaum, Allen; Angenent, Sigurd (1 de diciembre de 2004). "Transporte masivo óptimo para registro y deformación". Revista Internacional de Visión por Computador . 60 (3): 225–240. CiteSeerX 10.1.1.59.4082 . doi : 10.1023 / B: VISI.0000036836.66311.97 . ISSN 0920-5691 . S2CID 13261370 .
^ Glimm, T .; Oliker, V. (1 de septiembre de 2003). "Diseño óptico de sistemas de reflector único y el problema de transferencia de masa de Monge-Kantorovich". Revista de Ciencias Matemáticas . 117 (3): 4096–4108. doi : 10.1023 / A: 1024856201493 . ISSN 1072-3374 . S2CID 8301248 .
^ Kasim, Muhammad Firmansyah; Ceurvorst, Luke; Ratan, Naren; Sadler, James; Chen, Nicholas; Sävert, Alexander; Trines, Raoul; Bingham, Robert; Burrows, Philip N. (16 de febrero de 2017). "Shadowgraphy cuantitativo y radiografía de protones para modulaciones de gran intensidad". Revisión E física . 95 (2): 023306. arXiv : 1607.04179 . Código bibliográfico : 2017PhRvE..95b3306K . doi : 10.1103 / PhysRevE.95.023306 . PMID 28297858 . S2CID 13326345 .
^ Metivier, Ludovic (24 de febrero de 2016). "Medición del desajuste entre sismogramas utilizando una distancia de transporte óptima: aplicación a la inversión de forma de onda completa" . Revista Geofísica Internacional . 205 (1): 345–377. Código bibliográfico : 2016GeoJI.205..345M . doi : 10.1093 / gji / ggw014 .

Otras lecturas

Brualdi, Richard A. (2006). Clases de matrices combinatorias . Enciclopedia de las matemáticas y sus aplicaciones. 108 . Cambridge: Cambridge University Press . ISBN 978-0-521-86565-4. Zbl 1106.05001 .

[Monge-1] G. Monge. Mémoire sur la théorie des déblais et des remblais. Histoire de l'Académie Royale des Sciences de Paris, avec les Mémoires de Mathématique et de Physique pour la même année , páginas 666–704, 1781.

[2] Schrijver, Alexander , Optimización combinatoria , Berlín; Nueva York: Springer, 2003. ISBN 3540443894 . Cf. p. 362

[3] Ivor Grattan-Guinness, Ivor, Enciclopedia compañera de la historia y la filosofía de las ciencias matemáticas , Volumen 1, JHU Press, 2003. Cf. p.831

[Kantorovich-4] L. Kantorovich. Sobre la translocación de masas. CR (Doklady) Acad. Sci. URSS (NS), 37: 199-201, 1942.

[Villani2003-5] Cédric Villani (2003). Temas en transporte óptimo . American Mathematical Soc. pag. 66. ISBN 978-0-8218-3312-4.

[RaoRao2009-6] Singiresu S. Rao (2009). Optimización de la ingeniería: teoría y práctica (4ª ed.). John Wiley e hijos. pag. 221. ISBN 978-0-470-18352-6.

[7] Frank L. Hitchcock (1941) "La distribución de un producto de varias fuentes a numerosas localidades", MIT Journal of Mathematics and Physics 20: 224-230 MR0004469 .

[8] DR Fulkerson (1956) Problema de transporte de Hitchcock , corporación RAND.

[9] LR Ford Jr. y DR Fulkerson (1962) § 3.1 en Flujos en redes , página 95, Princeton University Press

[AGS-10] L. Ambrosio, N. Gigli y G. Savaré. Flujos de gradiente en espacios métricos y en el espacio de medidas de probabilidad . Conferencias de Matemáticas ETH Zürich, Birkhäuser Verlag, Basel. (2005)

[AHT-11] Angenent, S .; Haker, S .; Tannenbaum, A. (2003). "Minimización de flujos para el problema Monge-Kantorovich". SIAM J. Math. Anal . 35 (1): 61–97. CiteSeerX 10.1.1.424.1064 . doi : 10.1137 / S0036141002410927 .

[Galichon2016-12] Galichon, Alfred . Métodos de transporte óptimos en economía . Prensa de la Universidad de Princeton, 2016.

[RL_MTP-13] Rachev, Svetlozar T. y Ludger Rüschendorf. Problemas de transporte masivo: Volumen I: Teoría . Vol. 1. Springer, 1998.

[14] Santambrogio, Filippo. Transporte óptimo para matemáticos aplicados . Birkhäuser Basel, 2016. En particular, el capítulo 6, sección 4.2.

[15] Aurenhammer, Franz (1987), "Diagramas de potencia: propiedades, algoritmos y aplicaciones", SIAM Journal on Computing , 16 (1): 78–96, doi : 10.1137 / 0216006 , MR 0873251.

[16] Peyré, Gabriel y Marco Cuturi (2019), "Transporte óptimo computacional: con aplicaciones a la ciencia de datos", Fundamentos y tendencias en el aprendizaje automático: vol. 11: núm. 5-6, págs. 355-607. DOI: 10.1561 / 2200000073 .

[17] Haker, Steven; Zhu, Lei; Tannenbaum, Allen; Angenent, Sigurd (1 de diciembre de 2004). "Transporte masivo óptimo para registro y deformación". Revista Internacional de Visión por Computador . 60 (3): 225–240. CiteSeerX 10.1.1.59.4082 . doi : 10.1023 / B: VISI.0000036836.66311.97 . ISSN 0920-5691 . S2CID 13261370 .

[18] Glimm, T .; Oliker, V. (1 de septiembre de 2003). "Diseño óptico de sistemas de reflector único y el problema de transferencia de masa de Monge-Kantorovich". Revista de Ciencias Matemáticas . 117 (3): 4096–4108. doi : 10.1023 / A: 1024856201493 . ISSN 1072-3374 . S2CID 8301248 .

[19] Kasim, Muhammad Firmansyah; Ceurvorst, Luke; Ratan, Naren; Sadler, James; Chen, Nicholas; Sävert, Alexander; Trines, Raoul; Bingham, Robert; Burrows, Philip N. (16 de febrero de 2017). "Shadowgraphy cuantitativo y radiografía de protones para modulaciones de gran intensidad". Revisión E física . 95 (2): 023306. arXiv : 1607.04179 . Código bibliográfico : 2017PhRvE..95b3306K . doi : 10.1103 / PhysRevE.95.023306 . PMID 28297858 . S2CID 13326345 .

[20] Metivier, Ludovic (24 de febrero de 2016). "Medición del desajuste entre sismogramas utilizando una distancia de transporte óptima: aplicación a la inversión de forma de onda completa" . Revista Geofísica Internacional . 205 (1): 345–377. Código bibliográfico : 2016GeoJI.205..345M . doi : 10.1093 / gji / ggw014 .

[1]