Establecer problema de portada

El problema de cobertura de conjuntos es una cuestión clásica en combinatoria , informática , investigación de operaciones y teoría de la complejidad . Es uno de los 21 problemas NP-completo de Karp que se demostró que era NP-completo en 1972.

Se trata de un problema "cuyo estudio ha llevado al desarrollo de técnicas fundamentales para todo el campo" de los algoritmos de aproximación . ^[1]

Dado un conjunto de elementos ${\ Displaystyle \ {1,2, ..., n \}}$ (llamado el universo ) y una colección ${\ Displaystyle S}$ de ${\ Displaystyle m}$ conjuntos cuya unión es igual al universo, el problema de cobertura del conjunto es identificar la subcolección más pequeña de ${\ Displaystyle S}$ cuya unión es igual al universo. Por ejemplo, considere el universo ${\ Displaystyle U = \ {1,2,3,4,5 \}}$ y la colección de decorados ${\ Displaystyle S = \ {\ {1,2,3 \}, \ {2,4 \}, \ {3,4 \}, \ {4,5 \} \}}$ . Claramente la unión de ${\ Displaystyle S}$ es ${\ Displaystyle U}$ . Sin embargo, podemos cubrir todos los elementos con el siguiente número menor de conjuntos: ${\ Displaystyle \ {\ {1,2,3 \}, \ {4,5 \} \}}$ .

Más formalmente, dado un universo ${\ Displaystyle {\ mathcal {U}}}$ y una familia ${\ Displaystyle {\ mathcal {S}}}$ de subconjuntos de ${\ Displaystyle {\ mathcal {U}}}$ , una portada es una subfamilia ${\ Displaystyle {\ mathcal {C}} \ subseteq {\ mathcal {S}}}$ de conjuntos cuya unión es ${\ Displaystyle {\ mathcal {U}}}$ . En el conjunto que cubre el problema de decisión , la entrada es un par ${\ Displaystyle ({\ mathcal {U}}, {\ mathcal {S}})}$ y un entero ${\ Displaystyle k}$ ; la pregunta es si existe una cobertura de tamaño determinada ${\ Displaystyle k}$ o menos. En el problema de optimización de cobertura del conjunto , la entrada es un par ${\ Displaystyle ({\ mathcal {U}}, {\ mathcal {S}})}$ , y la tarea es encontrar una cobertura de conjuntos que utilice la menor cantidad de conjuntos.

La versión de decisión de la cobertura del conjunto es NP-complete , y la versión de optimización / búsqueda de la cobertura del conjunto es NP-hard . ^[2]

Si a cada conjunto se le asigna un costo, se convierte en un problema de cobertura de conjunto ponderado .

Formulación de programas lineales enteros

El problema de cobertura del conjunto mínimo se puede formular como el siguiente programa lineal de enteros (ILP). ^[3]

minimizar	${\ Displaystyle \ sum _ {S \ in {\ mathcal {S}}} x_ {S}}$		(minimizar el número de juegos)
sujeto a	${\ Displaystyle \ sum _ {S \ colon e \ in S} x_ {S} \ geqslant 1}$	para todos ${\ Displaystyle e \ in {\ mathcal {U}}}$	(cubre todos los elementos del universo)
	${\ Displaystyle x_ {S} \ in \ {0,1 \}}$	para todos ${\ Displaystyle S \ in {\ mathcal {S}}}$ .	(cada juego está en la portada del juego o no)

Este ILP pertenece a la clase más general de ILP para cubrir problemas . La brecha de integralidad de este ILP es como máximo ${\ Displaystyle \ scriptstyle \ log n}$ , por lo que su relajación da un factor- ${\ Displaystyle \ scriptstyle \ log n}$ algoritmo de aproximación para el problema de cobertura del conjunto mínimo (donde ${\ Displaystyle \ scriptstyle n}$ es el tamaño del universo). ^[4]

En la cubierta de conjuntos ponderados, a los conjuntos se les asignan pesos. Denote el peso del conjunto ${\ Displaystyle S \ in {\ mathcal {S}}}$ por ${\ Displaystyle w_ {S}}$ . Entonces, el programa lineal de enteros que describe la cobertura del conjunto ponderado es idéntico al dado anteriormente, excepto que la función objetivo para minimizar es ${\ Displaystyle \ sum _ {S \ in {\ mathcal {S}}} w_ {S} x_ {S}}$ .

Formulación de conjunto de golpes

La cobertura del set es equivalente al problema del set de golpes . Eso se ve al observar que una instancia de cobertura de conjunto puede verse como un gráfico bipartito arbitrario , con conjuntos representados por vértices a la izquierda, el universo representado por vértices a la derecha y aristas que representan la inclusión de elementos en conjuntos. La tarea es entonces encontrar un subconjunto de cardinalidad mínima de vértices izquierdos que cubra todos los vértices derechos. En el problema del conjunto de golpes, el objetivo es cubrir los vértices izquierdos utilizando un subconjunto mínimo de los vértices derechos. Por lo tanto, la conversión de un problema a otro se logra intercambiando los dos conjuntos de vértices.

Algoritmo codicioso

Existe un algoritmo codicioso para la aproximación de tiempo polinomial de la cobertura de conjuntos que elige conjuntos de acuerdo con una regla: en cada etapa, elija el conjunto que contiene la mayor cantidad de elementos descubiertos. Este método se puede implementar en el tiempo lineal en la suma de tamaños de los conjuntos de entrada, utilizando una cola de depósito para priorizar los conjuntos. ^[5] Alcanza una relación de aproximación de ${\ Displaystyle H (s)}$ , dónde ${\ Displaystyle s}$ es el tamaño del conjunto a cubrir. ^[6] En otras palabras, encuentra una cubierta que puede ser ${\ Displaystyle H (n)}$ veces tan grande como el mínimo, donde ${\ Displaystyle H (n)}$ es el ${\ Displaystyle n}$ -th armónico número :

{\ Displaystyle H (n) = \ sum _ {k = 1} ^ {n} {\ frac {1} {k}} \ leq \ ln {n} +1}

Este algoritmo codicioso en realidad logra una relación de aproximación de ${\ Displaystyle H (s ^ {\ prime})}$ dónde ${\ Displaystyle s ^ {\ prime}}$ es el conjunto de cardinalidad máxima de ${\ Displaystyle S}$ . Para ${\ Displaystyle \ delta -}$ casos densos, sin embargo, existe un ${\ Displaystyle c \ ln {m}}$ -algoritmo de aproximación para cada ${\ Displaystyle c> 0}$ . ^[7]

Estrecho ejemplo para el algoritmo codicioso con k = 3

Hay un ejemplo estándar en el que el algoritmo codicioso logra una relación de aproximación de ${\ Displaystyle \ log _ {2} (n) / 2}$ . El universo consta de ${\ Displaystyle n = 2 ^ {(k + 1)} - 2}$ elementos. El sistema de conjuntos consta de ${\ Displaystyle k}$ conjuntos disjuntos por pares ${\ Displaystyle S_ {1}, \ ldots, S_ {k}}$ con tallas ${\ Displaystyle 2,4,8, \ ldots, 2 ^ {k}}$ respectivamente, así como dos conjuntos disjuntos adicionales ${\ Displaystyle T_ {0}, T_ {1}}$ , cada uno de los cuales contiene la mitad de los elementos de cada ${\ Displaystyle S_ {i}}$ . En esta entrada, el algoritmo codicioso toma los conjuntos ${\ Displaystyle S_ {k}, \ ldots, S_ {1}}$ , en ese orden, mientras que la solución óptima consiste solo en ${\ Displaystyle T_ {0}}$ y ${\ Displaystyle T_ {1}}$ . Un ejemplo de tal entrada para ${\ Displaystyle k = 3}$ se muestra a la derecha.

Los resultados de inaproximación muestran que el algoritmo codicioso es esencialmente el mejor algoritmo de aproximación de tiempo polinomial posible para la cobertura de conjuntos hasta términos de orden inferior (consulte los resultados de inaproximación a continuación), bajo supuestos de complejidad plausibles. Un análisis más estricto del algoritmo codicioso muestra que la relación de aproximación es exactamente ${\ Displaystyle \ ln {n} - \ ln {\ ln {n}} + \ Theta (1)}$ . ^[8]

Sistemas de baja frecuencia

Si cada elemento ocurre en un máximo de conjuntos f , entonces se puede encontrar una solución en el tiempo polinomial que se aproxime al óptimo dentro de un factor de f usando relajación LP .

Si la restricción ${\ Displaystyle x_ {S} \ in \ {0,1 \}}$ es reemplazado por ${\ Displaystyle x_ {S} \ geq 0}$ para todos los S en ${\ Displaystyle {\ mathcal {S}}}$ en el número entero lineal programa mostrado anteriormente , entonces se convierte en un (no entero) lineal programa L . El algoritmo se puede describir de la siguiente manera:

Encuentre una solución óptima O para el programa L usando algún método de tiempo polinomial para resolver programas lineales.
Recoger todos los conjuntos S para el que la variable correspondiente x _S tiene un valor de al menos 1 / f en la solución de O . ^[9]

Resultados de inapropiabilidad

Cuándo ${\ Displaystyle n}$ se refiere al tamaño del universo, Lund y Yannakakis (1994) mostraron que la cobertura del conjunto no se puede aproximar en tiempo polinomial dentro de un factor de ${\ Displaystyle {\ tfrac {1} {2}} \ log _ {2} {n} \ aproximadamente 0,72 \ ln {n}}$ , a menos que NP tenga algoritmos de tiempo cuasi-polinomiales . Feige (1998) mejoró este límite inferior para ${\ Displaystyle {\ bigl (} 1-o (1) {\ bigr)} \ cdot \ ln {n}}$ bajo los mismos supuestos, que esencialmente coincide con la relación de aproximación lograda por el algoritmo codicioso. Raz y Safra (1997) establecieron un límite inferior de ${\ Displaystyle c \ cdot \ ln {n}}$ , dónde ${\ Displaystyle c}$ es una cierta constante, bajo el supuesto más débil de que P ${\ Displaystyle \ not =}$ NP . Un resultado similar con un valor más alto de ${\ Displaystyle c}$ fue probado recientemente por Alon, Moshkovitz & Safra (2006) . Dinur y Steurer (2013) mostraron una inaproximación óptima al demostrar que no se puede aproximar a ${\ Displaystyle {\ bigl (} 1-o (1) {\ bigr)} \ cdot \ ln {n}}$ a menos que P ${\ displaystyle =}$ NP .

Funda de juego ponderada

Al relajar el programa lineal de enteros para la cobertura del conjunto ponderado indicado anteriormente , se puede usar el redondeo aleatorio para obtener un ${\ Displaystyle O (\ log n)}$ -aproximación de factores. El análisis correspondiente para la cobertura del conjunto no ponderado se describe en Redondeo aleatorio # Algoritmo de redondeo aleatorio para la cobertura del conjunto y se puede adaptar al caso ponderado. ^[10]

Problemas relacionados

Golpear el set es una reformulación equivalente de Set Cover.
La cubierta de vértice es un caso especial de Hitting Set.
La funda Edge es un caso especial de Set Cover.
La cobertura de conjunto geométrico es un caso especial de cobertura de conjunto cuando el universo es un conjunto de puntos en ${\ Displaystyle \ mathbb {R} ^ {d}}$ y los conjuntos son inducidos por la intersección del universo y las formas geométricas (por ejemplo, discos, rectángulos).
Establecer embalaje
El problema de cobertura máxima es elegir como máximo k conjuntos para cubrir tantos elementos como sea posible.
El conjunto dominante es el problema de seleccionar un conjunto de vértices (el conjunto dominante) en un gráfico de modo que todos los demás vértices sean adyacentes a al menos un vértice en el conjunto dominante. Se demostró que el problema del set dominante es NP completo mediante una reducción de la cobertura del set.
El problema exacto de la cubierta es elegir una cubierta de juego sin ningún elemento incluido en más de un juego de cubierta.

Notas

^ Vazirani (2001 , p. 15)
^ Korte y Vygen 2012 , p. 414.
↑ Vazirani (2001 , p. 108)
^ Vazirani (2001 , págs. 110-112)
^ Cormen, Thomas H .; Leiserson, Charles E .; Rivest, Ronald L .; Stein, Clifford (2009) [1990], "Ejercicio 35.3-3", Introducción a los algoritmos (3ª ed.), MIT Press y McGraw-Hill, p. 1122, ISBN 0-262-03384-4
^ Chvatal, V.Una heurística codiciosa para el problema de cobertura de conjuntos . Matemáticas de la investigación operativa Vol. 4, núm. 3 (agosto de 1979), págs.
^ Karpinski y Zelikovsky 1998
^ Slavík Petr Un análisis riguroso del algoritmo codicioso para la cobertura del set . STOC'96, páginas 435-441, doi : 10.1145 / 237814.237991
^ Vazirani (2001 , págs. 118-119)
↑ Vazirani (2001 , Capítulo 14)

Referencias

Alon, Noga ; Moshkovitz, Dana ; Safra, Shmuel (2006), "Construcción algorítmica de conjuntos para k-restricciones", ACM Trans. Algoritmos , 2 (2): 153–177, CiteSeerX 10.1.1.138.8682 , doi : 10.1145 / 1150334.1150336 , ISSN 1549-6325 , S2CID 11922650.
Cormen, Thomas H .; Leiserson, Charles E .; Rivest, Ronald L .; Stein, Clifford (2001), Introducción a los algoritmos , Cambridge, Mass .: MIT Press y McGraw-Hill, págs. 1033–1038, ISBN 978-0-262-03293-3
Feige, Uriel (1998), "Un umbral de ln n para aproximar la cobertura del conjunto", Journal of the ACM , 45 (4): 634–652, CiteSeerX 10.1.1.70.5014 , doi : 10.1145 / 285055.285059 , ISSN 0004-5411 , S2CID 52827488.
Karpinski, Marek; Zelikovsky, Alexander (1998), Aproximación de casos densos de problemas de cobertura , 40 , págs. 169-178, ISBN 9780821870846 Parámetro desconocido |book-title=ignorado ( ayuda )
Lund, Carsten ; Yannakakis, Mihalis (1994), "Sobre la dureza de la aproximación de problemas de minimización", Journal of the ACM , 41 (5): 960–981, doi : 10.1145 / 185675.306789 , ISSN 0004-5411 , S2CID 9021065.
Raz, Ran ; Safra, Shmuel (1997), "Una prueba sub-constante de probabilidad de error de bajo grado, y una caracterización PCP de probabilidad de error sub-constante de NP", STOC '97: Actas del vigésimo noveno simposio anual de ACM sobre teoría de informática , ACM, págs. 475–484, ISBN 978-0-89791-888-6.
Dinur, Irit ; Steurer, David (2013), "Enfoque analítico de la repetición paralela", STOC '14: Actas del cuadragésimo sexto simposio anual de ACM sobre teoría de la computación , ACM, págs. 624–633.
Vazirani, Vijay V. (2001), Algoritmos de aproximación (PDF) , Springer-Verlag, ISBN 978-3-540-65367-7
Korte, Bernhard; Vygen, Jens (2012), Optimización combinatoria: teoría y algoritmos (5 ed.), Springer, ISBN 978-3-642-24487-2
Cardoso, Nuno; Abreu, Rui (2014), An Efficient Distributed Algorithm for Computing Minimal Hitting Sets (PDF) , Graz, Austria, doi : 10.5281 / zenodo.10037 Parámetro desconocido |book-title=ignorado ( ayuda )

enlaces externos

Puntos de referencia con soluciones óptimas ocultas para la cobertura del set, el embalaje del set y la determinación del ganador
Un compendio de problemas de optimización de NP - Cobertura mínima del conjunto

[1] Vazirani (2001 , p. 15)

[FOOTNOTEKorteVygen2012414-2] Korte y Vygen 2012 , p. 414.

[3] Vazirani (2001 , p. 108)

[4] Vazirani (2001 , págs. 110-112)

[5] Cormen, Thomas H .; Leiserson, Charles E .; Rivest, Ronald L .; Stein, Clifford (2009) [1990], "Ejercicio 35.3-3", Introducción a los algoritmos (3ª ed.), MIT Press y McGraw-Hill, p. 1122, ISBN 0-262-03384-4

[6] Chvatal, V.Una heurística codiciosa para el problema de cobertura de conjuntos . Matemáticas de la investigación operativa Vol. 4, núm. 3 (agosto de 1979), págs.

[7] Karpinski y Zelikovsky 1998

[8] Slavík Petr Un análisis riguroso del algoritmo codicioso para la cobertura del set . STOC'96, páginas 435-441, doi : 10.1145 / 237814.237991

[9] Vazirani (2001 , págs. 118-119)

[10] Vazirani (2001 , Capítulo 14)

[1]