Teorema de separación de hiperplano

En geometría , el teorema de separación de hiperplanos es un teorema sobre conjuntos convexos disjuntos en el espacio euclidiano n- dimensional . Hay varias versiones bastante similares. En una versión del teorema, si ambos conjuntos son cerrados y al menos uno de ellos es compacto , entonces hay un hiperplano entre ellos e incluso dos hiperplanos paralelos entre ellos separados por un espacio. En otra versión, si ambos conjuntos convexos disjuntos están abiertos, entonces hay un hiperplano entre ellos, pero no necesariamente ningún espacio. Un eje que es ortogonal a un hiperplano de separación es un eje de separación, porque las proyecciones ortogonales de los cuerpos convexos sobre el eje son inconexas.

Ilustración del teorema de separación de hiperplano.

El teorema de la separación del hiperplano se debe a Hermann Minkowski . El teorema de separación de Hahn-Banach generaliza el resultado a espacios vectoriales topológicos .

Un resultado relacionado es el teorema del hiperplano de apoyo .

En el contexto de las máquinas de vectores de soporte , el hiperplano que separa de manera óptima o el hiperplano de margen máximo es un hiperplano que separa dos cascos convexos de puntos y es equidistante de los dos. ^[1]^[2]^[3]

Declaraciones y prueba

Teorema de separación de hiperplanos ^[4] - Sean A y B dos subconjuntos convexos no vacíos disjuntos de R ⁿ . Entonces existe un vector v distinto de cero y un número real c tal que

{\ Displaystyle \ langle x, v \ rangle \ geq c \, {\ text {y}} \ langle y, v \ rangle \ leq c}

para todo x en A e y en B ; es decir, el hiperplano ${\ Displaystyle \ langle \ cdot, v \ rangle = c}$ , V el vector normal, separa A y B .

La prueba se basa en el siguiente lema:

Lema - Dejar ${\ Displaystyle K}$ ser un subconjunto convexo cerrado no vacío de R ⁿ . Entonces existe un vector único en ${\ Displaystyle K}$ de norma mínima (longitud).

Prueba de lema : Let ${\ Displaystyle \ delta = \ inf \ {| x |: x \ in K \}.}$ Dejar ${\ Displaystyle x_ {j}}$ ser una secuencia en ${\ Displaystyle K}$ tal que ${\ Displaystyle | x_ {j} | \ to \ delta}$ . Tenga en cuenta que ${\ Displaystyle (x_ {i} + x_ {j}) / 2}$ es en ${\ Displaystyle K}$ desde ${\ Displaystyle K}$ es convexo y entonces ${\ Displaystyle | x_ {i} + x_ {j} | ^ {2} \ geq 4 \ delta ^ {2}}$ . Desde

{\ Displaystyle | x_ {i} -x_ {j} | ^ {2} = 2 | x_ {i} | ^ {2} +2 | x_ {j} | ^ {2} - | x_ {i} + x_ {j} | ^ {2} \ leq 2 | x_ {i} | ^ {2} +2 | x_ {j} | ^ {2} -4 \ delta ^ {2} \ to 0}

como ${\ Displaystyle i, j \ to \ infty}$ , ${\ Displaystyle x_ {i}}$ es una secuencia de Cauchy y por lo tanto tiene límite x en ${\ Displaystyle K}$ . Es único ya que si y está en ${\ Displaystyle K}$ y tiene norma δ, entonces ${\ Displaystyle | xy | ^ {2} \ leq 2 | x | ^ {2} +2 | y | ^ {2} -4 \ delta ^ {2} = 0}$ y x = y . ${\ Displaystyle \ cuadrado}$

Demostración del teorema : Dados conjuntos convexos no vacíos disjuntos A , B , sea

{\ Displaystyle K = A + (- B) = \ {xy \ mid x \ in A, y \ in B \}.}

Desde ${\ Displaystyle -B}$ es convexo y la suma de conjuntos convexos es convexa, ${\ Displaystyle K}$ es convexo. Por el lema, el cierre ${\ Displaystyle {\ overline {K}}}$ de ${\ Displaystyle K}$ , que es convexo, contiene un vector ${\ Displaystyle v}$ de norma mínima. Desde ${\ Displaystyle {\ overline {K}}}$ es convexo, para cualquier ${\ Displaystyle n}$ en ${\ Displaystyle K}$ , el segmento de línea

{\ Displaystyle v + t (nv), \, 0 \ leq t \ leq 1}

yace en ${\ Displaystyle {\ overline {K}}}$ y entonces

{\ Displaystyle | v | ^ {2} \ leq | v + t (nv) | ^ {2} = | v | ^ {2} + 2t \ langle v, nv \ rangle + t ^ {2} | nv | ^ {2}}

.

Para ${\ Displaystyle 0$ , así tenemos:

{\ Displaystyle 0 \ leq 2 \ langle v, n \ rangle -2 | v | ^ {2} + t | nv | ^ {2}}

y dejando ${\ Displaystyle t \ to 0}$ da: ${\ Displaystyle \ langle n, v \ rangle \ geq | v | ^ {2}}$ . Por tanto, para cualquier x en A e y en B , tenemos: ${\ Displaystyle \ langle xy, v \ rangle \ geq | v | ^ {2}}$ . Por tanto, si v es distinto de cero, la demostración es completa ya que

{\ Displaystyle \ inf _ {x \ in A} \ langle x, v \ rangle \ geq | v | ^ {2} + \ sup _ {y \ in B} \ langle y, v \ rangle.}

De manera más general (cubriendo el caso v = 0), tomemos primero el caso cuando el interior de ${\ Displaystyle K}$ no está vacío. El interior puede agotarse mediante una secuencia anidada de subconjuntos convexos compactos no vacíos ${\ Displaystyle K_ {1} \ subconjunto K_ {2} \ subconjunto K_ {3} \ subconjunto \ cdots}$ . ^{[ aclaración necesaria ]} Dado que 0 no está en ${\ Displaystyle K}$ , cada ${\ Displaystyle K_ {n}}$ contiene un vector distinto de cero ${\ Displaystyle v_ {n}}$ de longitud mínima y por el argumento de la primera parte, tenemos: ${\ Displaystyle \ langle x, v_ {n} \ rangle \ geq 0}$ para cualquier ${\ Displaystyle x \ in K_ {n}}$ . Podemos normalizar el ${\ Displaystyle v_ {n}}$ debe tener la longitud uno. Entonces la secuencia ${\ Displaystyle v_ {n}}$ contiene una subsecuencia convergente (porque la n-esfera es compacta) con límite v , que es distinto de cero. Tenemos ${\ Displaystyle \ langle x, v \ rangle \ geq 0}$ para cualquier x en el interior de ${\ Displaystyle K}$ y por continuidad lo mismo vale para todo x en ${\ Displaystyle K}$ . Ahora terminamos la prueba como antes. Finalmente, si ${\ Displaystyle K}$ tiene interior vacío, el conjunto afín que abarca tiene una dimensión menor que la de todo el espacio. como consecuencia ${\ Displaystyle K}$ está contenido en algún hiperplano ${\ Displaystyle \ langle \ cdot, v \ rangle = c}$ ; por lo tanto, ${\ Displaystyle \ langle x, v \ rangle \ geq c}$ para todo x en ${\ Displaystyle K}$ y terminamos la prueba como antes. ${\ Displaystyle \ cuadrado}$

El número de dimensiones debe ser finito. En los espacios de dimensión infinita hay ejemplos de dos conjuntos cerrados, convexos y disjuntos que no pueden ser separados por un hiperplano cerrado (un hiperplano donde un funcional lineal continuo es igual a alguna constante) incluso en el sentido débil donde las desigualdades no son estrictas. ^[5]

La prueba anterior también prueba la primera versión del teorema mencionado en el lede (para verlo, tenga en cuenta que ${\ Displaystyle K}$ en la demostración se cierra bajo la hipótesis del teorema siguiente.)

Teorema de separación I - Sean A y B dos conjuntos convexos cerrados no vacíos disjuntos, uno de los cuales es compacto. Entonces existe un vector v distinto de cero y números reales ${\ Displaystyle c_ {1}$ tal que

{\ Displaystyle \ langle x, v \ rangle> c_ {2} \, {\ text {y}} \ langle y, v \ rangle

para todos x en A y y en B .

Aquí, la compacidad de la hipótesis no se puede relajar; vea un ejemplo en la siguiente sección. Esta versión del teorema de la separación se generaliza a la dimensión infinita; la generalización se conoce más comúnmente como el teorema de separación de Hahn-Banach .

También tenemos:

Teorema de separación II - Sean A y B dos conjuntos convexos no vacíos disjuntos. Si A está abierto, entonces existe un vector v distinto de cero y un número real ${\ Displaystyle c}$ tal que

{\ Displaystyle \ langle x, v \ rangle> c \, {\ text {y}} \ langle y, v \ rangle \ leq c}

para todos x en A y y en B . Si ambos conjuntos están abiertos, entonces existe un vector v distinto de cero y un número real ${\ Displaystyle c}$ tal que

{\ Displaystyle \ langle x, v \ rangle> c \, {\ text {y}} \ langle y, v \ rangle }>

para todos x en A y y en B .

Esto se deriva de la versión estándar, ya que el hiperplano de separación no puede intersecar los interiores de los conjuntos convexos.

Inverso del teorema

Tenga en cuenta que la existencia de un hiperplano que sólo "separa" dos conjuntos convexos en el sentido débil de que ambas desigualdades no son estrictas, obviamente, no implica que los dos conjuntos sean disjuntos. Ambos conjuntos podrían tener puntos ubicados en el hiperplano.

Contraejemplos y singularidad

El teorema no se aplica si uno de los cuerpos no es convexo.

Si uno de A o B no es convexo, entonces hay muchos contraejemplos posibles. Por ejemplo, A y B podrían ser círculos concéntricos. Un contraejemplo más sutil es aquel en el que A y B están cerrados pero ninguno es compacto. Por ejemplo, si A es un semiplano cerrado y B está limitado por un brazo de una hipérbola, entonces no hay un hiperplano estrictamente separador:

{\ Displaystyle A = \ {(x, y): x \ leq 0 \}}

{\ Displaystyle B = \ {(x, y): x> 0, y \ geq 1 / x \}. \}

(Aunque, según un ejemplo del segundo teorema, hay un hiperplano que separa sus interiores). Otro tipo de contraejemplo tiene A compacto y B abierto. Por ejemplo, A puede ser un cuadrado cerrado y B puede ser un cuadrado abierto que toca A .

En la primera versión del teorema, evidentemente el hiperplano separador nunca es único. En la segunda versión, puede ser único o no. Técnicamente, un eje de separación nunca es único porque se puede trasladar; en la segunda versión del teorema, un eje de separación puede ser único hasta la traslación.

Uso en detección de colisiones

El teorema del eje de separación (SAT) dice que:

Dos objetos convexos no se superponen si existe una línea (llamada eje) sobre la cual las proyecciones de los dos objetos no se superponen.

SAT sugiere un algoritmo para probar si dos sólidos convexos se cruzan o no.

Independientemente de la dimensionalidad, el eje de separación es siempre una línea. Por ejemplo, en 3D, el espacio está separado por planos, pero el eje de separación es perpendicular al plano de separación.

El teorema del eje de separación se puede aplicar para la detección rápida de colisiones entre mallas poligonales. La dirección normal u otra característica de cada cara se utiliza como eje de separación. Tenga en cuenta que esto produce posibles ejes de separación, no líneas / planos de separación.

En 3D, el uso de caras normales por sí solas no logrará separar algunos casos de borde a borde que no colisionen. Se requieren ejes adicionales, que consisten en los productos cruzados de pares de bordes, uno tomado de cada objeto. ^[6]

Para una mayor eficiencia, los ejes paralelos se pueden calcular como un solo eje.

Ver también

Notas

^ Hastie, Trevor ; Tibshirani, Robert ; Friedman, Jerome (2008). Los elementos del aprendizaje estadístico: minería de datos, inferencia y predicción (PDF) (segunda edición). Nueva York: Springer. págs. 129-135.
^ Witten, Ian H .; Frank, Eibe; Hall, Mark A .; Pal, Christopher J. (2016). Minería de datos: herramientas y técnicas prácticas de aprendizaje automático (cuarta ed.). Morgan Kaufmann. págs. 253-254.
^ Deisenroth, Marc Peter; Faisal, A. Aldo; Ong, Cheng Soon (2020). Matemáticas para el aprendizaje automático . Prensa de la Universidad de Cambridge. págs. 337–338. ISBN 978-1-108-45514-5.
^ Boyd y Vandenberghe 2004 , ejercicio 2.22.
^ Haïm Brezis , Analyse fonctionnelle: théorie et applications , 1983, remarque 4, p. 7.
^ https://docs.godotengine.org/en/stable/tutorials/math/vectors_advanced.html#collision-detection-in-3d

Referencias

Boyd, Stephen P .; Vandenberghe, Lieven (2004). Optimización convexa (pdf) . Prensa de la Universidad de Cambridge. ISBN 978-0-521-83378-3.
Golshtein, EG; Tretyakov, NV (1996). Lagrangianos modificados y mapas monótonos en optimización . Nueva York: Wiley. pag. 6. ISBN 0-471-54821-9.
Shimizu, Kiyotaka; Ishizuka, Yo; Bard, Jonathan F. (1997). Programación matemática no diferenciable y de dos niveles . Boston: Editores académicos de Kluwer. pag. 19. ISBN 0-7923-9821-1.

enlaces externos

Detección y respuesta a colisiones

[1] Hastie, Trevor ; Tibshirani, Robert ; Friedman, Jerome (2008). Los elementos del aprendizaje estadístico: minería de datos, inferencia y predicción (PDF) (segunda edición). Nueva York: Springer. págs. 129-135.

[2] Witten, Ian H .; Frank, Eibe; Hall, Mark A .; Pal, Christopher J. (2016). Minería de datos: herramientas y técnicas prácticas de aprendizaje automático (cuarta ed.). Morgan Kaufmann. págs. 253-254.

[3] Deisenroth, Marc Peter; Faisal, A. Aldo; Ong, Cheng Soon (2020). Matemáticas para el aprendizaje automático . Prensa de la Universidad de Cambridge. págs. 337–338. ISBN 978-1-108-45514-5.

[4] Boyd y Vandenberghe 2004 , ejercicio 2.22.

[5] Haïm Brezis , Analyse fonctionnelle: théorie et applications , 1983, remarque 4, p. 7.

[6] ttps://docs.godotengine.org/en/stable/tutorials/math/vectors_advanced.html#collision-detection-in-3d

[1]