De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda
Caso de uso típico de la geometría epipolar
Dos cámaras toman una fotografía de la misma escena desde diferentes puntos de vista. La geometría epipolar luego describe la relación entre las dos vistas resultantes.

La geometría epipolar es la geometría de la visión estéreo . Cuando dos cámaras ven una escena 3D desde dos posiciones distintas, hay una serie de relaciones geométricas entre los puntos 3D y sus proyecciones en las imágenes 2D que generan restricciones entre los puntos de la imagen. Estas relaciones se derivan de la suposición de que las cámaras pueden aproximarse mediante el modelo de cámara estenopeica .

Definiciones [ editar ]

La siguiente figura muestra dos cámaras oscuras que buscan en el punto X . En las cámaras reales, el plano de la imagen está realmente detrás del centro focal y produce una imagen simétrica con respecto al centro focal de la lente. Aquí, sin embargo, el problema se simplifica colocando un plano de imagen virtual delante del centro focal, es decir, el centro óptico de cada lente de cámara para producir una imagen no transformada por la simetría. O L y O R representan los centros de simetría de las lentes de las dos cámaras. X representa el punto de interés en ambas cámaras. Puntos x L y x Rson las proyecciones del punto X sobre los planos de la imagen.

Geometría epipolar

Cada cámara captura una imagen 2D del mundo 3D. Esta conversión de 3D a 2D se denomina proyección en perspectiva y se describe mediante el modelo de cámara estenopeica. Es común modelar esta operación de proyección mediante rayos que emanan de la cámara, pasando por su centro focal. Cada rayo que emana corresponde a un único punto de la imagen.

Epipole o punto epipolar [ editar ]

Dado que los centros ópticos de las lentes de las cámaras son distintos, cada centro se proyecta en un punto distinto en el plano de imagen de la otra cámara. Estos dos puntos de imagen, denotados por e L y e R , se denominan epipolos o puntos epipolares . Ambas epipolas e L y e R en sus respectivos planos de imagen y ambos centros ópticos O L y O R se encuentran en una sola línea 3D.

Línea epipolar [ editar ]

La línea O L - X es vista por la cámara izquierda como un punto porque está directamente en línea con el centro óptico de la lente de esa cámara. Sin embargo, la cámara de la derecha ve esta línea como una línea en su plano de imagen. Esa línea ( e R - x R ) en la cámara derecha se llama línea epipolar . Simétricamente, la línea O R - X es vista por la cámara derecha como un punto y es vista como línea epipolar e L - x L por la cámara izquierda.

Una línea epipolar es función de la posición del punto X en el espacio 3D, es decir, a medida que X varía, se genera un conjunto de líneas epipolares en ambas imágenes. Dado que la línea 3D O L - X pasa a través del centro óptico de la lente O L , la línea epipolar correspondiente en la imagen de la derecha debe pasar a través del epipolar e R (y de manera correspondiente para las líneas epipolares en la imagen de la izquierda). Todas las líneas epipolares en una imagen contienen el punto epipolar de esa imagen. De hecho, cualquier línea que contenga el punto epipolar es una línea epipolar ya que puede derivarse de algún punto X 3D .

Plano epipolar [ editar ]

Como visualización alternativa, considere los puntos X , O L y O R que forman un plano llamado plano epipolar . El plano epipolar cruza el plano de la imagen de cada cámara donde forma líneas, las líneas epipolares. Todos los planos epipolares y las líneas epipolares se cruzan con el epipolar independientemente de dónde se encuentre X.

Restricción epipolar y triangulación [ editar ]

Si se conoce la posición relativa de las dos cámaras, esto conduce a dos observaciones importantes:

  • Suponga que se conoce el punto de proyección x L, que se conoce la línea epipolar e R - x R y que el punto X se proyecta en la imagen de la derecha, en un punto x R que debe estar en esta línea epipolar particular. Esto significa que para cada punto observado en una imagen, el mismo punto debe observarse en la otra imagen en una línea epipolar conocida. Esto proporciona una restricción epipolar : la proyección de X en el plano derecho de la cámara x R debe estar contenida en la línea epipolar e R - x R. Todos los puntos X, por ejemplo, X 1 ,X 2 , X 3 en la línea O L - X L verificará esa restricción. Significa que es posible probar si dos puntos corresponden al mismo punto 3D. Las limitaciones epipolares también pueden describirse mediante la matriz esencial o la matriz fundamental entre las dos cámaras.
  • Si se conocen los puntos x L y x R, también se conocen sus líneas de proyección. Si los dos puntos de imagen corresponden al mismo punto 3D X las líneas de proyección deben intersectar con precisión en X . Esto significa que X se puede calcular a partir de las coordenadas de los dos puntos de la imagen, un proceso llamado triangulación .

Casos simplificados [ editar ]

La geometría epipolar se simplifica si coinciden los dos planos de imagen de la cámara. En este caso, las líneas epipolares también coinciden ( e L - X L = e R - X R ). Además, las líneas epipolares son paralelas a la línea O L - O Rentre los centros de proyección y, en la práctica, puede alinearse con los ejes horizontales de las dos imágenes. Esto significa que para cada punto de una imagen, su punto correspondiente en la otra imagen se puede encontrar mirando solo a lo largo de una línea horizontal. Si las cámaras no se pueden colocar de esta manera, las coordenadas de la imagen de las cámaras se pueden transformar para emular tener un plano de imagen común. Este proceso se llama rectificación de imágenes .

Geometría epipolar del sensor pushbroom [ editar ]

En contraste con la cámara de fotograma convencional que usa un CCD bidimensional, la cámara pushbroom adopta una serie de CCD unidimensionales para producir una tira de imagen continua y larga que se denomina "alfombra de imagen". La geometría epipolar de este sensor es bastante diferente a la de las cámaras de proyección estenopeicas. Primero, la línea epipolar del sensor de empuje no es recta, sino una curva similar a una hipérbola. En segundo lugar, el par de "curvas" epipolares no existe. [1] Sin embargo, en algunas condiciones especiales, la geometría epipolar de las imágenes de satélite podría considerarse como un modelo lineal. [2]

Ver también [ editar ]

Referencias [ editar ]

  1. ^ Jaehong Oh. "Enfoque novedoso para el remuestreo epipolar de HRSI y georreferenciación de imágenes aéreas basada en imágenes estéreo de satélite" , 2011, consultado 2011-08-05.
  2. ^ Nurollah Tatar y Hossein Arefi. "Rectificación estéreo de imágenes de satélite pushbroom mediante la estimación robusta de la matriz fundamental" , 2019, págs. 1–19, consultado el 3 de junio de 2019.

Lectura adicional [ editar ]

  • Richard Hartley y Andrew Zisserman (2003). Geometría de vista múltiple en visión artificial . Prensa de la Universidad de Cambridge. ISBN 0-521-54051-8.
  • Quang-Tuan Luong. "Aprendizaje de geometría epipolar" . Centro de Inteligencia Artificial . SRI Internacional . Consultado el 4 de marzo de 2007 .
  • Robyn Owens . "Geometría epipolar" . Consultado el 4 de marzo de 2007 .
  • Linda G. Shapiro y George C. Stockman (2001). Visión por computadora . Prentice Hall. págs.  395 –403. ISBN 0-13-030796-3.
  • Vishvjit S. Nalwa (1993). Una visita guiada de visión artificial . Addison Wesley. págs. 216–240. ISBN 0-201-54853-4.
  • Roberto Cipolla y Peter Giblin (2000). Movimiento visual de curvas y superficies . Prensa de la Universidad de Cambridge, Cambridge. ISBN 0-521-63251-X.