Disparidad binocular

La disparidad binocular se refiere a la diferencia en la ubicación de la imagen de un objeto visto por los ojos izquierdo y derecho , como resultado de la separación horizontal de los ojos ( paralaje ). El cerebro utiliza la disparidad binocular para extraer información de profundidad de las imágenes retinianas bidimensionales en estereopsis . En la visión por computadora , la disparidad binocular se refiere a la diferencia en las coordenadas de características similares dentro de dos imágenes estéreo.

Se puede usar una disparidad similar en la determinación de distancia mediante un telémetro de coincidencia para determinar la distancia y / o altitud a un objetivo. En astronomía, la disparidad entre diferentes lugares de la Tierra se puede utilizar para determinar varios paralaje celestes , y la órbita de la Tierra se puede utilizar para el paralaje estelar .

Definición

Figura 1. Definición de disparidad binocular (lejana y cercana).

Los ojos humanos están separados horizontalmente por unos 50-75 mm ( distancia interpupilar ) dependiendo de cada individuo. Por lo tanto, cada ojo tiene una visión ligeramente diferente del mundo que lo rodea. Esto se puede ver fácilmente al cerrar alternativamente un ojo mientras mira un borde vertical. La disparidad binocular se puede observar por el aparente desplazamiento horizontal del borde vertical entre ambas vistas.

En un momento dado, la línea de visión de los dos ojos se encuentra en un punto del espacio. Este punto en el espacio se proyecta hacia la misma ubicación (es decir, el centro) en la retina de los dos ojos. Sin embargo, debido a los diferentes puntos de vista observados por el ojo izquierdo y el derecho, muchos otros puntos en el espacio no caen en las ubicaciones retinianas correspondientes. La disparidad visual binocular se define como la diferencia entre el punto de proyección en los dos ojos y generalmente se expresa en grados como el ángulo visual . ^[1]

El término "disparidad binocular" se refiere a medidas geométricas realizadas en el exterior del ojo. La disparidad de las imágenes en la retina real depende de factores internos del ojo, especialmente la ubicación de los puntos nodales, incluso si la sección transversal de la retina es un círculo perfecto. La disparidad en la retina se ajusta a la disparidad binocular cuando se mide en grados, mientras que es muy diferente si se mide como distancia debido a la complicada estructura dentro del ojo.

Figura 1: El círculo negro completo es el punto de fijación. El objeto azul se encuentra más cerca del observador. Por lo tanto, tiene una disparidad "cercana" d _n . Los objetos que se encuentran más lejos (verde) tienen correspondientemente una disparidad "lejana" d _f . La disparidad binocular es el ángulo entre dos líneas de proyección. Uno de los cuales es la proyección real desde el objeto hasta el punto real de proyección. El otro es la proyección imaginaria que atraviesa el punto nodal del punto de fijación.

En visión por computadora, la disparidad binocular se calcula a partir de imágenes estéreo tomadas de un conjunto de cámaras estéreo. La distancia variable entre estas cámaras, llamada línea de base, puede afectar la disparidad de un punto específico en su plano de imagen respectivo. A medida que aumenta la línea de base, la disparidad aumenta debido al mayor ángulo necesario para alinear la mira en el punto. Sin embargo, en la visión por computadora, se hace referencia a la disparidad binocular como diferencias de coordenadas del punto entre las imágenes derecha e izquierda en lugar de un ángulo visual. Las unidades se miden generalmente en píxeles.

Engañando neuronas con imágenes 2D

Figura 2. Simulación de disparidad de profundidad en el plano. (se relaciona con la Figura 1)

Las células cerebrales ( neuronas ) en una parte del cerebro responsable de procesar la información visual proveniente de las retinas ( corteza visual primaria ) pueden detectar la existencia de disparidad en la información que reciben de los ojos. Específicamente, estas neuronas estarán activas, si un objeto con "su" disparidad especial se encuentra dentro de la parte del campo visual a la que tienen acceso ( campo receptivo ). ^[2]

Los investigadores que investigan las propiedades precisas de estas neuronas con respecto a la disparidad presentan estímulos visuales con diferentes disparidades a las células y observan si están activas o no. Una posibilidad de presentar estímulos con diferentes disparidades es colocar objetos en profundidad variable frente a los ojos. Sin embargo, el inconveniente de este método puede no ser lo suficientemente preciso para los objetos colocados más lejos, ya que poseen disparidades más pequeñas, mientras que los objetos más cercanos tendrán disparidades mayores. En cambio, los neurocientíficos utilizan un método alternativo como se esquematiza en la Figura 2.

Figura 2: La disparidad de un objeto con una profundidad diferente a la del punto de fijación se puede producir alternativamente presentando una imagen del objeto en un ojo y una versión desplazada lateralmente de la misma imagen en el otro ojo. El círculo negro completo es el punto de fijación. Se colocan objetos en diferentes profundidades a lo largo de la línea de fijación del ojo izquierdo. La misma disparidad producida por un cambio en la profundidad de un objeto (círculos de colores rellenos) también puede producirse desplazando lateralmente el objeto en profundidad constante en la imagen que ve un ojo (círculos negros con margen de color). Tenga en cuenta que para las disparidades cercanas, el desplazamiento lateral debe ser mayor para corresponder a la misma profundidad en comparación con las disparidades lejanas. Esto es lo que los neurocientíficos suelen hacer con los estímulos de puntos aleatorios para estudiar la selectividad de la disparidad de las neuronas, ya que la distancia lateral requerida para probar las disparidades es menor que las distancias requeridas mediante pruebas de profundidad. Este principio también se ha aplicado en ilusiones de autostereograma .

Calcular la disparidad utilizando imágenes estéreo digitales

La disparidad de características entre dos imágenes estéreo generalmente se calcula como un desplazamiento a la izquierda de una característica de imagen cuando se ve en la imagen de la derecha. ^[3] Por ejemplo, un solo punto que aparece en la coordenada x t (medido en píxeles ) en la imagen de la izquierda puede estar presente en la coordenada x t - 3 en la imagen de la derecha. En este caso, la disparidad en esa ubicación en la imagen de la derecha sería de 3 píxeles.

Es posible que las imágenes estéreo no siempre estén alineadas correctamente para permitir un cálculo rápido de la disparidad. Por ejemplo, el conjunto de cámaras puede girarse ligeramente fuera de nivel. A través de un proceso conocido como rectificación de imagen , ambas imágenes se rotan para permitir disparidades solo en la dirección horizontal (es decir, no hay disparidad en las coordenadas de la imagen y ). ^[3] Esta es una propiedad que también se puede lograr mediante la alineación precisa de las cámaras estéreo antes de la captura de imágenes.

Algoritmo informático

Después de la rectificación, el problema de correspondencia se puede resolver utilizando un algoritmo que escanea las imágenes izquierda y derecha en busca de características de imagen coincidentes. Un enfoque común para este problema es formar un parche de imagen más pequeño alrededor de cada píxel de la imagen de la izquierda. Estos parches de imagen se comparan con todas las posibles disparidades en la imagen de la derecha comparando sus parches de imagen correspondientes. Por ejemplo, para una disparidad de 1, el parche de la imagen de la izquierda se compararía con un parche de tamaño similar de la derecha, desplazado un píxel hacia la izquierda. La comparación entre estos dos parches se puede realizar obteniendo una medida computacional de una de las siguientes ecuaciones que compara cada uno de los píxeles en los parches. Para todas las siguientes ecuaciones, L y R se refieren a las columnas izquierda y derecha, mientras que r y c se refieren a la fila y columna actual de cualquiera de las imágenes que se están examinando. d se refiere a la disparidad de la imagen de la derecha.

Correlación normalizada: ${\ Displaystyle {\ frac {\ sum {\ sum {L (r, c) \ cdot R (r, cd)}}} {\ sqrt {(\ sum {\ sum {L (r, c) ^ {2 }}}) \ cdot (\ sum {\ sum {R (r, cd) ^ {2}}})}}}}$
Suma de diferencias al cuadrado: ${\ Displaystyle \ sum {\ sum {(L (r, c) -R (r, cd)) ^ {2}}}}$
Suma de diferencias absolutas: ${\ Displaystyle \ sum {\ sum {\ left | L (r, c) -R (r, cd) \ right \ vert}}}$

La disparidad con el valor calculado más bajo utilizando uno de los métodos anteriores se considera la disparidad para la característica de la imagen. Esta puntuación más baja indica que el algoritmo ha encontrado la mejor coincidencia de características correspondientes en ambas imágenes.

El método descrito anteriormente es un algoritmo de búsqueda de fuerza bruta . Con parches grandes y / o tamaños de imagen, esta técnica puede llevar mucho tiempo ya que los píxeles se vuelven a examinar constantemente para encontrar la puntuación de correlación más baja. Sin embargo, esta técnica también implica una repetición innecesaria, ya que muchos píxeles se superponen. Un algoritmo más eficiente implica recordar todos los valores del píxel anterior. Un algoritmo aún más eficiente implica recordar las sumas de las columnas de la fila anterior (además de recordar todos los valores del píxel anterior). Las técnicas que guardan información previa pueden aumentar en gran medida la eficiencia algorítmica de este proceso de análisis de imágenes.

Usos de la disparidad de las imágenes

El conocimiento de la disparidad se puede utilizar para extraer más información de imágenes estéreo. Un caso en el que la disparidad es más útil es para el cálculo de profundidad / distancia. La disparidad y la distancia de las cámaras están inversamente relacionadas. A medida que aumenta la distancia de las cámaras, la disparidad disminuye. Esto permite la percepción de profundidad en imágenes estéreo. Usando geometría y álgebra, los puntos que aparecen en las imágenes estéreo 2D se pueden mapear como coordenadas en el espacio 3D.

Este concepto es particularmente útil para la navegación. Por ejemplo, el Mars Exploration Rover utiliza un método similar para escanear el terreno en busca de obstáculos. ^[4] El rover captura un par de imágenes con sus cámaras de navegación estereoscópicas y se realizan cálculos de disparidad para detectar objetos elevados (como rocas). ^[5] Además, los datos de ubicación y velocidad se pueden extraer de imágenes estéreo posteriores midiendo el desplazamiento de los objetos en relación con el rover. En algunos casos, esta es la mejor fuente de este tipo de información, ya que los sensores del codificador en las ruedas pueden ser inexactos debido al deslizamiento de los neumáticos.

En la cultura popular

La disparidad binocular forma la premisa de un boceto de la película El mundo de Wayne en el que Wayne, que está acostado en la cama como el personaje de Tia Carrere , Cassandra, se posa sobre él, compara las imágenes respectivas de sus ojos izquierdo y derecho mientras observa cuál es cuál. diciendo "Cámara 1 ... Cámara 2 ... Cámara 1 ... Cámara 2."

Ver también

Referencias

^ Qian, N., Disparidad binocular y la percepción de profundidad , Neuron, 18, 359-368, 1997.
^ González, F. y Pérez, R., Mecanismos neuronales subyacentes a la visión estereoscópica , Prog Neurobiol, 55 (3), 191-224, 1998.
↑ ^a ^b Linda G. Shapiro y George C. Stockman (2001). Visión por computador. Prentice Hall, 371–409. ISBN 0-13-030796-3 .
^ "El laboratorio de visión por computadora". JPL.NASA.GOV. JPL / NASA, nd Web. 5 de junio de 2011. < https://www-robotics.jpl.nasa.gov/facilities/facilityImage.cfm?Facility=13&Image=335 >.
^ "Nave espacial: Operaciones de superficie: Rover". JPL.NASA.GOV. JPL / NASA, nd Web. 5 de junio de 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html .

[binocular-1] Qian, N., Disparidad binocular y la percepción de profundidad , Neuron, 18, 359-368, 1997.

[neural-2] González, F. y Pérez, R., Mecanismos neuronales subyacentes a la visión estereoscópica , Prog Neurobiol, 55 (3), 191-224, 1998.

[comp_vision-3] Linda G. Shapiro y George C. Stockman (2001). Visión por computador. Prentice Hall, 371–409. ISBN 0-13-030796-3 .

[4] "El laboratorio de visión por computadora". JPL.NASA.GOV. JPL / NASA, nd Web. 5 de junio de 2011. < https://www-robotics.jpl.nasa.gov/facilities/facilityImage.cfm?Facility=13&Image=335 >.

[5] "Nave espacial: Operaciones de superficie: Rover". JPL.NASA.GOV. JPL / NASA, nd Web. 5 de junio de 2011. http://marsrovers.jpl.nasa.gov/mission/spacecraft_rover_eyes.html .

[1]