2.5D (percepción visual)


2.5D se describe como un efecto en la percepción visual, especialmente la visión estereoscópica , donde el entorno 3D del observador se proyecta en los planos 2D de las retinas . [ cuando se define como? ] Si bien el efecto sigue siendo esencialmente 2D, permite la percepción de profundidad . Este es un aspecto de la visión estereoscópica que le permite al ojo discernir la diferencia entre dos elementos en lugar de encontrar la profundidad exacta de un único entorno en el campo de visión. [1] La vista 2.5D se puede obtener combinando varias imágenes 2D y las computadoras pueden usar esta técnica para hacer que los rostros humanos parezcan reales. [2]

Una imagen 2.5d

2.5D es la construcción de un entorno tridimensional a partir de proyecciones retinianas 2D. [3] [4] [5] 2.5D es la capacidad de percibir el entorno físico, lo que nos permite comprender las relaciones entre los objetos y nosotros mismos. [4] La percepción del entorno físico es limitada debido a problemas visuales y cognitivos. El problema visual es la falta de objetos en el espacio tridimensional para ser fotografiados con la misma proyección, mientras que el problema cognitivo es que la percepción de un objeto depende del espectador. [4] El trabajo de David Marr en 2.5D Sketch ha encontrado que 2.5D tiene restricciones de proyección visual. Existen restricciones de proyección 2.5D porque "partes de las imágenes son siempre discontinuidades (deformadas) en la luminancia". [4] Por lo tanto, en realidad, no vemos todo nuestro entorno, sino que construimos la vista tridimensional centrada en el espectador de nuestro entorno.

Un aspecto principal en lo que respecta al sistema visual humano es la percepción borrosa. Esto juega un papel vital en el enfoque ocular para lograr una claridad fundamental en las imágenes de la retina. [6] La percepción visual es un sistema complejo en el que la percepción borrosa juega un papel clave al enfocarse en objetos cercanos o lejanos. Los patrones de enfoque retiniano son críticos en la percepción borrosa, ya que estos patrones están compuestos por desenfoque retiniano distal y proximal. Dependiendo de la distancia del objeto y el movimiento de la persona que lo ve, estos patrones contienen un equilibrio y un desequilibrio de enfoque en ambas direcciones. [6]

Las percepciones humanas del desenfoque implican ideas de detección de desenfoque y discriminación de desenfoque en detalle. También atraviesa la retina central y periférica. El modelo tiene una naturaleza muy cambiante y se muestra que un modelo de percepción borrosa está en el espacio dióptrico mientras se ve de cerca. El modelo puede tener sugerencias de acuerdo con la percepción de profundidad y el control acomodativo. [6]

Los datos del rango 2.5D se obtienen mediante un sistema de imágenes de rango , y la imagen en color 2D se toma con una cámara a color normal. Estos dos conjuntos de datos se procesan individualmente y luego se combinan. La salida del rostro humano será realista y se puede manipular mediante herramientas de gráficos por computadora. En la identificación automática de rostros humanos, esta herramienta puede proporcionar detalles completos sobre el rostro. [7] Hay tres enfoques diferentes en la detección de bordes de color: (a) para detectar bordes en cada color de forma independiente y luego combinarlos; (b) para detectar bordes en el 'canal de luminancia' y utilizar los canales de crominancia para ayudar a tomar otras decisiones; y (c) tratar la imagen en color como un campo vectorial y utilizar las derivadas del campo vectorial como gradiente de color para la detección de bordes.

2.5D ( percepción visual ) se ha convertido en un enfoque automático para hacer modelos de rostros humanos. Es un sistema individual con la entrada en forma de un conjunto de datos de rango y una imagen de percepción de color de un rostro humano. Para obtener la información necesaria para sintetizar instantáneamente un modelo facial realista, estas dos fuentes se procesan por separado. Dichos datos retratan los sitios anatómicos de las características y los datos geométricos de la cara. Los límites de los rasgos faciales y los atributos de las texturas faciales son el resultado de la información extraída de la imagen del color facial. Se produce un modelo facial volumétrico mediante la integración de estas dos fuentes. [8] Los dos métodos de localización de características pueden utilizarse mediante el concepto de plantilla deformable y la técnica de detección de bordes cromáticos. [9] Hay muchos usos para un modelo de rostro humano, como en medicina, identificación, animación por computadora y codificación inteligente. [10]

Los conjuntos de datos 2.5D se pueden representar convenientemente en un marco de recuadros, que son recuadros alineados con el eje que no se cruzan y que se pueden utilizar para representar directamente objetos en la escena o como volúmenes delimitadores. El trabajo de Leonidas J. Guibas y Yuan Yao mostró que los rectángulos disjuntos alineados con el eje en el plano se pueden ordenar en cuatro órdenes totales para que cualquier rayo los encuentre en uno de los cuatro órdenes. Se ha demostrado que este trabajo también es aplicable a los recuadros en este contexto y ha demostrado que existen cuatro particiones diferentes de los recuadros en secuencias ordenadas de conjuntos disjuntos. Estos se denominan antichains y permiten que los boxels en un antichain actúen como oclusores de los boxels en antichains posteriores. El tiempo de ejecución esperado para la partición antichain es O (n log n), donde n es el número de cajas. Esta partición se puede utilizar para la implementación eficiente de recorridos virtuales y trazado de rayos. [11]

Se ha propuesto un enfoque automático para hacer modelos de rostros humanos. Es un sistema separado con la entrada en forma de un rango de conjuntos de datos y una imagen en color de un rostro humano. Estas dos fuentes se procesan individualmente para obtener la información necesaria para sintetizar automáticamente un modelo facial realista. La información obtenida del conjunto de datos de rango facial incluye los sitios anatómicos de las características y los datos geométricos de la cara. La información extraída de la imagen de color facial son los límites de los rasgos faciales y los atributos de las texturas faciales. Estas dos fuentes se integran para producir un modelo facial volumétrico. El sistema de imágenes de rango tiene ventajas tales como evitar problemas a través de la medición por contacto. Esto sería más fácil de mantener y es mucho más seguro, y otras ventajas también incluyen que no es necesario calibrar al medir un objeto de similitud y permitir que la máquina sea apropiada para la medición de datos de rango facial. [12]

La percepción de una persona de construir una representación visual de un objeto corresponde a tres etapas sucesivas. En primer lugar, el componente de representación 2D permite un proceso descriptivo aproximado realizado sobre el objeto percibido. En segundo lugar, el componente de representación 2.5D agrega propiedades visuoespaciales detalladas a la superficie del objeto. En tercer lugar, el componente de representación 3D agrega percepción de profundidad y volumen al objeto. [13]

  1. ^ Leer, JCA; Phillipson, GP; Serrano-Pedraza, I; Milner, AD; Parker, AJ (2010). "Visión estereoscópica sobre la ausencia de la corteza occipital lateral" . PLOS ONE . 5 (9): e12608. Código Bibliográfico : 2010PLoSO ... 512608R . doi : 10.1371 / journal.pone.0012608 . PMC  2935377 . PMID  20830303 .
  2. ^ Kang, C., Chen, Y. y Hsu, W. (1994, enero). Enfoque automático para mapear un rostro humano 2.5d realista.
  3. ^ MacEachren, Alan . "GVIS Facilitando el Pensamiento Visual". En Cómo funcionan los mapas: representación, visualización y diseño, 355–458. Nueva York: The Guilford Press, 1995.
  4. ^ a b c d Watt, RJ y BJ Rogers. "Visión humana y ciencia cognitiva". En Direcciones de investigación en psicología cognitiva en ciencia cognitiva: perspectivas europeas, vol. 1, editado por Alan Baddeley y Niels Ole Bernsen, 10–12. East Sussex: Lawrence Erlbaum Associates, 1989.
  5. ^ Madera, Jo, Sabine Kirschenbauer, Jurgen Dollner, Adriano Lopes y Lars Bodum. "Uso de 3D en visualización". En Exploring Geovisualization, editado por Jason Dykes , Alan M. MacEachren y Menno-Jan Kraak , 295–312. Oxford: Elsevier Ltd, 2005.
  6. ^ a b c Ciuffreda, Kenneth J .; Wang, Bin; Vasudevan, Balamurali (abril de 2007). "Modelo conceptual de la percepción del desenfoque humano". Investigación de la visión . 47 (9): 1245-1252. doi : 10.1016 / j.visres.2006.12.001 . PMID  17223154 .
  7. ^ Kang Chii-Yuan, Chen Yung-Sheng y Hsu Wen-Hsing. Enero / febrero de 1994. Image and Vision Computing Volumen 12 Número 1. Fuente web de Butterworth-Heinemann Ltd. recuperada en agosto de 2012. http://resolver.scholarsportal.info/resolve/02628856/v12i0001/5_aatmal2hf
  8. ^ Chii-Yuan, Kang; Yung-Sheng, Chen; Wen-Hsing, Hsu (1994). "Enfoque automático para mapear un rostro humano 2.5D realista". Computación de imagen y visión . 12 : 5-14. doi : 10.1016 / 0262-8856 (94) 90051-5 .
  9. ^ Identificación automática de rostros humanos mediante la forma tridimensional de las superficies, utilizando vértices de B spline surface Syst. & Computers in Japan, versión Vol 22 (No 7), p. 96, 1991, Abe T et al.
  10. ^ Kang, CY; Chen, YS; Hsu, WH (1994). "Enfoque automático para mapear un rostro humano 2.5d realista". Computación de imagen y visión . 12 (1): 5–14. doi : 10.1016 / 0262-8856 (94) 90051-5 .
  11. ^ El marco BOXEL para datos 2.5D con aplicaciones para drivethroughs virtuales y ray tracing 2007-11-07
  12. ^ Kang Chii-Yuan; Chen Yung-Sheng; Hsu Wen-Hsing. Enfoque automático para mapear un rostro humano 2.5D realista. Image and Vision Computing (enero de 1994), 12 (1), págs. 6–7.
  13. ^ Serge Bouaziz, Annie Magnan, "Contribución de la percepción visual y los sistemas de producción gráfica a la copia de dibujos geométricos complejos: un estudio de desarrollo", Universidad Lumiere Lyon 2, 69676 Bron Cedex, Francia.
  • Kang Chii-Yuan; Chen Yung-Sheng; Hsu Wen-Hsing. Enfoque automático para mapear un rostro humano 2.5D realista. Image and Vision Computing (enero de 1994), 12 (1), págs. 6–7.