Computación visual


Computación visual es un término genérico para todas las disciplinas informáticas que se ocupan de imágenes y modelos 3D , como gráficos por computadora, procesamiento de imágenes, visualización, visión por computadora, realidad virtual y aumentada y procesamiento de video . La computación visual también incluye aspectos de reconocimiento de patrones , interacción humano-computadora, aprendizaje automático y bibliotecas digitales. Los principales desafíos son la adquisición, el procesamiento, el análisis y la representación de información visual (principalmente imágenes y video). Las áreas de aplicación incluyen control de calidad industrial, procesamiento y visualización de imágenes médicas, topografía, robótica, sistemas multimedia, patrimonio virtual, efectos especiales en películas y televisión y juegos de computadora.

Computación visual [1] es un término bastante nuevo, que obtuvo su significado actual alrededor de 2005, cuando se reunió por primera vez el Simposio Internacional sobre Computación Visual. [2] Las áreas de la tecnología informática relacionadas con las imágenes, como formatos de imágenes, métodos de filtrado, modelos de color y métricas de imágenes, tienen en común muchos métodos y algoritmos matemáticos. Cuando los informáticos que trabajan en disciplinas informáticas que involucran imágenes, como gráficos por computadora , procesamiento de imágenes y visión por computadora, notó que sus métodos y aplicaciones se superponían cada vez más, comenzaron a usar el término "computación visual" para describir estos campos colectivamente. Y también los métodos de programación en hardware de gráficos, los trucos de manipulación para manejar grandes cantidades de datos, libros de texto y conferencias, las comunidades científicas de estas disciplinas y los grupos de trabajo en las empresas se entremezclaron cada vez más.

Además, las aplicaciones necesitaban cada vez más técnicas de más de uno de estos campos al mismo tiempo. Para generar modelos muy detallados de objetos complejos, necesita reconocimiento de imágenes , sensores 3D y algoritmos de reconstrucción , y para mostrar estos modelos de manera creíble, necesita técnicas de renderizado realistas con simulación de iluminación compleja. Los gráficos en tiempo real son la base del software utilizable de realidad virtual y aumentada. Una buena segmentación de los órganos es la base para la manipulación interactiva de visualizaciones 3D de exploraciones médicas. El control de robots necesita el reconocimiento de objetos como un modelo de su entorno. Y todos los dispositivos (computadoras) necesitan interfaces gráficas de usuario ergonómicas.

Aunque muchos problemas se consideran resueltos dentro de las comunidades científicas de las subdisciplinas que componen la computación visual (principalmente bajo suposiciones idealistas), un desafío importante de la computación visual en su conjunto es la integración de estas soluciones parciales en productos aplicables. Esto incluye lidiar con muchos problemas prácticos como abordar una multitud de hardware, el uso de datos reales (que a menudo son erróneos y/o de tamaño gigantesco) y la operación por parte de usuarios no capacitados. En este sentido, Visual Computing es más que la suma de sus subdisciplinas , es el siguiente paso hacia sistemas aptos para un uso real en todas las áreas utilizando imágenes u objetos 3D en la computadora.

Al menos las siguientes disciplinas son subcampos de la computación visual. Se pueden encontrar descripciones más detalladas de cada uno de estos campos en las páginas especiales vinculadas.

Gráficos por computadora es un término general para todas las técnicas que producen imágenes como resultado con la ayuda de una computadora. Transformar la descripción de los objetos en imágenes agradables se denomina representación, que siempre es un compromiso entre la calidad de la imagen y el tiempo de ejecución.