Glosario de visión artificial

Este artículo no cita ninguna fuente . Por favor, ayuda a mejorar este artículo mediante la adición de citas de fuentes confiables . El material no obtenido puede ser cuestionado y eliminado .
Buscar fuentes: "Glosario de visión artificial" - noticias · periódicos · libros · académico · JSTOR ( diciembre de 2011 ) ( Aprenda cómo y cuándo eliminar este mensaje de plantilla )

Las siguientes son definiciones comunes relacionadas con el campo de la visión artificial .

Campos relacionados generales

0-9 [ editar ]

1394 . FireWire es el nombre comercial de Apple Inc. para la interfaz IEEE 1394. También se conoce como i.Link (nombre de Sony ) o IEEE 1394 (aunque el estándar 1394 también define una interfaz de backplane). Es un estándar de interfaz de bus serie para computadora personal (y audio / video digital), que ofrece comunicaciones de alta velocidad y servicios de datos isócronos en tiempo real.
1D . Unidimensional.
Gráficos por computadora en 2D . La generación de imágenes digitales por computadora, principalmente a partir de modelos bidimensionales (como modelos geométricos 2D, texto e imágenes digitales) y mediante técnicas específicas para ellos.

Ejemplo de renderizado 3D

Gráficos 3D por computadora . Los gráficos por computadora en 3D se diferencian de los gráficos por computadora en 2D en que unarepresentación tridimensional de datos geométricos se almacena en la computadora con el fin de realizar cálculos y representar imágenes en 2D. Estas imágenes pueden ser para visualización posterior o para visualización en tiempo real. A pesar de estas diferencias, los gráficos por computadora en 3D se basan en muchos de los mismos algoritmos que los gráficos vectoriales por computadora en 2Den el modelo de estructura de alambre y los gráficos de trama por computadora en 2Den la pantalla renderizada final. En el software de gráficos por computadora, la distinción entre 2D y 3D se difumina ocasionalmente; Las aplicaciones 2D pueden usar técnicas 3D para lograr efectos como la iluminación, y principalmente 3D pueden usar técnicas de renderizado 2D.

Escáner láser 3D montado en un trípode

Escáner 3D . Este es un dispositivo que analiza un objeto o entorno del mundo real para recopilar datos sobre su forma y posiblemente su color. Los datos recopilados se pueden utilizar para construir modelos digitales tridimensionales útiles para una amplia variedad de aplicaciones.

A [ editar ]

Aberración . Ópticamente, el desenfoque se refiere a una traslación a lo largo del eje óptico alejándose del plano o superficie de mejor enfoque. En general, el desenfoque reduce la nitidez y el contraste de la imagen. Lo que deberían ser bordes nítidos y de alto contraste en una escena se convierten en transiciones graduales.
Apertura . En el contexto de la fotografía o la visión artificial, la apertura se refiere al diámetro del tope de apertura de una lente fotográfica. El tope de apertura se puede ajustar para controlar la cantidad de luz que llega a la película o al sensor de imagen.
relación de aspecto (imagen) . La relación de aspecto de una imagen es su ancho mostrado dividido por su alto (generalmente expresado como " x : y ").
Resolución angular . Describe el poder de resolución de cualquier dispositivo de formación de imágenes, como un telescopio óptico o de radio, un microscopio, una cámara o un ojo.
Inspección óptica automatizada .

B [ editar ]

" Wikipedia " codificada en el código 128-B

Código de barras . Un código de barras (también código de barras) es una representación de información legible por máquina en un formato visual en una superficie.
Descubrimiento de gotas . Inspeccionar una imagen en busca de manchas discretas de píxeles conectados (por ejemplo, un agujero negro en un objeto gris) como puntos de referencia de la imagen. Estas manchas suelen representar objetivos ópticos para mecanizado, captura robótica o fallas de fabricación.
Mapa de bits . Una imagen de gráficos de trama, una imagen digital o un mapa de bits, es un archivo o estructura de datos que representa una cuadrícula generalmente rectangular de píxeles, o puntos de color, en un monitor de computadora, papel u otro dispositivo de visualización.

C [ editar ]

Relación entre la visión por computadora y varios otros campos

Cámara . Una cámara es un dispositivo que se utiliza para tomar fotografías, ya sea individualmente o en secuencia. Una cámara que toma fotografías individualmente a veces se llama cámara de fotos para distinguirla de una cámara de video.
Enlace de cámara . Camera Link es un protocolo de comunicación en serie diseñado para aplicaciones de visión por computadora basadas en lainterfaz de National Semiconductor Channel-link. Fue diseñado con el propósito de estandarizar productos de video científicos e industriales, incluidas cámaras, cables y capturadores de fotogramas. El estándar es mantenido y administrado por Automated Imaging Association , o AIA, el grupo comercial de la industria global de la visión artificial.
Dispositivo de carga acoplada . Un dispositivo de carga acoplada (CCD) es un sensor para grabar imágenes, que consta de un circuito integrado que contiene una matriz de condensadores enlazados o acoplados. Los sensores y cámaras CCD tienden a ser más sensibles, menos ruidosos y más costosos que los sensores y cámaras CMOS.

El diagrama de cromaticidad del espacio de color CIE 1931. El límite exterior curvo es el locus espectral (o monocromático), con longitudes de onda mostradas en nanómetros. Tenga en cuenta que los colores representados dependen del espacio de color del dispositivo en el que está viendo la imagen, y ningún dispositivo tiene una gama lo suficientemente grande como para presentar una representación precisa de la cromaticidad en cada posición.

Espacio de color CIE 1931 . En el estudio de la percepción del color , uno de los primeros espacios de color definidos matemáticamentefue el espacio de color CIE XYZ (también conocido como espacio de color CIE 1931 ), creado por la Comisión Internacional de Iluminación (CIE) en 1931.
CMOS . CMOS ("see-moss") significa semiconductor complementario de óxido de metal, es una clase importante de circuitos integrados. Los sensores de imágenes CMOS para visión artificial son más baratos que los sensores CCD, pero más ruidosos.
CoaXPress . CoaXPress (CXP) es un estándar asimétrico de comunicación en serie de alta velocidad sobrecable coaxial . CoaXPress combina datos de imagen de alta velocidad, control de cámara de baja velocidad y alimentación a través de un solo cable coaxial. El estándar es mantenido por JIIA, la Asociación Japonesa de Imágenes Industriales.
Color . La percepción de la frecuencia (o longitud de onda) de la luz, y se puede comparar con cómo el tono (o una nota musical) es la percepción de la frecuencia o longitud de onda del sonido.
Daltonismo . También conocida como deficiencia de la visión del color, en los seres humanos es la incapacidad de percibir diferencias entre algunos o todos los colores que otras personas pueden distinguir.
Temperatura de color . La "luz blanca" se describe comúnmente por su temperatura de color. La temperatura de color de una fuente de luz incandescente tradicional se determina comparando su tono con un radiador teórico de cuerpo negro calentado. La temperatura de color de la lámpara es la temperatura en grados Kelvin a la que el radiador de cuerpo negro calentado coincide con el tono de la lámpara.
Visión de color . CV es la capacidad de un organismo o máquina para distinguir objetos en función de las longitudes de onda (o frecuencias ) de la luz que reflejan o emiten.
visión por computadora . Estudio y aplicación de métodos que permitan a las computadoras "comprender" el contenido de las imágenes.
Contraste . En la percepción visual, el contraste es la diferencia en las propiedades visuales que hace que un objeto (o su representación en una imagen) sea distinguible de otros objetos y del fondo.
C-Mount . Adaptador estandarizado para lentes ópticas en cámaras CCD. Los objetivos con montura C tienen una distancia focal trasera de 17,5 mm frente a 12,5 mm para los objetivos con montura CS. Se puede utilizar una lente con montura C en una cámara con montura CS mediante el uso de un adaptador de extensión de 5 mm. La montura C es una rosca de montaje de 32 hilos por pulgada de 1 "de diámetro (1" -32UN-2A.)
CS-Mount . Igual que C-Mount pero el punto focal es 5 mm más corto. Una lente con montura CS no funcionará en una cámara con montura C. La montura CS es una rosca de montaje de 32 hilos por pulgada de 1 "de diámetro.

D [ editar ]

" Wikipedia, la enciclopedia libre " codificada en el código de barras DataMatrix 2D

Matriz de datos . Un código de barras bidimensional.
Profundidad de campo . En óptica, particularmente fotografía y visión artificial, la profundidad de campo (DOF) es la distancia delante y detrás del sujeto que parece estar enfocado.
Percepción de profundidad . DP es lacapacidad visual de percibir el mundo en tres dimensiones . Es un rasgo común a muchos animales superiores. La percepción de profundidad permite al espectador medir con precisión la distancia a un objeto.
Diafragma . En óptica, un diafragma es una estructura delgada y opaca con una abertura (apertura) en su centro. La función del diafragma es detener el paso de la luz, excepto la luz que atraviesa la abertura.

E [ editar ]

Detección de bordes . ED marca los puntos en una imagen digital en los que la intensidad luminosa cambia bruscamente. También marca los puntos de cambios de intensidad luminosa de un objeto o silueta de taxón espacial.
Interferencia electromagnética . La interferencia de radiofrecuencia (RFI) es radiación electromagnética que es emitida por circuitos eléctricos que transportan señales que cambian rápidamente, como un subproducto de su funcionamiento normal, y que provoca que se induzcan señales no deseadas (interferencia o ruido) en otros circuitos.

F [ editar ]

FireWire . FireWire (también conocido como i. Link o IEEE 1394) es un estándar de interfaz de bus serie de computadora personal (y audio / video digital) que ofrece comunicaciones de alta velocidad. A menudo se utiliza como interfaz para cámaras industriales.
Ruido de patrón fijo .
Corrección de campo plano .
Capturador de fotogramas . Dispositivo electrónico que captura fotogramas fijos digitales individuales de una señal de video analógica o un flujo de video digital.
Técnica de proyección de franjas . Técnica de adquisición de datos 3D que emplea un proyector que muestra un patrón de franjas en una superficie de pieza medida y una o más cámaras grabando imágenes.
Campo de visión . El campo de visión (FOV) es la parte que el sistema de visión artificial puede ver en un momento. El campo de visión depende de la lente del sistema y de la distancia de trabajo entre el objeto y la cámara.
Enfoque . Se dice que una imagen, o un punto o región de la imagen, está enfocado si la luz de los puntos del objeto converge lo mejor posible en la imagen; a la inversa, está desenfocado si la luz no converge bien. El límite entre estas condiciones se define a veces mediante un criterio de círculo de confusión.

G [ editar ]

Una gama típica de CRT .
La forma de herradura atenuada es toda la gama de posibles cromaticidades . El triángulo de color es la gama disponible para un monitor de computadora típico; no cubre todo el espacio.

Gamut . En la reproducción del color, incluyendo gráficos por ordenador y fotografía , la gama o gama de colores / ɡ æ m ə t / , es un cierto subconjunto completo de colores .
Escala de grises . Una imagen digital en escala de grises es una imagen en la que el valor de cada píxel es una sola muestra. Las imágenes mostradas de este tipo se componen típicamente de tonos de gris, que varían desde el negro en la intensidad más débil hasta el blanco en la más fuerte, aunque en principio las muestras podrían mostrarse como tonos de cualquier color, o incluso codificadas con varios colores para diferentes intensidades.
GUI . Una interfaz gráfica de usuario (o GUI, a veces pronunciada "pegajosa") es un método de interactuar con una computadora a través de una metáfora de manipulación directa de imágenes gráficas y widgets además del texto.

H [ editar ]

Una fotografía con su histograma de luminosidad debajo

Histograma . En estadística , un histograma es una representación gráfica de frecuencias tabuladas. Un histograma es la versión gráfica de una tabla que muestra qué proporción de casos caen en cada una de varias o muchas categorías especificadas. El histograma se diferencia de un gráfico de barras en que es el área de la barra la que denota el valor, no la altura, una distinción crucial cuando las categorías no tienen un ancho uniforme (Lancaster, 1974). Las categorías generalmente se especifican como intervalos no superpuestosde alguna variable. Las categorías (barras) deben ser adyacentes.
Histograma (color) . En los gráficos por computadora y la fotografía , un histograma de color es una representación de la distribución de colores en una imagen, que se obtiene contando el número de píxeles de cada uno de los conjuntos de rangos de colores en un formato típicamente bidimensional (2D) o tridimensional ( 3D) espacio de color . Un histograma es unadescripción estadística estándarde una distribución en términos de frecuencias de ocurrencia de diferentes clases de eventos; para el color, las clases de eventos son regiones en el espacio de color.

Espacio de color HSV como rueda de color

Espacio de color HSV . El modelo HSV (tono, saturación, valor), también llamado HSB (tono, saturación, brillo), define un espacio de color en términos de tres componentes constituyentes:
- Matiz, el tipo de color (como rojo, azul o amarillo)
- Saturación, la "vitalidad" del color y pureza colorimétrica
- Valor, el brillo del color.

Yo [ editar ]

Formatos de archivo de imagen . Los formatos de archivo de imagen proporcionan un método estandarizado para organizar y almacenar datos de imágenes. Este artículo trata sobre los formatos de imágenes digitales que se utilizan para almacenar información fotográfica y de otras imágenes. Los archivos de imagen se componen de datos de píxeles o vectoriales (geométricos), que se rasterizan en píxeles en el proceso de visualización, con algunas excepciones en la visualización de gráficos vectoriales. Los píxeles que componen una imagen tienen la forma de una cuadrícula de columnas y filas. Cada uno de los píxeles de una imagen almacena números digitales que representan el brillo y el color.
Segmentación de imágenes .

Imagen de un perro tomada con luz infrarroja media ("térmica") (color falso)

Imágenes infrarrojas . Ver cámara termográfica .
Bombilla incandescente . Una bombilla de luz incandescente genera luz utilizando un filamento incandescente calentado al rojo vivo por una corriente eléctrica.

J [ editar ]

JPEG . JPEG (pronunciado jay-peg) es el método estándar más utilizado de compresión con pérdida para imágenes fotográficas.

K [ editar ]

Factor Kell . Es un parámetro que se utiliza para determinar la resolución efectiva de un dispositivo de visualización discreto.

L [ editar ]

Láser . En física, un láser es un dispositivo que emite luz a través de un mecanismo específico para el cual el término láser es un acrónimo: amplificación de luz por emisión estimulada de radiación.
Lente . Una lente es un dispositivo que hace que la luz converja y se concentre o diverja, generalmente formada a partir de una pieza de vidrio con forma. Las lentes se pueden combinar para formar sistemas ópticos más complejos como una lente normal o una lente telefoto .
Controlador de lente . Un controlador de lente es un dispositivo que se utiliza para controlar una lente motorizada (ZFI). Los controladores de lentes pueden ser internos de una cámara, un conjunto de interruptores que se usan manualmente o un dispositivo sofisticado que permite el control de una lente con una computadora.
Iluminación . La iluminación se refiere a fuentes de luz artificial, como lámparas, o iluminación natural.

M [ editar ]

Metrología . La metrología es la ciencia de la medición. Hay muchas aplicaciones para la visión artificial en metrología.
visión artificial . MV es la aplicación de la visión por computadora a la industria y la manufactura.
Percepción de movimiento . MP es el proceso de inferir la velocidad y la dirección de objetos y superficies que se mueven en una escena visual dada alguna entrada visual.

N [ editar ]

Vista simplificada de una red neuronal artificial

Red neuronal . Una NN es un grupo interconectado de neuronas artificiales que utiliza un modelo matemático o computacional para el procesamiento de información basado en un enfoque conexionista de la computación. En la mayoría de los casos, una RNA es un sistema adaptativo que cambia su estructura en base a información externa o interna que fluye a través de la red.
Lente normal . En la visión artificial, una lente normal o entrocéntrica es una lente que genera imágenes que generalmente se considera que tienen una perspectiva "natural" en comparación con las lentes con distancias focales más largas o más cortas. Las lentes de menor distancia focal se denominan lentes gran angular, mientras que las lentes de mayor distancia focal se denominan teleobjetivos.

O [ editar ]

Reconocimiento óptico de caracteres . Generalmente abreviado como OCR, implica un software de computadora diseñado para traducir imágenes de texto mecanografiado (generalmente capturado por un escáner) en texto editable por máquina, o para traducir imágenes de caracteres en un esquema de codificación estándar que los representa en (ASCII o Unicode).
Resolución óptica . Describe la capacidad de un sistema para distinguir, detectar y / o registrar detalles físicos por medios electromagnéticos. El sistema puede ser de imágenes (por ejemplo, una cámara) o no de imágenes (por ejemplo, un detector láser de cuatro celdas).
Función de transferencia óptica .

P [ editar ]

Lente principal con una apertura máxima de f / 2

Reconocimiento de patrones . Este es un campo dentro del área del aprendizaje automático. Alternativamente, se puede definir como el acto de tomar datos sin procesar y tomar una acción basada en la categoría de los datos. Es una colección de métodos para el aprendizaje supervisado.
Pixel . Un píxel es uno de los muchos puntos diminutos que componen la representación de una imagen en la memoria o pantalla de una computadora.
Pixelación . En los gráficos por computadora, la pixelación es un efecto causado por la visualización de un mapa de bits o una sección de un mapa de bits a un tamaño tan grande que los píxeles individuales, pequeños elementos de visualización cuadrados de un solo color que componen el mapa de bits, son visibles.
Lente de cebado . Ensamblaje mecánico de lentes cuya distancia focal es fija, a diferencia de un lente zoom, que tiene una distancia focal variable.

Q [ editar ]

Factor Q (óptica) . En óptica , elfactor Q de una cavidad resonante viene dado por

{\ Displaystyle Q = {\ frac {2 \ pi f_ {o} {\ mathcal {E}}} {P}}}

,

donde es la frecuencia de resonancia, es la energía almacenada en la cavidad y es la potencia disipada. El Q óptico es igual a la relación entre la frecuencia de resonancia y el ancho de banda de la resonancia de la cavidad. La vida media de un fotón resonante en la cavidad es proporcional al Q de la cavidad . Si el factor Q de la cavidad de un láser cambia abruptamente de un valor bajo a uno alto, el láser emitirá un pulso de luz que es mucho más intenso que la salida continua normal del láser. Esta técnica se conoce como Q-switching . ${\ Displaystyle f_ {o}}$ ${\ Displaystyle {\ mathcal {E}}}$ ${\ Displaystyle P = - {\ frac {dE} {dt}}}$

R [ editar ]

Región de interés . Una región de interés, a menudo abreviada como ROI, es un subconjunto seleccionado de muestras dentro de un conjunto de datos identificado para un propósito particular.

Una representación de la mezcla de colores aditivos RGB.

RGB . El modelo de color RGB utiliza el modelo aditivo en el que la luz roja, verde y azul se combinan de varias formas para crear otros colores.
ROI . Consulte Región de interés.
Primer plano, figura y objetos . Véase también espacial-taxón.

S [ editar ]

S-video . El video separado , abreviado S-Video y también conocido como Y / C (o erróneamente , S-VHS y "super video") es una señal de video analógica que transporta los datos de video como dos señales separadas (brillo y color), a diferencia del video compuesto que transporta el conjunto completo de señales en una línea de señal. S-Video, como se implementa más comúnmente, transmitevideo de alta resolución de 480i o 576i de ancho de banda, es decir , video de definición estándar . No transmite audio por el mismo cable.
Principio de Scheimpflug .
Obturador . Un obturador es un dispositivo que permite que la luz pase durante un período de tiempo determinado, con el propósito de exponer el sensor de imagen a la cantidad de luz adecuada para crear una imagen permanente de una vista.
Velocidad de obturación . En la visión artificial, la velocidad del obturador es el tiempo durante el cual el obturador se mantiene abierto durante la toma de una imagen para permitir que la luz llegue al sensor de imagen. En combinación con la variación de la apertura de la lente, esto regula la cantidad de luz que recibirá el sensor de imagen de una cámara digital.
Cámara inteligente . Una cámara inteligente es un sistema de visión artificial integrado que, además de los circuitos de captura de imágenes, incluye un procesador, que puede extraer información de las imágenes sin necesidad de una unidad de procesamiento externa, y dispositivos de interfaz utilizados para poner los resultados a disposición de otros dispositivos.
Taxón espacial . Los taxones espaciales son gránulos de información, compuestos de regiones de píxeles no excluyentes entre sí, dentro de la arquitectura de la escena. Son similares a la designación psicológica Gestalt de figura-fondo, pero se extienden para incluir el primer plano, grupos de objetos, objetos y partes de objetos salientes.
Escáner 3D de luz estructurada . El proceso de proyectar un patrón conocido de iluminación (a menudo cuadrículas o barras horizontales) en una escena. La forma en que estos patrones parecen deformarse cuando golpean superficies permite que los sistemas de visión calculen la información de profundidad y superficie de los objetos en la escena.
SVGA . Super Video Graphics Array, casi siempre abreviado como Super VGA o simplemente SVGA, es un término amplio que cubre una amplia gama de estándares de visualización de computadoras.

T [ editar ]

Lente telecéntrica . Lente compuesta con una propiedad inusual en cuanto a su geometría de rayos formadores de imágenes. En los sistemas de visión artificial, las lentes telecéntricas se emplean generalmente para lograr la invariancia dimensional y geométrica de las imágenes dentro de un rango de distancias diferentes desde la lente y en todo el campo de visión.
Teleobjetivo . Lente cuya distancia focal es significativamente mayor que la distancia focal de una lente normal.
Termografía . Imagen térmica, un tipo de imagen infrarroja .
TIFF . El formato de archivo de imagen etiquetada (abreviado TIFF) es un formato de archivo para almacenar principalmente imágenes, incluidas fotografías y dibujos lineales.

U [ editar ]

USB . Universal Serial Bus (USB) proporciona un estándar de bus serial para conectar dispositivos, generalmente a computadoras como PC, pero también se está volviendo común en las cámaras.

V [ editar ]

VESA . La Video Electronics Standards Association (VESA) es un organismo internacional, fundado a fines de la década de 1980 por NEC Home Electronics y otros ocho fabricantes de adaptadores de video. El objetivo inicial era producir un estándar parapantallas de video con resolución SVGA de 800 × 600. Desde entonces VESA ha emitido una serie de normas, sobre todo en relación con la función de vídeo periféricos en IBM PC compatibles ordenadores .
VGA . Video Graphics Array (VGA) es un estándar de visualización de computadora comercializado por primera vez en 1987 por IBM .
Unidad de procesamiento de visión . Una clase de microprocesadores destinados a acelerar las tareas de visión artificial.

W [ editar ]

Lente gran angular: 17-40 f / 4 L

Lente gran angular . En fotografía y cinematografía, una lente gran angular es una lente cuya distancia focal es más corta que la longitud focal de una lente normal.

X [ editar ]

Una imagen de rayos X (radiografía), tomada por Wilhelm Röntgen , de la mano de su esposa.

Los rayos X . Forma de radiación electromagnética con una longitud de onda en el rango de 10 a 0.01 nanómetros, correspondiente a frecuencias en el rango de 30 a 3000 PHz (10¹⁵ hertz). Los rayos X se utilizan principalmente para diagnóstico por imágenes médicas e industriales, así como para cristalografía. Los rayos X son una forma de radiación ionizante y, como tales, pueden ser peligrosos.

Y [ editar ]

Y-cable . Un cable Y o cable Y es un cable eléctrico que contiene tres extremos, uno de los cuales es un extremo común que a su vez conduce a una división en los dos extremos restantes, que se asemeja a la letra " Y ". Los cables en Y son típicamente, pero no necesariamente, cortos (menos de 12 pulgadas) y, a menudo, los extremos se conectan a otros cables. Los usos pueden ser tan simples como dividir un canal de audio o video en dos, hasta usos más complejos, como empalmar señales de un conector de computadora de alta densidada su periférico apropiado.

Z [ editar ]

Un objetivo con zoom de 70-200 mm

Lente de zoom . Un conjunto mecánico de lentes cuya distancia focal se puede cambiar, a diferencia de un lente fijo, que tiene una distancia focal fija. Vea una animación del principio de zoom a continuación.

Principio de zoom

Ver también [ editar ]

Glosario de inteligencia artificial
Capturador de fotogramas
Google Goggles
Glosario de visión artificial
Procesamiento de imágenes morfológicas
OpenCV
Cámara inteligente