De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

El procesamiento de imágenes digitales es el uso de una computadora digital para procesar imágenes digitales a través de un algoritmo . [1] [2] Como subcategoría o campo del procesamiento de señales digitales, el procesamiento de imágenes digitales tiene muchas ventajas sobre el procesamiento de imágenes analógicas . Permite aplicar una gama mucho más amplia de algoritmos a los datos de entrada y puede evitar problemas como la acumulación de ruido y distorsión durante el procesamiento. Dado que las imágenes se definen en dos dimensiones (quizás más), el procesamiento de imágenes digitales puede modelarse en forma de sistemas multidimensionales. La generación y el desarrollo del procesamiento de imágenes digitales se ven afectados principalmente por tres factores: primero, el desarrollo de las computadoras; segundo, el desarrollo de las matemáticas (especialmente la creación y mejora de la teoría de las matemáticas discretas); En tercer lugar, ha aumentado la demanda de una amplia gama de aplicaciones en el medio ambiente, la agricultura, el ejército, la industria y la ciencia médica.

Historia [ editar ]

Muchas de las técnicas de procesamiento de imágenes digitales , o procesamiento de imágenes digitales, como se le llama a menudo, se desarrollaron en la década de 1960 en Bell Laboratories , el Laboratorio de Propulsión a Chorro , el Instituto de Tecnología de Massachusetts , la Universidad de Maryland y algunas otras instalaciones de investigación. con aplicación a imágenes satelitales , conversión de estándares de fotografías por cable , imágenes médicas , videoteléfono , reconocimiento de caracteres y mejora de fotografías. [3]El propósito del procesamiento de imágenes temprano era mejorar la calidad de la imagen. Estaba destinado a que los seres humanos mejoraran el efecto visual de las personas. En el procesamiento de imágenes, la entrada es una imagen de baja calidad y la salida es una imagen con una calidad mejorada. El procesamiento de imágenes común incluye mejora, restauración, codificación y compresión de imágenes. La primera aplicación exitosa fue el Laboratorio de Propulsión a Chorro Estadounidense (JPL). Utilizaron técnicas de procesamiento de imágenes como corrección geométrica, transformación de gradación, eliminación de ruido, etc. en las miles de fotos lunares enviadas por el Space Detector Ranger 7 en 1964, teniendo en cuenta la posición del sol y el entorno de la luna. El impacto del mapeo exitoso del mapa de la superficie de la luna por la computadora ha sido un gran éxito. Mas tarde,Se realizó un procesamiento de imágenes más complejo en las casi 100.000 fotos enviadas por la nave espacial, de modo que se obtuvieron el mapa topográfico, el mapa de colores y el mosaico panorámico de la luna, que logró resultados extraordinarios y sentó una base sólida para el aterrizaje humano en la luna.[4]

Sin embargo, el costo de procesamiento era bastante alto con el equipo informático de esa época. Eso cambió en la década de 1970, cuando el procesamiento de imágenes digitales proliferó a medida que se dispuso de computadoras más baratas y hardware dedicado. Esto llevó a que las imágenes se procesaran en tiempo real, para algunos problemas específicos, como la conversión de estándares de televisión . A medida que las computadoras de uso general se volvieron más rápidas, comenzaron a asumir el papel de hardware dedicado para todas las operaciones menos las más especializadas y con uso intensivo de computadoras. Con las computadoras rápidas y los procesadores de señal disponibles en la década de 2000, el procesamiento de imágenes digitales se ha convertido en la forma más común de procesamiento de imágenes, y generalmente se usa porque no solo es el método más versátil, sino también el más barato.

Sensores de imagen [ editar ]

La base de los sensores de imagen modernos es la tecnología de semiconductores de óxido de metal (MOS), [5] que se origina a partir de la invención del MOSFET (transistor de efecto de campo MOS) por Mohamed M. Atalla y Dawon Kahng en Bell Labs en 1959. [ 6] Esto condujo al desarrollo de sensores de imagen de semiconductores digitales , incluido el dispositivo de carga acoplada (CCD) y más tarde el sensor CMOS . [5]

El dispositivo de carga acoplada fue inventado por Willard S. Boyle y George E. Smith en Bell Labs en 1969. [7] Mientras investigaban la tecnología MOS, se dieron cuenta de que una carga eléctrica era la analogía de la burbuja magnética y que podía almacenarse. en un minúsculo condensador MOS . Como era bastante sencillo fabricar una serie de condensadores MOS en una fila, les conectaron un voltaje adecuado para que la carga pudiera pasar de uno a otro. [5] El CCD es un circuito semiconductor que luego se utilizó en las primeras cámaras de video digitales para la transmisión de televisión . [8]

El sensor de píxeles activos NMOS (APS) fue inventado por Olympus en Japón a mediados de la década de 1980. Esto fue posible gracias a los avances en la fabricación de dispositivos semiconductores MOS , con la escala MOSFET alcanzando niveles de micrones más pequeños y luego submicrónicos . [9] [10] El NMOS APS fue fabricado por el equipo de Tsutomu Nakamura en Olympus en 1985. [11] El sensor CMOS de píxeles activos (sensor CMOS) fue desarrollado posteriormente por el equipo de Eric Fossum en el Laboratorio de Propulsión a Chorro de la NASA en 1993 . [12] En 2007, las ventas de los sensores CMOS habían superado los sensores CCD. [13]

Compresión de imagen [ editar ]

Un desarrollo importante en la tecnología de compresión de imágenes digitales fue la transformada de coseno discreta (DCT), una técnica de compresión con pérdida propuesta por primera vez por Nasir Ahmed en 1972. [14] La compresión DCT se convirtió en la base de JPEG , que fue introducida por el Joint Photographic Experts Group en 1992. [15] JPEG comprime imágenes en tamaños de archivo mucho más pequeños y se ha convertido en el formato de archivo de imagen más utilizado en Internet . [16] Su algoritmo de compresión DCT altamente eficiente fue en gran parte responsable de la amplia proliferación de imágenes digitales.y fotografías digitales , [17] con varios miles de millones de imágenes JPEG producidas todos los días a partir de 2015. [18]

Procesador de señal digital (DSP) [ editar ]

El procesamiento de señales electrónicas fue revolucionado por la amplia adopción de la tecnología MOS en la década de 1970. [19] La tecnología de circuitos integrados MOS fue la base para los primeros microprocesadores y microcontroladores de un solo chip a principios de la década de 1970, [20] y luego los primeros chips de procesador de señal digital (DSP) de un solo chip a fines de la década de 1970. [21] [22] Desde entonces, los chips DSP se han utilizado ampliamente en el procesamiento de imágenes digitales. [21]

El algoritmo de compresión de imagen de transformada de coseno discreta (DCT) se ha implementado ampliamente en chips DSP, y muchas empresas desarrollan chips DSP basados ​​en tecnología DCT. DCT son ampliamente utilizados para la codificación , decodificación, codificación de vídeo , de codificación de audio , la multiplexación , las señales de control, de señalización , de analógico a digital , el formato de luminancia diferencias y el color, y formatos de color tales como YUV444 y YUV411 . DCT también se utilizan para operaciones de codificación, tales como estimación de movimiento , la compensación de movimiento ,predicción entre cuadros , cuantificación , ponderación perceptual, codificación de entropía , codificación de variables y vectores de movimiento , y operaciones de decodificación como la operación inversa entre diferentes formatos de color ( YIQ , YUV y RGB ) con fines de visualización. Los DCT también se utilizan comúnmente para chips codificadores / decodificadores de televisión de alta definición (HDTV). [23]

Imágenes médicas [ editar ]

En 1972, el ingeniero de la empresa británica EMI Housfield inventó el dispositivo de tomografía computarizada de rayos X para el diagnóstico de la cabeza, que es lo que se suele llamar CT (tomografía computarizada). El método del núcleo de TC se basa en la proyección de la sección de la cabeza humana y es procesado por computadora para reconstruir la imagen de la sección transversal, lo que se denomina reconstrucción de la imagen. En 1975, EMI desarrolló con éxito un dispositivo de TC para todo el cuerpo, que obtuvo una imagen tomográfica clara de varias partes del cuerpo humano. En 1979, esta técnica de diagnóstico ganó el Premio Nobel. [4] La tecnología de procesamiento de imágenes digitales para aplicaciones médicas se incorporó al Salón de la Fama de la Tecnología Espacial de la Fundación Espacial en 1994. [24]

Tareas [ editar ]

El procesamiento de imágenes digitales permite el uso de algoritmos mucho más complejos y, por lo tanto, puede ofrecer tanto un rendimiento más sofisticado en tareas simples como la implementación de métodos que serían imposibles por medios analógicos.

En particular, el procesamiento de imágenes digitales es una aplicación concreta y una tecnología práctica basada en:

  • Clasificación
  • Extracción de características
  • Análisis de señales multiescala
  • Reconocimiento de patrones
  • Proyección

Algunas técnicas que se utilizan en el procesamiento de imágenes digitales incluyen:

  • Difusión anisotrópica
  • Modelos ocultos de Markov
  • Edición de imagen
  • Restauración de imagen
  • Análisis de componentes independientes
  • Filtrado lineal
  • Redes neuronales
  • Ecuaciones diferenciales parciales
  • Pixelación
  • Coincidencia de características puntuales
  • Análisis de componentes principales
  • Mapas autoorganizados
  • Wavelets

Transformaciones de imágenes digitales [ editar ]

Filtrado [ editar ]

Los filtros digitales se utilizan para desenfocar y enfocar imágenes digitales. El filtrado se puede realizar mediante:

  • convolución con núcleos específicamente diseñados (matriz de filtros) en el dominio espacial [25]
  • enmascarar regiones de frecuencia específicas en el dominio de frecuencia (Fourier)

Los siguientes ejemplos muestran ambos métodos: [26]

Relleno de imágenes en el filtrado de dominios de Fourier [ editar ]

Las imágenes generalmente se rellenan antes de transformarse en el espacio de Fourier, las imágenes filtradas de paso alto a continuación ilustran las consecuencias de las diferentes técnicas de relleno:

Observe que el filtro de paso alto muestra bordes adicionales cuando se rellena con cero en comparación con el relleno de borde repetido.

Ejemplos de código de filtrado [ editar ]

Ejemplo de MATLAB para filtrado de paso alto de dominio espacial.

img = tablero de ajedrez ( 20 ); % generar tablero de ajedrez % ************************** DOMINIO ESPACIAL ********************* ******klaplace = [ 0 - 1 0 ; - 1 5 - 1 ; 0 - 1 0 ]; % Núcleo de filtro laplaciano         X = conv2 ( img , klaplace ); % convolve prueba img con  % 3x3 kernel laplacianofigura ()imshow ( X , []) % muestra laplaciano filtrado título ( 'Detección de bordes laplacianos' )

Transformaciones afines [ editar ]

Las transformaciones afines permiten transformaciones básicas de imágenes que incluyen escalar, rotar, trasladar, reflejar y distorsionar, como se muestra en los siguientes ejemplos: [26]

Para aplicar la matriz afín a una imagen, la imagen se convierte en una matriz en la que cada entrada corresponde a la intensidad de píxeles en esa ubicación. Luego, la ubicación de cada píxel se puede representar como un vector que indica las coordenadas de ese píxel en la imagen, [x, y], donde xey son la fila y la columna de un píxel en la matriz de la imagen. Esto permite que la coordenada se multiplique por una matriz de transformación afín, que da la posición en la que se copiará el valor de píxel en la imagen de salida.

Sin embargo, para permitir transformaciones que requieren transformaciones de traslación, se necesitan coordenadas tridimensionales homogéneas . La tercera dimensión generalmente se establece en una constante distinta de cero, generalmente 1, de modo que la nueva coordenada es [x, y, 1]. Esto permite que el vector de coordenadas se multiplique por una matriz de 3 por 3, lo que permite cambios de traslación. Entonces, la tercera dimensión, que es la constante 1, permite la traducción.

Debido a que la multiplicación de matrices es asociativa, múltiples transformaciones afines se pueden combinar en una única transformación afín multiplicando la matriz de cada transformación individual en el orden en que se realizan las transformaciones. Esto da como resultado una única matriz que, cuando se aplica a un vector de puntos, da el mismo resultado que todas las transformaciones individuales realizadas en el vector [x, y, 1] en secuencia. Por tanto, una secuencia de matrices de transformación afín puede reducirse a una única matriz de transformación afín.

Por ejemplo, las coordenadas bidimensionales solo permiten la rotación alrededor del origen (0, 0). Pero las coordenadas tridimensionales homogéneas se pueden usar para trasladar primero cualquier punto a (0, 0), luego realizar la rotación y, por último, trasladar el origen (0, 0) al punto original (lo opuesto a la primera traslación). Estas 3 transformaciones afines se pueden combinar en una sola matriz, lo que permite la rotación alrededor de cualquier punto de la imagen. [27]

Aplicaciones [ editar ]

Imágenes de cámaras digitales [ editar ]

Las cámaras digitales generalmente incluyen hardware de procesamiento de imágenes digitales especializado, ya sea chips dedicados o circuitos agregados en otros chips, para convertir los datos sin procesar de su sensor de imagen en una imagen con corrección de color en un formato de archivo de imagen estándar .

Película [ editar ]

Westworld (1973) fue el primer largometraje en utilizar el procesamiento de imágenes digitales para pixelar la fotografía para simular el punto de vista de un androide. [28]

Tecnologías de monitorización y detección de fatiga [ editar ]

Hubo avances significativos en la tecnología de monitoreo de la fatiga durante la última década. Estas innovadoras soluciones tecnológicas ahora están disponibles comercialmente y ofrecen beneficios de seguridad reales a los conductores, operadores y otros trabajadores por turnos en todas las industrias. [29]

Los desarrolladores de software, ingenieros y científicos desarrollan software de detección de fatiga utilizando varias señales fisiológicas para determinar el estado de fatiga o somnolencia. La medición de la actividad cerebral (electroencefalograma) está ampliamente aceptada como estándar en el control de la fatiga. Otra tecnología utilizada para determinar el deterioro relacionado con la fatiga incluye mediciones de síntomas de comportamiento tales como; comportamiento de los ojos, dirección de la mirada, micro-correcciones en el uso de la dirección y el acelerador, así como la variabilidad de la frecuencia cardíaca. [ cita requerida ]

Ver también [ editar ]

  • Imagen digital
  • Gráficos de computadora
  • Visión por computador
  • CVIPtools
  • Digitalización
  • Condición de límite libre
  • GPGPU
  • Filtrado homomórfico
  • Análisis de imagen
  • Sociedad de sistemas de transporte inteligente IEEE
  • Sistemas multidimensionales
  • Software de teledetección
  • Imagen de prueba estándar
  • Súper resolución
  • Eliminación de ruido de variación total
  • Visión de máquina
  • Variación limitada
  • Radiomics

Referencias [ editar ]

  1. Chakravorty, Pragnan (2018). "¿Qué es una señal? [Notas de la conferencia]". Revista de procesamiento de señales IEEE . 35 (5): 175-177. Código bibliográfico : 2018ISPM ... 35..175C . doi : 10.1109 / MSP.2018.2832195 . S2CID  52164353 .
  2. ^ González, Rafael (2018). Procesamiento de imágenes digitales . Nueva York, NY: Pearson. ISBN 978-0-13-335672-4. OCLC  966609831 .
  3. ^ Azriel Rosenfeld, Procesamiento de imágenes por computadora , Nueva York: Academic Press, 1969
  4. ↑ a b González, Rafael C. (2008). Procesamiento de imágenes digitales . Woods, Richard E. (Richard Eugene), 1954- (3ª ed.). Upper Saddle River, Nueva Jersey: Prentice Hall. págs. 23-28. ISBN 9780131687288. OCLC  137312858 .
  5. ↑ a b c Williams, JB (2017). La revolución de la electrónica: inventando el futuro . Saltador. págs. 245–8. ISBN 9783319490885.
  6. ^ "1960: Transistor de semiconductor de óxido de metal (MOS) demostrado" . El motor de silicio . Museo de Historia de la Computación . Archivado desde el original el 3 de octubre de 2019 . Consultado el 31 de agosto de 2019 .
  7. ^ James R. Janesick (2001). Dispositivos científicos de carga acoplada . SPIE Press. págs. 3–4. ISBN 978-0-8194-3698-6.
  8. ^ Boyle, William S; Smith, George E. (1970). "Dispositivos semiconductores acoplados por carga". Bell Syst. Tech. J . 49 (4): 587–593. doi : 10.1002 / j.1538-7305.1970.tb01790.x .
  9. ^ Fossum, Eric R. (12 de julio de 1993). "Sensores de píxeles activos: ¿son dinosaurios CCDS?". En Blouke, Morley M. (ed.). Dispositivos de carga acoplada y sensores ópticos de estado sólido III . Actas del SPIE. 1900 . págs. 2-14. Código Bibliográfico : 1993SPIE.1900 .... 2F . CiteSeerX 10.1.1.408.6558 . doi : 10.1117 / 12.148585 . S2CID 10556755 .  
  10. ^ Fossum, Eric R. (2007). "Sensores de píxeles activos". S2CID 18831792 .  Cite journal requires |journal= (help)
  11. ^ Matsumoto, Kazuya; et al. (1985). "Un nuevo fototransistor MOS que funciona en modo de lectura no destructiva". Revista japonesa de física aplicada . 24 (5A): L323. Código bibliográfico : 1985JaJAP..24L.323M . doi : 10.1143 / JJAP.24.L323 .
  12. ^ Fossum, Eric R .; Hondongwa, DB (2014). "Una revisión del fotodiodo fijado para sensores de imagen CCD y CMOS" . Revista IEEE de la Sociedad de Dispositivos Electrónicos . 2 (3): 33–43. doi : 10.1109 / JEDS.2014.2306412 .
  13. ^ "Las ventas del sensor de imagen CMOS se mantienen a un ritmo récord" . IC Insights . 8 de mayo de 2018. Archivado desde el original el 21 de junio de 2019 . Consultado el 6 de octubre de 2019 .
  14. ^ Ahmed, Nasir (enero de 1991). "Cómo se me ocurrió la transformada discreta del coseno" . Procesamiento de señales digitales . 1 (1): 4–5. doi : 10.1016 / 1051-2004 (91) 90086-Z . Archivado desde el original el 10 de junio de 2016 . Consultado el 10 de octubre de 2019 .
  15. ^ "T.81 - COMPRESIÓN DIGITAL Y CODIFICACIÓN DE FOTOGRAFÍAS EN TONO CONTINUO - REQUISITOS Y DIRECTRICES" (PDF) . CCITT . Septiembre de 1992. Archivado (PDF) desde el original el 17 de julio de 2019 . Consultado el 12 de julio de 2019 .
  16. ^ "Explicación del formato de imagen JPEG" . BT.com . BT Group . 31 de mayo de 2018. Archivado desde el original el 5 de agosto de 2019 . Consultado el 5 de agosto de 2019 .
  17. ^ "¿Qué es un JPEG? El objeto invisible que ves todos los días" . El Atlántico . 24 de septiembre de 2013. Archivado desde el original el 9 de octubre de 2019 . Consultado el 13 de septiembre de 2019 .
  18. ^ Baraniuk, Chris (15 de octubre de 2015). "Las protecciones de copia podrían llegar a los archivos JPEG" . BBC News . BBC . Archivado desde el original el 9 de octubre de 2019 . Consultado el 13 de septiembre de 2019 .
  19. ^ Grant, Duncan Andrew; Gowar, John (1989). Power MOSFETS: teoría y aplicaciones . Wiley . pag. 1. ISBN 9780471828679. El transistor de efecto de campo semiconductor de óxido metálico (MOSFET) es el dispositivo activo más utilizado en la integración a gran escala de circuitos integrados digitales (VLSI). Durante la década de 1970, estos componentes revolucionaron el procesamiento de señales electrónicas, los sistemas de control y las computadoras.
  20. ^ Shirriff, Ken (30 de agosto de 2016). "La sorprendente historia de los primeros microprocesadores" . Espectro IEEE . Instituto de Ingenieros Eléctricos y Electrónicos . 53 (9): 48–54. doi : 10.1109 / MSPEC.2016.7551353 . S2CID 32003640 . Archivado desde el original el 13 de octubre de 2019 . Consultado el 13 de octubre de 2019 . 
  21. ^ a b "1979: se introduce el procesador de señal digital de un solo chip" . El motor de silicio . Museo de Historia de la Computación . Archivado desde el original el 3 de octubre de 2019 . Consultado el 14 de octubre de 2019 .
  22. ^ Taranovich, Steve (27 de agosto de 2012). "30 años de DSP: del juguete de un niño al 4G y más" . EDN . Archivado desde el original el 14 de octubre de 2019 . Consultado el 14 de octubre de 2019 .
  23. Stanković, Radomir S .; Astola, Jaakko T. (2012). "Reminiscencias de los primeros trabajos en DCT: Entrevista con KR Rao" (PDF) . Reimpresiones de los primeros días de las ciencias de la información . 60 . Archivado (PDF) desde el original el 13 de octubre de 2019 . Consultado el 13 de octubre de 2019 .
  24. ^ "Salón de la fama de la tecnología espacial: tecnologías inducidas / 1994" . Fundación espacial. 1994. Archivado desde el original el 4 de julio de 2011 . Consultado el 7 de enero de 2010 .
  25. ^ Zhang, MZ; Livingston, AR; Asari, VK (2008). "Una arquitectura de alto rendimiento para la implementación de convolución 2-D con núcleos simétricos cuadrantes". Revista Internacional de Computadoras y Aplicaciones . 30 (4): 298-308. doi : 10.1080 / 1206212x.2008.11441909 . S2CID 57289814 . 
  26. ↑ a b González, Rafael (2008). Procesamiento de imágenes digitales, 3er . Pearson Hall. ISBN 9780131687288.
  27. ^ House, Keyser (6 de diciembre de 2016). Transformaciones afines (PDF) . Clemson . Fundamentos del modelado y animación basados ​​en la física. AK Peters / CRC Press. ISBN  9781482234602. Archivado (PDF) desde el original el 30 de agosto de 2017 . Consultado el 26 de marzo de 2019 .
  28. A Brief, Early History of Computer Graphics in Film Archivado el 17 de julio de 2012 en Wayback Machine , Larry Yaeger , 16 de agosto de 2002 (última actualización), consultado el 24 de marzo de 2010
  29. ^ "Tecnología de monitoreo de fatiga | Alternativas de transporte" . Consultado el 6 de marzo de 2021 .

Lectura adicional [ editar ]

  • Solomon, CJ; Breckon, TP (2010). Fundamentos del procesamiento de imágenes digitales: un enfoque práctico con ejemplos en Matlab . Wiley-Blackwell. doi : 10.1002 / 9780470689776 . ISBN 978-0470844731.
  • Wilhelm Burger; Mark J. Burge (2007). Procesamiento de imágenes digitales: un enfoque algorítmico que utiliza Java . Springer . ISBN 978-1-84628-379-6.
  • R. Fisher; K Dawson-Howe; A. Fitzgibbon; C. Robertson; E. Trucco (2005). Diccionario de Visión por Computador y Procesamiento de Imágenes . John Wiley. ISBN 978-0-470-01526-1.
  • Rafael C. González; Richard E. Woods; Steven L. Eddins (2004). Procesamiento de imágenes digitales usando MATLAB . Educación Pearson. ISBN 978-81-7758-898-9.
  • Tim Morris (2004). Visión por computadora y procesamiento de imágenes . Palgrave Macmillan. ISBN 978-0-333-99451-1.
  • Tyagi Vipin (2018). Comprensión del procesamiento de imágenes digitales . Taylor y Francis CRC Press. ISBN 978-11-3856-6842.
  • Milan Sonka; Vaclav Hlavac; Roger Boyle (1999). Procesamiento, análisis y visión artificial de imágenes . Publicación de PWS. ISBN 978-0-534-95393-5.
  • Rafael C. González (2008). Procesando imagen digital. Prentice Hall. ISBN 9780131687288 

Enlaces externos [ editar ]

  • Conferencias sobre procesamiento de imágenes , a cargo de Alan Peters. Universidad de Vanderbilt. Actualizado el 7 de enero de 2016.
  • Procesamiento de imágenes digitales con algoritmos informáticos