Procesamiento de documentos

El procesamiento de documentos es un campo de investigación y un conjunto de procesos de producción destinados a convertir un documento analógico en digital. El procesamiento de documentos no tiene como objetivo simplemente fotografiar o escanear un documento para obtener una imagen digital , sino también hacerlo digitalmente inteligible. Esto incluye extraer la estructura del documento o el diseño y luego el contenido, que puede tomar la forma de texto o imágenes. El proceso puede involucrar algoritmos tradicionales de visión por computadora , redes neuronales convolucionales o trabajo manual. Los problemas abordados están relacionados con la segmentación semántica , detección de objetos ,reconocimiento óptico de caracteres (OCR) , reconocimiento de texto escrito a mano (HTR) y, más ampliamente, transcripción , automática o no. ^[1] El término también puede incluir la fase de digitalización del documento usando un escáner y la fase de interpretación del documento, por ejemplo, usando procesamiento de lenguaje natural (NLP) o tecnologías de clasificación de imágenes . Se aplica en muchos campos industriales y científicos para la optimización de procesos administrativos, procesamiento de correo y digitalización de archivos analógicos y documentos históricos.

Fondo

El procesamiento de documentos era inicialmente, como todavía lo es, una especie de trabajo en línea de producción que se ocupa del tratamiento de documentos , como cartas y paquetes, con el objetivo de clasificar, extraer o extraer datos de forma masiva. Este trabajo podría realizarse internamente o mediante la subcontratación de procesos comerciales . ^[2]^{[3] De} hecho, el procesamiento de documentos puede implicar algún tipo de trabajo manual externalizado, como el turco mecánico .

Como ejemplo de procesamiento manual de documentos, relativamente reciente como 2007, ^{[4] el} procesamiento de documentos para "millones de solicitudes de visa y ciudadanía" se refería al uso de "aproximadamente 1,000 trabajadores contratados" que trabajaban para "administrar la sala de correo y la entrada de datos ".

Si bien el procesamiento de documentos implicaba la entrada de datos a través del teclado mucho antes del uso de un mouse de computadora o un escáner de computadora , un artículo de 1990 en The New York Times sobre lo que llamó la " oficina sin papel " declaró que "el procesamiento de documentos comienza con el escáner". ^[5] En este contexto, un ex vicepresidente de Xerox , Paul Strassman, expresó una opinión crítica, diciendo que las computadoras agregan en lugar de reducir el volumen de papel en una oficina. ^[5] Se dijo que los documentos de ingeniería y mantenimiento de un avión pesan "más que el avión en sí" ^{[ cita requerida ]} .

Procesamiento automático de documentos

A medida que avanzaba el estado de la técnica , el procesamiento de documentos pasó a manejar "componentes de documentos ... como entidades de base de datos". ^[6]

Una tecnología llamada procesamiento automático de documentos o, a veces, procesamiento inteligente de documentos (IDP) surgió como una forma específica de automatización inteligente de procesos (IPA), que combina inteligencia artificial como el aprendizaje automático (ML), el procesamiento del lenguaje natural (NLP) o el reconocimiento inteligente de caracteres (ICR). ) para extraer datos de varios tipos de documentos. ^[7]^[8]

Aplicaciones

El procesamiento automático de documentos se aplica a una amplia gama de documentos, ya sean estructurados o no. Por ejemplo, en el mundo de los negocios y las finanzas, las tecnologías se pueden utilizar para procesar facturas en papel, formularios, órdenes de compra, contratos y facturas en efectivo. ^[9] Las instituciones financieras utilizan el procesamiento inteligente de documentos para procesar grandes volúmenes de formularios, como formularios reglamentarios o documentos de préstamos. IDP usa IA para extraer y clasificar datos de documentos, reemplazando la entrada de datos manual. ^[10]

En medicina, se han desarrollado métodos de procesamiento de documentos para facilitar el seguimiento de los pacientes y agilizar los procedimientos administrativos, en particular mediante la digitalización de informes de análisis médicos o de laboratorio. El objetivo también es estandarizar las bases de datos médicas. ^{[11] Los} algoritmos también se utilizan directamente para ayudar a los médicos en el diagnóstico médico, por ejemplo, mediante el análisis de imágenes de resonancia magnética , ^[12]^[13] o imágenes microscópicas . ^[14]

El procesamiento de documentos también se utiliza ampliamente en las humanidades y las humanidades digitales , con el fin de extraer grandes datos históricos de archivos o colecciones patrimoniales. Se desarrollaron enfoques específicos para diversas fuentes, incluidos documentos textuales, como archivos de periódicos, ^[15] pero también imágenes, ^[16] o mapas. ^[17]^[18]

Tecnologias

Si, desde la década de 1980 en adelante, los algoritmos tradicionales de visión por computadora se utilizaron ampliamente para resolver problemas de procesamiento de documentos, ^[19]^[20] estos han sido reemplazados gradualmente por tecnologías de redes neuronales en la década de 2010. ^[21] Sin embargo, las tecnologías tradicionales de visión por computadora todavía se utilizan, a veces junto con redes neuronales, en algunos sectores.

Muchas tecnologías apoyan el desarrollo del procesamiento de documentos, en particular el reconocimiento óptico de caracteres (OCR) y el reconocimiento de texto escrito a mano (HTR), que permiten que el texto se transcriba automáticamente. Los segmentos de texto como tales se identifican mediante algoritmos de detección de objetos o instancias , que a veces también se pueden utilizar para detectar la estructura del documento. La resolución de este último problema a veces también utiliza algoritmos de segmentación semántica .

Estas tecnologías a menudo forman el núcleo del procesamiento de documentos. Sin embargo, otros algoritmos pueden intervenir antes o después de estos procesos. De hecho, las tecnologías de digitalización de documentos también están involucradas, ya sea en forma de escaneo clásico o tridimensional. ^[22] La digitalización de documentos 3D puede recurrir en particular a derivados de la fotogrametría . En ocasiones, también se deben desarrollar escáneres 2D específicos para adaptarse al tamaño de los documentos o por razones de ergonomía del escaneo. ^[16] El procesamiento de documentos también depende de la codificación digital de los documentos en un formato de archivo adecuado . Además, el procesamiento de bases de datos heterogéneas puede depender de tecnologías de clasificación de imágenes .

En el otro extremo de la cadena se encuentran varios algoritmos de finalización, extrapolación o limpieza de datos de imágenes. Para documentos textuales, la interpretación puede utilizar tecnologías de procesamiento del lenguaje natural (PNL).

Ver también

Automatización de documentos
Modelado de documentos
Procesamiento de datos
Imágenes de documentos
Escaneo dúplex
Extracción de textos
Flujo de trabajo

Referencias

^ Len Asprey; Michael Middleton (2003). Gestión integradora de documentos y contenidos: estrategias para explotar el conocimiento empresarial . Idea Group Inc (IGI). ISBN 9781591400554.
^ Vinod V. Sople (25 de mayo de 2009). Subcontratación de procesos empresariales: una cadena de suministro de especializaciones . PHI Learning Pvt. Ltd. ISBN 978-8120338159.
^ Mark Kobayashi-Hillary (5 de diciembre de 2005). Subcontratación a la India: la ventaja offshore . Springer Science & Business Media. ISBN 9783540247944.
^ Julia Preston (2 de diciembre de 2007). "Contratista de inmigración recorta salarios" . The New York Times .
^ a b Lawrence M. Fisher (7 de julio de 1990). "El papel, una vez descartado, ocupa un lugar en la oficina" . The New York Times .
^ Al Young; Dayle Woolstein; Jay Johnson (febrero de 1996). "Título desconocido". Revista de objetos . pag. 51.
^ "Procesamiento inteligente de documentos por Floriana Esposito, Stefano Ferilli, Teresa MA Basile, Nicola Di Mauro" (PDF) . Departamento de Ciencias de la Computación - Universidad de Bari . 2005-04-07 . Consultado el 8 de septiembre de 2018 .
^ Floriana Esposito, Stefano Ferilli, Teresa MA Basile, Nicola Di Mauro (2005-04-01). "Procesamiento inteligente de documentos" en Proceedings. Octava Conferencia Internacional sobre Análisis y Reconocimiento de Documentos, Seúl, Corea del Sur, 2005 págs. 1100-1104. doi: 10.1109 / ICDAR.2005.144 . doi : 10.1109 / ICDAR.2005.144 . S2CID 17302169 .CS1 maint: varios nombres: lista de autores ( enlace )
^ EE.UU. activo US7873576B2 , John E. Jones; William J. Jones y Frank M. Csultis, "Sistema de procesamiento de documentos financieros", publicado el 18 de enero de 2011, publicado el 18 de enero de 2011
^ Bridgwater, Adrian. "Appian agrega inteligencia en la nube de Google a la mezcla de automatización de código bajo" . Forbes . Consultado el 21 de abril de 2021 .
^ Adamo, Francesco; Attivissimo, Filippo; Di Nisio, Attilio; Spadavecchia, Maurizio (febrero de 2015). "Un sistema de procesamiento automático de documentos para la extracción de datos médicos" . Medida . 61 : 88–99. doi : 10.1016 / j.measurement.2014.10.032 . Consultado el 31 de enero de 2021 .
^ Changwan, Kim; Seong-Il, Lee; Won Joon, Cho (septiembre de 2020). "Evaluación volumétrica de extrusión en desgarros de raíz posterior del menisco medial mediante segmentación semiautomática en imágenes de resonancia magnética de 3 teslas" . Ortopedia y traumatología: cirugía e investigación . 101 (5): 963–968. doi : 10.1016 / j.rcot.2020.06.003 . Consultado el 31 de enero de 2021 .
^ Despotović, Ivana; Bart, Goossens; Wilfried, Philips (1 de marzo de 2015). "Segmentación por resonancia magnética del cerebro humano: desafíos, métodos y aplicaciones" . Técnicas de inteligencia computacional en medicina . 2015 : 963–968. doi : 10.1155 / 2015/450341 . PMC 4402572 . PMID 25945121 .
^ Putzua, Lorenzo; Caocci, Giovanni; Di Rubertoa, Cecilia (noviembre de 2014). "Clasificación de leucocitos para la detección de leucemias mediante técnicas de procesamiento de imágenes" . Inteligencia artificial en Medicina . 63 (3): 179-191. doi : 10.1016 / j.artmed.2014.09.002 . hdl : 11584/94592 . PMID 25241903 .
^ Ehrmann, Maud; Romanello, Matteo; Clematide, Simon; Ströbel, Phillip; Barman, Raphaël (2020). "Recursos lingüísticos para periódicos históricos: la colección Impresso" . Actas de la 12ª Conferencia de evaluación y recursos lingüísticos . Marsella, Francia. págs. 958–968.
^ a b Seguin, Benoit; Costiner, Lisandra; di Lenardo, Isabella; Kaplan, Frédéric (1 de abril de 2018). "Nuevas técnicas para la digitalización de archivos fotográficos históricos de arte: el caso de la Fundación Cini en Venecia" . Archivo del programa final y las actas de 2018 . Sociedad de Ciencia y Tecnología de la Imagen. págs. 1-5. doi : 10.2352 / issn.2168-3204.2018.1.0.2 .
^ Ares Oliveira, Sofía; di Lenardo, Isabella; Tourenc, Bastien; Kaplan, Frédéric (11 de julio de 2019). Un enfoque de aprendizaje profundo para la Computación Catastral . Jornada de Humanidades Digitales. Utrecht, Holanda.
^ Petitpierre, Rémi (julio de 2020). Redes neuronales para la segmentación semántica de mapas históricos de ciudades: rendimiento transcultural y el impacto de la diversidad figurativa (MSc). arXiv : 2101.12478 . doi : 10.13140 / RG.2.2.10973.64484 .
^ Fujisawa, H .; Nakano, Y .; Kurino, K. (julio de 1992). "Métodos de segmentación para el reconocimiento de caracteres: de la segmentación al análisis de la estructura del documento" . Actas del IEEE . 80 (7): 1079–1092. doi : 10.1109 / 5.156471 . Consultado el 3 de febrero de 2021 .
^ Tang, Yuan Y .; Lee, Seong-Whan; Suen, Ching Y. (1996). "Procesamiento automático de documentos: una encuesta" . Reconocimiento de patrones . 29 (12): 1931-1952. doi : 10.1016 / S0031-3203 (96) 00044-1 . Consultado el 3 de febrero de 2021 .
^ Ares Oliveira, Sofía; Seguin, Benoit; Kaplan, Frederic (5 a 8 de agosto de 2018). dhSegment: un enfoque genérico de aprendizaje profundo para la segmentación de documentos . 2018 XVI Conferencia Internacional sobre Fronteras en el Reconocimiento de la Escritura (ICFHR). Cataratas del Niágara, NY, EE.UU .: IEEE. arXiv : 1804.10371 . doi : 10.1109 / ICFHR-2018.2018.00011 .Mantenimiento CS1: formato de fecha ( enlace )
^ "Tecnología de escaneo revolucionaria para el arte" . Artmyn . Consultado el 3 de febrero de 2021 .

[1] Len Asprey; Michael Middleton (2003). Gestión integradora de documentos y contenidos: estrategias para explotar el conocimiento empresarial . Idea Group Inc (IGI). ISBN 9781591400554.

[2] Vinod V. Sople (25 de mayo de 2009). Subcontratación de procesos empresariales: una cadena de suministro de especializaciones . PHI Learning Pvt. Ltd. ISBN 978-8120338159.

[3] Mark Kobayashi-Hillary (5 de diciembre de 2005). Subcontratación a la India: la ventaja offshore . Springer Science & Business Media. ISBN 9783540247944.

[VisaDox-4] Julia Preston (2 de diciembre de 2007). "Contratista de inmigración recorta salarios" . The New York Times .

[Paper.NYT-5] Lawrence M. Fisher (7 de julio de 1990). "El papel, una vez descartado, ocupa un lugar en la oficina" . The New York Times .

[6] Al Young; Dayle Woolstein; Jay Johnson (febrero de 1996). "Título desconocido". Revista de objetos . pag. 51.

[7] "Procesamiento inteligente de documentos por Floriana Esposito, Stefano Ferilli, Teresa MA Basile, Nicola Di Mauro" (PDF) . Departamento de Ciencias de la Computación - Universidad de Bari . 2005-04-07 . Consultado el 8 de septiembre de 2018 .

[8] Floriana Esposito, Stefano Ferilli, Teresa MA Basile, Nicola Di Mauro (2005-04-01). "Procesamiento inteligente de documentos" en Proceedings. Octava Conferencia Internacional sobre Análisis y Reconocimiento de Documentos, Seúl, Corea del Sur, 2005 págs. 1100-1104. doi: 10.1109 / ICDAR.2005.144 . doi : 10.1109 / ICDAR.2005.144 . S2CID 17302169 .CS1 maint: varios nombres: lista de autores ( enlace )

[9] EE.UU. activo US7873576B2 , John E. Jones; William J. Jones y Frank M. Csultis, "Sistema de procesamiento de documentos financieros", publicado el 18 de enero de 2011, publicado el 18 de enero de 2011

[10] Bridgwater, Adrian. "Appian agrega inteligencia en la nube de Google a la mezcla de automatización de código bajo" . Forbes . Consultado el 21 de abril de 2021 .

[11] Adamo, Francesco; Attivissimo, Filippo; Di Nisio, Attilio; Spadavecchia, Maurizio (febrero de 2015). "Un sistema de procesamiento automático de documentos para la extracción de datos médicos" . Medida . 61 : 88–99. doi : 10.1016 / j.measurement.2014.10.032 . Consultado el 31 de enero de 2021 .

[12] Changwan, Kim; Seong-Il, Lee; Won Joon, Cho (septiembre de 2020). "Evaluación volumétrica de extrusión en desgarros de raíz posterior del menisco medial mediante segmentación semiautomática en imágenes de resonancia magnética de 3 teslas" . Ortopedia y traumatología: cirugía e investigación . 101 (5): 963–968. doi : 10.1016 / j.rcot.2020.06.003 . Consultado el 31 de enero de 2021 .

[13] Despotović, Ivana; Bart, Goossens; Wilfried, Philips (1 de marzo de 2015). "Segmentación por resonancia magnética del cerebro humano: desafíos, métodos y aplicaciones" . Técnicas de inteligencia computacional en medicina . 2015 : 963–968. doi : 10.1155 / 2015/450341 . PMC 4402572 . PMID 25945121 .

[14] Putzua, Lorenzo; Caocci, Giovanni; Di Rubertoa, Cecilia (noviembre de 2014). "Clasificación de leucocitos para la detección de leucemias mediante técnicas de procesamiento de imágenes" . Inteligencia artificial en Medicina . 63 (3): 179-191. doi : 10.1016 / j.artmed.2014.09.002 . hdl : 11584/94592 . PMID 25241903 .

[15] Ehrmann, Maud; Romanello, Matteo; Clematide, Simon; Ströbel, Phillip; Barman, Raphaël (2020). "Recursos lingüísticos para periódicos históricos: la colección Impresso" . Actas de la 12ª Conferencia de evaluación y recursos lingüísticos . Marsella, Francia. págs. 958–968.

[cini_archive_digitization-16] Seguin, Benoit; Costiner, Lisandra; di Lenardo, Isabella; Kaplan, Frédéric (1 de abril de 2018). "Nuevas técnicas para la digitalización de archivos fotográficos históricos de arte: el caso de la Fundación Cini en Venecia" . Archivo del programa final y las actas de 2018 . Sociedad de Ciencia y Tecnología de la Imagen. págs. 1-5. doi : 10.2352 / issn.2168-3204.2018.1.0.2 .

[17] Ares Oliveira, Sofía; di Lenardo, Isabella; Tourenc, Bastien; Kaplan, Frédéric (11 de julio de 2019). Un enfoque de aprendizaje profundo para la Computación Catastral . Jornada de Humanidades Digitales. Utrecht, Holanda.

[18] Petitpierre, Rémi (julio de 2020). Redes neuronales para la segmentación semántica de mapas históricos de ciudades: rendimiento transcultural y el impacto de la diversidad figurativa (MSc). arXiv : 2101.12478 . doi : 10.13140 / RG.2.2.10973.64484 .

[19] Fujisawa, H .; Nakano, Y .; Kurino, K. (julio de 1992). "Métodos de segmentación para el reconocimiento de caracteres: de la segmentación al análisis de la estructura del documento" . Actas del IEEE . 80 (7): 1079–1092. doi : 10.1109 / 5.156471 . Consultado el 3 de febrero de 2021 .

[20] Tang, Yuan Y .; Lee, Seong-Whan; Suen, Ching Y. (1996). "Procesamiento automático de documentos: una encuesta" . Reconocimiento de patrones . 29 (12): 1931-1952. doi : 10.1016 / S0031-3203 (96) 00044-1 . Consultado el 3 de febrero de 2021 .

[21] Ares Oliveira, Sofía; Seguin, Benoit; Kaplan, Frederic (5 a 8 de agosto de 2018). dhSegment: un enfoque genérico de aprendizaje profundo para la segmentación de documentos . 2018 XVI Conferencia Internacional sobre Fronteras en el Reconocimiento de la Escritura (ICFHR). Cataratas del Niágara, NY, EE.UU .: IEEE. arXiv : 1804.10371 . doi : 10.1109 / ICFHR-2018.2018.00011 .Mantenimiento CS1: formato de fecha ( enlace )

[22] "Tecnología de escaneo revolucionaria para el arte" . Artmyn . Consultado el 3 de febrero de 2021 .

[1]