En ciencias de la computación , el reconocimiento inteligente de caracteres ( ICR ) es un sistema de reconocimiento óptico de caracteres (OCR) avanzado o, algo más específico, un sistema de reconocimiento de escritura a mano que permite que una computadora aprenda fuentes y diferentes estilos de escritura a mano durante el procesamiento para mejorar la precisión y los niveles de reconocimiento. .
Capacidades
La mayor parte del software ICR tiene un sistema de autoaprendizaje denominado red neuronal , que actualiza automáticamente la base de datos de reconocimiento de nuevos patrones de escritura a mano. Amplía la utilidad de los dispositivos de escaneo para el procesamiento de documentos, desde el reconocimiento de caracteres impresos (una función del OCR) hasta el reconocimiento de material escrito a mano. Debido a que este proceso está involucrado en el reconocimiento de la escritura a mano, los niveles de precisión pueden, en algunas circunstancias, no ser muy buenos, pero pueden alcanzar tasas de precisión de más del 97% en la lectura de escritura a mano en formas estructuradas. A menudo, para lograr estas altas tasas de reconocimiento, se utilizan varios motores de lectura dentro del software y cada uno recibe derechos electivos de voto para determinar la lectura real de los caracteres. En los campos numéricos, los motores que están diseñados para leer números tienen preferencia, mientras que en los campos alfa, los motores diseñados para leer letras escritas a mano tienen derechos electivos más altos. Cuando se usa junto con un concentrador de interfaz personalizado, los datos escritos a mano se pueden ingresar automáticamente en un sistema de back office evitando la laboriosa codificación manual y pueden ser más precisos que la entrada tradicional de datos humanos.
Procesamiento automatizado de formularios
Un desarrollo importante de ICR fue la invención del procesamiento automatizado de formularios en 1993 por Joseph Corcoran, a quien se le otorgó una patente sobre la invención. Esto implicó un proceso de tres etapas para capturar la imagen del formulario para ser procesada por ICR y prepararla para permitir que el motor ICR dé los mejores resultados, luego capturar la información usando el motor ICR y finalmente procesar los resultados para validar automáticamente la salida. desde el motor ICR.
Esta aplicación de ICR aumentó la utilidad de la tecnología y la hizo aplicable para su uso con formas del mundo real en aplicaciones comerciales normales. Las aplicaciones de software modernas utilizan ICR como una tecnología para reconocer texto en formularios rellenados a mano (impresos a mano).
Reconocimiento inteligente de palabras
El reconocimiento inteligente de palabras (IWR) puede reconocer y extraer no solo información escrita a mano impresa, sino también escritura cursiva. ICR reconoce a nivel de personaje, mientras que IWR trabaja con palabras o frases completas. Capaz de capturar información no estructurada de las páginas de todos los días, se dice que IWR está más evolucionado que el ICR impreso a mano. [ cita requerida ]
IWR, que no está destinado a reemplazar los sistemas ICR y OCR convencionales, está optimizado para procesar documentos del mundo real que contienen en su mayoría campos de datos de formato libre difíciles de reconocer que son inherentemente inadecuados para ICR. Esto significa que el mejor y más alto uso de IWR es eliminar un alto porcentaje de la entrada manual de datos escritos a mano y campos de impresión a mano en documentos que de otra manera solo podrían ser ingresados por humanos.
Ver también
- Automatización de documentos
- Análisis de diseño de documentos
- Modelado de documentos
- Aprendizaje automático
- Procesamiento de documentos subcontratado
- Extracción de textos