OCRFeeder es un paquete de reconocimiento óptico de caracteres para GNOME , que también admite prácticamente cualquier motor de OCR de línea de comandos, como CuneiForm , GOCR , Ocrad y Tesseract . Convierte documentos en papel en archivos de documentos digitales y puede servir para hacerlos accesibles a los usuarios con discapacidad visual.
Desarrollador (es) | Joaquim Rocha ( Igalia ) |
---|---|
Versión inicial | Marzo de 2009 |
Lanzamiento estable | 0.8.3 / 8 de marzo de 2020 [1] |
Repositorio | |
Escrito en | Python , PyGTK |
Sistema operativo | Linux , similar a Unix |
Disponible en | Interfaz: checo , danés , alemán , inglés , español , francés , gallego , italiano , noruego (bokmål) , portugués , rumano , esloveno , sueco , chino [2] Reconocimiento: depende del motor OCR utilizado |
Tipo | Reconocimiento óptico de caracteres |
Licencia | GPL ( software gratuito ) |
Sitio web | wiki |
OCRFeeder es un software gratuito y de código abierto sujeto a los términos de la GNU General Public License (GPL) versión 3 o posterior. Está disponible para Linux y otros sistemas operativos similares a Unix.
Historia
OCRFeeder se inició como una tesis de maestría en informática por Joaquim Rocha, [3] quien luego fue contratado por Igalia , SL y continuó su desarrollo allí. [4] [5]
La primera versión se publicó en marzo de 2009. [6] El proyecto OCRFeeder se publicó inicialmente y se alojó en Google Code , usó temporalmente Gitorious [7] y ahora usa la infraestructura GNOME. [8] Desde el 5 de abril de 2010, se incluye un paquete de software en los repositorios oficiales de Debian. [9]
La versión 0.7 del 30 de julio de 2010 trajo características de preprocesamiento de imágenes, 0.7.1 (8 de noviembre de 2010) habilitadas para el acceso al escáner desde OCRFeeder.
Características
OCRFeeder tiene una interfaz gráfica de usuario simple que está diseñada según las Pautas de interfaz humana de GNOME . Realiza un análisis de diseño de documentos y transfiere el diseño a formatos de salida compatibles. Busca áreas de contenido, las describe y adivina el tipo de contenido (texto o imagen) y procesa áreas de texto a través del back-end de OCR. Puede utilizar prácticamente cualquier motor de OCR de línea de comandos como back-end y cuenta con detección automática y configuración automática para todos los motores gratuitos populares. Los back-end de OCR pueden configurarse automáticamente, la línea de comando necesaria ingresada en un diálogo GUI o configurarse directamente a través de un archivo XML . Se puede realizar el posprocesamiento de la imagen escaneada, incluido el desviación. [10] Todos los resultados del reconocimiento se pueden revisar y editar antes de guardarlos en el formato de salida deseado. Las sesiones se pueden guardar y cargar. La suite también incluye un corrector ortográfico . [11] OCRFeeder tiene procedimientos incorporados para el posprocesamiento de los resultados de OCR sin procesar devueltos por el motor de OCR. Puede eliminar la segmentación restante de las líneas de texto impresas, incluso con la eliminación de la separación de sílabas.
Aunque OCRFeeder es una herramienta GUI, también se puede ejecutar en modo de línea de comandos (como ocrfeeder-cli), que puede ser una herramienta útil para el procesamiento automático de documentos por lotes . [12] En este modo, OCRFeeder utiliza el motor de OCR predeterminado, que el usuario puede configurar en las preferencias de la aplicación. [13] [14]
El programa está escrito en Python y usa la biblioteca GTK + (usando PyGTK ). [12] actúa como un gráfico front-end para otras herramientas existentes. Por ejemplo, no realiza el reconocimiento de caracteres en sí, sino que utiliza programas externos como un "motor OCR" que está instalado en el sistema. Puede detectar y configurar automáticamente CuneiForm , GOCR , Ocrad y Tesseract como motores backend de OCR. [15] Se accede a los escáneres a través de SANE . Para el posprocesamiento de imágenes escaneadas hay integración de la herramienta de línea de comandos “Unpaper”, [12] entre otras cosas. Los archivos PDF se procesan con Ghostscript en el backend.
Entrada y salida
OCRFeeder puede importar datos de archivos PDF o gráficos . A partir de la versión 0.7.1a, admite la captura de imágenes directamente desde el dispositivo de escaneo . [11]
Los resultados se pueden guardar en formatos de archivo HTML , OpenDocument , texto plano [16] o PDF [17] . También se planea la salida del archivo hOCR . [3] El formateo inicial se puede realizar directamente en el programa.
Referencias
- ^ "Archivo FTP de GNOME, archivo de noticias OCRFeeder 0.8.3" . Consultado el 12 de abril de 2020 .
- ^ "Repositorio de código fuente GNOME GIT, archivo LINGUAS" . Consultado el 9 de febrero de 2011 .
- ^ a b "OCRFeeder - GNOME Live!" . Consultado el 9 de febrero de 2011 .
- ^ "Productos" . Igalia . Consultado el 24 de noviembre de 2012 .
- ^ Rocha, Joaquim (14 de enero de 2013). "Vientos de cambio" . Consultado el 4 de septiembre de 2013 .
- ^ OCRFeeder, Código de Google
- ^ wiki.gnome.org Diferencias entre las revisiones 2 y 3
- ^ wiki.gnome.org - Diferencias entre las revisiones 5 y 6
- ^ Debian Changelog ocrfeeder (0.6.6 + dfsg1-1)
- ^ "Repositorio de código fuente GNOME GIT, archivo NEWS" . Consultado el 3 de febrero de 2011 .
- ^ a b Rocha, Joaquim (9 de noviembre de 2010). "Lanzamiento de la versión 0.7.1a de OCRFeeder" . Consultado el 9 de febrero de 2011 .
- ^ a b c "Repositorio de código fuente GNOME GIT, archivo README" . Consultado el 9 de febrero de 2011 .
- ^ Μάνος (22 de marzo de 2011). "OCRFeeder 0.7.4: Ψηφιοποιήστε τα έγγραφα σας" . OSArena . Consultado el 8 de junio de 2011 .
- ^ Hejda, Václav (26 de mayo de 2011). "OCRFeeder - Užitečný rozpoznávač textu, který však neumí česky" . LinuxEXPRES.cz . QCM sro . Consultado el 8 de junio de 2011 .
- ^ "Repositorio de código fuente GNOME GIT, archivo configuration.py" . Consultado el 3 de febrero de 2011 .
- ^ Nuevas funciones de OCRFeeder versión 0.7.4
- ^ Versión 0.7.6
enlaces externos
- Página web oficial