Escaneo de libros


El escaneo de libros o la digitalización de libros (también: escaneo de revistas o digitalización de revistas ) es el proceso de convertir libros físicos y revistas en medios digitales como imágenes , texto electrónico o libros electrónicos ( libros electrónicos) mediante el uso de un escáner de imágenes .

Los libros digitales se pueden distribuir, reproducir y leer fácilmente en la pantalla . Los formatos de archivo comunes son DjVu , formato de documento portátil (PDF) y formato de archivo de imagen etiquetada (TIFF). Para convertir las imágenes sin procesar, el reconocimiento óptico de caracteres (OCR) se utiliza para convertir las páginas de un libro en un formato de texto digital como ASCII u otro formato similar, lo que reduce el tamaño del archivo y permite que otras aplicaciones vuelvan a formatear, buscar o procesar el texto.

Los escáneres de imágenes pueden ser manuales o automáticos. En un escáner de imágenes comercial común, el libro se coloca sobre una placa de vidrio plana (o platina), y una matriz óptica y de luz se mueve a través del libro debajo del vidrio. En los escáneres de libros manuales, la placa de vidrio se extiende hasta el borde del escáner, lo que facilita la alineación del lomo del libro. Otros escáneres de libros colocan el libro boca arriba en un marco en forma de V y fotografían las páginas desde arriba. Las páginas pueden pasarse a mano o mediante dispositivos automáticos de transporte de papel. Por lo general, se presionan hojas de vidrio o plástico contra la página para aplanarla.

Después de escanear, el software ajusta las imágenes del documento alineándolo, recortándolo, editándolo y convirtiéndolo en texto y en formato de libro electrónico final. Los correctores de pruebas humanos suelen comprobar la salida en busca de errores.

El escaneo a 118 puntos / centímetro ( 300 ppp ) es adecuado para la conversión a salida de texto digital, pero para la reproducción de archivos de libros raros, elaborados o ilustrados, se usa una resolución mucho más alta. [ Cita requerida ] escáneres de alta gama capaces de miles de páginas por hora pueden costar miles de dólares, pero hágalo usted mismo (DIY), escáneres de libros manuales capaces de 1200 páginas por hora han sido construidos por US $ 300. [1]

Los escáneres de libros comerciales no son como los escáneres normales ; Estos escáneres de libros suelen ser una cámara digital de alta calidad con fuentes de luz a cada lado de la cámara montadas en algún tipo de marco para facilitar el acceso de una persona o máquina a hojear las páginas del libro. Algunos modelos incluyen soportes para libros en forma de V, que brindan soporte para el lomo de los libros y también centran la posición del libro automáticamente.


Escáner de libros Internet Archive Scribe en 2011
Escáner de libros de Internet Archive
Boceto de un escáner de libros en forma de V de Atiz
Boceto de un escáner de libros manual típico
Un ejemplo de un escáner / digitalizador de libros no destructivo de bricolaje, con el diseño del libro hacia abajo, lo que permite que la gravedad aplaste las páginas
Vídeo del escáner de libros robótico DL mini
Escáner automático ScanRobot con ángulo de apertura de 60 °
Pasar las páginas entre escaneos