DjVu


DjVu ( / ˌ d ʒ ɑ v ü / DIA -zhah- VOO , como el francés " deja vu " [3] ) es un equipo de formato de archivo diseñado principalmente para almacenar documentos escaneados , especialmente los que contienen una combinación de texto, dibujos lineales , imágenes en color indexadas y fotografías. Utiliza tecnologías como la separación de capas de imagen de texto y fondo / imágenes, carga progresiva , codificación aritmética y compresión con pérdida para bitonal ( monocromo) imágenes. Esto permite almacenar imágenes legibles de alta calidad en un espacio mínimo, de modo que puedan estar disponibles en la web .

Se ha promocionado que DjVu proporciona archivos más pequeños que PDF para la mayoría de los documentos escaneados. [4] Los desarrolladores de DjVu informan que las páginas de las revistas en color se comprimen a 40-70 kB, los papeles técnicos en blanco y negro se comprimen a 15-40 kB y los manuscritos antiguos se comprimen a alrededor de 100 kB; una imagen JPEG satisfactoria normalmente requiere 500 kB. [5] Al igual que PDF, DjVu puede contener una capa de texto OCR , lo que facilita la realización de operaciones de copiar y pegar y de búsqueda de texto.

Hay disponibles creadores, manipuladores, convertidores, complementos de navegador web y visores de escritorio gratuitos. [3] DjVu es compatible con varios visores de documentos multiformato y software de lectura de libros electrónicos en Linux ( Okular , Evince ), Windows ( Okular , SumatraPDF ) y Android (FBReader, EBookDroid, PocketBook).

La tecnología DjVu fue desarrollada originalmente por Yann LeCun , Léon Bottou , Patrick Haffner , Paul G. Howard , Patrice Simard y Yoshua Bengio en AT&T Labs de 1996 a 2001. [5]

Antes de la estandarización de PDF en 2008, [6] [7] DjVu se consideraba superior debido a que era un formato de archivo abierto en contraste con la naturaleza patentada de PDF en ese momento. La relación de compresión más alta declarada (y, por lo tanto, el tamaño de archivo más pequeño) y la supuesta facilidad de convertir grandes volúmenes de texto en formato DjVu, fueron otros argumentos para la superioridad de DjVu sobre PDF en el panorama tecnológico de 2004. Tecnólogo independiente Brewster Kahle en una charla de 2004 on IT Conversations discutió los beneficios de permitir un acceso más fácil a los archivos DjVu. [8] [9]

La biblioteca DjVu distribuida como parte del paquete de código abierto DjVuLibre se ha convertido en la implementación de referencia para el formato DjVu. DjVuLibre ha sido mantenido y actualizado por los desarrolladores originales de DjVu desde 2002. [10]