PDF / A es una versión estandarizada por ISO del formato de documento portátil (PDF) especializada para su uso en el archivo y la conservación a largo plazo de documentos electrónicos . PDF / A se diferencia de PDF al prohibir funciones que no son adecuadas para el archivo a largo plazo, como el enlace de fuentes (a diferencia de la incrustación de fuentes ) y el cifrado. [1] Los requisitos ISO para los visores de archivos PDF / A incluyen pautas de gestión del color , compatibilidad con fuentes incrustadas y una interfaz de usuario para leer anotaciones incrustadas .
Extensión de nombre de archivo | .pdf |
---|---|
Tipo de medio de Internet | Solicitud PDF |
Código de tipo | 'PDF' (incluido un solo espacio) |
Identificador de tipo uniforme (UTI) | com.adobe.pdf |
número mágico | %PDF |
Desarrollado por | YO ASI |
Versión inicial | 1 de octubre de 2005 |
Extendido desde | |
Estándar | ISO 19005 |
Estándares
Abbr. | Subtitular | Publicado | Estándar | Residencia en | Árbitro. |
---|---|---|---|---|---|
PDF / A-1 | Parte 1: Uso de PDF 1.4 | 2005-09-28 | ISO 19005-1 | PDF 1.4 ( Adobe Systems , PDF Reference , tercera edición) | [2] |
PDF / A-2 | Parte 2: Uso de ISO 32000-1 | 2011-06-20 | ISO 19005-2 | PDF 1.7 (ISO 32000-1: 2008) | [3] |
PDF / A-3 | Parte 3: Uso de ISO 32000-1 con soporte para archivos incrustados | 2012-10-15 | ISO 19005-3 | PDF 1.7 (ISO 32000-1: 2008) | [4] |
PDF / A-4 | Parte 4: Uso de ISO 32000-2 | 2020-11 | ISO 19005-4 | PDF 2.0 (ISO 32000-2: 2020) | [5] |
Fondo
PDF es un estándar para codificar documentos en un formato "tal como está impreso" que es portátil entre sistemas. Sin embargo, la idoneidad de un archivo PDF para la conservación de archivos depende de las opciones elegidas cuando se crea el PDF: más notablemente, si incrustar las fuentes necesarias para renderizar el documento; si usar encriptación; y si se debe conservar información adicional del documento original más allá de lo necesario para imprimirlo.
PDF / A fue originalmente una nueva actividad conjunta entre la Asociación de Proveedores de Tecnologías de Impresión, Publicación y Conversión ( NPES ) y la Asociación para la Gestión de la Información y la Imagen para desarrollar un estándar internacional que defina el uso del Formato de Documento Portátil (PDF) para el archivo. documentos. [6] El objetivo era abordar la creciente necesidad de archivar documentos electrónicamente de manera que se garantice la preservación de su contenido durante un período prolongado y garantizar que esos documentos puedan recuperarse y reproducirse con un resultado coherente y predecible. en el futuro. [7] Esta necesidad existe en una amplia variedad de áreas gubernamentales, industriales y académicas en todo el mundo, incluidos los sistemas legales, bibliotecas, periódicos e industrias reguladas. [8]
Descripción
El estándar PDF / A no define una estrategia de archivo ni los objetivos de un sistema de archivo. Identifica un "perfil" para los documentos electrónicos que garantiza que los documentos se puedan reproducir exactamente de la misma manera utilizando varios software en los próximos años. Un elemento clave para esta reproducibilidad es el requisito de que los documentos PDF / A sean 100% autónomos. Toda la información necesaria para mostrar el documento de la misma manera está incrustada en el archivo. Esto incluye, entre otros, todo el contenido (texto, imágenes rasterizadas y gráficos vectoriales), fuentes e información de color. No se permite que un documento PDF / A dependa de información de fuentes externas (por ejemplo, programas de fuentes y flujos de datos), pero puede incluir anotaciones (por ejemplo, enlaces de hipertexto) que enlazan con documentos externos. [9]
Otros elementos clave para la conformidad con PDF / A incluyen: [10] [11] [12]
- Está prohibido el contenido de audio y video.
- Están prohibidos los lanzamientos de archivos ejecutables y JavaScript .
- Todas las fuentes deben estar incrustadas y también deben poder incrustarse legalmente para una reproducción universal ilimitada. Esto también se aplica a las denominadas fuentes estándar PostScript , como Times o Helvetica .
- Espacios de colores especificados de forma independiente del dispositivo.
- Está prohibido el cifrado.
- Se requiere el uso de metadatos basados en estándares.
- Se prohíben las referencias de contenido externo.
- LZW está prohibido debido a restricciones de propiedad intelectual. Los modelos de compresión de imágenes JPEG 2000 no están permitidos en PDF / A-1 (basado en PDF 1.4), ya que se introdujeron por primera vez en PDF 1.5. La compresión JPEG 2000 está permitida en PDF / A-2 y PDF / A-3.
- Los objetos y capas transparentes (grupos de contenido opcionales) están prohibidos en PDF / A-1, pero están permitidos en PDF / A-2.
- Las disposiciones para firmas digitales de acuerdo con el estándar PAdES ( firmas electrónicas avanzadas en PDF ) se admiten en PDF / A-2.
- Los archivos incrustados están prohibidos en PDF / A-1, pero PDF / A-2 permite incrustar archivos PDF / A, lo que facilita el archivo de conjuntos de documentos PDF / A en un solo archivo. PDF / A-3 permite incrustar cualquier formato de archivo como XML, CAD y otros en documentos PDF / A.
- El uso de formularios XML Forms Architecture (XFA) basados en XML está prohibido en PDF / A. (Los datos del formulario XFA se pueden conservar en un archivo PDF / A-2 pasando de la clave XFA al árbol de nombres, que en sí mismo es el valor de la clave XFAResources del diccionario de nombres del diccionario del catálogo de documentos).
- Los campos de formulario PDF interactivo deben tener un diccionario de apariencia asociado con los datos del campo. El diccionario de apariencia se utilizará al representar el campo.
Niveles y versiones de conformidad
PDF / A-1
La Parte 1 de la norma se publicó por primera vez el 28 de septiembre de 2005, [2] y especifica dos niveles de conformidad para archivos PDF: [13]
- PDF / A-1b: conformidad de nivel B (básico)
- PDF / A-1a: conformidad de nivel A (accesible)
La conformidad con el nivel B solo requiere que se sigan los estándares necesarios para la reproducción confiable de la apariencia visual de un documento, mientras que la conformidad con el nivel A incluye todos los requisitos del nivel B además de las características destinadas a mejorar la accesibilidad de un documento .
Requisitos adicionales de nivel A:
- Especificación de idioma
- Estructura jerárquica del documento
- Intervalos de texto etiquetados y texto descriptivo para imágenes y símbolos
- Asignaciones de caracteres a Unicode
La conformidad de Nivel A tenía la intención de aumentar la accesibilidad de los archivos conformes para usuarios con discapacidades físicas al permitir que el software de asistencia, como lectores de pantalla , extraiga e interprete con mayor precisión el contenido de un archivo. [13] Un estándar posterior, PDF / UA , fue desarrollado para eliminar lo que se consideró algunas de las deficiencias de PDF / A, reemplazando muchas de sus pautas generales con especificaciones técnicas más detalladas. [14]
PDF / A-2
La Parte 2 del estándar, publicada el 20 de junio de 2011, [3] aborda algunas de las nuevas características agregadas con las versiones 1.5, 1.6 y 1.7 de la Referencia PDF. Los archivos PDF / A-1 no necesariamente se ajustarán a PDF / A-2, y los archivos PDF / A-2 no necesariamente se ajustarán a PDF / A-1.
La Parte 2 del Estándar PDF / A se basa en un PDF 1.7 (ISO 32000-1), en lugar de PDF 1.4, y ofrece una serie de características nuevas:
- Compresión de imagen JPEG 2000 .
- soporte para efectos de transparencia y capas.
- incrustación de fuentes OpenType .
- disposiciones para firmas digitales de acuerdo con el estándar PDF Advanced Electronic Signatures - PAdES .
- la opción de incrustar archivos PDF / A para facilitar el archivo de conjuntos de documentos con un solo archivo. [11]
La parte 2 define tres niveles de conformidad. PDF / A-2a y PDF / A-2b corresponden a los niveles de conformidad ayb en PDF / A-1. Un nuevo nivel de conformidad, PDF / A-2u, representa la conformidad de Nivel B (PDF / A-2b) con el requisito adicional de que todo el texto del documento tenga mapeo Unicode. [13] [15]
PDF / A-3
La parte 3 del estándar, publicada el 15 de octubre de 2012, [4] difiere de PDF / A-2 solo en un aspecto: permite la incrustación de formatos de archivo arbitrarios (como XML, CSV, CAD, documentos de procesamiento de texto, hojas de cálculo documentos y otros) en documentos compatibles con PDF / A. [dieciséis]
PDF / A-4
La parte 4 del estándar, basada en PDF 2.0, se publicó a finales de 2020. [17]
Cómo crear un archivo PDF / A
Los archivos a veces solicitan a sus usuarios que envíen archivos PDF / A. Por lo tanto, brindan a sus usuarios información sobre cómo convertir sus archivos a PDF / A. Hay varios métodos que utilizan software estándar que difieren en el tiempo de cálculo, así como en la preservación de enlaces, ecuaciones, gráficos vectoriales y caracteres especiales. [18]
Cuando los documentos se convierten a PDF / Se necesita una inspección visual ya que los errores en el contenido visual son comunes. En una muestra de prueba, el 11 por ciento del documento PDF / A-1b producido contenía artefactos visuales. Estos errores de reproducibilidad incluyeron problemas de gráficos vectoriales (objetos transparentes), pérdida de enlaces, pérdida de otro contenido del documento (caracteres ilegibles, texto faltante, parte del documento faltante), campos actualizados (que reflejan la hora o carpeta de conversión) y errores ortográficos. [19] Por lo tanto, los archivos no suelen convertirse a PDF / A por sí mismos. En cambio, algunos archivos piden a sus usuarios que proporcionen un documento PDF / A. Las configuraciones de computadora típicas proporcionan varios métodos para la conversión de documentos a PDF / A con diferentes pros y contras. [20]
La conversión de un PDF simple (hasta la versión 1.4) en un PDF / A-2 generalmente funciona como se esperaba, excepto por problemas con glifos . Según la PDF Association, "Pueden surgir problemas antes y / o durante la generación de archivos PDF. Un archivo PDF / A puede ser formalmente correcto pero aún tener glifos incorrectos. Solo una revisión visual cuidadosa puede descubrir este problema. Porque los problemas de generación también afectan Mapeo Unicode, el problema atrae la atención cuando se realiza una verificación visual en el texto extraído. En PDF / A, el uso de texto / fuente se especifica de manera lo suficientemente única como para garantizar que no pueda ser incorrecto. Si los visores o impresoras no ofrecen soporte completo para los sistemas de codificación, esto puede resultar en problemas con respecto a PDF / A ". [21] Lo que significa que para que un documento cumpla completamente con el estándar, será correcto internamente, mientras que el sistema utilizado para ver o imprimir el documento puede producir resultados no deseados.
Un documento producido con conversión de reconocimiento óptico de caracteres (OCR) a PDF / A-2 o PDF / A-3 no admite la notdefglyph
marca. Por lo tanto, este tipo de conversión puede resultar en contenido sin renderizar.
Se pueden crear documentos estándar PDF / A con el siguiente software: SoftMaker Office 2021 [22] [ referencia circular ] , MS Word 2010 y versiones posteriores, Adobe Acrobat Distiller, PDF Creator, OpenOffice o LibreOffice desde la versión 3.0, LaTeX con complementos pdfx o pdfTeX o utilizando una impresora PDF virtual (Adobe Acrobat Pro, PDF24, FreePDF + Ghostscript). [23]
Identificación
Un documento PDF / A se puede identificar como tal a través de metadatos específicos de PDF / A ubicados en el espacio de nombres "http://www.aiim.org/pdfa/ns/id/". Estos metadatos representan un reclamo de conformidad; en sí mismo no asegura la conformidad:
- un documento PDF puede ser compatible con PDF / A, excepto por la falta de metadatos PDF / A. Esto puede suceder, por ejemplo, con documentos que fueron generados antes de la definición del estándar PDF / A, por autores que conocen las características que presentan problemas de conservación a largo plazo.
- un documento PDF puede identificarse como PDF / A, pero puede contener incorrectamente funciones de PDF no permitidas en PDF / A; por lo tanto, los documentos que afirman ser compatibles con PDF / A deben probarse para verificar su conformidad. [24]
Validación
Se intenta la validación de documentos PDF / A para revelar si un archivo producido es realmente un archivo PDF / A o no. Desafortunadamente, los validadores de PDF / A a menudo no están de acuerdo, ya que la interpretación de los estándares PDF / A no siempre es clara. [19]
Suite de prueba Isartor
La colaboración de la industria en el PDF / A Competence Center original llevó al desarrollo de Isartor Test Suite en 2007 y 2008. El conjunto de pruebas consta de 204 archivos PDF construidos intencionalmente para fallar sistemáticamente cada uno de los requisitos de conformidad con PDF / A-1b, lo que permite los desarrolladores para probar la capacidad de su software para validar contra el nivel más básico de conformidad del estándar. [25] [26] A mediados de 2009, el conjunto de pruebas ya había hecho una diferencia apreciable en la calidad general del software de validación de PDF / A. [27]
veraPDF
El consorcio veraPDF, liderado por la Open Preservation Foundation [28] y la PDF Association, fue creado en respuesta al desafío PREFORMA de la Comisión de la UE [29] para desarrollar un validador de código abierto para el formato PDF / A. La PDF Association lanzó el Grupo de trabajo técnico de validación de PDF en noviembre de 2014 para articular un plan para desarrollar un validador de PDF / A compatible con la industria. [30] [ verificación fallida ]
El consorcio veraPDF ganó posteriormente la fase 2 del contrato PREFORMA en abril de 2015. [31] El desarrollo continuó durante 2016, [32] y la Fase 2 se completó según lo programado para diciembre de 2016. El período de prueba y aceptación de la Fase 3 concluyó en julio de 2017. veraPDF ahora cubre todas las partes (1, 2 y 3) y los niveles de conformidad (a, b, u) de PDF / A.
veraPDF está disponible para su instalación en Windows, macOS o Linux mediante un analizador de PDF basado en PDFBox o "Greenfields". [33]
Visores de PDF / A
La especificación PDF / A también establece algunos requisitos para un visor PDF / A conforme, que debe
- ignore cualquier dato que no esté descrito por los estándares PDF y PDF / A;
- ignorar cualquier información de linealización proporcionada por el archivo;
- utilice únicamente las fuentes incrustadas (en lugar de las fuentes simuladas, sustituidas o disponibles localmente);
- mostrar solo usando el perfil de color incrustado;
- asegurarse de que los campos del formulario no cambien la presentación renderizada y se rendericen sin tener en cuenta los datos del formulario;
- asegúrese de que las anotaciones se representen de forma coherente.
Cuando se encuentra un archivo que afirma ser compatible con PDF / A, algunos visores de PDF utilizarán de forma predeterminada un "modo de visualización de PDF / A" especial para cumplir con los requisitos del lector conforme. Por poner un ejemplo, Adobe Acrobat y Adobe Reader 9 incluyen una alerta para avisar al usuario de que se ha activado el modo de visualización PDF / A. Algunos visores de PDF permiten a los usuarios desactivar el modo de visualización de PDF / A o eliminar la información de PDF / A de un archivo. [34] [35]
Recepción
Un documento PDF / A debe incluir todas las fuentes en uso; en consecuencia, un archivo PDF / A a menudo será más grande que un archivo PDF equivalente que no incluya fuentes incrustadas.
El uso de transparencias está prohibido en PDF / A-1. La mayoría de las herramientas de generación de PDF que permiten el cumplimiento de documentos PDF / A, como la exportación de PDF en OpenOffice.org o la herramienta de exportación de PDF en las suites de Microsoft Office 2007, también harán que las imágenes transparentes de un documento determinado no sean transparentes. Esa restricción se eliminó en PDF / A-2. [10]
Algunos archiveros han expresado su preocupación de que PDF / A-3, que permite incrustar archivos arbitrarios en documentos PDF / A, podría resultar en la elusión de los procedimientos de la institución de la memoria y restricciones en los formatos archivados. [36]
La PDF Association había abordado varios conceptos erróneos [37] sobre PDF / A en su publicación "PDF / A in a Nutshell 2.0". [38]
Ver también
- Edad oscura digital
- PDF / E : para documentación técnica y de ingeniería
- PDF / X : otro subconjunto del estándar PDF, optimizado para la producción de impresión
- PDF / VT : para impresión variable y transaccional
Referencias
- ↑ Oettler, Alexandra (7 de febrero de 2013). "Datos de PDF / A: una introducción al estándar" . Asociación PDF . Consultado el 11 de julio de 2014 .
- ^ a b "ISO 19005-1: 2005" . ISO . Consultado el 27 de julio de 2016 .
- ^ a b "ISO 19005-2: 2011" . ISO . Consultado el 27 de julio de 2016 .
- ^ a b "ISO 19005-3: 2012" . ISO . Consultado el 27 de julio de 2016 .
- ^ "ISO 19005-4: 2020" . ISO . Consultado el 4 de febrero de 2021 .
- ^ "Una breve historia de PDF / A" . Asociación PDF . 2013-02-07 . Consultado el 11 de julio de 2014 .
- ^ Oettler, Alexandra (7 de febrero de 2013). "Las razones más importantes para utilizar PDF / A" . Asociación PDF . Consultado el 11 de julio de 2014 .
- ^ Oettler, Alexandra (7 de febrero de 2013). "Usos típicos de PDF / A" . Asociación PDF . Consultado el 11 de julio de 2014 .
- ^ Oettler, Alexandra (7 de febrero de 2013). "El lado técnico del estándar PDF / A" . Asociación PDF . Archivado desde el original el 2 de julio de 2015 . Consultado el 7 de agosto de 2017 .CS1 maint: bot: estado de URL original desconocido ( enlace )
- ^ a b "PDF / A - Una mirada al aspecto técnico" . Archivado desde el original el 26 de julio de 2011 . Consultado el 6 de julio de 2011 .
- ^ a b "¡Estándar PDF / A-2 publicado por ISO! El nuevo estándar incluye grandes mejoras técnicas" . 2011-07-01 . Consultado el 6 de julio de 2011 .
- ^ Preguntas frecuentes (FAQ) - ISO 19005-1: 2005 - PDF / A-1, Fecha: 10 de julio de 2006 (PDF) , 2006-07-10, archivado desde el original (PDF) el 18 de enero de 2012 , recuperado 2011-07-06
- ^ a b c "PDF / A-1b mejorado" . Asociación PDF . 2011-08-05. Archivado desde el original el 15 de septiembre de 2012 . Consultado el 26 de septiembre de 2012 .
- ^ Oettler, Alexandra (7 de febrero de 2013). "PDF / A y los demás estándares PDF" . Asociación PDF . Archivado desde el original el 14 de julio de 2014 . Consultado el 12 de julio de 2014 .
- ^ PDF / A-2, PDF para conservación a largo plazo, el uso de la norma ISO 32000-1 (PDF 1.7) , Biblioteca del Congreso , recuperada 09/26/2012
- ^ "PDF Association organiza su primer seminario sobre PDF / A para incluir los estándares 1 a 3" . Asociación PDF . 2012-03-29. Archivado desde el original el 15 de septiembre de 2012.
- ^ El nuevo PDF 2.0 y los estándares de subconjunto (PDF Association)
- ^ "¿Cómo creo un archivo PDF / A?" . Innovación @ ETH-Bibliothek . 2017-02-15 . Consultado el 29 de abril de 2020 .
- ^ a b Suri, Roland Erwin; El-Saad, Mohamed (6 de junio de 2018). "Perdido en la migración: calidad del documento para la conversión por lotes a PDF / A". Library Hi Tech (antes de impresión): LHT – 10–2017-0220. doi : 10.1108 / LHT-10-2017-0220 . hdl : 20.500.11850 / 269199 . ISSN 0737-8831 .
- ^ Suri, Roland (15 de febrero de 2017). "¿Cómo creo un archivo PDF / A?". doi : 10.16911 / ethz-ib-2722-de . Cite journal requiere
|journal=
( ayuda ) - ^ PDF / A - Una mirada al aspecto técnico , consultado el 14 de agosto de 2015
- ^ Oficina de SoftMaker
- ^ INSTRUCCIONES PARA LA CREACIÓN DE ARCHIVOS QUE CUMPLEN CON PDF / A PARA SU PUBLICACIÓN EN LÍNEA EN TU BERLIN
- ^ Oettler, Alexandra (7 de febrero de 2013). "Validación: ¿es realmente PDF / A?" . Asociación PDF . Consultado el 11 de julio de 2014 .
- ^ Conjunto de pruebas Isartor (PDF) . Centro de competencia PDF / A. 2008-08-12 . Consultado el 23 de septiembre de 2016 .
- ^ "Isartor Test Suite" . Asociación PDF . 2011-08-03 . Consultado el 23 de septiembre de 2016 .
- ^ "Informe Bavaria" . PDFlib . 2009. Archivado desde el original el 21 de abril de 2015 . Consultado el 30 de abril de 2015 .CS1 maint: URL no apta ( enlace )
- ^ "Proyecto Open Preservation Foundation veraPDF" . Fundación de Preservación Abierta . Consultado el 30 de abril de 2015 .
- ^ PREFORMA, un proyecto financiado por la Comisión de la UE
- ^ "Un consorcio que incluye la Asociación PDF gana la fase 1 de una licitación de la Comisión de la UE para crear un validador PDF / A de código abierto" . Asociación PDF . 2014-11-13. Archivado desde el original el 21 de abril de 2015 . Consultado el 30 de abril de 2015 .
- ^ PREFORMA inicia la fase de creación de prototipos , consultado el 30 de abril de 2015
- ^ "veraPDF 0.22 lanzado" . Consultado el 23 de septiembre de 2016 .
- ^ "Software" . veraPDF . 30 de junio de 2015 . Consultado el 15 de marzo de 2017 . Página para descargar el instalador específico de la plataforma.
- ^ "Cómo eliminar información PDF / A de un archivo" . Consultado el 10 de abril de 2014 .
- ^ "Cambiar el modo de visualización de PDF / A" . Consultado el 10 de abril de 2014 .
- ^ Archiveros: Sin flores para PDF / A-3 , consultado el 12 de julio de 2014
- ^ Los mitos y leyendas que rodean a PDF / A , consultado el 15 de febrero de 2018
- ^ "PDF / A en pocas palabras 2.0" .
Otras lecturas
- PDF / A in a Nutshell 2.0 - publicado por PDF Association (2013)
- PDF / A 101: Introducción - presentación de la Primera Conferencia Internacional PDF / A (2008)
- Informe técnico: PDF / A - Conceptos básicos - de PDF Tools AG (2009)
- Descripción del formato para PDF / A-1 - en digitalpreservation.gov
enlaces externos
- Asociación PDF
- Centro de competencia PDF / A
- veraPDF : software de validación de PDF / A