ALTO (Diseño analizado y objeto de texto) es un esquema XML abierto desarrollado por el proyecto financiado con fondos europeos llamado METAe.
El estándar se desarrolló inicialmente para la descripción de texto OCR e información de diseño de páginas para material digitalizado. El objetivo era describir el diseño y el texto en una forma para poder reconstruir la apariencia original en función de la información digitalizada, similar al enfoque de una operación de almacenamiento de imágenes sin pérdidas.
ALTO se utiliza a menudo en combinación con el estándar de transmisión y codificación de metadatos (METS) para la descripción de todo el objeto digitalizado y la creación de referencias en los archivos ALTO, por ejemplo, la descripción de la secuencia de lectura.
El estándar está alojado en la Biblioteca del Congreso desde 2010 y mantenido por el Comité Editorial al mismo tiempo.
En el tiempo desde la versión final del estándar ALTO en junio de 2004 (versión 1.0) ALTO fue mantenido por CCS CCS Content Conversion Specialists GmbH, Hamburgo hasta la versión 1.4.
Versiones
La última versión del esquema y una descripción general de todas las versiones con los enlaces al esquema se pueden encontrar en https://github.com/altoxml
Estructura
Un archivo ALTO consta de tres secciones principales como elementos secundarios del elemento raíz
- La sección
contiene ón>metadatos sobre el archivo ALTO en sí y la información de procesamiento sobre cómo se creó el archivo. - La sección
contiene los estilos de texto y párrafo con sus descripciones individuales: tiene descripciones de fuentes tiene descripciones de párrafo, por ejemplo, información de alineación
- La sección
contiene la información del contenido. ño>Se subdivide en elementos.
xml version = "1.0"?>
Ver también
- Estándar de transmisión y codificación de metadatos (METS)
- Dublin Core , un estándar de metadatos ISO
- Metadatos de preservación: estrategias de implementación (PREMIS)
- Protocolo de la Iniciativa de Archivos Abiertos para la Recolección de Metadatos (OAI-PMH)
- hOCR
Referencias
enlaces externos
- Estándares ALTO (Diseño analizado y objeto de texto) en el sitio web de la Biblioteca del Congreso
- https://altoxml.github.io/ resp. https://github.com/altoxml ALTOxml en GitHub
- Más información sobre METS / ALTO de CCS GmbH
- Introducción a METS ALTO de CCS GmbH Archivado el 4 de septiembre de 2014 en la Wayback Machine.
- Transformaciones XSLT desde y hacia ALTO