Arquitectura de contenido del documento


De Wikipedia, la enciclopedia libre
  (Redirigido desde el texto en formato revisable )
Saltar a navegación Saltar a búsqueda

El Documento de Arquitectura contenido , o DCA para abreviar, es un estándar desarrollado por IBM para documentos de texto en la década de 1980. DCA se utilizó en sistemas mainframe e IBM i , y formó la base del formato de archivo de DisplayWrite . Más tarde, DCA se amplió como MO: DCA (Arquitectura de contenido de documentos de objetos mixtos), que agregó archivos de datos incrustados, como gráficos.

El propósito original de DCA era proporcionar un formato de documento común que pudiera usarse en múltiples plataformas de procesamiento de texto de IBM, como IBM PC , mainframes de IBM , el procesador de texto dedicado Displaywriter y el Sistema Administrativo IBM 5520 . [1]

DCA define dos tipos de documentos: [2] [3]

  • Texto de formato revisable (DCA / RFT) que es editable.
  • Texto de formato final (DCA / FFT) que está "formateado para un dispositivo de salida en particular y no se puede cambiar".

Descripción

DCA define un flujo de datos que representa un documento .

Los documentos pueden contener fuentes, superposiciones y otros objetos de recursos necesarios en el momento de la presentación para presentar los datos correctamente. Finalmente, los documentos pueden contener objetos de recursos, como un índice de documento y elementos de etiquetado que apoyan la búsqueda y navegación de datos de documentos, para una variedad de propósitos de aplicación. [4] : 2

MO: DCA es el envoltorio o contenedor de varios objetos que pueden componer el documento. Cada objeto está definido por su propia arquitectura subordinada. Las arquitecturas son: [4] : 4

  • La Arquitectura de contenido de objetos de texto de presentación (PTOCA) describe el texto formateado, incluidos los atributos del texto, como la fuente o el color.
  • La Arquitectura de contenido de objetos de imagen (IOCA) describe imágenes independientes de la resolución.
  • La Arquitectura de contenido de objetos gráficos (GOCA) describe imágenes de gráficos vectoriales . Una variación de GOCA, AFP GOCA, se utiliza en entornos de presentación de funciones avanzadas .
  • Bar Code Object Content Architecture (BCOCA ) describe códigos de barras en varios formatos diferentes.
  • La Arquitectura de contenido de objetos de fuentes (FOCA) describe las fuentes que se utilizarán en el documento.
  • Color Management Object Content Architecture (CMOCA ) describe la información de gestión del color necesaria.

Cada arquitectura utiliza una serie de campos estructurados binarios para describir su objeto correspondiente.

Texto de forma revisable

El texto en formato revisable (abreviado RFT o RFT-DCA ) es parte de DCA. A veces se lo denomina texto de formato revisable . Fue utilizado por IBM DisplayWrite 4 y 5 procesadores de texto en System / 360 y 370 ordenadores centrales , y OfficeVision / 400 para permitir la transferencia de documentos con formato a otros sistemas. [ cita requerida ]

RFT tiene un texto de formato final equivalente (abreviado FFT o FFT-DCA ), que no estaba destinado a ser editable y solo se imprimía.

Historia

El impulso para iniciar estándares internacionales para los DCA se inició en 1980 en las instalaciones de IBM Rochester. Se formó el equipo formado por dos arquitectos MODCA, un arquitecto RTOCA y un arquitecto PTOCA. Estos arquitectos, como fueron llamados, fueron responsables de reunir el consenso de IBM para el diseño de los flujos de datos y llevar el trabajo al campo de los estándares internacionales. Se hizo un esfuerzo concertado para que la comunidad internacional participara en el desarrollo. Esta decisión se basó en parte en la experiencia adquirida con la aceptación de GML en un estándar SGML internacional. Para evitar la gran demora en la creación de la arquitectura, querían involucrar a todos desde el principio. SGML [5]la normalización había tardado muchos años y horas en desarrollarse. El trabajo de IBM con contenido de documentos había sido impulsado por las necesidades de las computadoras de marco principal donde se usaban GML y DCA, pero esa experiencia apuntaba a la necesidad de arquitecturas de componentes estandarizadas para texto revisable y no revisable en particular.

En 1981, poco después de su creación, el grupo se trasladó junto con IBM 5280 Distributed Data System a IBM Austin cerca de Round Rock, TX, donde el trabajo continuó con un éxito mixto. A medida que las arquitecturas se posicionaron más firmemente en el escenario internacional, el equipo se trasladó nuevamente en 1987 al Centro de Programación de IBM Dallas cerca de Roanoke, Texas (Westlake), donde en 1998 se disolvió y el trabajo se interrumpió en las arquitecturas DCA debido principalmente a la comunidad de PC que había ido en una dirección diferente por necesidad. Las arquitecturas DCA se completaron por completo, pero no se acordaron totalmente en los detalles después de 18 años. Y no había implementaciones activas a la vista.

El mundo de la PC se había decidido por HTML (que se creía que era una aplicación del estándar internacional SGML ) y usaba partes de él para sus propósitos. Microsoft Word finalmente utilizó el flujo de datos similar para el flujo de datos de trabajo interno para el almacenamiento de contenido editable. A pesar de que el estándar SGML estaba disponible, no era práctico que la implementación completa del analizador SGML fuera útil, por lo que un posible subconjunto del mismo se convirtió en el estándar de facto para el texto revisable que se usa hoy en día en el campo de la PC.

Aproximadamente al mismo tiempo, Adobe Systems diseñó y produjo la codificación de documentos imprimibles llamada PDF, que se ha convertido en el estándar para documentos imprimibles producidos por PC. El estándar internacional se estableció en 2008 sin ningún aporte de nadie, excepto de los usuarios que decidieron utilizar los productos ofrecidos en mayor número de lo que los gerentes de los arquitectos de flujo de datos jamás hubieran soñado. La decisión fue impulsada por la necesidad del producto y la solución encontrada fue mucho más aceptable de lo que los comités de estándares pudieron diseñar como estándar en el marco de tiempo en el que se necesitaba la decisión. Más de 10 años de trabajo no habían producido el método aceptable y la comunidad informática creó lo que necesitaban en menos tiempo.

El intento de lograr un flujo de datos de documentos de consenso fue rápidamente superado por el contenido disponible y utilizable proporcionado por las empresas que no intentaron compartir con otros, sino que crearon una solución viable y la vendieron a los usuarios, y les gustó. Por lo tanto, la salida del software de procesamiento de texto se 'imprime' en el formato PDF proporcionado por el producto de presentación más utilizado. Es decir, por ejemplo, Microsoft Word proporciona una selección de impresora 'Microsoft Print to PDF' para producir la salida necesaria para un documento PDF, una solución muy aceptable para la mayoría de los usuarios. Se podría haber utilizado un método similar para producir el estándar internacional si finalmente hubiera llegado uno.

Cuando IBM disolvió su Dallas Programming Center en 1998, todo el personal de arquitectos se retiró y dejó la empresa, excepto el gerente, que fue trasladado a otra ubicación y otro puesto, poniendo fin al proyecto de arquitectura DCA para el futuro previsible en IBM.

Ver también

Referencias

  1. ^ Henkel, Tom (21 de mayo de 1984), "IBM tomando la ruta de estandarización hacia DPP" , Computerworld , IDG Enterprise, 18 (21), p. 7, ISSN  0010-4841
  2. ^ "Enciclopedia de la revista PC" . Consultado el 25 de julio de 2012 .
  3. de la Beaujardière, Jean Marie (1988). "Formatos de intercambio de documentos bien establecidos". Manipulación y tipografía de documentos: Actas de la Conferencia internacional sobre edición electrónica, manipulación y tipografía de documentos, Niza (Francia) 20-22 de abril de 1988 . Archivo CUP. pag. 83. ISBN 978-0-521-36294-8.
  4. ^ a b IBM Corporation (mayo de 2006). Referencia de arquitectura de contenido de documentos de objetos mixtos (PDF) . Consultado el 7 de febrero de 2020 .
  5. ^ http://www.sgmlsource.com/

enlaces externos

  • Página de inicio del Consorcio AFP
  • Consorcio de presentación de funciones avanzadas (abril de 2017). Arquitectura de contenido de objetos gráficos para referencia de presentación de funciones avanzadas (PDF) (Cuarta ed.) . Consultado el 7 de febrero de 2020 .
  • Williams; et al. (1996). Método y aparato para la transformación de formatos de documentos de varias etapas en un sistema de procesamiento de datos (PDF) . Número de patente de Estados Unidos 5.513.323
Obtenido de " https://en.wikipedia.org/w/index.php?title=Document_Content_Architecture&oldid=1025306575#Revisable-Form_Text "