El modelado de documentos examina la estructura inherente de los documentos . Más que la estructura del formato, que es el ámbito clásico de las herramientas de procesamiento de texto , se ocupa de la estructura del contenido. Debido a que el contenido del documento se considera típicamente como el resultado ad hoc de un proceso creativo, el arte del modelado de documentos aún está en su infancia. La mayor parte del modelado de documentos se presenta en forma de plantillas de documentos que se evidencian con mayor frecuencia como documentos de procesamiento de texto, formularios PDF rellenables y plantillas XML . La fortaleza particular de XML en este contexto es su capacidad para modelar componentes de documentos en una estructura en forma de árbol y su separación de contenido y estilo.
El modelado de documentos va más allá del simple llenado de formularios y la combinación de correo para observar la estructura de la información en, por ejemplo, un documento legal, un contrato, un informe de inspección o alguna forma de análisis.
Por lo tanto, el modelado de documentos examina las estructuras y patrones del trabajo escrito y lo divide en diferentes opciones o ramas. Luego etiqueta las ramas y los resultados. Sin un modelado de documentos efectivo, es difícil obtener el valor total de una iniciativa de automatización de documentos , por ejemplo, utilizando software de ensamblaje de documentos. Pero al utilizar un modelo que contiene cientos y miles de ramas, un usuario puede crear variaciones estructuradas casi infinitas hasta el punto de que tales sistemas pueden rivalizar con la redacción no estructurada de un especialista. De hecho, los resultados de un modelo de documento sofisticado pueden superar a los del especialista en términos de falta de error y coherencia de la prosa.