Un documento bien formado en XML es un documento que "se adhiere a las reglas de sintaxis especificadas por la especificación XML 1.0 en el sentido de que debe satisfacer las estructuras físicas y lógicas". [1]
Requisitos
En su nivel básico, los documentos bien formados requieren que:
- Se definirá el contenido.
- El contenido debe delimitarse con una etiqueta de inicio y finalización
- El contenido esté correctamente anidado (padres dentro de las raíces, hijos dentro de los padres)
Para ser un documento bien formado, se deben establecer reglas sobre la declaración y tratamiento de las entidades. Las etiquetas distinguen entre mayúsculas y minúsculas , con atributos delimitados por comillas. Los elementos vacíos tienen reglas establecidas. Las etiquetas superpuestas invalidan un documento. Idealmente, un documento bien formado se ajusta a los objetivos de diseño de XML. Otras reglas de sintaxis clave proporcionadas en la especificación incluyen:
- Solo contiene caracteres Unicode legales codificados correctamente.
- Ninguno de los caracteres de sintaxis especial como
<
y&
aparece excepto cuando desempeñan sus funciones de marcado y delimitación. - Las etiquetas de inicio, fin y elemento vacío que delimitan los elementos están correctamente anidadas, sin que falte ninguna y ninguna se superponga.
- Las etiquetas de los elementos distinguen entre mayúsculas y minúsculas; las etiquetas de inicio y finalización deben coincidir exactamente. Los nombres de etiqueta no puede contener ninguno de los caracteres
!"#$%&'()*+,/;<=>?@[\]^`{|}~
, ni un carácter de espacio, y no pueden comenzar con-
,.
o un dígito numérico. - Hay un único elemento "raíz" que contiene todos los demás elementos.
Un documento XML válido se define en la especificación XML como un documento XML bien formado que también se ajusta a las reglas de una definición de tipo de documento (DTD). Según el tutorial XML de JavaCommerce.com, "Los documentos XML bien formados simplemente marcan las páginas con etiquetas descriptivas. No es necesario que describas o expliques lo que significan estas etiquetas. En otras palabras, un documento XML bien formado no necesita una DTD, pero debe ajustarse a las reglas de sintaxis XML. Si todas las etiquetas de un documento están formadas correctamente y siguen las directrices XML, se considera que un documento está bien formado ". [2] [3]
Se requiere que un procesador XML que encuentre una violación de las reglas de buen formato informe tales errores y cese el procesamiento normal. Esta política, a veces denominada draconiana , [4] contrasta notablemente con el comportamiento de los programas que procesan HTML , que están diseñados para producir un resultado razonable incluso en presencia de graves errores de marcado [5] en el espíritu de la ley de Postel. ("Sea conservador en lo que envía; sea liberal en lo que acepta"). [6] [4]
Importancia
El concepto de documento bien formado permite una mejor comprensión de la construcción fundamental de XML. Ayuda a aclarar XML más allá del sentido típico. Por ejemplo, si bien la mayoría de las definiciones de tipos de documentos XML utilizan corchetes angulares izquierdo y derecho como delimitadores de contenido, estrictamente hablando, esto no es una necesidad (aunque un delimitador debe ser conciso y conciso). Los códigos de corchetes de ángulo izquierdo y derecho son una convención, aunque claros y distintivos, no un requisito absoluto.
El concepto de documento bien formado también permite la comprensión de la naturaleza abstracta de XML. En realidad, XML no existe. [ cita requerida ] Más bien, XML es un principio que representa un conjunto de comportamientos y prácticas. Es posible discutir los tipos de XML, como se expresa en una Definición de tipo de documento (DTD).
Los documentos bien formados también ponen de relieve la cuestión del XML válido frente al correcto. Según la Organización W3, los documentos válidos son aquellos que se validan frente a un DTD. Las reglas de validez significan que un documento cumple con las restricciones establecidas en un DTD. Así, las etiquetas o entidades deben estar en conformidad con las reglas y relaciones establecidas dentro de una DTD. Sin embargo, no hay control sobre si una etiqueta o entidad es correcta. Por lo tanto, una etiqueta de cabeza de primer nivel podría aplicarse a un objeto de cabeza de segundo nivel y ser válida, aunque incorrecta.
El énfasis en documentos bien formados se ha desarrollado dentro de la industria editorial , donde el uso de información delimitada por corchetes de ángulo izquierdo y derecho se ha vuelto problemático. [ cita requerida ] El énfasis en el documento bien formado permite que la definición, delimitación y anidamiento del contenido se gestione dentro de programas que no son XML, per se, pero que exhiben las características o el potencial de estar bien formados.
Herramientas de validación
Hay varias herramientas disponibles para determinar si un documento XML dado está bien formado. Un ejemplo es:
Ver también
Referencias
- ^ "XML: documento" . La empresa de diseño web del Reino Unido . Consultado el 11 de agosto de 2013 .[ enlace muerto ]
- ^ "Documentos XML bien formados" . Red de desarrollo de JCommerce . Archivado desde el original el 22 de agosto de 2009.
- ^ "No hay excepciones a la Ley de Postel" . Sumérgete en Mark . Archivo de Internet. Archivado desde el original el 10 de mayo de 2013 . Consultado el 11 de agosto de 2013 .
- ↑ a b "Dracon and Postel" , 19/08/2003, Tim Bray
- ^ "La historia del draconiano manejo de errores en XML" . Sumérgete en Mark . Archivo de Internet. Archivado desde el original el 18 de agosto de 2013 . Consultado el 11 de agosto de 2013 .
- ^ "La ley de Postel no tiene excepciones" , 18 de agosto de 2003 Aaron Swartz