Documento bien formado

Un documento bien formado en XML es un documento que "cumple las reglas de sintaxis especificadas por la especificación XML 1.0 en el sentido de que debe satisfacer tanto las estructuras físicas como las lógicas". [1]

Requisitos

En su nivel básico, un documento bien formado requiere que:

  • El contenido se definirá.
  • El contenido se delimitará con una etiqueta de inicio y una de fin.
  • El contenido debe estar correctamente anidado (padres dentro de raíces, hijos dentro de padres)

Para que un documento esté bien formado, se deben establecer reglas sobre la declaración y el tratamiento de las entidades. Las etiquetas distinguen entre mayúsculas y minúsculas y los atributos se delimitan con comillas. Los elementos vacíos tienen reglas establecidas. Las etiquetas superpuestas invalidan un documento. Lo ideal es que un documento bien formado se ajuste a los objetivos de diseño de XML. Otras reglas de sintaxis clave proporcionadas en la especificación incluyen:

  • Contiene únicamente caracteres Unicode legales codificados correctamente.
  • Ninguno de los caracteres de sintaxis especial como <y &aparecen excepto cuando cumplen su función de delimitación de marcado.
  • Las etiquetas de inicio, fin y elemento vacío que delimitan los elementos están correctamente anidadas, sin que ninguna falte ni se superponga.
  • Las etiquetas de elementos distinguen entre mayúsculas y minúsculas; las etiquetas de inicio y fin deben coincidir exactamente. Los nombres de las etiquetas no pueden contener ninguno de los caracteres !"#$%&'()*+,/;<=>?@[\]^`{|}~, ni un espacio, y no pueden comenzar con -, .o un dígito numérico.
  • Hay un único elemento "raíz" que contiene todos los demás elementos.

Un documento XML válido se define en la especificación XML como un documento XML bien formado que también cumple con las reglas de una definición de tipo de documento (DTD). Según el tutorial de XML de JavaCommerce.com, "Los documentos XML bien formados simplemente marcan las páginas con etiquetas descriptivas. No es necesario describir ni explicar lo que significan estas etiquetas. En otras palabras, un documento XML bien formado no necesita una DTD, pero debe cumplir con las reglas de sintaxis XML. Si todas las etiquetas de un documento están formadas correctamente y siguen las pautas de XML, entonces se considera que un documento está bien formado". [2] [3]

Un procesador XML que detecta una violación de las reglas de formato correcto debe informar de dichos errores y detener el procesamiento normal. Esta política, a veces denominada draconiana , [4] contrasta notablemente con el comportamiento de los programas que procesan HTML , que están diseñados para producir un resultado razonable incluso en presencia de graves errores de marcado [5] en el espíritu de la ley de Postel ("Sea conservador en lo que envía; sea liberal en lo que acepta"). [6] [4]

Importancia

El concepto de un documento bien formado permite una mejor comprensión de la construcción fundamental de XML. Ayuda a aclarar XML más allá de su sentido típico. Por ejemplo, si bien la mayoría de las definiciones de tipos de documentos XML utilizan corchetes angulares izquierdo y derecho como delimitadores de contenido, estrictamente hablando esto no es una necesidad (aunque un delimitador debe ser breve y conciso). Los códigos de corchetes angulares izquierdo y derecho son una convención, aunque claros y distintivos, no un requisito absoluto.

El concepto de documento bien formado también permite comprender la naturaleza abstracta de XML. En realidad, no existe tal cosa como XML. [ cita requerida ] Más bien, XML es un principio que representa un conjunto de comportamientos y prácticas. Es posible analizar los tipos de XML, tal como se expresan en una definición de tipo de documento (DTD).

Los documentos bien formados también ponen de relieve la cuestión de XML válido frente a XML correcto. Según la Organización W3, los documentos válidos son aquellos que se validan con una DTD. Las reglas de validez significan que un documento cumple con las restricciones establecidas en una DTD. Por lo tanto, las etiquetas o entidades deben cumplir con las reglas y relaciones establecidas en una DTD. Sin embargo, no existe ningún control sobre si una etiqueta o entidad es correcta. Por lo tanto, una etiqueta de encabezado de primer nivel podría aplicarse a un objeto de encabezado de segundo nivel y ser válida, aunque incorrecta.

El énfasis en los documentos bien formados se ha desarrollado dentro de la industria editorial , donde el uso de información delimitada por corchetes angulares izquierdo y derecho se ha vuelto problemático. [ cita requerida ] El énfasis en el documento bien formado permite que la definición, delimitación y anidación de contenido se gestione dentro de programas que no son XML, per se, pero que exhiben las características o el potencial para estar bien formados.

Herramientas de validación

Hay varias herramientas disponibles para determinar si un documento XML determinado está bien formado.

  • Validador XML de Richard Tobin
  • Validador XML de Truugo
  • Validador XML de W3Schools

Véase también

Referencias

  1. ^ "XML: Documento". The UK Web Design Company . Consultado el 11 de agosto de 2013 .[ enlace muerto ]
  2. ^ "Documentos XML bien formados". JCommerce Dev Network . Archivado desde el original el 22 de agosto de 2009.
  3. ^ "No hay excepciones a la Ley de Postel". Sumérgete en Mark . Internet Archive. Archivado desde el original el 10 de mayo de 2013 . Consultado el 11 de agosto de 2013 .
  4. ^ de "Dracon y Postel", 19/08/2003, Tim Bray
  5. ^ "La historia del manejo draconiano de errores en XML". Sumérjase en Mark . Internet Archive. Archivado desde el original el 18 de agosto de 2013 . Consultado el 11 de agosto de 2013 .
  6. ^ "La ley de Postel no tiene excepciones", 18 de agosto de 2003 Aaron Swartz
Obtenido de "https://es.wikipedia.org/w/index.php?title=Documento_bien_formado&oldid=1175883198"