Cómo convertir un archivo XML para que esté bien formado

Este artículo explica cómo escribir correctamente XML mostrando un ejemplo. El boletín de Web Writer se escribe utilizando una forma de XML; lo llamamos AML o Acerca del lenguaje de marcado. Si bien este es un documento de trabajo, no es un documento XML válido ni bien formado.

Bien formado

Existen algunas reglas específicas para crear un documento XML bien formado:

  • La declaración XML debe ser lo primero en cada documento.
  • Los comentarios no son válidos dentro de una etiqueta. Los comentarios no pueden contener dos guiones seguidos, salvo el principio y el final del comentario.
  • Las etiquetas deben tener una etiqueta de cierre o estar cerradas dentro de la propia etiqueta singleton, por ejemplo.
  • Todos los atributos de las etiquetas deben estar entre comillas, preferiblemente comillas dobles, a menos que el atributo en sí contenga una comilla doble.
  • Cada documento XML debe contener un elemento que contenga completamente todos los demás elementos.

Solo hay dos problemas con el documento que hacen que no esté bien formado:

instagram viewer
  • Lo primero que necesita el documento AML es una declaración de declaración XML.
  • El otro problema es que ningún elemento encierra completamente todos los demás elementos. Para solucionar esto, agregaremos un elemento contenedor externo:

Hacer esos dos cambios simples (y asegurarse de que todos los elementos contengan solo CDATA) convertirá el documento con formato incorrecto en un documento con formato correcto.

Un documento XML válido se valida con una definición de tipo de documento (DTD) o un esquema XML. Se trata de un conjunto de reglas creadas por el desarrollador o una organización de estándares que definen la semántica del documento XML. Estos le dicen a la computadora qué hacer con el marcado.

En el caso de Acerca de Lenguaje de marcado, dado que este no es un lenguaje XML estándar, como XHTML o SMIL, el DTD sería creado por el desarrollador. Lo más probable es que esa DTD esté en el mismo servidor que el documento XML y se haga referencia a ella en la parte superior del documento.

Antes de comenzar a desarrollar una DTD o un esquema para sus documentos, debe darse cuenta de que simplemente por estar bien formado, un documento XML es autodescriptivo y, por lo tanto, no necesita una DTD.

Por ejemplo, con nuestro documento AML bien formado, existen las siguientes etiquetas:

Si está familiarizado con el boletín de Web Writer, es posible que reconozca las diferentes secciones del boletín. Esto hace que sea muy fácil crear nuevos documentos XML utilizando el mismo formato estándar. Siempre pondríamos el título completo en la etiqueta y la URL de la primera sección en la etiqueta.

DTD

Si se le solicita que escriba un documento XML válido, ya sea para usar los datos o para procesarlo, lo incluiría en su documento con la etiqueta. En esta etiqueta, define la etiqueta XML base en el documento y la ubicación de la DTD (generalmente un URI web).

Por ejemplo:

Una cosa buena acerca de las declaraciones DTD es que puede declarar que una DTD es local al sistema donde el El documento XML está con el "SISTEMA". También puede apuntar a una DTD pública, como con un documento HTML 4.0:

Cuando usa ambos, le está diciendo al documento que use un DTD específico (el identificador público) y dónde encontrarlo (el identificador del sistema).

Finalmente, puede incluir un DTD interno directamente en el documento, dentro de la etiqueta DOCTYPE. Por ejemplo (esta no es una DTD completa para el documento AML):

Esquema XML

Para crear un documento XML válido, también puede utilizar un documento de esquema XML para definir su XML. XML Schema es un documento XML que describe documentos XML. Aprenda a escribir un esquema.

Nota

No basta con señalar un esquema DTD o XML. El XML que está en el documento debe seguir las reglas de la DTD o el esquema. El uso de un analizador de validación es una forma sencilla de comprobar que su XML sigue las reglas de DTD. Puede encontrar muchos analizadores de este tipo en línea.