La Red de Conocimientos Pedagógicos - Conocimientos históricos - ¿Qué es XML?

¿Qué es XML?

XML significa Extensible Markup Language (la abreviatura de eXtensible Markup Language, que significa lenguaje de marcado extensible). ?

XML es un conjunto de reglas que definen el marcado semántico que divide un documento en partes e identifica estas partes. También es un lenguaje de metamarcado, es decir, define un lenguaje sintáctico para definir otros lenguajes de marcado estructurados, semánticos y específicos de dominio.

XML es un metalenguaje de marcado

Lo primero que hay que entender acerca de XML es que no es solo un lenguaje de marcado de hipertexto (HTML) o un programa formateado. Estos lenguajes definen un conjunto fijo de etiquetas que describen una cierta cantidad de elementos. Si las etiquetas requeridas no están disponibles en el lenguaje de marcado, el usuario tiene pocos recursos. En este momento, tenemos que esperar a la próxima versión del lenguaje de marcado, con la esperanza de que las etiquetas requeridas se incluyan en la nueva versión, pero esto dependerá de la elección del desarrollador del software.

Pero XML es un lenguaje de metamarcado. Los usuarios pueden definir las etiquetas que necesitan. Estas etiquetas deben crearse según ciertos principios generales, pero también existe una flexibilidad considerable en el significado de las etiquetas. Por ejemplo, si el usuario está trabajando en algo relacionado con la genealogía y necesita describir el nacimiento, muerte, lugar de entierro, familia, matrimonio, divorcio, etc. de una persona, es necesario crear etiquetas para cada elemento. El marcado recién creado se puede describir en la Definición de tipo de documento (a menudo denominada DTD en las páginas siguientes). Aprenderá más sobre las DTD en la segunda parte de este libro. Por ahora, piense en una DTD como un vocabulario y sintaxis para un determinado tipo de documento. Por ejemplo, el vocabulario y la sintaxis de las ciencias moleculares se describen en el archivo MOL.DTD en el lenguaje de marcado químico (CML) de Peter Murray-Rust: que incluye química, cristalografía y vocabulario como la física del estado sólido. Incluye etiquetas para átomos, moléculas, enlaces, espectros, etc. Esta DTD se puede compartir con muchas personas diferentes en el campo de la ciencia molecular. Hay otras DTD para otros campos y los usuarios también pueden crear sus propias DTD.

XML define un conjunto de metasintaxis que los lenguajes de marcado específicos del dominio (como MusicML, MathML y ​​CML) deben cumplir. Si una aplicación puede comprender esta metasintaxis, automáticamente podrá comprender todos los lenguajes creados a partir de este metalenguaje. El navegador no tiene que conocer de antemano cada etiqueta utilizada por varios lenguajes de marcado diferentes. El hecho es que el navegador sólo aprende sobre el marcado utilizado por un documento determinado cuando lee el documento o su DTD. Se proporcionan instrucciones detalladas sobre cómo mostrar el contenido de estas etiquetas en hojas de estilo separadas adjuntas al documento. Consideremos, por ejemplo, la ecuación de Schrodinger:

Los artículos científicos están llenos de ecuaciones de este tipo, pero los científicos tuvieron que esperar años antes de que los desarrolladores de navegadores brindaran el soporte necesario para escribir incluso las fórmulas matemáticas más básicas. Los músicos tienen las mismas limitaciones, ya que ni Netscape Navigator ni Internet Explorer soportan aún partituras. ?

Tener XML significa que no hay necesidad de esperar a que los desarrolladores del navegador satisfagan las necesidades del usuario. Los usuarios pueden crear las etiquetas que necesitan y simplemente decirle al navegador cómo mostrarlas cuando sea necesario.

XML describe la estructura y la semántica, no el formato

Lo segundo que hay que entender sobre XML es que las etiquetas XML describen la estructura y el significado de un documento. No describe el formato de los elementos de la página. Las hojas de estilo se pueden utilizar para agregar información de formato a los documentos. El documento en sí solo describe qué marcas contiene, no cómo se ve el documento.

Por el contrario, los documentos HTML incluyen formato, estructura y marcado semántico.

Es una etiqueta de formato que pone el contenido en negrita. Es una marca semántica que significa que el contenido es particularmente importante. Es una etiqueta de estructura que indica que el contenido es una unidad en la tabla. De hecho, algunas marcas pueden tener los tres significados. El marcado puede representar simultáneamente títulos de primer nivel en negrita y títulos de página en fuente Helvética de 20 puntos.

Por ejemplo, en HTML, una canción podría describirse definiendo un título, definiendo datos, una lista desordenada y elementos de lista. Pero, en realidad, ninguno de estos proyectos trata sobre música. Una canción definida en HTML podría verse así:

Hot Cop

de Jacques Morali Henri Belolo y Victor Willis

Productor: Jacques Morali

Editor: PolyGram Records

Duración: 6:20

Escrito: 978

Artista: Village People

Y en XML, los mismos datos para pueden estar etiquetados:

Hot Cop

Jacques Morali

Henri Belolo

Victor Willis

Jacques Morali

PolyGram Records

6:20

978

Village People

no se utiliza en En esta lista se utilizan marcadores comunes como y, pero se utilizan marcadores significativos como, y, etc. Este uso tiene muchas ventajas, incluido que el código fuente es fácil de leer y permite a las personas ver el significado del autor.

Las etiquetas XML también facilitan que los robots automatizados no humanos encuentren todas las canciones de un documento. En HTML, los robots sólo pueden