introducciÓn a los lenguajes de marcas. un lenguaje de marcas o lenguaje de marcado es una forma de...

15
INTRODUCCIÓN A LOS LENGUAJES DE MARCAS

Upload: natividad-gallego-cabrera

Post on 24-Jan-2016

224 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

INTRODUCCIÓN A LOS

LENGUAJES DE MARCAS

Page 2: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora etiquetas o marcas que contienen información adicional acerca de la estructura del texto o su presentación. En definitiva permiten hacer explicita la estructura de un documento, su contenido semántico o cualquier otra información lingüística o extralingüística que se quiera hacer patente.

El lenguaje de marcas más extendido es el HTML, fundamento del World Wide Web. Los lenguajes de marcado suelen confundirse con lenguajes de programación. Sin embargo, no son lo mismo, ya que el lenguaje de marcado no tiene funciones aritméticas o variables, como sí poseen los lenguajes de programación

Un ejemplo de cómo funciona el lenguaje de marcado puede observarse en el dictado de viva voz de un documento a una persona que lo transcribe a máquina:

Ponga estilo de carta. ponga comillas, ponga mayúsculas, Estimado Juan, ponga dos puntos, aparte, sangría, ponga primera letra mayúscula, te escribo esta carta, ponga negrillas, de forma muy urgente, cierre negrilla, ya que no me has enviado... etc".

LENGUAJES DE MARCAS

Page 3: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

CLASES DE LENGUAJES DE MARCAS• El marcado de presentación es aquel que indica el formato del texto.

Este tipo de marcado es útil para maquetar la presentación de un documento para su lectura, pero resulta insuficiente para el procesamiento automático de la información. El marcado de presentación resulta más fácil de elaborar, sobre todo para cantidades pequeñas de información.

• El marcado de procedimientos está enfocado hacia la presentación del texto, sin embargo, también es visible para el usuario que edita el texto. El programa que representa el documento debe interpretar el código en el mismo orden en que aparece.

• El marcado descriptivo o semántico describen las diferentes partes en las que se estructura el documento pero sin especificar cómo deben ser representados, o en que orden.

Page 4: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

MAPA DE LOS LENGUAJES DE MARCAS

• Principales– GML --> SGML --> XML --> Dialectos XML

• Documentos en general

Lenguajes descriptivos

Lenguajes de presentación

Lenguajes ligeros Lenguajes para manuales

ASN.1

EBML

YAML

Rich Text Format

S1000D

TeX

troff

HTML

BBCode

Markdown

ReStructuredText

setext

Textile

Wikitexto

DocBook

HelpML

LinuxDoc

POD

Microsoft Assistance ML

Page 5: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

MAPA DE LOS LENGUAJES DE MARCAS

• Tecnologías de internet

World Wide WebInterfaz de usuario

Sindicación Servicios web

HTML

XHTML

Wireless ML

Handhelp ML

RDF

Meta Content Framework

GladeXML

MXML (Macromedia)

User Interface ML

XAML and MyXaml

XForms

XUL / XBL

Atom

RSS

ICE

OPML y OML

SyncML

WSDL

XINS

WSCL

WSFL

XML-RPC

Webml

Page 6: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

MAPA DE LOS LENGUAJES DE MARCAS

• Lenguajes especializados– Gráficos 2D: SVG, CGM, VML, InkML.– Gráficos 3D: VRML/X3D, STEP.– Matemática: MathML y OpenMath.– Música: LilyPond y MusicXML.– Taxonomía: DITA– Finanzas: eXtensible Bussiness Reporting Language, Financial products ML.– Geomática: Geography ML.– Aeronáutica: Spacecraft ML.– Multimedia: Synchronized Multimedia Integration Language.– Voz: VoiceXML.– Mensajería instantánea: XMPP.– Videojuegos: BulletML, COLLADA.

Page 7: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

HISTORIA• Los lenguajes de marcas se llaman así por la práctica tradicional de

marcar los manuscritos con instrucciones de impresión en los márgenes.

• En la década de los 60 se empieza a desarrollar la idea de separar la presentación y la estructura del texto.

• Sin embargo, quien es considerado el padre de los lenguajes de marcas es Charles Goldfarb, investigador para la compañía IBM. Goldfarb participó en la creación del lenguaje GML, y posteriormente dirigió el comité que elaboró el estándar SGML, la piedra angular de los lenguajes de marcas.

• La potencia de SGML implica una dificultad en su aprendizaje y uso.• El HTML se crea a partir del SGML.• XML surge como respuesta al desorden que supuso el rápido • crecimiento del HTML.

GML: Generalized Markup Language SGML: Standard Generalized Markup Language

Page 8: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

LENGUAJE XML (Extensible Markup Language )

XML es un lenguaje de marcas que ofrece un formato para la descripción de datos estructurados.

XML es un metalenguaje, dado que con él podemos definir nuestro propio lenguaje de presentación y, a diferencia del HTML, que se centra en la representación de la información, XML se centra en la información en si misma.

XML no posee etiquetas prefijadas con anterioridad, ya que es el propio diseñador el que las crea a su antojo, dependiendo del contenido del documento.

Todo documento debe cumplir dos condiciones: ser válido y estar bien formado.

Válido: si se valida frente a una DTD (lista de reglas que definen la estructura del documento XML)

Bien formado: si sigue las reglas de sintaxis de XML.

Page 9: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

ESTRUCTURA DE XMLPROLOGO(1ª linea): declaración de la versión, estándar de la

codificación de caracteres, vínculos hacia la información DTD.

ELEMENTOS: constituyen la arquitectura en árbol de un documento. Se les señala mediante etiquetas.

La raíz es el elemento padre del resto (directorio). Da lugar a los elementos de tipo entrada. El nombre de los elementos va en el interior de las etiquetas y su valor se sitúa entre una etiqueta de apertura y una de cierre. Pueden existir elementos vacios.

ATRIBUTO: informaciones adicionales asociadas a los elementos.

COMENTARIOS

ENTIDADES PREDEFINIDAS: Entidades para representar caracteres especiales .

ENTIDADES DEFINIDAS POR EL USUARIO: recursos externos…

SECCIONES CDATA: Es una construcción para especificar datos utilizando cualquier carácter.

ESPACIOS DE NOMBRES

Page 10: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

Espacios de nombres

Los espacios de nombres permiten definir la pertenencia de los elementos y los atributos de un documento XML a una familia de vocabulario XML. El nombre de un elemento puede pertenecer a varias familias sin que ello implique que poseen el mismo significado.

Gracias a los espacios de nombres, es posible integrar las etiquetas de diferentes lenguajes dentro de un mismo documento XML (HTML, XHTML, o cualquier lenguaje de etiquetas).

Dentro de un mismo documento, se pueden utilizar elementos con el mismo nombre que aparezcan en tipos de lenguajes diferentes.

Los espacios de nombres están vinculados a un URI (Universal Resource Identifier). Los URI son hipervínculos a un recurso remoto.

Page 11: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

SINTAXIS DE XML• Los nombres de elementos y atributos son sensibles a las

mayúsculas y minúsculas.• Todos los elementos se tienen que cerrar de forma adecuada.• Los elementos se tienen que anidar de forma adecuada, no

solaparse.• Todos los atributos tienen que tener valores.• Todos los valores de atributos deben de ir entrecomillados.• Los espacios no están permitidos en los nombres de elementos. • Deben de comenzar por una letra o uno de los siguientes

caracteres: “-”, “:”, “_”, “.”. Evitar que comiencen por xml o por x, m o l.

• Los caracteres permitidos: “-”, “:”, “_”, “.”, caracteres alfabéticos, caracteres numéricos

Page 12: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

EJEMPLO DE XML• <?xml version="1.0" standalone="no"?>• <!DOCTYPE movies SYSTEM "Movies.dtd" [<!NOTATION JPEG SYSTEM "Iexplore.exe">• <!ENTITY raposter SYSTEM "RAPoster.jpg" NDATA JPEG> <!ENTITY mrposter SYSTEM "MRPoster.jpg"

NDATA• JPEG>]>• <movies>• <movie rating="PG-13" review="5" type="comedy" year="1987">• <title>Raising Arizona</title>• <writer>Ethan Coen</writer>• <writer>Joel Coen</writer>• <producer>Ethan Coen</producer>• <director>Joel Coen</director>• <actor>Nicolas Cage</actor><actor>Holly Hunter</actor><actor>John Goodman</actor>• <poster image="raposter"/>• <comments>A classic one-of-a-kind screwball love story.</comments>• </movie>• <movie rating="R" review="5" type="comedy" year="1988">• <title>Midnight Run</title>• <writer>George Gallo</writer>• <producer>Martin Brest</producer>• <director>Martin Brest</director>• <actor>Robert De Niro</actor><actor>Charles Grodin</actor>• <poster image="mrposter"/>• <comments>The quintessential road comedy.</comments>• </movie>• </movies>

Page 13: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

HERRAMIENTAS DE EDICIÓN

• Como XML es un formato sólo de texto, podemos utilizar cualquier editor de textos. Sin embargo los editores específicos de XML, facilitan el trabajo añadiendo comprobación de sintaxis, validación de código…

• OPCIONES DE EDICIÓN DE TEXTO XML:– Xmetal– XMLSpy– <oXygen/>– PSGML

Page 14: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora

LENGUAJES DE MARCAS Y LA WEB SEMÁNTICA

• Los lenguajes de marcado son la herramienta fundamental en el diseño de la web semántica, aquella que no solo permite acceder a la información, sino que además define su significado, de forma que sea más fácil su procesamiento automático y se pueda reutilizar para distintas aplicaciones. Esto se consigue añadiendo datos adicionales a los documentos, por medio de dos lenguajes expresamente creados: el RDF (Resource descriptión framework-Plataforma de descripción de recursos) y OWL (Web Ontology Language-Lenguaje de ontologías para la web), ambos basados en XML.

Page 15: INTRODUCCIÓN A LOS LENGUAJES DE MARCAS. Un lenguaje de marcas o lenguaje de marcado es una forma de codificar un documento que, junto con el texto, incorpora