html y xml

15
Diferencias

Upload: facultad-de-filosofia

Post on 08-Jul-2015

724 views

Category:

Education


4 download

DESCRIPTION

diferencia entre html y xml

TRANSCRIPT

Page 1: Html y xml

Diferencias

Page 2: Html y xml

«lenguaje de marcado de hipertexto»

Page 3: Html y xml

HTML, siglas de HyperText Markup Language («lenguaje de marcado de hipertexto»),

hace referencia al lenguaje de marcado predominante para la elaboración de páginas

web que se utiliza para describir la estructura y el contenido en forma de texto, así como

para complementar el texto con objetos tales como imágenes. El HTML se escribe en

forma de «etiquetas», rodeadas por corchetes angulares (<,>). HTML también puede

describir, hasta un cierto punto, la apariencia de un documento, y puede incluir un script

(por ejemplo JavaScript), el cual puede afectar el comportamiento de navegadores web y

otros procesadores de HTML.

HTML también sirve para referirse al contenido del tipo de MIME text/html o todavía más

ampliamente como un término genérico para el HTML, ya sea en forma descendida del

XML (como XHTML 1.0 y posteriores) o en forma descendida directamente de SGML

(como HTML 4.01 y anteriores).

Page 4: Html y xml

Primeras especificaciones

La primera descripción de HTML disponible públicamente fue un documento llamado

HTML Tags (Etiquetas HTML), publicado por primera vez en Internet por Tim Berners-

Lee en 1991.2 3 Describe 22 elementos que incluyen el diseño inicial y relativamente

simple de HTML. Trece de estos elementos todavía existen en HTML 4.4

Berners-Lee consideraba a HTML una ampliación de SGML, pero no fue formalmente

reconocida como tal hasta la publicación de mediados de 1993, por la IETF, de una

primera proposición para una especificación de HTML: el boceto Hypertext Markup

Language de Berners-Lee y Dan Connolly, el cual incluía una Definición de Tipo de

Documento SGML para definir la gramática.5 El boceto expiró luego de seis meses, pero

fue notable por su reconocimiento de la etiqueta propia del navegador Mosaic usada

para insertar imágenes sin cambio de línea, que reflejaba la filosofía del IETF de basar

estándares en prototipos con éxito. 6 De la misma manera, el boceto competidor de

Dave Raggett HTML+ (Hypertext Markup Format) (Formato de Marcaje de Hipertexto),

de finales de 1993, sugería estandarizar características ya implementadas, como las

tablas.

Page 5: Html y xml

Elementos

Los elementos son la estructura básica de HTML. Los elementos tienen dospropiedades básicas: atributos y contenido. Cada atributo y contenido tieneciertas restricciones para que se considere válido al documento HTML. Unelemento generalmente tiene una etiqueta de inicio (por ejemplo, <nombre-de-elemento>) y una etiqueta de cierre (por ejemplo, </nombre-de-elemento>).Los atributos del elemento están contenidos en la etiqueta de inicio y elcontenido está ubicado entre las dos etiquetas (por ejemplo, <nombre-de-elemento atributo="valor">Contenido</nombre-de-elemento>). Algunoselementos, tales como <br>, no tienen contenido ni llevan una etiqueta decierre. Debajo se listan varios tipos de elementos de marcado usados enHTML.

Estructura general de una línea de código en el lenguaje de etiquetas HTML.

El marcado estructural describe el propósito del texto. Por ejemplo,<h2>Golf</h2> establece «Golf» como un encabezamiento de segundo nivel,el cual se mostraría en un navegador de una manera similar al título «MarcadoHTML» al principio de esta sección. El marcado estructural no define cómo severá el elemento, pero la mayoría de los navegadores web han estandarizadoel formato de los elementos. Puede aplicarse un formato específico al texto pormedio de hojas de estilo en cascada.

Page 6: Html y xml

El marcado presentacional describe la apariencia del texto, sin importar su función. Por

ejemplo, <b>negrita</b> indica que los navegadores web visuales deben mostrar el texto

en negrita, pero no indica qué deben hacer los navegadores web que muestran el

contenido de otra manera (por ejemplo, los que leen el texto en voz alta). En el caso de

<b>negrita</b> e <i>itálica</i>, existen elementos que se ven de la misma manera pero

tienen una naturaleza más semántica: <strong>enfásis fuerte</strong> y

<em>énfasis</em>. Es fácil ver cómo un lector de pantalla debería interpretar estos dos

elementos. Sin embargo, son equivalentes a sus correspondientes elementos

presentacionales: un lector de pantalla no debería decir más fuerte el nombre de un libro,

aunque éste esté en itálicas en una pantalla. La mayoría del marcado presentacional ha

sido desechada con HTML 4.0, en favor de hojas de estilo en cascada.

El marcado hipertextual se utiliza para enlazar partes del documento con otros

documentos o con otras partes del mismo documento. Para crear un enlace es necesario

utilizar la etiqueta de ancla <a> junto con el atributo href, que establecerá la dirección

URL a la que apunta el enlace. Por ejemplo, un enlace a la Wikipedia sería de la forma

<a href=”es.wikipedia.org”>Wikipedia</a>. También se pueden crear enlaces sobre otros

objetos, tales como imágenes <a href=”enlace”><img src=”imagen” /></a>.

Page 7: Html y xml

AtributosLa mayoría de los atributos de un elemento son pares nombre-valor,

separados por un signo de igual «=» y escritos en la etiqueta de comienzo de

un elemento, después del nombre de éste. El valor puede estar rodeado por

comillas dobles o simples, aunque ciertos tipos de valores pueden estar sin

comillas en HTML (pero no en XHTML). De todas maneras, dejar los valores

sin comillas es considerado poco seguro. En contraste con los pares nombre-

elemento, hay algunos atributos que afectan al elemento simplemente por su

presencia (tal como el atributo ismap para el elemento img).

Page 8: Html y xml

«Lenguaje de marcado extensible»

Page 9: Html y xml

Extensible Markup Language (XML) es un lenguaje de marcado que define un conjunto de reglas para

la codificación de documentos en un formato que sea legible y legible por máquina . Se define en la

especificación XML 1.0 producido por el W3C , y varias otras especificaciones relacionadas, a todos

gratuitamente los estándares abiertos .

Los objetivos de diseño de XML hincapié en la simplicidad, la generalidad y la facilidad de uso en el

Internet . Se trata de un formato de datos textual con un fuerte apoyo a través de Unicode para los

idiomas del mundo. Aunque el diseño de XML se centra en los documentos, es ampliamente utilizado

para la representación de arbitrarias estructuras de datos , por ejemplo en los servicios Web .

Muchas interfaces de programación de aplicaciones (API) se han desarrollado para los

desarrolladores de software a utilizar para procesar datos XML, y varios sistemas de esquema existen

para ayudar en la definición de lenguajes basados en XML.

A partir de 2009 , cientos de lenguajes basados en XML se han desarrollado, incluyendo RSS , Atom ,

JABÓN , y XHTML . Formatos basados en XML se han convertido en la opción predeterminada para

muchos de productividad de oficina, herramientas, incluyendo Microsoft Office ( Office Open XML ),

OpenOffice.org y LibreOffice ( OpenDocument ) y de Apple 's de iWork . XML también se ha empleado

como base idioma de los protocolos de comunicación , tales como XMPP .

Page 10: Html y xml

El material de esta sección se basa en la especificación XML. Esto no es una lista

exhaustiva de todas las construcciones que aparecen en XML, que proporciona una

introducción a la clave construye con mayor frecuencia en el uso del día a día.

(Unicode) Carácter

Por definición, un documento XML es una cadena de caracteres. Casi todos los

legales Unicode de caracteres pueden aparecer en un documento XML.

Procesador y aplicaciones

El procesador analiza el marcado y pasa la información estructurada a una aplicación.

Los lugares de especificación de requisitos en lo que es un procesador de XML debe

hacer y no hacer, pero la aplicación se encuentra fuera de su alcance. El procesador

(como la especificación de la llama) se refiere a menudo coloquialmente como un

analizador XML.

Page 11: Html y xml

Marcas y Contenido

Los personajes que componen un documento XML se dividen en el marcado y el contenido. De marcado y el contenido puede ser distinguido por la aplicación de sencillas reglas sintácticas. Todas las cadenas que constituyen marcas o bien comenzar con el carácter < y terminan con un > , o comenzar con el carácter & y terminar con un ; . Las cadenas de caracteres que no son de marcas están contentos.

Etiqueta

Una construcción de marcado que comienza con < y termina con > . Tags vienen en tres sabores:

puesta en las etiquetas, por ejemplo: <section>

las etiquetas de fin, por ejemplo: </section>

los elementos vacios etiquetas, por ejemplo: <line-break />

Page 12: Html y xml

Elemento

Un componente de lógica en el documento o bien comienza con una etiqueta de comienzo y

termina con un juego etiqueta final o se compone sólo de una etiqueta de elemento vacío. Los

caracteres entre el comienzo y final de las etiquetas, si las hubiere, son el contenido del

elemento, y puede contener marcas, incluyendo otros elementos, que se llaman elementos

secundarios. Un ejemplo de un elemento es <Greeting>Hello, world.</Greeting> (ver hola

mundo ). Otra es <line-break /> .

Atributo

Un marcado la construcción que consta de un par de nombre / valor que existe dentro de

una etiqueta de inicio de etiqueta o vacío elemento. En el ejemplo (abajo) el elemento img

tiene dos atributos, src y alt: <img src="madonna.jpg" alt='Foligno Madonna, by Raphael' /> .

Otro ejemplo sería <step number="3">Connect A to B.</step> donde el nombre del atributo es

"número" y el valor es "3".

Declaración XML

Los documentos XML pueden empezar por declarar alguna información sobre ellos mismos,

como en el ejemplo siguiente:

<? Xml version = "1.0" encoding = "UTF-8"?>

Page 13: Html y xml

Documentos XML contener solamente caracteres del Unicode repertorio. A excepción de un pequeño número de excluidos específicamente los caracteres de control , con cualquier carácter definido por Unicode puede aparecer en el contenido de un documento XML. La selección de caracteres que pueden aparecer dentro de margen de beneficio es algo más limitado, pero sigue siendo grande.

XML incluye facilidades para la identificación de la codificación de los caracteres Unicode que componen el documento, y para expresar caracteres que, por una u otra razón, no pueden ser utilizados directamente.

Page 14: Html y xml

Los caracteres válidos

Artículo principal: Los caracteres válidos en XML

Puntos de código Unicode en los siguientes rangos son válidos en documentos XML 1.0: [10]

U +0009, U +000 A, U +000 D: éstos son los únicos C0 controles aceptados en XML 1.0;

U +0020- U + D7FF, U + U + E000-FFFD: esto excluye a algunos (no todos) que no son

personajes de la BMP (todos los sustitutos, U + U + FFFE y FFFF están prohibidas);

U +10000- U +10 FFFF: esto incluye todos los puntos de código en los planos

complementarios, incluidos los no caracteres.

XML 1.1 [11] se extiende el conjunto de caracteres permitidos para incluir todo lo anterior,

además de los caracteres restantes en el rango de U +0001- U +001 F. Al mismo tiempo, sin

embargo, restringe el uso de C0 y C1 caracteres de control que no sean U 0009, U 000, U D

000 y U 0085 al obligarles a ser escrito en forma de escape (por ejemplo, U 0001 debe ser

escrito como o su equivalente). En el caso de caracteres C1, esta restricción es una

incompatibilidad hacia atrás, sino que se introdujo para permitir los errores comunes de

codificación para ser detectado.

El punto de código U 0000 es el único personaje que no está permitido en cualquier XML 1.0 o

documento 1.1.

Page 15: Html y xml

Detección de codificación

El conjunto de caracteres Unicode puede ser codificado en bytes para el almacenamiento o transmisión en una variedad de maneras diferentes, llamados "codificaciones". Unicode se define codificaciones que cubren todo el repertorio, muy conocidas son UTF-8 y UTF-16 . [12] Hay muchas otras codificaciones de texto que antes de la fecha de Unicode, como ASCII y ISO / IEC 8859 , sus repertorios de caracteres en casi todos los casos son subconjuntos del conjunto de caracteres Unicode.

XML permite el uso de cualquiera de las codificaciones Unicode definidos, y cualquier otro tipo de codificación cuyos personajes también aparecen en Unicode. XML también proporciona un mecanismo por el cual un procesador de XML de forma fiable puede, sin ningún conocimiento previo, determinar qué está codificado. [13] codificaciones distintas de UTF-8 y UTF-16 no necesariamente será reconocido por todos los análisis de XML.