linked data:¿qué es y qué nos ofrece?
Post on 12-Jan-2015
2.131 Views
Preview:
DESCRIPTION
TRANSCRIPT
Linked Data:¿qué es y qué nos ofrece?
Daniel Vila-SueroFacultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
dvila@fi.upm.es
Agradecimientos: A. Gómez-Pérez.
Seminario web Linked Open Data@AIMS FAOMartes 11 de Diciembre de 2012
Contenido
• Produciendo y consumiendo información en la Web • Linked Data• Conceptos básicos a través de un ejemplo• Lecturas
2
Produciendo y consumiendo
información en la Web
3
La Web desde dos perspectivas
4
PRODUCTORINFORMACIÓN
CONSUMIDORINFORMACIÓN
WWW
• Dos roles con fronteras cada día más diluídas• Usuarios:
• Consumimos a diario información de wikipedia, prensa, twitter, facebook, etc.
• Producimos información en twitter, wikipedia, facebook, comentamos noticias, etc.
• Una organización (empresa, institución pública):• Produce información y ofrece servicios (compra-venta,
agregación información, etc.)• Consume información para mejorar sus servicios/oferta
Consumidores
5
CONSUMIDORES WWW
• Cuando usamos la Web:
• Consultamos varias fuentes de información:• Para organizar un viaje: compra de billetes, hotel, sitios
de interés, etc.• Para comprar un libro: desde un autor que nos gusta a
un tema determinado• Los servicios más exitosos son aquellos que son capaces
de agregar/derivar información que nos interesa: google, twitter, etc.
• Muchas veces resulta tedioso/difícil encontrar lo que buscamos
Productores
6
PRODUCTORES WWW
• Necesitan que su información/servicio sea visible, útil y relevante
• Reutilizar información de otros aumenta las capacidades del servicio
• Compartir información de una manera sencilla y
estándar amplía el potencial de la misma y la visibilidad de la organización
Produciendo información en la Web
7
WWWWeb 1.0
AUTOR
EDITOR
LIBRO
IDIOMA
Produciendo información en la Web
8
WWWWeb 1.0
Web 2.0WWW
AUTOR
EDITOR
LIBRO
IDIOMA
HTML
HTML, XML, servicios web
Produciendo información en la Web
9
WWWWeb 1.0
Web 2.0WWW
WWW
Linked Data
WWW
AUTOR
EDITOR
LIBRO
IDIOMA
HTML
HTML, XML, servicios web
Produciendo información en la Web
10
WWWWeb 1.0
Web 2.0WWW
WWW
Linked Data
WWW
HTML
“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”
Limitaciones
• El sistema actual (HTML + Servicios Web) no facilita la reutilización ni la generación de nuevo conocimiento
• HTML: Es un formato para estructurar documentos, no datos
• Servicios Web: Aunque estructuran los datos, no especifican el modelo de una manera estándar (e.g. es Eduardo Mendoza una persona? )
11
Linked Data
12
Comparte tus datos y reutiliza los de otros
13
WWW
Linked Data
WWW
Idea básica
14
WWW
Mantén el modelo de tus datos cuando publiquesinformación en la Web
AUTOR
EDITOR
LIBRO IDIOMA
LIBRO
AUTOR
Estar en la Web……..
Idea básica
15
WWW
WWW
Mantén el modelo de tus datos cuando publiquesinformación en la Web
AUTOR
EDITOR
LIBRO IDIOMA
LIBRO
AUTOR
… ser parte de la Web.
Linked Data
• Publicación de datos en la Web:
• Usando las tecnologías de la Web: HTTP, URL/URI, DNS• Con un modelo de datos explícito: RDF + vocabularios (o
esquemas, ontologías..) en RDF Schema o OWL
• Permite compartir (aumentar) tus datos
• Permite reutilizar datos de otros para enriquecer tu información, reducir costes, y ofrecer mejores servicios
16
¿Qué podemos publicar usando Linked Data?
• Información sobre cualquier cosa:
17
AMORhttp://dbpedia.org/resource/Love
Eduardo Mendoza
http://datos.bne.es//resource/XX1013037
Barcelona
http://geo.linkeddata.es/resource/Provincia/Barcelona
Los 4 Principios*
18
1. Utilizar URIs para nombrar cosas (recursos)
http://dbpedia.org/resource/Love
http://geo.linkeddata.es/resource/Provincia/Barcelona
2. Usar el protocolo HTTP para publicar/recuperar recursos
3. Describir datos en un formato estándar (RDF)
4. Enlazar con otros recursos a través de URIs
dbpedia:Tim_Berners-Lee rdf:type foaf:Person
foaf:surname "Berners-Lee"@en ;foaf:givenName "Tim"@en ;
*http://www.w3.org/DesignIssues/LinkedData
¿Qué necesitamos? (1)
• Bloque básico: tripletas RDF
Sujeto Predicado Objeto
Eduardo Mendoza es autor de La ciudad de los prodigios
Barcelona forma parte de Catalunya
• Sujeto y predicado son URIs
• El objeto puede ser una URI o un literal
19
¿Qué necesitamos? (2)
• Vocabularios para:
• Indicar de qué tipo son nuestros recursos (CLASES):
• Describir nuestros recursos (PROPIEDADES):• Tiene nombre, nº de páginas, etc.
• Existen multitud de vocabularios (http://lov.okfn.org/) para describir todo tipo de cosas en la Web
20
Eduardo Mendoza es Persona
Barcelona es Municipio
El modelo (vocabulario) y los datos
21
Obra
Lengua
Traducción
Año
Fecha de Publicación
Biblioteca
Ubicado en
Persona
Es autor
Tiene como materia
El Quijote Cervantes
Es autor
Catalán
Traducción
1960
Fecha de Publicación
BNE
Ubicado en
Tiene como materia
Vida de Cervantes
Vocab
Datos
22
Ejemplo*:
2 recursos
3 conjuntos de datos
*Basado en la presentación de Tom Baker@FAO-AIMS: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-web
Descripción en Google Knowledge Graph
23
Recurso A: Eduardo Mendoza
Bloque básico para describir el recurso: Tripletas
24
Sujeto Predicado Objeto
Eduardo Mendoza Nacido en Barcelona
Eduardo Mendoza Fecha de nacimiento 01-11-1943
Eduardo Mendoza Profesión Escritor
Eduardo Mendoza Autor de La ciudad de los prodigios
Sujeto Predicado Objeto
Triplificando la descripción
25
Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga Nacido en Barcelonadbpedia:Eduardo_Mendoza_Garriga Fecha de nacimiento 01-11-1943dbpedia:Eduardo_Mendoza_Garriga Profesión Escritordbpedia:Eduardo_Mendoza_Garriga Autor de La ciudad de los prodigios
Identificamos el sujeto con una URI
La URI completa es http://dbpedia.org/resource/Eduardo_Mendoza_Garriga pero utilizamos la abreviación dbpedia:
Triplificando la descripción: Usando otros conjuntos de datos
26
Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga Nacido en geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga Fecha de nacimiento "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga Es una foaf:Person
dbpedia:Eduardo_Mendoza_Garriga Autor de bne:XX1892304
Los objetos pueden ser URIs o literales
La URI completa es http://datos.bne.es/resource/XX1892304 pero utilizamos la abreviación bne:
Triplificando la descripción: Usando vocabularios
27
Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
Los predicados SON URIs
(de uno o varios vocabularios)
Foaf es un vocabulario para describir personas (fecha y lugar de nacimiento por ejemplo).
rdf:type asigna un tipo al recurso
Al usar recursos de otros conjuntos: ampliamos la información
28
bne:XX1892304 es la URI que identifica la obra con titulo "La ciudad de los prodigios" en el portal de datos de la BNE (datos.bne.es)
Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
bne:XX1892304 dc:title La ciudad de los prodigios
Las tripletas conforman un grafo
29
Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
bne:XX1892304 dc:title La ciudad de los prodigios
dbpedia:Eduardo_Mendoza…
geoes:Barcelona01-11-1943
foaf:Person
bne:XX1892304
La ciudad de los prodigios
foaf:birthPlacefoaf:birthDate
rdf:type
frbr:isCreatorOf
dc:title
Descripción en Google Knowledge Graph
30
Recurso B: Barcelona
Explorando el grafo
31
Sujeto Predicado Objeto
geoes:Barcelona http://geo.linkeddata.es/ontology/formaParteDe
http://geo.linkeddata.es/page/resource/ComunidadAutónoma/
Cataluña
geoes:Barcelona geo:lat 41.3833333333333
geoes:Barcelona geo:long 2.16666666666667
geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/Provincia
geoes:Barcelona
geoes:Cataluña
41.3833333333333
geoes:Provincia
2.16666666666667
geo:latgeoes:formaParteDe
geo:long
rdf:type
Aumentando el grafo
32
Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
bne:XX1892304 dc:title La ciudad de los prodigios
Uniendo las tripletas del recurso A
Aumentando el grafo
33
Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
bne:XX1892304 dc:title La ciudad de los prodigios
geoes:Barcelona http://geo.linkeddata.es/ontology/formaParteDe
http://geo.linkeddata.es/page/resource/ComunidadAutónoma/
Cataluña
geoes:Barcelona geo:lat 41.3833333333333
geoes:Barcelona geo:long 2.16666666666667
geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/Provincia
Con las tripletas del recurso B
URIs: integrando datos en la WWW
34
Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
bne:XX1892304 dc:title La ciudad de los prodigios
geoes:Barcelona http://geo.linkeddata.es/ontology/formaParteDe
http://geo.linkeddata.es/page/resource/ComunidadAutónoma/
Cataluña
geoes:Barcelona geo:lat 41.3833333333333
geoes:Barcelona geo:long 2.16666666666667
geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/Provincia
Con las tripletas del recurso B
Las URIs
35
dbpedia:Eduardo_Mendoza…
geoes:Barcelona
01-11-1943
foaf:Person
bne:XX1892304
La ciudad de los prodigios
foaf:birthPlace
foaf:birthDate
rdf:type
frbr:isCreatorOf
dc:title
geoes:Barcelona
geoes:Cataluña
41.3833333333333
geoes:Provincia
2.16666666666667
geo:latgeoes:formaParteDe
geo:long
rdf:type
Creando un grafo de datos
36
dbpedia:Eduardo_Mendoza…
geoes:Barcelona
01-11-1943
foaf:Person
bne:XX1892304
La ciudad de los prodigios
foaf:birthPlace
foaf:birthDate
rdf:type
frbr:isCreatorOf
dc:title
geoes:Cataluña
41.3833333333333
geoes:Provincia
2.16666666666667
geo:lat
geoes:formaParteDe
geo:longrdf:type
Generando valor a través del enlazado
37
dbpedia:Eduardo_Mendoza…
geoes:Barcelona
01-11-1943
foaf:Person
bne:XX1892304
La ciudad de los prodigios
foaf:birthPlace
foaf:birthDate
rdf:type
frbr:isCreatorOf
dc:title
geoes:Cataluña
41.3833333333333
geoes:Provincia
2.16666666666667
geo:lat
geoes:formaParteDe
geo:longrdf:type
Ampliando la red de datos
38
dbpedia:Eduardo_Mendoza…
geoes:Barcelona
01-11-1943
foaf:Person
bne:XX1892304
La ciudad de los prodigios
foaf:birthPlace
foaf:birthDate
rdf:type
frbr:isCreatorOf
dc:title
geoes:Cataluña
41.3833333333333
geoes:Provincia
2.16666666666667
geo:lat
geoes:formaParteDe
geo:longrdf:type
Lecciones aprendidas
• Nombrar nuestros recursos usando HTTP URIs, describirlos usando vocabularios (RDFS y OWL), enlazar nuestros datos usando URIs de otros proveedores de datos.
• Receta básica:1. Entender nuestro modelo de datos de origen
2. Crear un espacio de URIs gestionadas por la organización y que identifiquen univocamente nuestros recursos
3. Seleccionar los vocabularios adecuados (http://lov.okfn.org/dataset/lov). Mantener el modelo claro y sencillo
4. Describir nuestros recursos usando tripletas RDF y los vocabularios
5. Usar URIs de otros para describir nuestros datos complementando y aumentando nuestros recursos
39
Lecturas
• Informes del W3C Library Linked Data Incubator Group:• Inglés:http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/• Español y otros idiomas:
http://www.w3.org/2003/03/Translations/byTechnology?technology=lld-reports
• Linked Data book, Heath and Bizer:• http://linkeddatabook.com/editions/1.0/
• Artículo sobre la publicación de datos de la BNE:• http://semantic-web-journal.net/content/datosbnees-library-linked-
data-dataset
40
Muchas gracias!
Email: dvila@fi.upm.es
Twitter: @dvilasuero
41
top related