linked data - minicurso - sbbd 2011

103
Linked Data: Construindo um Espaço de Dados Global na Web Regis Pires Magalhães, Percy Rivera Salas, José Antônio F. de Macêdo, Vânia Maria Ponte Vidal, Karin Breitman, Marco Antonio Casanova

Upload: regis-magalhaes

Post on 11-Feb-2017

2.608 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Linked Data - Minicurso - SBBD 2011

Linked Data:Construindo um Espaço de Dados Global na Web

Regis Pires Magalhães, Percy Rivera Salas, José Antônio F. de Macêdo, Vânia Maria Ponte Vidal, Karin Breitman, Marco Antonio Casanova

Page 2: Linked Data - Minicurso - SBBD 2011

Agenda

• Introdução• Fundamentos de Linked Data• Publicação de Linked Data• Melhores práticas para publicação de

Linked Data• Consumo de Linked Data• Limitações e Desafios• Conclusão• Referências

Page 3: Linked Data - Minicurso - SBBD 2011

Introdução

Page 4: Linked Data - Minicurso - SBBD 2011

Web Atual

“A Web atual deixou de ser apenas um espaço global de documentos interligados e está se tornando um enorme espaço global de dados vinculados constituído de bilhões de triplas RDF que cobrem os mais variados domínios.”

Heath, T. and Bizer, C. (2011). Linked Data: Evolving the Web into a Global Data Space. Morgan & Claypool, 1st edition.

Page 5: Linked Data - Minicurso - SBBD 2011

Linked Data

“The term Linked Data refers to a set of best practices for publishing and connectingstructured data on the Web.”

Bizer, C., Heath, T., and Berners-Lee, T. (2009). Linked Data - The Story So Far.

Page 6: Linked Data - Minicurso - SBBD 2011

Web de Documentos

• Internet, Links e Documentos

Page 7: Linked Data - Minicurso - SBBD 2011

Problemas

• As pessoas não estão interessadas em documentos, mas em coisas que estão neles.

• As pessoas podem analisar os documentos para extrair significado. ▫ As máquinas ainda não fazem isso de forma viável.▫ HTML define a estrutura de um documento, mas

não seu significado.

Page 8: Linked Data - Minicurso - SBBD 2011

Como fazer as máquinas entenderem o que está na Web?• Precisamos publicar aquilo que as máquinas

possam entender.▫ DADOS BRUTOS (RAW DATA)!!!

Page 9: Linked Data - Minicurso - SBBD 2011

Como os dados estão publicados na Web?• Assim:▫ Bancos de dados relacionais▫ XML▫ CSV▫ XLS▫ ...

• Problemas:▫ Diferentes formatos▫ Diferentes modelos de dados▫ Não há vínculos entre fontes de dados diferentes

• Conclusão:▫ Dificuldade para integrar os dados

Page 10: Linked Data - Minicurso - SBBD 2011

APIs proprietárias isolando os dados

Imagem: Bob Jagensdorf, http://flickr.com/photos/darwinbell/, CC-BY

Page 11: Linked Data - Minicurso - SBBD 2011

Projeto Linking Open Data

• Esforço espontâneo e volutário da comunidade iniciado em janeiro de 2007.

• Objetivo principal:▫ Desenvolver Linked Data a partir da identificação

de dados existentes sob licença livre e convertê-los para RDF de acordo com os princípios de LinkedData.

Page 12: Linked Data - Minicurso - SBBD 2011

Crescimento da Web de Dados

http://richard.cyganiak.de/2007/10/lod/

Page 13: Linked Data - Minicurso - SBBD 2011

Linked Open Data cloud – Set/2010

http://richard.cyganiak.de/2007/10/lod/

Page 14: Linked Data - Minicurso - SBBD 2011

LOD – Outubro de 2010

• 207 conjuntos de dados• Mais de 28 bilhões de triplas RDF • Aproximadamente 395 milhões de links RDF• Vários domínios

Page 15: Linked Data - Minicurso - SBBD 2011

Workshop Linked Data on the Web (LDOW)• Importante iniciativa dentro da programação da

International World Wide Web Conference(WWW) a partir de 2008.

Page 16: Linked Data - Minicurso - SBBD 2011

Número de Triplas

4th Linked Data on the Web Workshop (LDOW 2011).

Page 17: Linked Data - Minicurso - SBBD 2011

Crescimento por domínio

4th Linked Data on the Web Workshop (LDOW 2011).

Page 18: Linked Data - Minicurso - SBBD 2011

Fundamentos de Linked Data

Page 19: Linked Data - Minicurso - SBBD 2011

Linked Data

“Linked Data é um conjunto de melhores práticas para publicação e conexão de dados estruturados na Web, permitindo estabelecer links entre itens de diferentes fontes de dados para formar um único espaço de dados global.”

Heath, T. and Bizer, C. (2011). Linked Data: Evolving the Web into a Global Data Space. Morgan & Claypool, 1st edition.

Page 20: Linked Data - Minicurso - SBBD 2011

Início

• O pontapé inicial para essas melhores práticas foram os princípios de Linked Data estabelecidos por Tim Berners Lee em 2006.

Page 21: Linked Data - Minicurso - SBBD 2011

Princípios de Linked Data

1. Usar URIs como nomes para coisas.2. URIs HTTP para que as pessoas possam

procurar (dereferenciar) esses nomes.3. Quando alguém procurar uma URI, prover

informação útil, usando os padrões (RDF, SPARQL).

4. Incluir links para outras URIs, de modo que possam permitir a descoberta de mais coisas.

Tim Berners-Lee 2006http://www.w3.org/DesignIssues/LinkedData.html

Page 22: Linked Data - Minicurso - SBBD 2011

Boas práticas

• Os princípios foram estendidos por documentos originados a partir das experiências da comunidade de Linked Data, resultando em boas práticas de publicação e consumo de LinkedData.

• Documentos importantes:▫ Bizer, C., Cyganiak, R., and Heath, T. (2007). How to

Publish Linked Data on the Web. http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/.

▫ Sauermann, L. and Cyganiak, R. (2008). Cool URIs for the Semantic Web. http://www.w3.org/TR/cooluris/.

Page 23: Linked Data - Minicurso - SBBD 2011

Web de Dados

• Linked Data torna a Web um enorme banco de dados global:▫ O Espaço de Dados Global é chamado de Web de

Dados.• A Web de Dados forma um imenso grafo global

constituído de bilhões de triplas RDF de várias fontes cobrindo os mais variados domínios.

Page 24: Linked Data - Minicurso - SBBD 2011

Web de Documentos x Web de Dados

Web de Documentos Web de DadosNavegadores HTML Navegadores RDFLinks HTML conectando documentos

Links RDF interligando dados

Mecanismo de identificação - URIs Mecanismo de identificação – URIsMecanismo de acesso – HTTP Mecanismo de acesso – HTTPFormato de conteúdo – HTML Modelo de dados – RDF

– Linguagem de consulta – SPARQL

Page 25: Linked Data - Minicurso - SBBD 2011

Padrões usados em Linked Data▫ URIs – identificam objetos e conceitos,

permitindo que eles sejam dereferenciados para obtenção de informações a seu respeito.

▫ HTTP – Mecanismo de acesso universal

Page 26: Linked Data - Minicurso - SBBD 2011

Padrões usados em Linked Data▫ Modelo RDF A utilização um modelo de dados comum torna

possível a implementação de aplicações genéricas capazes de operar sobre o espaço de dados global [Heath and Bizer 2011] .

Descentralizado, baseado em grafo e extensível, com alto nível de expressividade e permitindo a interligação entre conjuntos de dados através de Links RDF.

Armazenamento através de grafo em memória, arquivo texto ou RDF Triple Store.

Page 27: Linked Data - Minicurso - SBBD 2011

RDF Statement

• Tripla

Page 28: Linked Data - Minicurso - SBBD 2011

RDF Links

Sujeito: http://www.w3.org/People/Berners-Lee/card#iPredicado: http://www.w3.org/2002/07/owl#sameAsObjeto: http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007

Sujeito: http://dbpedia.org/resource/Tim_Berners-LeePredicado: http://www.w3.org/2002/07/owl#sameAsObjeto: http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007

Page 29: Linked Data - Minicurso - SBBD 2011

RDF: Formatos de Serialização• RDF/XML▫ Mais antigo e mais amplamente usado.▫ Prolixo e pouco legível para o ser humano.

• N3 (Notation 3) [Berners-Lee 1998]▫ Mais expressivo que RDF/XML.

• Turtle [Beckett 2007]▫ Subconjunto de N3.

• N-Triples▫ Subconjunto de N3 e Turtle▫ Não possui alguns atalhos dos outros formatos como

recursos aninhados e URIs compactas Termina ficando prolixo, mas simples para fazer parse.

• RDFa▫ RDF embutido em HTML

• JSON

Page 30: Linked Data - Minicurso - SBBD 2011

RDFa

• Marcações semânticas adicionadas ao HTML:

<p xmlns:dc="http://purl.org/dc/elements/1.1/"about="http://www.example.com/books/wikinomics">No seu último livro<i property="dc:title">Wikinomics</i>,<span property="dc:author">Don Tapscott</span>explica as mudanças profundas tecnológicas,demográficas e de negócios.Este livro será publicado em<span property="dc:date" content="2006-10-01">October 2006</span>.

</p>

Page 31: Linked Data - Minicurso - SBBD 2011

Grafo RDF e sua representação em Turtle

@prefix foaf: <http://xmlns.com/foaf/0.1/> .@prefix ex: <http://example.org#> .<http://scott.com/> dc:creator <http://scott.com/foaf.rdf#me> .<http://scott.com/foaf.rdf#me> foaf:homepage <http://scott.com/> .<http://scott.com/foaf.rdf#me> foaf:name "John Scott" .<http://scott.com/foaf.rdf#me> foaf:mbox <mailto:[email protected]> .

Fonte: Langegger, A. (2010). A Flexible Architecture for Virtual Information Integrationbased on Semantic Web Concepts. PhD thesis, J. Kepler University Linz.

Page 32: Linked Data - Minicurso - SBBD 2011

Grafo RDF de uma rede social FOAF

Imagem: Langegger, A. (2010). A Flexible Architecture for Virtual Information Integrationbased on Semantic Web Concepts. PhD thesis, J. Kepler University Linz.

Page 33: Linked Data - Minicurso - SBBD 2011

Documento na Web

Fonte: Consuming Linked Data Tutorial – WWW Conference 2010

Page 34: Linked Data - Minicurso - SBBD 2011

Dados do documento provenientes do banco de dados relacional

Fonte: Consuming Linked Data Tutorial – WWW Conference 2010

Page 35: Linked Data - Minicurso - SBBD 2011

Representando em RDF...

Fonte: Consuming Linked Data Tutorial – WWW Conference 2010

Page 36: Linked Data - Minicurso - SBBD 2011

Vinculando com Revyu.com

Fonte: Consuming Linked Data Tutorial – WWW Conference 2010

Page 37: Linked Data - Minicurso - SBBD 2011

Padrões usados em Linked Data• Protocolo e Linguagem SPARQL▫ Linguagem de consulta de alto nível

[Prud’hommeaux and Seaborne 2008] para recuperação de informações contidas em grafos RDF.

▫ Protocolo [Clark et al. 2008] usado para enviar consultas e recuperar resultados através do protocolo HTTP.

▫ Fontes Linked Data tipicamente fornecem um SPARQL Endpoint que é um serviço Web com suporte ao protocolo SPARQL.

Page 38: Linked Data - Minicurso - SBBD 2011

Web de dados: características

• Genérica e pode conter qualquer tipo de dado;

• Qualquer pessoa pode publicar dados;

• Não há restrições para seleção de vocabulários;

• Dados são auto-descritos.

• Mecanismo padrão de acesso aos dados (HTTP) e modelo de dados padrão (RDF) simplificam o acesso aos dados;

• Aplicações que usam a Web de dados não se limitam a um conjunto fixo de fontes de dados, podendo inclusive descobrir novas fontes em tempo de execução.

Page 39: Linked Data - Minicurso - SBBD 2011

Publicação de Linked Data

Page 40: Linked Data - Minicurso - SBBD 2011

Publicação de Linked Data

• Publicar Linked Data: usar os princípios e melhores práticas de Linked Data para disponibilizar os dados na Web.

• Requisitos mínimos:▫ Fornecer URIs dereferenciáveis para cada

entidade.▫ Criar links RDF para outras fontes de dados.

• Desejável:▫ Disponibilização de SPARQL Endpoints e dumps

dos dados.

Page 41: Linked Data - Minicurso - SBBD 2011

Interface Linked Data

• Tratar requisições de URIs.• Dereferenciar URIs.• Tratar dos redirecionamentos 303 requeridos

pela arquitetura Web.• Negociação de conteúdo entre descrições de um

mesmo recurso em diferentes formatos.

http://dblp.l3s.de/d2r/resource/Marco_A._Casanovahttp://dblp.l3s.de/d2r/page/Marco_A._Casanova http://dblp.l3s.de/d2r/data/Marco_A._Casanova

Page 42: Linked Data - Minicurso - SBBD 2011

Publicação de dados de fontes RDF como Linked Data• Fontes de dados que adotam o modelo RDF são

normalmente armazenadas em arquivo RDF ou RDF Store.

Page 43: Linked Data - Minicurso - SBBD 2011

Publicação de arquivos RDF como Linked Data• Simples• Usado para arquivos pequenos• RDF/XML▫ Formato de serialização mais antigo e usado para

publicação de Linked Data.

Page 44: Linked Data - Minicurso - SBBD 2011

Arquivo RDF no formato Turtle

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .@prefix foaf: <http://xmlns.com/foaf/0.1/> .@prefix dc: <http://purl.org/dc/elements/1.1/> .@prefix : <http://lia.ufc.br/~regispires/researchers.rdf#> .

# The <> (the empty URI) means "this document".<> a foaf:Document ;

dc:title "Researchers file" .

:ufca foaf:Organization ;foaf:name "Universidade Federal do Ceará" .

:vaniaa foaf:Person ;foaf:name "Vânia Maria Ponte Vidal" ;foaf:Organization :ufc ;rdfs:sameAs <http://dblp.l3s.de/d2r/resource/V%C3%A2nia_Maria_Ponte_Vidal> .

Page 45: Linked Data - Minicurso - SBBD 2011

Conversão de Turtle para RDF/XML

• Conversores on-line:▫ Babel http://simile.mit.edu/babel

▫ RDFConverter http://www.mindswap.org/2002/rdfconvert/

Page 46: Linked Data - Minicurso - SBBD 2011

Arquivo RDF no formato RDF/XML<?xml version="1.0" encoding="UTF-8"?><rdf:RDF

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xmlns:foaf="http://xmlns.com/foaf/0.1/"xmlns:dc="http://purl.org/dc/elements/1.1/"xmlns="http://lia.ufc.br/~regispires/researchers.rdf#">

<rdf:Description rdf:about=""><rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Document"/><dc:title>Researchers file</dc:title>

</rdf:Description>

<rdf:Description rdf:about="http://lia.ufc.br/~regispires/researchers.rdf#ufc"><rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Organization"/><foaf:name>Universidade Federal do Ceará</foaf:name>

</rdf:Description>

<rdf:Description rdf:about="http://lia.ufc.br/~regispires/researchers.rdf#vania"><rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Person"/><foaf:name>Vânia Maria Ponte Vidal</foaf:name><foaf:Organization rdf:resource="http://lia.ufc.br/~regispires/researchers.rdf#ufc"/><rdfs:sameAs rdf:resource="http://dblp.l3s.de/d2r/resource/V%C3%A2nia_Maria_Ponte_Vidal"/>

</rdf:Description></rdf:RDF>

Page 47: Linked Data - Minicurso - SBBD 2011

Interface Linked Data

• Disponibilização de um arquivo RDF/XML:▫ Possibilita o dereferenciamento de URIs▫ Uso de RDF Links

• Não resolve:▫ Redirecionamentos 303 e a negociação de

conteúdo. • Fornecimento de interface Linked Data através

do serviço Pubby (http://www4.wiwiss.fu-berlin.de/pubby/)

Page 48: Linked Data - Minicurso - SBBD 2011

RDFa: RDF embutido em documento Web

• Textos e links legíveis ao ser humano coexistindo com dados que poderão ser processados pelas máquinas.

• Alterações centralizadas em um único documento.

Page 49: Linked Data - Minicurso - SBBD 2011

<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN""http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"><html

xml:lang="en"version="XHTML+RDFa 1.0"xmlns="http://www.w3.org/1999/xhtml"xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xmlns:foaf="http://xmlns.com/foaf/0.1/"xmlns:dc="http://purl.org/dc/elements/1.1/"xmlns:rs="http://lia.ufc.br/~regispires/researchers.rdf#"

><head>

<title>Researchers</title><meta http-equiv="content-type" content="text/html;charset=UTF-8" /><meta property="dc:title" content="Researchers file" /><link rel="rdf:type" href="http://xmlns.com/foaf/0.1/Document" />

</head><body>

<h1>Organizations</h1><ul>

<li><div about="http://lia.ufc.br/~regispires/researchers.rdf#ufc" typeof="foaf:Organization">

<span property="foaf:name">Universidade Federal do Ceará</span></div>

</li></ul><h1>Researchers</h1><ul>

<li><div about="http://lia.ufc.br/~regispires/researchers.rdf#vania" typeof="foaf:Person">

<span property="foaf:name">Vânia Maria Ponte Vidal</span><span rel="foaf:Organization" resource="http://lia.ufc.br/~regispires/researchers.rdf#ufc"></span><span rel="rdfs:sameAs" resource="http://dblp.l3s.de/d2r/resource/V%C3%A2nia_Maria_Ponte_Vidal"></span>

</div></li>

</ul></body>

</html>

RDFa

Page 50: Linked Data - Minicurso - SBBD 2011

Publicação de dados de RDF Storecomo Linked Data• Tipicamente envolve:▫ Disponibilização de interface Linked Data▫ SPARQL Endpoint

• Servidor Joseki ou Fuseki pode ser usado como SPARQL Endpoint de uma RDF Store.

• Pubby pode prover a interface Linked Data.▫ Realiza consulta SPARQL usando o comando

DESCRIBE para obtenção do resultado em formato RDF.

Page 51: Linked Data - Minicurso - SBBD 2011

Publicação de dados de fontes não RDF como Linked Data

• Dados publicados devem estar no modelo RDF ou serem convertidos para ele.

• Abordagens para lidar com dados não RDF:▫ Processo de Conversão Gerar RDF através de algum conversor

▫ Fornecer uma visão RDF Acesso a dados que não estão no modelo RDF através

de um RDF Wrapper Conversão dinâmica baseada em mapeamentos

estabelecidos entre o modelo nativo e o modelo RDF.

Page 52: Linked Data - Minicurso - SBBD 2011

RDB-to-RDF Wrappers

• Criam visões RDF a partir de mapeamentos entre as estruturas relacionais e os grafos RDF.

Page 53: Linked Data - Minicurso - SBBD 2011

RDB-to-RDF Wrappers

• Plataforma D2RQ▫ Fornece a infra-estrutura necessária para acessar

bancos de dados relacionais como grafos RDF virtuais.

• Componentes▫ Linguagem de mapeamento D2RQ▫ Mecanismo D2RQ▫ Servidor D2R

Page 54: Linked Data - Minicurso - SBBD 2011

RDB-to-RDF Wrappers• Plataforma D2RQ - Arquitetura

Page 55: Linked Data - Minicurso - SBBD 2011

RDB-to-RDF Wrappers

• Virtuoso RDF Views• Triplify▫ Pequeno plugin para aplicações Web▫ Mapeia os resultados de consultas SQL em RDF,

JSON e Linked Data.

Page 56: Linked Data - Minicurso - SBBD 2011

RDB2RDF

• Grupo de trabalho do W3C criado em 2009.• Definição da linguagem R2RML▫ Mapeamento de dados e esquemas relacionais

para RDF▫ Tende a substituir as soluções de mapeamento já

existentes.

Page 57: Linked Data - Minicurso - SBBD 2011

Processo StdTrip

• Guia usuários durante os estágios de modelagem conceitual do processo RDB para RDF

Page 58: Linked Data - Minicurso - SBBD 2011

Melhores práticas para publicação de Linked Data• Selecionar URIs adequadas▫ Evitar URIs contendo algum detalhe de

implementação ou do ambiente em que estão publicadas

▫ URIs relacionadas a um mesmo recurso http://dblp.l3s.de/d2r/resource/V%C3%A2nia_Maria_Ponte_Vidal http://dblp.l3s.de/d2r/page/V%C3%A2nia_Maria_Ponte_Vidal http://dblp.l3s.de/d2r/data/V%C3%A2nia_Maria_Ponte_Vidal

Page 59: Linked Data - Minicurso - SBBD 2011

Melhores práticas para publicação de Linked Data• Usar URIs dereferenciáveis.• Utilizar URIs estáveis.• Criar links para outras fontes de dados

Page 60: Linked Data - Minicurso - SBBD 2011

RDF Links entre Datasets

4th Linked Data on the Web Workshop (LDOW 2011).

Page 61: Linked Data - Minicurso - SBBD 2011

Melhores práticas para publicação de Linked Data• Publicação de Metadados▫ Facilita a seleção dos dados relevantes.▫ Devem ser fornecidos metadados sobre

proveniência e licenciamento dos dados.▫ Também é recomendável a disponibilização de

metadados sobre a fonte de dados.

Page 62: Linked Data - Minicurso - SBBD 2011

Metadados de Licenciamento e Proveniência• Somente 18 (9,05 %) das 207 fontes de dados

fornecem informação de licença machine-readable.

• Somente 50 (25.25 %) das fontes de dados fornecem informação de proveniênciamachine-readable.

Page 63: Linked Data - Minicurso - SBBD 2011

Melhores práticas para publicação de Linked Data• Usar termos de vocabulários amplamente

usados.▫ Objetivo: facilitar o processamento de Linked

Data pelas aplicações clientes• Novos termos só devem ser definidos se não

forem encontrados em vocabulários já existentes

Page 64: Linked Data - Minicurso - SBBD 2011

Uso de vocabulários comuns

4th Linked Data on the Web Workshop (LDOW 2011).

Page 65: Linked Data - Minicurso - SBBD 2011

Melhores práticas para publicação de Linked Data• Estabelecer relações entre os termos de

vocabulários proprietários para termos de outros vocabulários.▫ Uso das propriedades owl:equivalentClass,

owl:equivalentProperty, rdfs:subClassOf, rdfs:subPropertyOf.

Page 66: Linked Data - Minicurso - SBBD 2011

Mapeamentos de Vocabulários

• Somente 9 (7,32%) de 123 fontes de dados que usam termos proprietários fornecem mapeamentos de termos para outros vocabulários.

• Exemplo:<http://xmlns.com/foaf/0.1/Person>owl:equivalentClass<http://dbpedia.org/ontology/Person> .

Page 67: Linked Data - Minicurso - SBBD 2011

Melhores práticas para publicação de Linked Data• Explicitar formas de acesso adicional aos dados ▫ SPARQL endpoints e RDF dumps.

Page 68: Linked Data - Minicurso - SBBD 2011

Melhores práticas para publicação de Linked Data• Estabelecer relações entre os termos de

vocabulários proprietários para termos de outros vocabulários.▫ Uso das propriedades owl:equivalentClass,

owl:equivalentProperty, rdfs:subClassOf, rdfs:subPropertyOf.

Page 69: Linked Data - Minicurso - SBBD 2011

Aplicações

Navegadores Motores de busca Aplicações de domínio específico

Page 70: Linked Data - Minicurso - SBBD 2011

Validação dos dados publicados como Linked Data• É necessário garantir que os dados realmente

estão de acordo com os princípios e melhores práticas de Linked Data.

• Ferramentas▫ W3C Validation Service▫ Eyeball▫ cURL▫ Vapour▫ Sindice Web Data Inspector▫ Navegadores RDF

Page 71: Linked Data - Minicurso - SBBD 2011

Consumo de Linked Data

Page 72: Linked Data - Minicurso - SBBD 2011

Consumo de Linked Data

• Ponto de partida▫ URIs▫ Palavras-chave▫ Consultas SPARQL

• Tipos de Aplicações que consomem Linked Data▫ Aplicações genéricas▫ Aplicações de domínio específico

Page 73: Linked Data - Minicurso - SBBD 2011

Aplicações genéricas para consumo de Linked Data• Navegadores RDF• Mecanismos de Busca Linked Data• Outras aplicações genéricas

Page 74: Linked Data - Minicurso - SBBD 2011

Navegadores Linked Data

Permitem a navegação entre fontes de dados seguindo links expressos como triplas RDF. LOD Browser Switch Explorator Disco Hiperdata Browser Marbles Tabulator LinkSailor Graphite RDF Browser

Page 75: Linked Data - Minicurso - SBBD 2011

Disco

Page 76: Linked Data - Minicurso - SBBD 2011

Tabulator

Page 77: Linked Data - Minicurso - SBBD 2011

Marbles Pontos coloridos correlacionam a origem dos

dados com uma lista de fontes de dados.

Page 78: Linked Data - Minicurso - SBBD 2011

Graphite

Page 79: Linked Data - Minicurso - SBBD 2011

Link Sailor

Page 80: Linked Data - Minicurso - SBBD 2011

Mecanismos de busca

• Rastreiam a Web seguindo links RDF e possibilitamconsultas sobre dados agregados. Orientados a humanos – criados para usuários

humanos. Orientados a aplicações – fornecem APIs para

descoberta de RDFs que referenciam certa URI o quepossuem determinada palavra chave.

Page 81: Linked Data - Minicurso - SBBD 2011

Mecanismos de busca

• Sindice• Sig.ma• VisiNav• Watson

Page 82: Linked Data - Minicurso - SBBD 2011

82

Page 83: Linked Data - Minicurso - SBBD 2011
Page 84: Linked Data - Minicurso - SBBD 2011

Outras aplicações genéricas

• sameAs▫ Serviço online de coreferenciamento▫ Encontrar URIs de diferentes fontes de dados que

representam um mesmo conceito• LDSpider▫ Segue links para obter dados e os armazena em

arquivo RDF ou em RDF Store através de SPARQL Update.

Page 85: Linked Data - Minicurso - SBBD 2011

Aplicações de domínio específico para consumo de Linked Data• Linked Data Mashups

Page 86: Linked Data - Minicurso - SBBD 2011

Aplicações de domínio específico BBC Programmes e BBC Music

Page 87: Linked Data - Minicurso - SBBD 2011

87

Page 88: Linked Data - Minicurso - SBBD 2011

Talis Aspire

• Aplicação de gerenciamento de lista de recursosvoltada para professores e estudantes. Quando o usuário cria listas, a aplicação produz

triplas RDF que são persistidas em um Linked Data store.

Itens de uma lista são transparentemente ligados(linked) a itens correspondentes de outras intituições.

Page 89: Linked Data - Minicurso - SBBD 2011

Semantic Web Pipes (SWP)

Integração de dados sobre Tim Berners-Lee a partir de 3 fontes de dados

Page 90: Linked Data - Minicurso - SBBD 2011
Page 91: Linked Data - Minicurso - SBBD 2011
Page 92: Linked Data - Minicurso - SBBD 2011

Revyu Avaliação / Classificação

Page 93: Linked Data - Minicurso - SBBD 2011

DBPedia Mobile• Exibe informações de

diversas fontes(DBPedia, Revyu, Flickr), baseado nalocalização do usuárioobtida por GPS.

Page 94: Linked Data - Minicurso - SBBD 2011

APIs para manipulação de Linked Data

• Sesame• Jena• Named Graphs API for Jena (NG4J)• Semantic Web Client Library (SWClLib)• ARQ2

Page 95: Linked Data - Minicurso - SBBD 2011

Abordagens para execução de consultas sobre múltiplas fontes de dados

• Abordagens Tradicionais▫ Data warehousing▫ Federação de consultas

• Abordagens Inovadoras▫ Descoberta ativa baseada em federação de

consultas▫ Consultas exploratórias (link traversal)

Page 96: Linked Data - Minicurso - SBBD 2011

Limitações e Desafios

Page 97: Linked Data - Minicurso - SBBD 2011

Limitações e Desafios

• Interfaces com o usuário precárias• Desempenho insatisfatório nas consultas sobre

múltiplas fontes de dados.• Tornar mais transparente a integração de dados

entre múltiplas fontes.• Instabilidade no acesso a fontes.• RDF Links quebrados.• Descoberta de fontes de dados relevantes.• Privacidade dos dados e restrições sobre eles.• Explicitar os direitos de cópia e reprodução

sobre os dados.

Page 98: Linked Data - Minicurso - SBBD 2011

Limitações e Desafios

• Mapeamento dos diversos vocabulários existentes.

• Criação, edição e manutenção de Linked Data por vários usuários.

• Manutenção de dados para evitar acesso a informações que não estejam mais disponíveis.

• Detecção de inconsistências.• Determinar as informações mais relevantes,

assim como detectar sua validade para melhorar a qualidade da informação.

Page 99: Linked Data - Minicurso - SBBD 2011

Conclusão

Page 100: Linked Data - Minicurso - SBBD 2011

Conclusão

Potencial de revolucionar como os dados sãoacessados e usados.

Sucesso de mashups, mas dificuldade para usarmuitas fontes de dados heterogêneas.

Linked Data permitem que aplicações usem fontes de dados sem limites através de mecanismos de acessopadronizados. A intenção é aproveitar todo o potencial da Web

Page 101: Linked Data - Minicurso - SBBD 2011

Conclusão

Slide from Tim Berners-Lee's TED talk in Feb 09

Page 102: Linked Data - Minicurso - SBBD 2011

Referências• Berners-Lee, T. (2006). Linked Data – Design Issues.

http://www.w3.org/DesignIssues/LinkedData.html.

• Bizer, C., Heath, T., and Berners-Lee, T. (2009). Linked Data - The Story So Far. Int. J. Semantic Web Inf. Syst., 5(3):1–22. Disponível em: http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf

• Bizer, C., Cyganiak, R., and Heath, T. (2007). How to Publish Linked Data on the Web. http://www4.wiwiss.fuberlin.de/bizer/pub/LinkedDataTutorial/.

• Heath, T. and Bizer, C. (2011). Linked Data: Evolving the Web into a Global Data Space. Morgan & Claypool.

• Langegger, A. (2010). A Flexible Architecture for Virtual Information Integration based on Semantic Web Concepts. PhD thesis, J. Kepler University Linz.

• Linking Open Data Project Wiki. Disponível em: http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

• Intro Slides. 4th Linked Data on the Web Workshop (LDOW 2011).

• Introduction to Linked Data Slides. Consuming Linked Data Tutorial. (LDOW 2010)• Prud’hommeaux, E. and Seaborne, A. (2008). SPARQL Query Language for RDF.

http://www.w3.org/TR/rdf-sparql-query/.• Clark, K. G., Feigenbaum, L., and Torres, E. (2008). SPARQL Protocol for RDF.

http://www.w3.org/TR/rdf-sparql-protocol/.

Page 103: Linked Data - Minicurso - SBBD 2011

Obrigado!Dúvidas, sugestões, comentários?