Download - Web Semântica e Ontologias
![Page 1: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/1.jpg)
Bem vindos à disciplina
Web Semân)ca e Ontologias
Universidade Federal de Pelotas Disciplina Opta7va: 1110202
Professores:
Daniela Brauner – [email protected] Ana Marilza Pernas Roger Machado
![Page 2: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/2.jpg)
O problema
O volume de dados disponíveis na Web aumentou (e vem aumentando)…
![Page 3: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/3.jpg)
Redes Sociais Páginas Web
Bases de dados científicas
BIG DATA
Sensores Dispositivos
móveis
Cidades Inteligentes
![Page 4: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/4.jpg)
O problema
…e como encontramos a informação que buscamos?
![Page 5: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/5.jpg)
! ?
![Page 6: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/6.jpg)
Em busca de imagens de…
![Page 7: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/7.jpg)
Procurando por imagens com a palavra “cano”
![Page 8: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/8.jpg)
Ahhhhh, mas o buscador está configurado para a língua inglesa…
Opa… quase… mas é necessário desambiguar.
![Page 9: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/9.jpg)
Pronto… configurei o buscador para língua portuguesa.
![Page 10: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/10.jpg)
Em busca de imagens de…
![Page 11: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/11.jpg)
![Page 12: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/12.jpg)
![Page 13: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/13.jpg)
![Page 14: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/14.jpg)
O problema
E as máquinas? Como os computadores desambiguam o resultado de uma busca
automaAcamente?
![Page 15: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/15.jpg)
Uma ideia
• A Web Semân7ca é uma área de pesquisa voltada a permi7r que usuários e máquinas consigam facilmente encontrar, compar7lhar e combinar informações na Web;
• A ideia é embu7r semân7ca nos dados; • Descrever os dados com informações semân7cas;
![Page 16: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/16.jpg)
Minha página pessoal
• Eu sou Daniela Brauner • Trabalho na • Moro em • Escuto • Assisto • Sou amiga da • Fui ao • Adoro
![Page 17: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/17.jpg)
LINK PARA
LINK PARA
LINK PARA
LINK PARA LINK PARA
LINK PARA
LINK PARA
Como o computador entende a minha página
![Page 18: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/18.jpg)
É AMIGA DE
CURTE
ASSISTE
ESCUTA
MORA EM ESTEVE EM
TRABALHA PARA
Incluindo semân7ca
TRABALHA PARA
MORA EM
![Page 19: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/19.jpg)
![Page 20: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/20.jpg)
Conceitos importantes
• A Web de documentos • A Web de dados • Tecnologias • Ferramentas • API • Armazenamento
![Page 21: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/21.jpg)
Web de documentos • Hoje, a maior parte das
páginas Web são documentos HTML conectados uns aos outros através de hyperlinks.
![Page 22: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/22.jpg)
Web de documentos • Em 1989 – Tim Berners-‐Lee inventou a Web • Em 1990 – Ele escreveu seu primeiro cliente/servidor Web • Em 1994 – Foi criado o W3C (World Wide Web Consor7um) …
Referências: Linha do tempo da evolução das tecnologias para Web (intera7va):
hip://www.evolu7onokheweb.com Mais sobre Tim Berners-‐Lee:
hip://www.w3.org/People/Berners-‐Lee/
![Page 23: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/23.jpg)
Web de documentos • O World Wide Web ConsorAum (W3C) é um consórcio
internacional formado por organizações, uma equipe em tempo integral e o público, que trabalha para desenvolver padrões para a Web. Foi fundado em 1994.
• Liderado pelo inventor da web Tim Berners-‐Lee e Jeffrey Jaffe, o W3C tem como missão conduzir a World Wide Web para que a)nja todo seu potencial, desenvolvendo protocolos e diretrizes que garantam seu crescimento de longo prazo.
Referências: Site oficial: hip://www.w3.org
Escritório brasileiro: hip://www.w3c.br
![Page 24: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/24.jpg)
Web de documentos • Máquinas conseguem ler esses documentos mas têm muita
dificuldade de extrair algum significado deles…
![Page 25: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/25.jpg)
Web de dados
Como viabilizar que os computadores “entendam” o conteúdo da Web?
• Web semân)ca: é a visão do W3C sobre dados conectados na
Web. As tecnologias para Web Semân7ca viabilizam que as pessoas criem repositórios de dados na Web, vocabulários e que escrevam regras para que os computadores possam manipular os dados.
• O W3C mantém esforços colabora7vos com a par7cipação de um grande número de pesquisadores e parceiros industriais.
![Page 26: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/26.jpg)
Web de dados
• Na web de dados também usamos links… • Tudo é iden7ficado por URIs (Uniform Resource Iden7fiers)
Imagine uma página com informações sobre Albert Einstein:
Name Albert Einstein Albert was born on March 14, 1879. Albert was born in the German Empire. Albert has a picture at hip://en.wikipedia.org/wiki/Image:Albert_Einstein_Head.jpg
![Page 27: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/27.jpg)
Web de dados
• Na web de dados teríamos os dados anotados, mais ou menos assim:
<hip://dbpedia.org/resource/Albert_Einstein> <hip://xmlns.com/foaf/0.1/name> "Albert Einstein". <hip://dbpedia.org/resource/Albert_Einstein> <hip://dbpedia.org/property/dateOfBirth> "March 14, 1879". <hip://dbpedia.org/resource/Albert_Einstein> <hip://dbpedia.org/property/birthPlace> <hip://dbpedia.org/resource/German_Empire>. <hip://dbpedia.org/resource/Albert_Einstein> <hip://xmlns.com/foaf/0.1/depic7on> <hip://en.wikipedia.org/wiki/Image:Albert_Einstein_Head.jpg>.
URI
![Page 28: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/28.jpg)
Web de dados
• Pra facilitar…criamos referências para os “vocabulários” u7lizados:
@prefix dbp: <hip://dbpedia.org/property/> . @prefix dbr: <hip://dbpedia.org/resource/> . @prefix foaf: <hip://xmlns.com/foaf/0.1/> . @prefix rdfs: <hip://www.w3.org/2000/01/rdf-‐schema#> . @prefix xsd: <hip://www.w3.org/2001/XMLSchema#> . dbr:Albert_Einstein foaf:name "Albert Einstein"; dbp:birthPlace dbr:German_Empire; dbp:dateOfBirth "1879-‐03-‐14"^^xsd:date; foaf:depic7on <hip://en.wikipedia.org/wiki/Image:Albert_Einstein_Head.jpg> .
![Page 29: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/29.jpg)
Tecnologias • Ontologias
• XML (eXtensible Markup Language): para definir a estrutura de documentos.
• RDF (Resource Descrip3on Framework): para descrever os recursos na Web.
• SPARQL (SPARQL Protocol and RDF Query Language): linguagem de consulta.
• OWL (Ontology Web Language): baseado em RDF, permite descrever recursos e suas relações.
![Page 30: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/30.jpg)
Tecnologias
Fonte: hip://www.dblab.ntua.gr/~bikakis/XMLSeman7cWebW3CTimeline.png
![Page 31: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/31.jpg)
Tecnologias As ontologias permitem descrever a semân7ca das classes e propriedades usadas em documentos na Web.
• Tecnologias relacionadas: RDF, SPARQL, OWL
![Page 32: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/32.jpg)
Tecnologias • XML (eXtensible Markup Language): É uma linguagem de
marcação que define um conjunto de regras para codificar um documento em um formato tanto lido por humanos quanto por máquinas. Foi definida pelo W3C (World Wide Web Consor7um) em 1996.
Referências: hip://www.w3.org/XML/
hip://www.w3schools.com/xml/
![Page 33: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/33.jpg)
Tecnologias • RDF (Resource
Descrip3on Framework): framework para expressar informação na Web sobre recursos (documentos, pessoas, objetos e conceitos abstratos) para que possa ser entendido por máquina.
Referências: hip://www.w3.org/TR/rdf-‐primer/
![Page 34: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/34.jpg)
Tecnologias • RDFa (Resource Descrip3on Framework in a>ributes): fornece
um conjunto de atributos de marcação para enriquecer o dado que está em HTML com informações que podem ser entendidas por máquinas.
Referências: hip://www.w3.org/TR/rdfa-‐primer/
![Page 35: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/35.jpg)
Tecnologias
Para ver exemplos de código RDFa em grafo: hip://rdfa.info/play/ (Beta service)
![Page 36: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/36.jpg)
Tecnologias • SPARQL (SPARQL Protocol
And RDF Query Language) é a linguagem de consulta para a Web Semân7ca.
Referência: hip://www.w3.org/TR/rdf-‐sparql-‐query/
PREFIX foaf: <hip://xmlns.com/foaf/0.1/> SELECT ?name FROM <hip://example.com/dataset.rdf> WHERE { ?x foaf:name ?name . } ORDER BY ?name
![Page 37: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/37.jpg)
Tecnologias • OWL (Web
Ontology Language): é uma linguagem para representação de ontologias. Baseada em RDF.
Referência: hip://www.w3.org/TR/owl-‐guide/
![Page 38: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/38.jpg)
Ferramentas • Protégé: ferramenta gratuita e open-‐source para construção
de modelos baseados em conhecimento usando ontologias.
Referência: hip://protege.stanford.edu
![Page 39: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/39.jpg)
API • Jena é uma API Java para criação de aplicações para Web
Semân7ca e Linked Data (essencialmente para manipulação de ontologias)
• Desenvolvida pela Hewlei-‐Packard (HP)
Referência: hip://jena.apache.org
![Page 40: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/40.jpg)
Armazenamento BD Relacional X Dados RDF
• As tabelas armazenam apenas aquilo que foram projetadas para armazenar
• O significado deve ser interpretado pelo usuário ou construído no sokware
• Pode acomodar novos esquemas de dados, sem custo
• É entendido por humanos e por máquinas
Fonte: Feigenbaum, L. Evolu7on Towards Web 3.0: The Seman7c Web. Experiences and Challenges on the Web and Inside Enterprises. 2011. hip://pt.slideshare.net/LeeFeigenbaum/evolu7on-‐towards-‐web-‐30-‐the-‐seman7c-‐web
![Page 41: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/41.jpg)
Armazenamento BD Relacional X Dados RDF
• Como seriam armazenados os dados sobre Einstein:
Sujeito Predicado Objeto <hip://dbpedia.org/resource/Albert_Einstein>
<hip://xmlns.com/foaf/0.1/name> "Albert Einstein".
<hip://dbpedia.org/resource/Albert_Einstein>
<hip://dbpedia.org/property/dateOfBirth> "March 14, 1879".
<hip://dbpedia.org/resource/Albert_Einstein>
<hip://dbpedia.org/property/birthPlace>
<hip://dbpedia.org/resource/German_Empire>
<hip://dbpedia.org/resource/Albert_Einstein>
<hip://xmlns.com/foaf/0.1/depic7on>
<hip://en.wikipedia.org/wiki/Image:Albert_Einstein_Head.jpg>
![Page 42: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/42.jpg)
Referência:
hip://www.ted.com/talks/7m_berners_lee_on_the_next_web
![Page 43: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/43.jpg)
Linked Data • A Web Semân7ca não é apenas colocar os dados na Web, mas
sim conectá-‐los para que uma pessoa ou máquina possa explorar a Web de Dados.
• Com dados vinculados (Linked Data) você pode achar muito mais dados e extrair mais informação.
• Ao invés de usar hyperlinks para explicitar o relacionamento entre documentos na Web, na Web de dados usamos relacionamentos descritos em RDF.
• As URIs iden7ficam qualquer 7po de objeto ou conceito.
Referência: hip://www.w3.org/DesignIssues/LinkedData.html
![Page 44: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/44.jpg)
Dados vinculados em 2007
FONTE: Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Chris7an Bizer, Anja Jentzsch and Richard Cyganiak. hip://lod-‐cloud.net/
![Page 45: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/45.jpg)
Dados vinculados em 2014
FONTE: Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Chris7an Bizer, Anja Jentzsch and Richard Cyganiak. hip://lod-‐cloud.net/
![Page 46: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/46.jpg)
Ferramentas • CKAN é uma ferramenta para gerenciar e publicar coleções de
dados.
• Permite a busca, construção de mapas, grafos e tabelas.
• Open-‐source.
• Desenvolvido pela Open Knowledge Founda7on (2006).
• Suporte a linked data.
Referência: hip://ckan.org
![Page 47: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/47.jpg)
Ferramentas • Datahub é um catálogo gratuito de coleções de dados abertos
• Permite a busca de dados, registro de coleções de dados, criação e gerenciamento de grupos de bases de dados, além de permi7r que o usuário receba atualizações sobre as coleções de interesse;
• API de acesso: CKAN API
• Criado pela Open Knowledge Founda7on
Referência: hip://datahub.io
![Page 48: Web Semântica e Ontologias](https://reader031.vdocuments.pub/reader031/viewer/2022022202/587baed21a28ab81758b7889/html5/thumbnails/48.jpg)
Referências
• hip://www.w3.org • hip://www.w3.org/standards/seman7cweb/ • Xexéo, G. Big Data: Computação para uma sociedade conectada e digitalizada. Ar7go publicado na revista Ciência Hoje (CH 306 -‐ Agosto/2013): hip://cienciahoje.uol.com.br/revista-‐ch/2013/306/pdf_aberto/bigdata306.pdf
Este obra de Ana Marilza Pernas e Daniela Brauner está licenciado com uma Licença Crea7ve Commons Atribuição-‐NãoComercial-‐Compar7lhaIgual 4.0 Internacional.