ce-262 ontologia e web semântica prof. josé m parente de oliveira sala 120 – prédio da...
TRANSCRIPT
CE-262 Ontologia e Web Semântica
Prof. José M Parente de Oliveira
Sala 120 – Prédio da ComputaçãoInstituto Tecnológico de Aeronáutica - ITA
[email protected]+55 12 3947-6941
Introdução à Web Semântica e Ontologias
Sumário de Conteúdo do Tópico
Motivação
Web Semântica: o que é?
Arquitetura da Web Semântica (W3C)
Desafios da Web Semântica
Perspectivas da Web Semântica
Noção de Ontologia
Material de Referência
Projeto e Construção de OntologiasProf. Luiz A M Palazzo - Universidade Católica de Pelotas
Ontology Engineering for the Semantic Web and BeyondProf. Natalya F. Noy - Stanford University
The Semantic Web Dr. V. Richard BenjaminsiSOCO
Jena TutorialAnna V. ZhdanovaDERI AT
Material de Referência
Ontologias, modelos e busca em JAVAAdriana da Silva Jacinto
Ian Horrocks and Alan RectorUniversity of ManchesterManchester, UK
Motivação
Motivação
Motivação
Motivação
Motivação
Motivação
Motivação
Motivação
É necessário navegar muito pela Web antes de se encontrar o conteúdo de interesse
Problema: a tecnologia atual de busca não entende o que se está procurando:
• Procura apenas por palavras-chave
• = string de caracteres
• Retorno de informação em vez de resposta a uma questão!
Motivação Web Sintática
[Hendler & Miller 02]
Motivação: Web Sintática
[Hendler & Miller 02]
A place where computers do the presentation (easy) and people do the linking and interpreting (hard).
– A hypermedia, a digital library• A library of documents called (web pages)
interconnected by a hypermedia of links– A database, an application platform
• A common portal to applications accessible through web pages, and presenting their results as web pages
– A platform for multimedia• BBC Radio 4 anywhere in the world! Terminator 3
trailers!– A naming scheme
• Unique identity for those documents
Motivação: Web Sintática
[Hendler & Miller 02]
Why not get computers to do more of the hard work?
Web Semântica: o que é?
“A Web Semântica é uma extensão da Web atual em que cada informação é dada por um significado bem definido, fazendo com que computadores e pessoas trabalhem melhor em cooperação”
Tim Berners-Lee, James Hendler, Ora LassilaScientific American, May 2001
Web Semântica: o que é?
Web Semântica: o que é?
“O poder real da Web Semântica será percebido quando as pessoas criarem programas que coletem conteúdo de diversas fontes, processem a informação e troquem os resultados com outros programas. A eficácia de tais agentes de software aumentará exponencialmente assim como mais máquinas leitoras do conteúdo Web e serviços automatizados (incluindo outros agentes) tornarem-se disponíveis.”
Tim Berners-Lee, James Hendler, Ora LassilaScientific American, May 2001
Web Semântica: o que é?
Web Semântica é a idéia de se ter dados na Web definida e interconectada por um caminho que pode ser usado para mais descobertas eficazes, automação, integração e reutilização através de várias aplicações.
A Web pode encontrar todo o seu potencial se tornar-se um local onde dados podem ser tão bem processados por ferramentas automatizadas como o são por pessoas.
W3C
Web Semântica: o que é?
Iniciativa do W3C com o objetivo de adicionar significado à Web
Baseada na tecnologia xml/rdf, fazendo evoluir a html da Web Sintática
WWW Consortium - http://www.w3.org
Arquitetura da Web Semântica
Arquitetura da Web Semântica
Dados
Web Semântica
Mecanismo de Busca
Ontologia Ontologia Ontologia
Camada deEstrutura
CamadadeEsquema
Regras de InferênciaCamadaLógica
… E-commerce
Arquitetura da Web Semântica
Camada de Estrutura
Responsável por estruturar os dados e definir seu significado:
XML, NamespacesURI, Unicode
Arquitetura da Web Semântica
Camada de Esquema
Responsável por definir relações entre os dados
Uso de ontologias em páginas Web torna mais simples a resolução de indefinição ou conflito de terminologia
RDF Schema, RDF M&S
Arquitetura da Web Semântica
Camada Lógica
Responsável por definir mecanismos para fazer inferência sobre os dados
Composta por um conjunto de regras de inferência
Regras de inferência fornecem aos agentes computacionais o poder de raciocinar sobre as estruturas de dados
Desafios da Web Semântica
Carência de profissionais especializados
Evolução de culturas (html – xml/rdf)
Padrões digitais de mídia instáveis
Crescimento simultâneo e continuado da Web Sintática
Falta de investimento adequado
Falta de visibilidade da área
Perspectivas
Base para a computação móvel e pervasiva
Grande disseminação prevista a médio prazo
Novo patamar para as interações humano-computador
Novos produtos e oportunidades de pesquisa
Aplicação em grande escala em educação e gestão de conhecimento
e-Science
Noção de Ontologia
Corpo de conhecimento declarativo sobre um dado domínio, assunto ou área de conhecimento
Na prática, hierarquias de conceitos (classes) com suas relações, restrições, axiomas e terminologia associada
Termo às vezes mal-empregado. Ontologias não são:
•Simples hierarquias
• Conjuntos de conceitos associados a palavras-chave
• Esquemas de bancos de dados
Noção de Ontologia
Definição de Ontologia:
Especificação formal e explícita de uma conceitualização compartilhada (Gruber, 1993)
Conceitualização: : modelo das entidades, relações, axiomas e regras de algum domínio
Formal: • Processável por máquina• Permitindo raciocínio automático• Com semântica lógica formal
Compartilhada: por uma comunidade, permitindo entendimento
Noção de Ontologia
Uma ontologia é uma descrição explícita de um domínio:
• Conceitos
• Propriedades - atributos de conceitos
• Restrições em propriedades e atributos
• Indivíduos (às vezes, mas não sempre)
Noção de Ontologia: Estrutura
Ontologies typically have two distinct components:• Names for important concepts in the domain
– Elephant is a concept whose members are a kind of animal
– Herbivore is a concept whose members are exactly those animals who eat only plants or parts of plants
– Adult_Elephant is a concept whose members are exactly those elephants whose age is greater than 20 years
• Background knowledge/constraints on the domain– Adult_Elephants weigh at least 2,000 kg– All Elephants are either African_Elephants or
Indian_Elephants– No individual can be both a Herbivore and a Carnivore
Noção de Ontologia: Conceitualização
Noção de Ontologia: Conceitualização
There can be two conceptualizations of this tiny world where the task is to make a plan of stack three blocks as the goal configuration using a robot hand
One is with conceptualization of the table and the other is without the table. In the latter, the table is imbedded in the relation onTable(X)
You can easily see the incompatibility between two plans based on each of the two conceptualizations. They are NOT interoperable each other when they come to a situation where they have to talk about the table. So, it is necessary to have an explicit representation of such a conceptualization.
Noção de Ontologia: Conceitualização
Noção de Ontologia: Conceitualização
We can design ontology of this block world corresponding to each of the two conceptualizations like this
It is roughly a hierarchy of things with axioms. Definitions of each concept and relation is omitted here
An example of an axiom is above(X,Z):-on(X,Y), on(Y,Z). There are many more axioms to represent constraints among the concepts and relations
Ontologia em Computação
O que pode ser representado por um computador
Uma ontologia pode ter várias formas, mas ela incluirá necessariamente um vocabulário de termos e alguma especificação de seu significadoUschold 1998, Jaspers & Uschold 1999
Um corpo de conhecimento descrevendo algum domínio de senso comum (Cyc e OpenCyc)
Exemplos de Aplicação de Ontologia
Taxonomias na Web• Yahoo! Categorias
Catálogo para compras on-line• Amazon.com catálogo de produtos
Domínio: especificação de terminologia padrão• Unified Medical Language System (UMLS)• UNSPSC - terminologia para produtos e serviços
Exemplos de Aplicação de Ontologia
Vinhos franceses e região de vinhos
Vinhos da Califórnia
e região de vinhos
Que tipo de vinho eu
devo servir com frutos do mar hoje?
Uma ontologiaUma ontologia compartilhadacompartilhada
de vinho e comidade vinho e comida
Uma ontologiaUma ontologia compartilhadacompartilhada
de vinho e comidade vinho e comida
Pode Haver Diferentes Ontologias para um Domínio
infection
meningitis pneumonia
bacterialpneumonia
acute viralpneumonia
chronic viralpneumonia
viralpneumonia
infection
meningitis pneumonia
chronicpneumonia
acute viralpneumonia
acute bacterialpneumonia
acutepneumonia
Por Que Criar Ontologias?
Para construir declarações explícitas sobre o domínio:
• Mais fácil mudar declarações do domínio (considerar, por exemplo, uma base de conhecimento de genética)
• Mais fácil entender e atualizar a legalidade dos dados
Para separar conhecimento do domínio do conhecimento operacional:
• Reuso do domínio e do conhecimento operacional separadamente
Ferramentas
• We need to provide tools and services to help users to:– Design and maintain high quality ontologies, e.g.:
• Meaningful — all named classes can have instances
• Correct — captured intuitions of domain experts• Minimally redundant — no unintended synonyms• Richly axiomatised — (sufficiently) detailed
descriptions– Store (large numbers) of instances of ontology
classes, e.g.:• Annotations from web pages
– Answer queries over ontology classes and instances, e.g.:
• Find more general/specific classes• Retrieve annotations/pages matching a given
description– Integrate and align multiple ontologies
Por Que é Difícil Criar Ontologias?
• Ontology languages are tricky– “All tractable languages are useless;
all useful languages are intractable”
• Ontologies are tricky– People do it too easily;
People are not logicians• Intuitions hard to formalise
• The evidence– The problem has been about for 3000 years
• But now it matters!– The semantic web means knowledge
representation matters
Alguns Tópicos de Pesquisa
• Web semântica – Padrões, princípios, linguagens, limitações
• Concepção de ontologias– Engenharia de ontologias– Paradoxo: tensão entre aplicação e extensibilidade– Aspectos a serem abordados
• funcional, intencional, social, físico, etc
– Relações parte-todo
Alguns Tópicos de Pesquisa
• Aprendizado e ontologias– Construção de ontologias a partir de texto (Text-to-
Onto)– Anotação semi-automática de páginas baseadas em
ontologias– Extração, agrupamento [Hotho et al 2001] e
classificação de informação (mineração de textos)
• Integração inteligente de informação– Diversidade de visões de ontologias sobre um mesmo
domínio, que o abordam sobre perspectivas distintas– Soluções: mapeamento e integração semântica
através de contextos comuns [Wache & Stuckenschmidt 2001]