plano de doutoramento construção de uma base de conhecimento lexical para o português nuno seco
TRANSCRIPT
![Page 1: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/1.jpg)
Plano de Doutoramento
Construção de uma Base de Conhecimento Lexical para o Português
Nuno Seco
![Page 2: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/2.jpg)
Estrutura da Apresentação
Objectivos
Motivação
Expectativas
Plano
Critérios de Sucesso
![Page 3: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/3.jpg)
Objectivo
Criar uma Base de Conhecimento
Lexical para o Português.
Formalização de uma metodologia
Uma implementação da metodologia
![Page 4: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/4.jpg)
Objectivo
Tornar explícita a informação sobre conceitos (referenciados por termos).
O que é árvore? “planta alta de caule (tronco) e ramos
lenhosos”
Para que servem? São seres vivos? Se sim, como nascem? Quantos tipos existem?
![Page 5: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/5.jpg)
Definição de Base de Conhecimento Lexical
“É um repositório de informação sobre conceitos que pode ser utilizado em áreas como a Linguística, IA e Ciências da Informação (…) contém informação sobre conceitos lexicais e as suas relações.”
Robert Amsler (1984)
![Page 6: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/6.jpg)
Definição de Base de Conhecimento Lexical
“É uma estrutura que fornece uma organização semântica aos termos do nosso léxico, tornando explícita as relações semânticas entre estes.”
![Page 7: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/7.jpg)
Motivação
O nosso sistema conceptual está organizado como uma rede de conceitos. (Miller, Quillan)
O sistema conceptual governa a forma como: pensamos, agimos e comunicamos. (Lackoff)
Conceitos esses que são referenciados por termos.
![Page 8: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/8.jpg)
Motivação
Para as máquinas: Recolha de Informação
Desambiguação Semântica e Sintáctica
Semelhança semântica entre Palavras
Pergunta e Resposta
Para os humanos: Pode servir como um auxiliar de escrita, como
um Dicionário ou Tesauro.
![Page 9: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/9.jpg)
Abordagens Estatísticas Algoritmos estatísticos, como frequências de
co-ocorrências, são semanticamente cegos.
carro pneu volante motor veículo condutor
![Page 10: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/10.jpg)
Abordagens Manuais
Conhecimento é compilado manualmente. WordNet, Cyc, HowNet
Problemas: Muito moroso Muito caro
![Page 11: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/11.jpg)
Abordagens Baseadas em Extracção de Informação
Procurar padrões que indicam a existência de uma relação semântica no texto:
parte_de(pneu, carro)
tipo_de(carro, veículo)
parte_de(motor, veículo)
usa(condutor, carro)
![Page 12: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/12.jpg)
Abordagem Proposta
Baseada em Extracção de
Informação. Análise das definições em dicionários.
(Inspirada na abordagem do MindNet)
![Page 13: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/13.jpg)
Abordagem Proposta Informação sintáctica
Substantivos Verbos Advérbios Adjectivos
Informação predicativa comida é o objecto_típico de verbo
comer
![Page 14: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/14.jpg)
Abordagem Proposta
Informação sobre os diferentes sentidos de um termo
Um representação para lidar com homonímia:
parte_de(banco.1, jardim)
instância_de(BES, banco.2)
![Page 15: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/15.jpg)
Exemplo
CARRO.1
Categoria: Substantivo
Definição:
Hiperónimos: veículo.1
Hipónimos:
Merónimos: pneu, motor, volante
Objecto_Típico_de: conduzir.2
(…)
![Page 16: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/16.jpg)
Expectativas
Existência de uma Ontologia Lexical para o
Português.
Um sistema informático (semi-)automático
de extracção de conhecimento. Capaz de Evoluir
Adição de novo conhecimento
Refinamento do existente
![Page 17: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/17.jpg)
Exemplo de utilização
Sistema de Pergunta e Resposta:
oraculo:\> Existe alguma bíblia muçulmana?
oraculo:\> Corão, Alcorão
![Page 18: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/18.jpg)
Exemplo de Utilização
Livro Sagrado
Bíblia Corão
IslamismoCristianismo
MuçulmanoCristão
![Page 19: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/19.jpg)
Planificação
Revisão Bibliográfica. Identificação das relações semânticas
mais importantes.
Procura de recursos para iniciar o processo de extracção. (Dicionários)
Definição do modelo de dados para armazenamento.
![Page 20: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/20.jpg)
Planificação
Protótipo do sistema de extracção. Formalização do Processo de Extracção Base de Conhecimento Lexical.
Análise do recurso gerado. Aplicação em tarefas específicas. Medição do Impacto
Melhoramentos.
![Page 21: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/21.jpg)
Critérios de Sucesso
Utilização do recurso por terceiros
Contribuição do recurso em tarefas relacionadas com PLN: Recolha de Informação Desambiguação Semelhança Semântica Sistemas de Pergunta e Resposta
![Page 22: Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco](https://reader035.vdocuments.pub/reader035/viewer/2022062701/552fc17c497959413d8f0962/html5/thumbnails/22.jpg)
Plano de Doutoramento
Construção de uma Ontologia Lexical para o Português
Nuno Seco