från metadata till uppmärkning av komplexa dokument: ett ramverk för semantisk dokumentproduktion

7
Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion Henrik Eriksson Magnus Bång Linköpings universitet

Upload: dai-chan

Post on 31-Dec-2015

37 views

Category:

Documents


0 download

DESCRIPTION

Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion. Henrik Eriksson Magnus Bång Linköpings universitet. Bakgrund och syfte. Problem: Stora mängder information tillgänglig elektroniskt, men svårt att hitta rätt när sökfrågan är komplex - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion

Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion

Henrik Eriksson

Magnus Bång

Linköpings universitet

Page 2: Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion

22

Bakgrund och syfte

• Problem: Stora mängder information tillgänglig

elektroniskt, men svårt att hitta rätt när sökfrågan är komplex

svårt att navigera i innehållsrik dokumentation

• Mål Semantisk beskrivning av dokumentinnehållet

Stöd för systematiskt författande av komplexa elektroniska

dokument

Page 3: Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion

33

Applikationsområde

• Statistiska centralbyrån (SCB)

• Informationssökning i dokument Semantisk märkning av innehållet

• Statistikrapportering Tabeller Diagram

• Statistiska metadata Databaser för metadata Forskning vid SCB (Professor Bo Sundgren)

Page 4: Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion

44

Word processor Meta-data editor

Web front-end

Specializedsearch engine

Domain ontology

Meta data

Electronicdocuments (PDF)

Arkitektur

Page 5: Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion

55

Semantiska dokument

• Kunskapsrepresentation Ontologier Semantic web: OWL

• Dokumentmodeller Adobe’s Portable Document Format (PDF) Extensible Metadata Platform (XMP)

• Funktioner Semantisk sökning Resonemang, inferens

XMP markup

Semantic search

Reportpublication

database

XMP markupXMP markup

Statisticsdocuments (PDF)

Documentretrieval

Functions

Reasoning engine

Page 6: Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion

66

Dokumentproduktion

Knowledgesource

Meta data

Data

Editing PublicationAuthoringAnalysis

Semanticmark-up

Page 7: Från metadata till uppmärkning av komplexa dokument: Ett ramverk för semantisk dokumentproduktion

77

Protégéontology editor

XMP manager

PDF documentswith XMP mark-up

Metadata manager

Pre-existingmetadata store

Statistics ontology

Modeller och verktyg