20101117 1-정보활용워크숍-정상원

70
시시시 시시 시시시 시시시 시시시시시 시시시시시시시시시시 [email protected] 시시시 시시시 시시시시시시

Upload: senator-jeong

Post on 19-Jan-2015

1.218 views

Category:

Technology


0 download

DESCRIPTION

Semantic Web and library

TRANSCRIPT

Page 1: 20101117 1-정보활용워크숍-정상원

시맨틱 웹과 도서관

정상원서울대학교 의생명지식공학연구실

[email protected]

경기도 도서관 정보활용교육

Page 2: 20101117 1-정보활용워크숍-정상원

http://www.ontopedia.net/pepper/slides/AToMS2007.ppt

Tim Berners-Lee1989

Information Management: A Proposal

World Wide Web

Bill Atkinson1987

HyperCard

웹의 역사

Vannevar Bush1945

As We May ThinkMemex

Doug Engelbart1962

Augmenting Human IntellectNLS / AUGMENT

Ted Nelson1965

“Hypertext”Xanadu

Page 3: 20101117 1-정보활용워크숍-정상원

World Wide Web

Information Management: A Proposal, Tim Berners-Lee, CERN, March 1989, May 1990, http://www.w3.org/History/1989/proposal.html

Page 4: 20101117 1-정보활용워크숍-정상원

http://info.cern.ch: 최초의 웹 서버

Page 5: 20101117 1-정보활용워크숍-정상원

Semantic Web

Page 6: 20101117 1-정보활용워크숍-정상원

Hypertext vs hyperdata

Web of Documents • 문서가 서로 연결된 체계• 하이퍼링크를 이용하여

연결• 암시적 의미를 갖는

관계링크

Web of Data (things)• 데이터가 서로 연결된 체계• RDF 를 이용하여 연결• 명시적 의미를 갖는

관계링크

Page 7: 20101117 1-정보활용워크숍-정상원

관계사람• 사물과 사물의 관계를 쉽게

이해할 수 있다 .

• 표제 : 태백산맥• 저자 : 조정래

컴퓨터• 기계도 사물과 사물간의

관계를 이해 ( 처리 ) 할 수 있도록 해보자 .

• 즉 , 사물간의 관계를 명확히 정의하자 .

isbn:8973375393 uri:ex.orgx:hasAuthor

태백산맥

dc:title

조정래

foaf:name

Page 8: 20101117 1-정보활용워크숍-정상원

Semantic Web Layer Cake

Page 9: 20101117 1-정보활용워크숍-정상원

RDF

• Resource Description Framework• 자원 (Resource) 간의 관계그래프• RDF graph: triple 의 집합• Triple 의 구성요소

– Subject, Predicate, Object• 자원과 관계는 URI 를 갖는다 .

subject objectpredicate

수원시 경기도ex:belongTo

<http:// www.suwon.ne.kr> <http://example.com#belongTo> <http://gg.go.kr> .

Subject Predicate Object관계

Page 10: 20101117 1-정보활용워크숍-정상원

RDF: 용어

SO

P

• Resource = 사물 (Thing, 개념 , 문헌 ,….)

• Literal = 문자열 (?lang, ?datatype)• Statement = Triple = (s, p, o)• Predicate = 속성 ( 관계 )(…, p, …)• Graph = Statements 의 집합

S OP

Page 11: 20101117 1-정보활용워크숍-정상원

간단한 RDF statement

<?xml version="1.0"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:dc="http://purl.org/dc/elements/1.1/” > <rdf:Description about="http://pptx” > <dc:creator> 정상원 </dc:creator> </rdf:Description></rdf:RDF>

[http://pptx] 는 정상원이 작성했다 .

http://pptx “ 정상원”dc:creator

Subject ObjectPredicate

Page 12: 20101117 1-정보활용워크숍-정상원

Linked Open Data

Page 13: 20101117 1-정보활용워크숍-정상원

Linked Open Data (LOD)

Semantic Web 비전을 실현시키기 위한 시도 Linking Open Data Project (2007 년 ~) 기존의 웹 기반 데이터를 RDF 로 전환하여

서로 연결 SPARQL endpoints 제공

http://esw.w3.org/SparqlEndpoints

Page 14: 20101117 1-정보활용워크숍-정상원

Linked Data 의 원칙1. URI 를 사물의 이름으로 사용한다 .-URI 를 이용하여 자원을 식별한다 .

2. HTTP URI 를 사용하여 사람들이 그 자원을 조회할 수 있도록 한다 .

3. URI 를 조회할 경우 , 표준포맷 (RDF*, SPARQL) 을 이용하여 유용한 정보를 제공한다 .

4. 다른 URI 에 링크를 걸어 추가정보를 발견할 수 있도록 한다 .

Tim Berners-Lee, Linked Data – Design Issues. http://www.w3.org/DesignIssues/LinkedData.html

Page 15: 20101117 1-정보활용워크숍-정상원

서지데이터 및 관련 데이터ID Autho

rTitle Publisher Year

ISBN 0-00-6511409-X id_xyz The Glass Palace id_qpr 2000ID Name Homepage

id_xyz Ghosh, Amitav http://www.amitavghosh.com

ID Publisher’s name

City

id_qpr Harper Collins London

(dataset “A”)

Ivan Herman. 2010. Introduction to Semantic Web Technologies

Page 16: 20101117 1-정보활용워크숍-정상원

데이터를 관계로 표현한다 .

http://…isbn/000651409Xhttp://…isbn/000651409X

Ghosh, AmitavGhosh, Amitav http://www.amitavghosh.comhttp://www.amitavghosh.com

The Glass PalaceThe Glass Palace

20002000

LondonLondon

Harper CollinsHarper Collins

a:title

a:year

a:city

a:p_name

a:namea:homepage

a:authora:publisher

Page 17: 20101117 1-정보활용워크숍-정상원

또 다른 서지데이터A B C D

1 ID Titre Traducteur Original2 ISBN 2020286682 Le Palais des Miroirs $A12$ ISBN 0-00-6511409-X3

4

5

6 ID Auteur7 ISBN 0-00-6511409-X $A11$8

9

10 Nom11 Ghosh, Amitav12 Besse, Christianne

(dataset “F”) 프랑스어 번역본

Page 18: 20101117 1-정보활용워크숍-정상원

이 데이터도 관계로 표현한다 .http://…isbn/000651409Xhttp://…isbn/000651409X

Ghosh, AmitavGhosh, Amitav

Besse, ChristianneBesse, Christianne

Le palais des miroirsLe palais des miroirs

f:original

f:nom

f:traducteur

f:auteurf:ti

tre

http://…isbn/2020386682http://…isbn/2020386682

f:nom

Page 19: 20101117 1-정보활용워크숍-정상원

두 데이터를 통합한다 .(1)

http://…isbn/000651409Xhttp://…isbn/000651409X

Ghosh, AmitavGhosh, Amitav

Besse, ChristianneBesse, Christianne

Le palais des miroirsLe palais des miroirs

f:original

f:nom

f:traducteur

f:auteur f:titre

http://…isbn/2020386682http://…isbn/2020386682

f:nom

http://…isbn/000651409Xhttp://…isbn/000651409X

Ghosh, AmitavGhosh, Amitav

http://www.amitavghosh.comhttp://www.amitavghosh.com

The Glass PalaceThe Glass Palace

20002000

LondonLondon

Harper CollinsHarper Collins

a:title

a:year

a:city

a:p_name

a:namea:homepage

a:author

a:publisher

Page 20: 20101117 1-정보활용워크숍-정상원

두 데이터를 통합한다 .(2)

http://…isbn/000651409Xhttp://…isbn/000651409X

Ghosh, AmitavGhosh, Amitav

Besse, ChristianneBesse, Christianne

Le palais des miroirsLe palais des miroirs

f:original

f:nom

f:traducteur

f:auteur f:titre

http://…isbn/2020386682http://…isbn/2020386682

f:nom

http://…isbn/000651409Xhttp://…isbn/000651409X

Ghosh, AmitavGhosh, Amitav

http://www.amitavghosh.comhttp://www.amitavghosh.com

The Glass PalaceThe Glass Palace

20002000

LondonLondon

Harper CollinsHarper Collins

a:title

a:year

a:city

a:p_name

a:namea:homepage

a:author

a:publisher 동일한 URI!

Page 21: 20101117 1-정보활용워크숍-정상원

두 데이터를 통합한다 .(3)a:title

Ghosh, AmitavGhosh, Amitav

Besse, ChristianneBesse, Christianne

Le palais des miroirsLe palais des miroirs

f:original

f:nom

f:traducteur

f:auteur

f:titre

http://…isbn/2020386682http://…isbn/2020386682

f:nom

Ghosh, AmitavGhosh, Amitav

http://www.amitavghosh.comhttp://www.amitavghosh.com

The Glass PalaceThe Glass Palace

20002000

LondonLondon

Harper CollinsHarper Collins

a:year

a:city

a:p_name

a:namea:homepage

a:author

a:publisher

http://…isbn/000651409Xhttp://…isbn/000651409X

Page 22: 20101117 1-정보활용워크숍-정상원

질의• 두 번째 데이터 (“F”) 의 이용자가 다음과 같이

질의할 수 있다 .– [donnes-moi le titre de l’original] 의 원제는 ?

• 이 정보는 “ F” 데이터에 없다 .• 그러나 데이터를 통합하면 검색할 수 있다 .

Page 23: 20101117 1-정보활용워크숍-정상원

추가적인 정보를 획득할 수 있다 .

• a:author 와 f:auteur 는 같은 의미임을 알수 있다 .

• 그러나 기계 ( 컴퓨터 ) 는 이 사실을 알 수 없다 .!

• 따라서 통합된 데이터에 부가정보를 추가한다 .– a:author same as f:auteur

Page 24: 20101117 1-정보활용워크숍-정상원

추가적인 지식을 활용한다 .

Besse, ChristianneBesse, Christianne

Le palais des miroirsLe palais des miroirsf:original

f:nom

f:traducteur

f:auteur

f:titre

http://…isbn/2020386682http://…isbn/2020386682

f:nom

Ghosh, AmitavGhosh, Amitav

http://www.amitavghosh.comhttp://www.amitavghosh.com

The Glass PalaceThe Glass Palace

20002000

LondonLondon

Harper CollinsHarper Collins

a:title

a:year

a:city

a:p_name

a:namea:homepage

a:author

a:publisher

http://…isbn/000651409Xhttp://…isbn/000651409X

http://…foaf/Personhttp://…foaf/Personr:type

r:type

Page 25: 20101117 1-정보활용워크숍-정상원

추가적인 질의가 가능하도록 만든다 .

• “F” 데이터 이용자는 다음과 같은 질의를 할 수 있다 .– “donnes-moi la page d’accueil » 의 원저자의

홈페이지는 ?• 이 정보는 “ F” 나 “ A” 에 없다 .• 그러나 “ A” 와 “ F” 를 통합하고 추가적인

내용을 추가하면 가능하다 .

Page 26: 20101117 1-정보활용워크숍-정상원

다른 데이터와 묶어준다 .

• “Person”, 데이터는 다른 데이터출처와 묶을 수 있다 .

• 위키피디아에 있는 데이터를 추출하여 활용한다 .– “dbpedia” : “infobox” 정보를 추출하는 프로젝트

Page 27: 20101117 1-정보활용워크숍-정상원

Wikipedia 데이터와 통합

Besse, ChristianneBesse, Christianne

Le palais des miroirsLe palais des miroirsf:original

f:nom

f:traducteur

f:auteur

f:titre

http://…isbn/2020386682http://…isbn/2020386682

f:nom

Ghosh, AmitavGhosh, Amitav http://www.amitavghosh.comhttp://www.amitavghosh.com

The Glass PalaceThe Glass Palace

20002000

LondonLondon

Harper CollinsHarper Collins

a:title

a:year

a:city

a:p_name

a:namea:homepage

a:author

a:publisher

http://…isbn/000651409Xhttp://…isbn/000651409X

http://…foaf/Personhttp://…foaf/Personr:type

r:type

http://dbpedia.org/../Amitav_Ghoshhttp://dbpedia.org/../Amitav_Ghosh

r:type

foaf:name w:reference

Page 28: 20101117 1-정보활용워크숍-정상원

Wikipedia 데이터와 통합

Besse, ChristianneBesse, Christianne

Le palais des miroirsLe palais des miroirsf:original

f:nom

f:traducteur

f:auteur

f:titre

http://…isbn/2020386682http://…isbn/2020386682

f:nom

Ghosh, AmitavGhosh, Amitav http://www.amitavghosh.comhttp://www.amitavghosh.com

The Glass PalaceThe Glass Palace

20002000

LondonLondon

Harper CollinsHarper Collins

a:title

a:year

a:city

a:p_name

a:namea:homepage

a:author

a:publisher

http://…isbn/000651409Xhttp://…isbn/000651409X

http://…foaf/Personhttp://…foaf/Personr:type

r:type

http://dbpedia.org/../Amitav_Ghoshhttp://dbpedia.org/../Amitav_Ghosh

http://dbpedia.org/../The_Hungry_Tidehttp://dbpedia.org/../The_Hungry_Tide

http://dbpedia.org/../The_Calcutta_Chromosomehttp://dbpedia.org/../The_Calcutta_Chromosome

http://dbpedia.org/../The_Glass_Palacehttp://dbpedia.org/../The_Glass_Palace

r:type

foaf:name w:reference

w:author_of

w:author_of

w:author_of

w:isbn

Page 29: 20101117 1-정보활용워크숍-정상원

Wikipedia 데이터와 통합

Besse, ChristianneBesse, Christianne

Le palais des miroirsLe palais des miroirsf:original

f:nom

f:traducteur

f:auteur

f:titre

http://…isbn/2020386682http://…isbn/2020386682

f:nom

Ghosh, AmitavGhosh, Amitav http://www.amitavghosh.comhttp://www.amitavghosh.com

The Glass PalaceThe Glass Palace

20002000

LondonLondon

Harper CollinsHarper Collins

a:title

a:year

a:city

a:p_name

a:namea:homepage

a:author

a:publisher

http://…isbn/000651409Xhttp://…isbn/000651409X

http://…foaf/Personhttp://…foaf/Personr:type

r:type

http://dbpedia.org/../Amitav_Ghoshhttp://dbpedia.org/../Amitav_Ghosh

http://dbpedia.org/../The_Hungry_Tidehttp://dbpedia.org/../The_Hungry_Tide

http://dbpedia.org/../The_Calcutta_Chromosomehttp://dbpedia.org/../The_Calcutta_Chromosome

http://dbpedia.org/../Kolkatahttp://dbpedia.org/../Kolkata

http://dbpedia.org/../The_Glass_Palacehttp://dbpedia.org/../The_Glass_Palace

r:type

foaf:name w:reference

w:author_of

w:author_of

w:author_of

w:born_in

w:isbn

w:long w:lat

Page 30: 20101117 1-정보활용워크숍-정상원

Linked Open Data, 2007 년 5 월

W3C SWEO group, http://linkeddata.org/docs/eswc2007-poster-linking-open-data.pdf

Page 31: 20101117 1-정보활용워크숍-정상원

Linked Open Data, March 2008 년 5 월

Richard Cyganiak, http://richard.cyganiak.de/2007/10/lod/

Page 32: 20101117 1-정보활용워크숍-정상원

Linked Open Data, 2008 년 9 월

Page 33: 20101117 1-정보활용워크숍-정상원

LOD “cloud”, 2009 년 3 월

Chris Bizer, http://www4.wiwiss.fu-berlin.de/bizer/pub/lod-datasets_2009-03-05.html

Page 34: 20101117 1-정보활용워크숍-정상원

Linked Open Data, 2010 년 9 월

Page 35: 20101117 1-정보활용워크숍-정상원

Linked Open Data

Page 36: 20101117 1-정보활용워크숍-정상원

Linked Open Data

Page 37: 20101117 1-정보활용워크숍-정상원

전체 구조

다양한 데이터 포맷

RDF 표현

응용수준

연결 , RDF 로 변환연계…

처리 , 질의

RDF 브라우저

Page 38: 20101117 1-정보활용워크숍-정상원

Linked Movie Database

Page 39: 20101117 1-정보활용워크숍-정상원

Linked Movie Database

Page 40: 20101117 1-정보활용워크숍-정상원

Linked Movie Database

Page 42: 20101117 1-정보활용워크숍-정상원

도서관에서의 Linked Data

Page 43: 20101117 1-정보활용워크숍-정상원

도서관분야의 Linked Data• Swedish National Library

– Libris 목록 및 시소러스– http://libris.kb.se/

• Library of Congress – LCSH 등의 통제어휘집– http://id.loc.gov/

• German National Library (DNB) – Gemeinsame Normdatei and

authority data– http://d nb.info/gnd/‐

• National Library of France (BnF) – RAMEAU 주제명표목표– http://stitch.cs.vu.nl/rameau/

• OCLC’s DDC classification– http://dewey.info/

• OCLC and LC– VIAF– The Virtual International

Authority File– http://viaf.org/

• National Library of Hungary – 목록 및 시소러스– http://oszkdk.oszk.hu/resource/D

RJ/404

• Agrovoc– http://aims.fao.org/

• New York Times subject headings– http://Data.nytimes.com

• 학술출판물– http://dblp.rkbexplorer.com

Page 44: 20101117 1-정보활용워크숍-정상원

VIAF http://viaf.org

• Virtual International Authority File• 국제가상 전거파일• 국가별 전거레코드의 연결• 국제서지통정 개념의 확장

• 인명 (Personal names)• 지명 (Geographic)• Corporate ( 단체명 )• Title ( 표제 )• Family ( 성 )• Events ( 이벤트 )

http://viaf.org/viaf/77390479

Page 45: 20101117 1-정보활용워크숍-정상원

VIAF

Page 46: 20101117 1-정보활용워크숍-정상원

VIAF

Page 47: 20101117 1-정보활용워크숍-정상원

Library of Congress Subject Headings

Page 48: 20101117 1-정보활용워크숍-정상원

Library of Congress Subject Headings

http://id.loc.gov/search/?q=&cs=cs%3Alcsh&Search_submit=Go

Page 49: 20101117 1-정보활용워크숍-정상원

Library of Congress Subject Headings

http://id.loc.gov/search/?q=&cs=cs%3Alcsh&Search_submit=Go

Page 50: 20101117 1-정보활용워크숍-정상원

Library of Congress Subject Headings

http://id.loc.gov/search/?q=&cs=cs%3Alcsh&Search_submit=Go

Page 51: 20101117 1-정보활용워크숍-정상원

Library of Congress Subject Headings

Page 52: 20101117 1-정보활용워크숍-정상원

Library of Congress Subject Headings

Page 53: 20101117 1-정보활용워크숍-정상원

RKB Explorerhttp://www.rkbexplorer.com/explorer/

Page 54: 20101117 1-정보활용워크숍-정상원

RKB Explorer

Page 55: 20101117 1-정보활용워크숍-정상원

RKB Explorer

Page 56: 20101117 1-정보활용워크숍-정상원

SKOS

• SKOS• Simple Knowledge Organization System• 시소러스 , 분류표 , 주제명표목표 ,

계층분류표 , ' 대중분류표 ', 기타 통제어휘집 의 RDF 표현체계

Page 57: 20101117 1-정보활용워크숍-정상원

개념Concept

우선어 ( 표지 )Preferred Label/ 상징 Symbol

비우선어 ( 표지 )Alternative Label/ 상징 Symbol

주석Note

e.g. definition, scope, history etc.정의 , 범위 , 이력

개념Concept

Semantic Relation의미적 관계

Concept Scheme

SKOS Core 기본 특징

AAT, DDC, AGROVOC, MeSH …

Page 58: 20101117 1-정보활용워크숍-정상원

SKOS 의 기본구조• Basic Structure

– skos:Concept• 어휘적 표지

– skos:prefLabel, skos:altLabel, skos:hiddenLabel• 기호 표지

– skos:prefSymbol, skos:altSymbol• Documentation

– skos:definition• 의미적 관계

– skos:broader, skos:narrower, skos:related

http://www.w3.org/2004/02/skos/core

Page 59: 20101117 1-정보활용워크숍-정상원

SKOS

Alistair Miles, SKOS Core Tutorial DC-2005 Madrid

Page 60: 20101117 1-정보활용워크숍-정상원

다중언어 표지

언어당 skos:prefLabel 은 한개만언어당 skos:prefLabel 은 한개만

‘ 사랑’@koskos:prefLabel

Page 61: 20101117 1-정보활용워크숍-정상원

기호 표지

Page 62: 20101117 1-정보활용워크숍-정상원

Broader/Narrower

N.B.skos:broader owl:inverseOf skos:narrower .skos:narrower owl:inverseOf skos:broader .skos:broader a owl:TransitiveProperty .skos:narrower a owl:TransitiveProperty .

N.B.skos:broader owl:inverseOf skos:narrower .skos:narrower owl:inverseOf skos:broader .skos:broader a owl:TransitiveProperty .skos:narrower a owl:TransitiveProperty .

Page 63: 20101117 1-정보활용워크숍-정상원

Related

N.B.skos:related a owl:SymmetricProperty .

N.B.skos:related a owl:SymmetricProperty .

Page 64: 20101117 1-정보활용워크숍-정상원
Page 65: 20101117 1-정보활용워크숍-정상원

W3C Library Linked Data Incubator Group

http://www.w3.org/2005/Incubator/lld/

Page 66: 20101117 1-정보활용워크숍-정상원

W3C Library Linked Data Incubator Group

• 웹에서 도서관 데이터의 전세계적 상호운용성 증진

• 도서관 등에서 시맨틱 웹 기술의 성공적인 구현 유스케이스 수집

• 데이터 모델 , 어휘 , 온톨로지간의 상호운용성 증진

• 새로운 표준 , 지침 , 모범사례 발굴의 필요성 확인

Page 67: 20101117 1-정보활용워크숍-정상원
Page 68: 20101117 1-정보활용워크숍-정상원

마치며• “ 옛 것은 흔들리고 새로운 것은 아직 오지 않은

혼돈 속에서 현실은 종전과 다름없이 돌아가고 있다 .”– http://goodeconomy.hani.co.kr/blog/archives/4559

• 수서 / 편목 / 장서관리 VS 시맨틱 웹 Vs 현실

• Collection Development Connection Development

Page 69: 20101117 1-정보활용워크숍-정상원

질의응답

감사합니다 .

Page 70: 20101117 1-정보활용워크숍-정상원

시맨틱 웹과 도서관• 정상원• 서울대학교 의생명지식공학연구실• 홈페이지: http://bike.snu.ac.kr/~senator

• 트위터 : http://twitter.com/senatorjeong• 이메일 : [email protected]

경기도 도서관 정보활용교육