library linked data

89
도서관과 Linked Open Data 2014.7.4. 박진호([email protected]) 2014 디지털도서관운영과정

Upload: jinho-park

Post on 15-May-2015

163 views

Category:

Technology


0 download

DESCRIPTION

2014년 7월 3일 국립중앙도서관 사서교육문화과 디지털도서관운영과정

TRANSCRIPT

Page 1: library linked data

도서관과 Linked Open Data2014.7.4. 박진호([email protected])

2014 디지털도서관운영과정

Page 2: library linked data

1 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

World Wide Web

For Everyone!

Access

Page 3: library linked data

2 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

http://vimeo.com/36752317

Page 4: library linked data

Data, Data, Data

• Linked Data, Open Data, Big Data, Gov2.0 등 최근 화두가 되고 있는 용어들은 공통적으로 가공된 정보(information)가 아닌 이전 단계의 데이터(data) 활용에 대한 가능성에 중점

• 정보화 사회에서 데이터는 흔히 ‘새로운 오일(data is the new oil)’로 지칭하며, 경제적 파급효과 분석을 위한 노력이 계속되고 있음

• 데이터 경제(Data Economy)적 관점은 이러한 노력을 뒷받침할 수 있는 중요한 접근적임

– ‘데이터’가 가져올 수 있는 실질적인 혜택과 구현은 어려움이 존재함

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 503

Page 5: library linked data

Linked Open Data

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 504

Linked Open Data

Linked Data Open Data

Page 6: library linked data

Open Data

• 저작권, 특허 등 다양한 조건들에 제약을 받지 않고 누구나 게시하고 모두가자유롭게 사용할 수 있는 데이터

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 505

Page 7: library linked data

Linked Data

• Linked Data는 데이터를 개방하는 방식 중 이미 거대한 정보생태계를 갖추고 있는 웹(web)을 플랫폼으로 기계(machine)가 자동적으로 처리할 수 있는 데이터 형식임

– 이전에도 데이터, 정보를 개방하는 방식은 존재해 왔음(예, 활용을 위한 엑셀 등파일형식과 기계적인 연계 처리를 위한 Open API)

– 그러나 이전의 방식은 창조적 성과물 창출을 위한 가공, 정제 등 부가적인 노력(시간, 예산 등)이 필요했으며, 저작권 등 활용에 있어서 장애요소가 지속적으로존재해 왔음

– Linked Open Data는 이미 거대한 정보생태계를 갖추고 웹(web)에 공통된 데이터 이해와 교환방식(linked data 원칙과 표준 용어집 활용)을 준수하는 개방형데이터를 구축하는 것으로 다양한 창조적 아이디어 구현과 데이터를 기반으로하는 새로운 서비스 실현이 가능한 가장 적극적인 형태의 개방형 데이터임

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 506

Page 8: library linked data

7 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

웹은 이미 개방된 공간이 아닌가?

도서관도 이미 웹에서 데이터를 개방하고 있지 않은가?

Page 9: library linked data

5 Star Open Data

• Tim Berners-Lee, 별점을 이용해 Open Data의 다섯 단계 표현

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 508

Page 10: library linked data

5 Star Open Data

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 509

별점 설명 예제

★ 데이터를 웹 상에 오픈 라이센스로 (포맷에 상관없이) 공개 링크

★★ 구조화된 데이터로 제공(예, 표를 스캔한 이미지 파일 대신엑셀 파일) 링크

★★★ 비독점 포맷을 사용(예, 엑셀 파일 대신 CSV 파일) 링크

★★★★ 사람들이 가리킬 수 있도록 개체를 나타내기 위해 URI를 사용 링크

★★★★★ 데이터의 문맥과 배경을 제공하기 위해 다른 데이터와 링크 링크

Page 11: library linked data

10 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

한 마디로, 웹(web)을 모두가 자유롭게 쓸 수 있는 글로벌 데이터베이스로 만들자!!

만들자!! = 나는(도서관은) 데이터 공급자이자, 소비자.

공급자로써 역할도 충실히하고 소비자로써 당당히 권리 행사

Linked Data Principles

이런 일이 가능하도록 하는 최소한의 필수조건

Page 12: library linked data

링크드 데이터 원칙

• 특정 개념(things) URI를 사용해서 명명함.

• HTTP를 활용해서 URIs로 명명된 자원에 접근할 수 있도록 함.

• URI로 정보를 찾았을 때 RDF(S), SPARQL과 같은 표준을 활용해서 유용한정보를 제공해야 함.

• 또 다른 URI를 포함하고 있어서 더 많은 것(개념, things)들을 탐색할 수 있

어야 함.

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5011

Page 13: library linked data

Elements of Linked Open Data Stack(revison 3)

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5012

Page 14: library linked data

13 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

지금하고 무엇이 어떻게 달라지는가?지금하고 뭐가 다른 거지?

Web of Documents Vs Web of Data

Page 15: library linked data

오늘날의 웹 : Web of Documents(HTML)

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5014

Resource

Resource

Resource

Resource

Resource

Resource

Resource

링크

링크 링크

링크

링크링크

링크

Page 16: library linked data

오늘 이야기하는 웹 : Web of Data

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5015

Library Linked Data

박진호

Library Data

Architect

DataLab

[email protected]

dc:creator dc:publisher

p:email

o:workplace

p:title

www.jino.home

o:homepage

Page 17: library linked data

16 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

두 개가 전혀 별개의 것인가?

문서 중심의 웹이 사라지고 데이터 웹이 등장하는 것인가?

Page 18: library linked data

17 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

"The Semantic Web is an extension of the current web in which

information is given well-defined meaning, better enabling

computers and people to work in cooperation."

Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001

Page 19: library linked data

첫번째문제점및접근점• 아직까지웹의문서들은HTML로작성, HTML은문법으로

숨겨진의미(Meaning, Semantics)를표현하지는못함

• 만약컴퓨터가, 우리처럼Meaning을이해할수있다면,

우리(사람)의정보검색(탐색)은더풍요로워질것임

Page 20: library linked data
Page 21: library linked data

Mr. Hatem Mahmoud

Syntax is the study of grammar

Semantics is the study of meaning

Syntax is how to say something

Semantic is the meaning behind what you say

Different syntaxes may have the same semantic:

x += y

x = x + y

Page 22: library linked data

두번째문제점및접근점• 이미구조화된데이터(정보원)를비구적인형태로표현함

• 제공할수있는많은데이터(정보원)중공급자중심에서판단하고

서비스함

Page 23: library linked data

[출처 : http://www.slideshare.net/sandhaus/all-about-rnews-evan-sandhaus]

structured

unstructured

Page 24: library linked data

Wikipedia Vs Dbpediahttp://en.wikipedia.org/wiki/Samul_nori

http://dbpedia.org/page/Samul_nori

Page 25: library linked data
Page 26: library linked data
Page 27: library linked data
Page 28: library linked data

27 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

어떻게 Web을Global Database로 활용할 것인가?

Page 29: library linked data

28 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

우리가 공유하고 있는 것.한국어?

Page 30: library linked data

29 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

사과

apple

Page 31: library linked data

누군가 사과를 바라보는 시각

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5030

쌍떡잎식물 장미목 장미과 낙엽교목 식물인 사과나무의 열매.[출처] 사과 | 두산백과

붉은 색에 둥근 모양을 갖고 있고 움푹 들어간 꼭지를 가지고 있는 과일

색 모양 분류

Page 32: library linked data

도서관 데이터(Library Data)

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5031

• 표제/책임표시사항: 철학이 필요한 시간 : 강신주의 인문학 카운슬링 / 강신주 지음

• 발행사항 파주 : 사계절출판사, 2011• 형태사항 346 p. :천연색삽화 ;23 cm• 표준번호/부호 ISBN: 978-89-5828-534-2 03100• 분류기호: 한국십진분류법-> 104 한국십진분류법->

001.3 듀이십진분류법-> 102 듀이십진분류법-> 001.3

• 주제명: 철학 에세이[哲學--] 인문 과학[人文科學]

Page 33: library linked data

도서관 데이터(Library Data)

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5032

• 표제/책임표시사항: 철학이 필요한 시간 : 강신주의 인문학 카운슬링 / 강신주 지음• 발행사항 파주 : 사계절출판사, 2011• 형태사항 346 p. :천연색삽화 ;23 cm• 표준번호/부호 ISBN: 978-89-5828-534-2 03100• 분류기호: 한국십진분류법-> 104 한국십진분류법-> 001.3 듀이십진분류법->

102 듀이십진분류법-> 001.3• 주제명: 철학 에세이[哲學--] 인문 과학[人文科學]

서지 정보/데이터저자명 정보/데이터

주제명 정보/데이터

Page 34: library linked data

Library Linked Open Data

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5033

특정 객체, 개념과 속성과 속성이 갖는 값(강신주, 철학)을누구나 이해할 수 있는 형태로 공개해서 활용할 수 있도록 해주는 것

Page 35: library linked data

Library Linked Open Data

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5034

서지 정보/데이터 저자명 정보/데이터주제명 정보/데이터

객체,서브젝트,

개념

속성 제목저자출판사발행년

용어상위어하위어

이름생몰년연락처

Page 36: library linked data

현재까지 도서관의 데이터 공개

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5035

MARC, OAI, Open API

Page 37: library linked data

도서관 데이터 플랫폼 구축

• 문서 중심의 현재 웹 생태계에 RDF기반의 데이터 플랫폼을 구축하고 사람들이 활용할 수 있도록 하는 활동

– 데이터 변환 : MARC2RDF

– 데이터 플랫폼 구축 : 데이터 검색, 다운로드 등

– 데이터 활용 교육(Data Literacy) 및 해커톤

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5036

Page 38: library linked data

XML

• XML은 메타 언어(meta-language)

• eXtensible Markup Language의 약자

• 데이터를 서술하기 위해 개발

• XML 태그는 정의된 것이 없음, 스스로 자신의 태그를 정의할 수 있음

• XML은 DTD, XML Schema로 자기기술이 가능함(Self-descriptive)

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5037

Page 39: library linked data

HTML Vs XML

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5038

<H1>Library Linked Data</H1><UL>

<LI>강사 : 박진호<LI>일시 : 2014.7.4<LI>장소 : 국립중앙도서관 사서연수관

</UL>

<nameOfLecture><title>Library Linked Data</title><lecturer>박진호</lecturer ><date>2014.7.4</date><place>국립중앙도서관 사서연수관</place>

</nameOfLecture >

HTML

XML

Page 40: library linked data

XML Vs RDF

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5039

[출처 : http://www.oreillynet.com/xml/blog/2005/09/the_difference_between_xml_and.html]

XML은 데이터(문서)의 구조 정의RDF는 데이터(문서)의 구문의 의미 정의(기계가 이해)

Page 41: library linked data

RDF

• Resource Description Framework

• 웹 상의 자원을 기술하기 위한 W3C 표준

– Resource: URI를 갖는 모든 것

– Description: 자원(resource)들의 속성, 특성, 관계 기술

– Framework: 위의 것들을 기술하기 위한 모델, 언어, 문법

• RDF는 컴퓨터 애플리케이션이 정보를 읽고 이해할 수 있도록 하기 위한 표준 방법

• RDF로 기술된 것은 웹에서 보여주기 위함은 아님

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5040

Page 42: library linked data

RDF 모델

• RDF는 SPO, 주어(Subject)/술어(Predicate)/목적어(Object)로 구성됨

• “인간에 대한 예의” 의 “작가”는 “공지영”이다.

• “http://www.amazon.com/Human-Decency-Jiyoung-

Gong/dp/8988095928” has a creator whose value is “http://en.wikipedia.org/wiki/Gong_Ji-young”.

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5041

주어(Subject) 술어(Predicate) 목적어(Object)

Page 43: library linked data

RDF 모델

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5042

“http://www.amazon.com/Human-Decency-Jiyoung-Gong/dp/8988095928” has a creatorwhose value is “http://en.wikipedia.org/wiki/Gong_Ji-young”.

주어(Subject)

술어(Predicate)

목적어(Object)

Page 44: library linked data

RDF Graph Model

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5043

주어(Subject)

목적어(Object)

술어(Predicate)

Page 45: library linked data

RDF Graph Model

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5044

http://www.amazon.com/Human-Decency-Jiyoung-Gong/dp/8988095928

Gong Ji-young

http://purl.org/dc/terms/creator

Page 46: library linked data

RDF Graph Model

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5045

http://www.amazon.com/Human-Decency-Jiyoung-Gong/dp/8988095928

http://purl.org/dc/terms/creator

http://en.wikipedia.org/wiki/Gong_Ji-young

1963-present

http://dbpedia.org/property/period

Jimoondang

http://purl.org/dc/terms/publisher

Gong Ji-young

http://dbpedia.org/property/name

Page 47: library linked data

RDF/XML로 표현

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5046

<RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”

xmlns:dc=http://purl.org/dc/terms/

xmlns:dbpprop="http://dbpedia.org/property/" >

<Description about=“http://www.amazon.com/Human-Decency-Jiyoung-

Gong/dp/8988095928”>

<dc:publisher>Jimoondang</dc:publisher>

<dc:creator rdf:resource=“http://en.wikipedia.org/wiki/Gong_Ji-young”/>

</Description>

<Description about=“http://en.wikipedia.org/wiki/Gong_Ji-young”>

<dbpprop:name>Gong Ji-young</dbpprop:name>

<dbpprop:period>1963-present</dbpprop:period >

</Description>

</RDF>

Page 48: library linked data

47 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

명확한가? 충분한가?우리는 충분히 대화가 가능한가?

Page 49: library linked data

48 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

인간에대한예의

공지영

작가(writtenBy)

소설(Class), 책 작가(Class), 사람

Type Type

Page 50: library linked data

Ontology

• 철학 : 존재론(存在論), 존재학(存在學)– Onto(being) + logos(word)– 세상의 구성요소에 대한 명확한 이해를 연구

• 언어학 : An ontology is a specification of a conceptualization. – 개념(화)의 명시적 명세, 시소러스의 확장 개념

• 컴퓨터, 웹 분야– an ontology is an explicit formal specification of a shared

conceptualization(Gruber, 1993)– An ontology provides a shared vocabulary, which can be used to model

a domain — that is, the type of objects and/or concepts that exist, and their properties and relations.(Arvidsson, 2008)

– 공유된 개념의 명시적 형식(?)

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5049

Page 51: library linked data

Ontology

• an ontology is an explicit formal specification of a shared conceptualization

– shared conceptualization: 인간과 컴퓨터가 공유하는 개념화

– Explicit Formal: 기계가 읽을 수 있는 형식으로 상세하게 개념, 개념간의 관계

등을 표현

• 개념화

– 우리 눈에 보이는 사물 혹은 추상적인 것들을 구체적인 집합으로 만듦

– SUV, 덤프트럭, 세단 = 탈것(Vehicle)

– 남자, 여자 = 사람

– 라이언헤드, 롭드와프, 더치 = 토끼

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5050

분류!!

Page 52: library linked data

51 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

인간에대한예의

공지영isWrittenBy

소설 소설가

type type

문학인

문학

subClassOfsubClassOf

RDF

RDFS

isWrittenBy

domain

시인

subClassOf

range

Page 53: library linked data

RDF Schema

• RDF를 확장하기 위한 소규모의 Vocabulary를 정의– Class, subClassOf, type– Property, subPropertyOf– Domain, range

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5052

<?xml version="1.0"?>

<rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xml:base="http://www.animals.fake/animals#">

<rdf:Description rdf:ID="animal"><rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>

</rdf:Description>

<rdf:Description rdf:ID="horse"><rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/><rdfs:subClassOf rdf:resource="#animal"/>

</rdf:Description>

</rdf:RDF>

Page 54: library linked data

53 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

HTML로도 가능하지 않을까? RDFa, Microformats, HTML5 MicroData

Page 55: library linked data

HTML5 MicroData

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5054

Your web pages have an underlying meaning that people understand when they read the web pages. But search engines have a limited understanding of what is being discussed on those pages. By adding

additional tags to the HTML of your web pages—tags that say, "Hey search engine, this information describes this specific movie, or place, or person, or video"—you can help search engines and other applications better

understand your content and display it in a useful, relevant way. Microdata is a set of tags, introduced with HTML5, that allows you to do this.

Page 56: library linked data

HTML5 MicroData

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5055

Page 57: library linked data

HTML5 MicroData

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5056

itemscope and itemtype

<div> <h1>화차</h1><span>감독: 변영주 (1966년 12월 20일 출생)</span> <span>미스터리</span> <a href="../movies/hwacha2012_trailer.html">예고편</a>

</div>

<div itemscope itemtype="http://schema.org/Movie"> <h1>화차</h1><span>감독: 변영주 (1966년 12월 20일 출생)</span> <span>미스터리</span> <a href="../movies/hwacha2012_trailer.html">예고편</a>

</div>

Page 58: library linked data

HTML5 MicroData

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5057

itemprop

<div itemscope itemtype="http://schema.org/Movie"> <h1>화차</h1><span>감독: 변영주 (1966년 12월 20일 출생)</span> <span>미스터리</span> <a href="../movies/hwacha2012_trailer.html">예고편</a>

</div>

<div itemscope itemtype="http://schema.org/Movie"> <h1 itemprop="name">화차</h1><span>감독: <span itemprop="director">변영주 (1966년 12월 20일 출생)</span> <span itemprop="genre">미스터리</span> <a href=“../movies/hwacha2012_trailer.html” itemprop="trailer">예고편</a>

</div>

Page 59: library linked data

HTML5 MicroData

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5058

Embedded items

<div itemscope itemtype="http://schema.org/Movie"> <h1 itemprop="name">화차</h1><span>감독: <span itemprop="director">변영주 (1966년 12월 20일 출생)</span> <span itemprop="genre">미스터리</span> <a href=“../movies/hwacha2012_trailer.html” itemprop="trailer">예고편</a>

</div>

<div itemscope itemtype="http://schema.org/Movie"> <h1 itemprop="name">화차</h1><span>감독: <span itemprop="director“ itemscope

itemtype="http://schema.org/Person">변영주 (1966년 12월 20일 출생)</span> <span itemprop="genre">미스터리</span> <a href=“../movies/hwacha2012_trailer.html” itemprop="trailer">예고편</a>

</div>

Page 60: library linked data

Microdatavocabulary

Microsoft, Google,Yahoo...

Page 61: library linked data

RDFa

• RDF in attributes• XHTML 웹 문서 안에 RDF 메타데이터를 포함시킬 수 있는 메커니즘

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5060

<div><h2>Library Linked Data</h2><h3>박진호</h3>

</div>

XHTML

<div xmlns:dc="http://purl.org/dc/elements/1.1/"> <h2 property="dc:title“>Library Linked Data</h2> <h3 property="dc:creator">박진호</h3>

</div>

RDFa

Page 62: library linked data

RDFa

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5061

<div typeof="foaf:Person" xmlns:foaf="http://xmlns.com/foaf/0.1/">

<p property="foaf:name"> 박진호 </p>

<p> Email: <a rel="foaf:mbox" href=“[email protected]"> [email protected]

</a></p>

<p> Phone: <a rel="foaf:phone" href="tel:+82-590-0792">+82 590 0792 </a></p>

</div>

RDFa

Page 63: library linked data

Microformat

• Microformat은 기존 HTML 태그의 확장으로 의미적인 정보를 강화함

• 웹 페이지에 있는 사람, 이벤트, 블로그 포스트, 리뷰와 같은 것들을 표현함

• 다음의 (X)HTML의 속성을 사용해서 표현 가능함

– class , rel, rev

• Humans first, machines second

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5062

Page 64: library linked data

Microformat

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5063

<head profile=“http://www.w3.org/2006/03/hcard”><div class=“vcard”>

<div class=“fn”>박진호</div><div class=“org”>국립중앙도서관</div><div class=“tel”>02-590-0792</div><a class=“url” href=“https://www.facebook.com/jino.kor”>https://www.facebook.com/jino.kor</a>

</div>

<div><div>박진호</div><div>국립중앙도서관</div><div>02-590-0792</div><a href=“https://www.facebook.com/jino.kor”>https://www.facebook.com/jino.kor</a>

</div>

HTML

Microformats(XHTML)

Page 65: library linked data
Page 66: library linked data

Netflix OData Catalog API Example

2014.7.4. , 국립중앙도서관 디지털도서관운영과정 | 5065

http://odata.netflix.com/Catalog/Collections: Titles, TitleAwards, People, Genres, Languages, …

The Metadata…/$metadataGenres…/GenresCount of horror movies…/Genres('Horror Movies')/Titles/$countKorean movies…/Languages('Korean')/Titles?$filter=Type eq 'Movie'Horror movies from the '70s …/Genres('Horror Movies')/Titles?$filter=ReleaseYear le 1979 and ReleaseYearge 1970 In JSON format: …&$format=json

Page 67: library linked data

66 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

복잡한 게 아닙니다. 기계가 이해할 수 있다(No)사람과 기계가 같이 이해할 수 있는 공유의 장!기계가 이해할 수 있다는 것은 사실

좀 더 엄격하고, 정확하고, 명확한 규칙과 정의가 필요

Page 68: library linked data

67 | 50국립중앙도서관 디지털도서관운영과정2014.7.4. ,

중요한 것은,

RDF, RDFa, Microformat, Microdata,Odata를 공부해라? 배워라? 써라?

Page 69: library linked data

StandardDataOPEN

Page 70: library linked data

Data Platform

Page 71: library linked data
Page 72: library linked data

개념화 MetadataVocabulary…

Page 73: library linked data

도서관 데이터 플랫폼 구축의 특징

• 개념적 접근과 기술적 접근이 동시에 진행

– 개념적 접근 = FRBR, RDA(?), BIBFRAME

– 단순히 가지고 있는 데이터를 표준언어, 프로토콜에 맞추어 개방하는 것이 아니

라 ‘책’ ‘서지’라는 객체가 갖는 데이터모델로 접근

Page 74: library linked data

British Library Data Model - Book

Page 75: library linked data

BIBFramework

Page 76: library linked data

BIBFramework

Page 77: library linked data

BIBFramework

Page 78: library linked data

BIBFramework

Page 79: library linked data

FRBR

Page 80: library linked data

의미있는 데이터 플랫폼(이용자 입장)

• 어떤객체, 개념을가지고있는지알수있는가?

• 그객체, 개념을어떤속성으로관리하고개방하고있는지알수있는가?

– 개방하고있는정보가정말가지고있는모든것인가?

• 범용적인, 혹은내가놀고있는플랫폼에서활용가능한가?(표준)

• 나도 (개발능력이없는) 활용할수있는플랫폼인가?– 나에게어떤노력을기울이고있는가?

Page 81: library linked data

도서관의 LOD 구축 원칙

• Open이먼저– 국립도서관의데이터는기본적으로누구나자유롭게활용할수있는

공공데이터(Public Data)

– 어떤형태, 방식으로든Open

• Open하되되도록이면개방형표준을활용– Linked Data Principle 준수

• Information Ecosystem에 기여– Web은가장보편화되고일반적인Platform이자Ecosystem

• Linked data로얻는이득보다글로벌데이터베이스(Web) 세계에기여한다는마음이우선

– 개방으로직접적으로얻을수있는이득보다우리의데이터가살아서누군가에게새로운“가능성”을열어줄수있음을우선고려

Page 82: library linked data

도서관의 LOD 구축 원칙

• 이용자를생산자로– 단순한데이터의개방과서비스를넘어, 데이터를만들고자유롭게활용할수있는Data

Literacy 교육

• 도서관데이터의시각화가아니라‘이용자’가갖고있는데이터의조합과시각화

Page 83: library linked data

도서관 데이터 플랫폼

• 내가활용하고싶은객체의속성은무엇인가?• 내가표현하고싶은객체의속성은무엇인가?• 다른사람들은어떻게부르고어떻게표현하는가?

Page 84: library linked data

도서관 데이터 플랫폼

Page 85: library linked data

서지정보의 미래 : 구조화된 데이터

• 국립도서관의 중요한 역할– 국립도서관은 정보를 영구보존 합니다. – 책, 전자책, CD, DVD, Web Site, Digital File

• 이 전자책의 제목은, 저자는, 출판년도는, 출판사는, 주제분야는,– 어떤 SW로 만들어졌고, 어떤 OS에서 돌아가고, 그 SW의 업데이트는 언제 이루

어졌고, 어디에 위치해있고, 현재 상태는 어떠하고...

Page 86: library linked data

서지정보의 미래 : 구조화된 데이터

• 도서관이 바라보는 전자책

정보객체(Information Object)

Epub해석규칙(EpubReader)

001011100000111101111110110101010110

표현정보 데이터객체

Page 87: library linked data

서지정보의 미래 : 구조화된 데이터

• Epub, Microsoft 2007이상

– 구조화된 형태로(XML) 표준 메타데이터를 활용(DublinCore 등)하여 플랫폼, 애플

리케이션 독립적으로 활용이 가능한 디지털 정보 객체

Page 88: library linked data

Data, Platform

Big Data

LinkedData

Complexity

Possibility

Library

• 내부데이터의처리와새로운가능성• 텍스트마이닝등을통한학술논문,특허

DB에서의유의미한가치발견• 비구조화된외부데이터(SNS)처리,연결방안

• 누구에게나열려있는가능성• 데이터의가치판단은소비자에게• Not Literal But Things

Page 89: library linked data

참고자료

• 이미지출처– http://blogs.loc.gov/digitalpreservation/files/2011/06/lod.jpg– https://www.flickr.com/photos/okfn/6419794587/

• 참고자료– http://5stardata.info/– http://5stardata.info/kr/

2014.6.30. , Europeana & BBC.국립중앙도서관 88