더블린코어 메타데이터 국제 컨퍼런스 (dc-2011) 참석 결과보고서 · 시맨틱...

34
도서관연구소 웹진 Vol. 82 (2012.2.15) 도서관으로의 여행기 출장정보 국립중앙도서관 도서관연구소(KRILI) 공무국외출장결과보고 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 국 립 중 앙 도 서 관

Upload: doxuyen

Post on 29-Aug-2019

240 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I)

공무국외출장결과보고

더블린코어 메타데이터 국제 컨퍼런스 (DC-2011)

참석 결과보고서

2011. 11.

국 립 중 앙 도 서 관

Page 2: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I)

【차 례】

Ⅰ. 출장 개요 ···················································1

Ⅱ. 출장 일정 ···················································2

Ⅲ. DC-2011 개요 ···········································3

Ⅳ. 컨퍼런스 주요 내용 ·································5

1. 튜토리얼 ·····································································5

2. 기조연설 ···································································10

3. 논문 ···········································································14

4. 포스터 ·······································································26

5. 워크샵 ·······································································29

6. 스페셜 세션 ·····························································30

Ⅴ. 종합의견 ···················································32

Page 3: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 1

Ⅰ 출장 개요

1. 목 적

❍ DCMI(Dublin Core Metadata Initiative) 상임이사국으로서의 역할 수행 및 활동❍ 메타데이터 새로운 모델 개념 ‘Harmonization'의 이해 도모❍ 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구

2. 출장지 : 네덜란드(헤이그)

3. 출장기간

❍ 2011. 9. 20 ~ 9. 25(4박 6일)

4. 출장자

❍ 이은정, 신은정 (디지털기획과 사서)

5. 주요 내용

❍ DCMI 회의 참석으로 상임이사국으로서의 역할 수행 및 활동❍ 메타데이터의 새로운 모델 모형인 ‘Harmonization'에 대한 개념 및 의미 파악❍ 도서관계 등 각 분야별 Linked Data 추진 현황에 관한 정보 습득❍ 메타데이터 상호운용성 관련 국제적인 동향 파악

Page 4: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 2

일 자 지 역 시 간 일 정 비 고

9.20

(화)

인천 14:30 ㅇ 인천 공항 출발KLM Royal

Dutch Airlines

(KL 866)암스테르담

헤이그18:40

ㅇ 암스테르담 스키폴 공항 도착

ㅇ 암스테르담 ⇒ 헤이그 이동

9.21

(수)헤이그

08:00-08:30 ㅇ 등록네덜란드

국립기록관,

국립도서관09:00-17:00

ㅇ Pre-Conference

- Tutorial 1-4

- 네덜란드 국립도서관 견학

9.22

(목)헤이그 09:00-18:00

ㅇ Conference Day 1

- 기조연설 : Metadata Harmonization

for Fun and Profit

- Papers 1 : Profiles & Usage - Ⅰ

- Papers 2 : Mapping, Alignments

- Projects 1 : Metadata Transparency

- Projects 2 : Collection-level Services

9.23

(금)헤이그 08:45-18:00

ㅇ Conference Day 2

- 기조연설 : Towards Linked Data for

Libraries, Archives, and Museums

- Papers 3 : Towards a Linked Data World

- Papers 4 : Profiles & Usage - Ⅱ

- Projects 3 : New Views of Legacy Data

9.24

(토)

헤이그

암스테르담17:45

ㅇ 헤이그 ⇒ 암스테르담 이동

ㅇ 암스테르담 스키폴 공항 출발 KLM Royal

Dutch Airlines

(KL 865)9.25

(일)인천 10:50 ㅇ 인천 공항 도착

Ⅱ 출장 일정

Page 5: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 3

Ⅲ DC-2011 개요

1. DCMI(Dublin Core Metadata Initiative) 개요

❍ 사무국 : 싱가포르 국립도서관 ❍ 이사가입국 : 7개국(핀란드, 영국, 싱가포르, 뉴질랜드, 한국, 말레이시아,

일본) ※ 2006. 4. 국립중앙도서관 이사국 가입 ❍ 역할 - 더블린코어를 국제표준으로 제정 - 웹자원 기술(description)을 위한 표준 개발, 공인문건 출판 및 배포 - 메타데이터의 상호 운용성 연구 및 표준안 개발 - 메타데이터 용어관리 및 표준 제정 - 메타데이터 활용 교육, 홍보 및 지원, 국제회의 개최 등 ❍ 홈페이지 운영 : http://www.dublincore.org ❍ 국립중앙도서관 역할 - DCMI 국제 이사국으로서 한국 대표기관 - 더블린코어에 대한 국내 표준(안) 마련 - 국내 메타데이터 발전 및 상호운영에 대한 방안 마련 - 국제회의 참석 및 국내의견 개진 - 한국 홈페이지 운영 : http://dublincore.go.kr

2. DC-2011 개요

❍ 주 제 : Metadata Harmonization: Bridging Languages of Description※

❍ 주 최 : 네덜란드 국립도서관 ❍ 기간/장소 : 2011. 9. 21 ~ 9. 23 (3일간) / 네덜란드 국립도서관 및 기록관 ❍ 참석자 : 도서관, 기록관, 문헌정보학, IT 기관 메타데이터 전문가(36개국 175명) ❍ 프로그램 : 상임이사회의, 워크숍, 스페셜세션, 튜토리얼, 페이퍼세션, 포스터세션 등 ❍ 차기 회의(DC-2012) 개최지 : 말레이시아

Page 6: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 4

※배경

- 메타데이터는 현재의 웹 환경에서 대규모의 분산된 자원을 관리할 수 있게 해

주는 도구로서 그 중요성을 더해가고 있음

- 여러 영역 간의 공동 작업 및 교환의 필요성 때문에, 이전에는 상대적으로 개별

적이었던 메타데이터 공동체 간의 상호작용이 최근 수년 간 성장세를 보이고 있

음. 그러나 메타데이터 표준은 독자적인 표준화 공동체 간의 상호운용성

(interoperability)에 대한 요구를 충족시킬 수 없었음

- 이러한 이유로, “메타데이터 명세 조합의 상호운용성” 으로 정의되는 “Metadata

Harmonization"이라는 개념이 웹 기반 메타데이터의 미래에 관한 핵심 이슈로 부상하였음

3. DC 2011에서 다룬 주요 주제

❍ 메타데이터 원칙, 지침, 모범사례 ❍ 메타데이터의 특성(체계, 도구, 실무) ❍ 개념적 모델 및 체계 (ex. RDF, DCAM, OAIS 등) ❍ 애플리케이션 프로파일(Application Profile)1) ❍ 메타데이터 생성(방법, 도구, 실무) ❍ 메타데이터 상호운용성(영역, 언어, 시대, 구조, 규모 간) ❍ 범용 메타데이터의 사용 (ex. 기록관리, 보존, 큐레이션, 기관저장소, publishing) ❍ 분야별 메타데이터 (ex. 기업, 도서관․박물관․기록관 등의 문화기관, 교육, 정부, 과학 분야) ❍ 시맨틱 웹 어휘로서의 서지 표준 (ex. RDA, FRBR, 주제명표목 등) ❍ 메타데이터 구축시 소셜 태깅 및 이용자 참여 ❍ 지식조직체계와 SKOS(Simple Knowledge Organization System) ❍ 온톨로지 설계 및 개발 ❍ 메타데이터와 온톨로지의 통합 ❍ 검색엔진과 메타데이터 ❍ Linked Data와 시맨틱 웹 (메타데이터 및 애플리케이션) ❍ 용어 레지스트리와 레지스트리 서비스 1) 특정 응용프로그램을 위해 정의된 일련의 메타데이터 요소, 정책, 지침

Page 7: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 5

Ⅳ 컨퍼런스 주요 내용

1. 튜토리얼

❍ 일시 : 2011. 9. 21(수), 09:00~17:00 ❍ 장소 : 네덜란드 국립기록관 ❍ 목적 : 회의에서 다루는 주제에 관한 입문용 교육 강좌(90분)

□ 더블린코어 소개(An Introduction to Dublin Core)2) ❍ 발표자 : Stephanie Taylor (UKOLN, University of Bath, 영국) ❍ 주요 내용 - 더블린코어 메타데이터 세트에 관한 기본적인 소개 - 각기 다른 작업 환경에서 DC의 적용을 설명하기 위해 실제적인 사례를 활

용하여 Simple DC와 Qualified DC를 설명함 - 그룹워크 : 참석자들이 기술대상자료의 요소를 분석하고, 객체를 기술하기

위해 Simple & Qualified DC를 사용하는 기회를 제공함 - 사물에 관한 구조화된 데이터인 ‘메타데이터’의 현행 표준으로는 더블린 코어,

MARC, ONIX, EAD, MODS, METS, DIDL, PREMIS, MIX, RSLP-CD 등이 있음 - 학술 연구 저작(저널 아티클, 워킹페이퍼, 논문, 북챕터, 보고서 등)을 기술하기 위한

더블린코어 애플리케이션 프로파일※인 SWAP(Scholarly Works Application Profiles)3) 모델을 소개함

2) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/66/34

Page 8: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 6

※ 애플리케이션 프로파일(Application Profiles) : 메타데이터 스키마의 한 유형으

로, ‘메타데이터의 패키지’라 할 수 있음. 하나 이상의 메타데이터 스키마 또는

요소 세트에서 가져온 데이터 요소들로 구성되어 있음

<SWAP 모델 구조(좌) 및 예시(우)>

□ 더블린코어에서 Linked Data로(From Dublin Core to Linked Data)4) ❍ 발표자 : Paul Hermans (벨기에) ❍ 주요 내용 - XML/HTML로 인코딩된 더블린코어 메타데이터 애플리케이션을 Linked

Data※ 버전으로 마이그레이션하는 구체적인 방식을 설명함.

※ Linked Data : 웹상에서 관련된 데이터를 연결하고 이용할 수 있게 하는 공

통의 웹 기술을 사용하는 데이터 발행(publishing) 기술. HTTP URI로 자원을 식별

하며, 자원에 대한 데이터를 제공하고 이들을 웹상의 다른 자원과 연결하는 데

에 RDF(Resource Description Framework)와 같은 표준을 사용함5) - 다음 작업을 수행하기 위한 각 단계를 설명함 * 자원의 식별자(URI)를 정의 * 적합한 모델과 어휘를 선택 * 다른 데이터세트로의 링크를 생성3) http://dublincore.org/scholarwiki/SWAPDSP

http://www.ukoln.ac.uk/repositories/digirep/index/Scholarly_Works_Application_Profile

4) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/67/35

5) 참고 : http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/55/14

Page 9: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 7

* 필요한 표현형(representation)(RDF/XML, turtle, HTML)으로 변환 * 해당 데이터를 역참조 가능한(dereferenceable) Linked data로 발행(publish) - 사용될 수 있는 도구와 기술에 관한 개관 - Linked Data의 원칙 * 사물의 명칭으로 URI를 사용함 * HTTP URI를 사용하여 사람들이 쉽게 찾아볼 수 있게 함 * URI를 찾았을 때, 유용한 정보(RDF)를 제공 * 더 많은 것을 검색할 수 있도록, 다른 HTTP URI로의 링크를 포함시킴

□ SKOS (Simple Knowledge Organization System)6) ❍ 발표자 : Antoine Issac (Europeana & Vrije Universiteit Amsterdam, 네덜란드) ❍ 주요 내용 - SKOS란 : 시맨틱 웹의 틀 내에서 지식 조직 체계(KOS: 시소러스, 분류체계,

주제명표목시스템, 택소노미 등)의 사용을 지원하기 위해, RDF를 사용하여 간단한 방식으로 표현하고 연결하는 데이터 모델

- SKOS의 다양한 특성을 소개하고, SKOS가 현존하는 KOS의 데이터를 표현하기 위하여 어떻게 사용될 수 있는가를 설명함

* SKOS의 유용성 : KOS를 시맨틱웹과 Linked Data의 비전에 쉽게 부합시킬 수 있음 (웹 지향적인(web-oriented) 표현, 개념 및 해당 기술(description)의 재사용․공유, 서로 다른 맥락의 개념 간의 연결, 확장가능성)

* SKOS의 기술적인(technical) 효용성 : 외부 출처로부터의 데이터 획득, 데이터 발행, 데이터세트 간의 연결 등이 쉬워짐

- 데이터의 웹 상에서 영향력 있는 현행 지식조직체계의 비전이 문화유산 등 의 분야에서 진행 중인 여러 프로젝트에서 어떻게 채택되고 있는지를 살펴 보고, KOS를 생성․발행하기 위한 수단 및 방법, 기존의 KOS 데이터를 SKOS로 porting하는 방법 등에 관해서도 살펴보았음

6) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/download/69/36

Page 10: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 8

- KOS를 Linked Data로 구현한 주요 사례 * 도서관 분야7)

• 스웨덴 국립도서관의 ‘Libris catalogue and thesaurus’ (http://libris.kb.se)

다양한 유형의 자원(인물․도서․저자․주제 등)을 서술한, 175개 도서관의 수백만건의 레코드• 미국 의회도서관의 어휘집(LCSH 포함) (http://id.loc.gov) 전거레코드 26만건• 독일 국립도서관의 ‘Gemeinsame Normdatei(GND)’ (SWD subject headings 포함) (http://d-nb.info/gnd)

(현재 독일, 오스트리아, 스위스 도서관계에서 전거제어 및 주제 색인에 사용중인) 독일어 전거파일을 통합 (개인명, 단체명, 주제명 포함)

• 프랑스 국립도서관의 ‘RAMEAU 주제명표목’ (http://stitch.cs.vu.nl) 개념(일반 명사 및 지명 포함) 16만건• OCLC의 ‘①DDC 분류’(http://dewey.info) 및 ‘②VIAF’(http://viaf.org) ① DDC를 1000구분까지 11개 언어로 이용 가능(축약본 14판은 3개 언어) ② OCLC 주관, 10여개 국립도서관의 합동 프로젝트. 국립도서관의 전거파일을 연결시켜서 해당 정보를 웹상에서 이용가능케 함• STW 경제 시소러스 (http://zbw.eu/stw) 표준화된 주제명(6천여개), entry term(18천개)을 RDF 표현형으로 제공• 헝가리 국립도서관의 목록 및 시소러스 (http://oszkdk.oszk.hu/resource/DRJ/404)(예시) 헝가리국립도서관의 OPAC 목록, 전거데이터• Open Library Project (http://openlibrary.org) '모든 책에 하나씩의 웹 페이지를 만들기‘를 목표로, 2천만건의 레코드를 수집했

고, 객체를 처리하기 위해 자원 중심의 구조를 제공함

※ 도서관 영역의 Linked Data 세트 (http://thedatahub.org/group/lld)

7) 다음 논문에서도 참고함 http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/55/14

Page 11: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 9

* 기타 분야 • Wikipedia categories through DBpedia (http://dbpedia.org) • 뉴욕타임즈 subject headings (http://data.nytimes.com) • IVOA 천문학 어휘 (http://www.ivoa.net/Documents/latest/Vocabularies.html) • GEMET 환경 시소러스 (http://eionet.europa.eu/gemet) • Agrovoc (http://aims.fao.org) • Linked Life Data (http://linkedlifedata.com) • Taxonconcept (http://www.taxonconcept.org) • UK Public sector vocabularies (http://standards.esd.org.uk)

Page 12: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 10

2. 기조연설

□ Metadata Harmonization8) for fun and profit9) ❍ 발표자 : Mikael Nilsson (Google, 스웨덴) ❍ 주요 내용 - 메타데이터 상호운용성

* 두 개 이상의 시스템 또는 구성요소가 사물에 관한 기술(descriptive)데이터를 교환하고, 데이터 생성자가 해석한 것과 일치하는 방식으로 교환되어온 기술(descriptive) 데이터를 해석할 수 있는 능력

* 두 응용프로그램 간에 메타데이터를 교환할 수 있고, 두 응용프로그램이 모두 그 메타데이터를 정확히 해석할 수 있다면, “메타데이터는 상호 정보 교환이 가능하다(interoperable)”

* 즉, 두 시스템이 동일한(또는 호환되는) 방식으로 이루어졌다면, “interoperable"하다.8) 참고(DCMI glossary) : http://wiki.dublincore.org/index.php/Glossary/Metadata_Harmonization

9) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/download/71/41

Page 13: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 11

- 메타데이터 Harmonization

* 두 개 이상의 시스템 또는 구성요소가 두 개 이상의 메타데이터 명세 (specification)를 따르는 "결합된 메타데이터“를 교환하고, 데이터 생성자가 의도한 것과 일치하는 방식으로 교환되어 온 메타데이터를 해석할 수 있는 능력* 두 개의 서로 다른 명세(ex. DC와 IEEE/LOM10))에 기반한 메타데이터를

채택하여 이들을 결합시키고, 그 결합된 메타데이터를 정확히 해석할 수 있다면, “메타데이터는 harmonized 되었다”

* 즉, 두 시스템이 별도로 이루어졌으나 공통의 모델로 연결되었다면, “harmonized” 되었다.

- 핵심 메타데이터 개념

* 메타데이터 구문(syntax) [예) RDF/XML, DC-HTML, LOM XML] 응용프로그램 간에 메타데이터를 교환하기 위해 사용되는 구체적인 데이

터 포맷으로서, 메타데이터 소프트웨어와 프로토콜을 실행하기 위해 사용됨. 실용적인 도구이지만, harmonization 문제의 본질은 아님

* 메타데이터 어휘 [예) DCMES, MARCREL, LCSH] 메타데이터 기술(description)에 사용하기 위한 기술적인(descriptive) 용

어 세트로서, 메타데이터 설계자들이 메타데이터 레코드를 생성하기 위해 사용함. 다양한 모델에 따라 정의되는데, 여러 모델이 상충하기 때문에 harmonization 이슈가 등장함

10) 학습객체 메타데이터(Learning Object Metadata : LOM) : 학습객체(명확한 교수․학습 목표를 가진 콘텐츠로, 독립적이고

재사용 가능한 최소 단위의 디지털 콘텐츠)의 메타데이터 기술을 위한 IEEE 표준

(위키백과 : http://ko.wikipedia.org/wiki/%ED%95%99%EC%8A%B5%EA%B0%9D%EC%B2%B4)

Page 14: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 12

* Abstract Models [예) RDF triple 모델, IEEE LOM 계층 모델, DCMI abstract 모델] 메타데이터 용어의 의미와 사용방법을 정의하는 데에 사용되는 모델로, 용어

설계자와 구문 생성자가 상호운용 가능한 명세(specification)를 생성하기 위하여 사용함. 호환성이 없는 모델들은 harmonization의 주된 장벽임

* Application profiles [예) ePrints AP, OAI-DC 등] 특정한 맥락에서(영역, 응용프로그램 등) 메타데이터 레코드의 구조를

정의함(구체적인 구문을 정의하기 위해, abstract model에 근거하여 어휘를 사용함). 특정 분야의 요구를 성문화하기 위하여 해당 영역의 전문가 또는 응용프로그램 설계자가 사용함. 단일한 abstract model의 맥락에서 harmonization에 유용함

□ 도서관, 기록관, 박물관을 위한 Linked Data를 향하여 (Towards Linked Data for libraries, archives and museums)11)

❍ 발표자 : Emmanuelle Bermes (퐁피두센터, 프랑스) ❍ 주요 내용 - 문화유산기관(도서관, 기록관, 박물관)※은 자관의 데이터를 자유롭게 사용(seamless

access) 할 수 있도록 제공하라는 이용자들의 요구에 직면하고 있는데, 각 영역의 특성을 보존하면서 데이터를 공동 활용하는 융합(convergence)의 필요성이 대두됨

※ 문화유산기관별 소장 데이터 특징

- 도서관 : 다양한 객체, 분담 목록

- 기록관 : 계층적 기술(description), 유기적인 특성, ‘퐁 존중의 원칙’

- 박물관 : 유일무이한 객체, 사건에 기반한 기술(description) - 변화의 필요성 : 오늘날 Linked Data와 시맨틱웹 기술에 관한 관심이 증가함에

따라, 이들 신기술이 우리 공동체에 오랫동안 존재해온 문제들을 해결할 수 있는지, 우리 공동체는 Linked Data를 채택하기 위해 필요한 시간과 예산을 투자하고, 사고방식을 변화시킬 준비가 되어 있는지와 같은 의문이 제기되고 있음

11) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/70/40

Page 15: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 13

Linked Data 원칙 이용가능한 데이터세트 및 어휘* 사물의 이름으로 URI를 사용함* 사람들이 이들 이름을 찾을 수 있도록 HTTP URI를 사용함* 표준(RDF, SPARQL)을 사용하여 유용한 정보를 제공* 다른 데이터세트와의 링크를 생성

* 메타데이터 요소 세트 : 더블린코어, RDA, FOAF, ISBD, FRBR* 유용한 어휘 : LCSH, VIAF, MARC code lists..* 기타 데이터세트 : Geonames, DBpedia..※ Library Linked Data : http://thedatahub.org/group/lld

- 융합의 사례 : 프랑스 퐁피두센터 * 퐁피두센터 내의 박물관, 도서관, 기록관, 문화시설 등 다양한 기관에서 생

산되는 모든 자원을 온라인상에서 이용할 수 있는 인터페이스를 구축 중 * ‘네비게이션 모델’ 채택 : 구성요소가 패싯화 되어있는 매우 유연한 모델로

서, 링크를 따라가면서 관련 자료를 발견할 수 있다.

<퐁피두센터의 ‘네비게이션 모델’> 예) ‘퐁피두센터 개관 XX주년 기념 기획전’(Event)에 소개된 ‘칸딘스키’(person)의

‘Trente’라는 작품(work)은 ‘퐁피두센터’(place)에 소장되어 있으며, ‘칸딘스키 콜렉션’(collection)에 속해있음. 이 작품은 ‘디지털 이미지’(resource) 등 다양한 형태로 이용 가능함. 또한 이 작품에 관한 ‘논문’(document)이 퐁피두센터 도서관에 소장되어 있음

⇒ 각 패싯을 검색하였을 때, 관련된 자원을 추가로 검색할 수 있음

Page 16: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 14

- 현재는 각 영역별로(도서관, 박물관, 기록관 등) 데이터가 개별적으로 존재하지만, 나중에는 여러 영역의 데이터를 결합하여 이용을 증진해야 함. 또한 Linked Data로 발행할 때, 데이터를 단순히 공개하는 게 아니라, 실제로 최종사용자가 이 데이터를 어떻게 사용할 것인가를 고려해야 함

3. 논문

□ 시맨틱 세계에서 맵핑※에 관한 재고 (Reconsideration of Mapping in a Semantic World)12)

❍ 발표자 : Gordon Dunsire, Diane Ileana Hillmann, Jon Phipps, Karen Coyle ❍ 주요 내용 - 지난 10년 동안, 급증하는 신규 메타데이터 스키마(또는 포맷)를 모으려는

시도들은 그다지 성공적이지 않았음 - 도서관 데이터의 장이 시맨틱 웹으로 옮겨감에 따라, 다양하고 급변하는

환경 속에서 상호운용성에 관한 우려가 계속되고 있으며, 구문적인 상호연동(syntactic crosswalks)에 기반한 전략도 더욱 복잡해지고 있음

- 본 논문에서는 전통적인 상호연동(crosswalking) 전략의 최신 방식을 검토하고, 이에 따른 시사점과, 접근방식에 있어서의 변화(레코드기반 → 문장(statement)기반, 구문기반 → 의미기반)가 어떻게 결과에 중요한 차이를 가져올 수 있는가를 제안함

※ 본 논문에서 ‘맵핑(mapping)'이란, 메타데이터 요소 간의 의미적 연관관계를 말함

12) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/52/6

Page 17: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 15

□ 대규모의 디지털 도서관에서, free-text 콜렉션 수준의 주제 메타데이터 (Free-text Collection-Level Subject Metadata in Large Scale Digital Libraries:

A Comparative Content Analysis)13) ❍ 발표자 : Oksana L. Zavalina (University of North Texas, 미국) ❍ 주요 내용 - 메타데이터는 디지털 도서관이 정보를 조직하는 데에 있어서 가장 중요함. 현재

는 개별 객체뿐만 아니라 전체 디지털 콜렉션을 기술하기 위하여 메타데이터를 생성하는 디지털 도서관이 전 세계적으로 증가하고 있는데, 콜렉션 수준의 메타데이터는 아직 실증적으로 평가되지 않았음

- 본 논문에서는 미국과 유럽의 대규모 디지털 문화유산 집단 3개관의 'free-text 콜렉션 수준의 주제 메타데이터(Free-text Collection-Level Subject Metadata)※'를 평가하기 위하여, 면밀한 비교 내용 분석을 사용한 연구 결과를 보고하였음

- 이 연구에서 관찰한 바와 같이, 최근의 모범 사례는 free-text 콜렉션 수준의 기술(記述) 메타데이터 요소로 표시된, 디지털 콜렉션에 관한 다양한 정보를 포함함

특정 주제 정보 주제에 특정되지 않은 정보* 디지털 콜렉션 내 객체의 주제* 지리적․시대적 범위* 유형/장르

* 제목, 크기, 출처, 콜렉션 개발, 저작권, 이용자, 검색 및 기능성* 디지털 콜렉션 내 아이템의 언어, 증가 빈도, 아이템 생성자* 디지털 콜렉션의 관리기관 또는 기여기관, 자금 출처* 디지털 콜렉션의 중요성․독창성․포괄성

※ Free-text Collection-level Subject Metadata :

- 메타데이터는, 메타데이터 요소가 어떤 값으로 채워지느냐에 따라 두 종류로 세분됨

① 통제어휘 메타데이터 (공식적으로 유지되는 용어 목록으로부터 값을 가져옴)

② free-text 메타데이터 (자연어에 의존함)

- 디지털도서관에서 디지털콜렉션을 기술하기 위한 메타데이터 스키마로 널리 이용되

는 ‘Dublin Core Collections Application Profile'에서, '주제 메타데이터'는 4개의 요소로

대표됨: : free-text인 ⓐ기술(description), 통제어휘인 ⓑ주제, ⓒ유형, ⓓ범위(coverage)

13) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/50/19

Page 18: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 16

□ Linked Data 발행을 위한 시소러스 alignment14) ❍ 발표자 : Johannes Keizer, Ahsan Morshed, Caterina Caracciolo, Gudrun

Johannsen (UN식량농업기구(FAO), 이탈리아) ❍ 주요 내용 - ‘사람과 기계가 동일하게 데이터에 접근할 수 있어야 한다’라는 시맨틱 웹의

비전에 따라, 최근에는 Linked Data(LD)로 데이터를 발행(publishing)하는 방식이 웹을 통해 데이터를 이용할 수 있는 방식으로서 주목받고 있음

- 데이터를 Linked Data로 발행하기 위해서는, 역참조(dereferenceable)할 수 있는 URI와, 표준 언어(주로 RDF(S)), 그리고 데이터 조각들 간의 링크가 필요함.

- 본 논문에서는 AGROVOC※을 6개의 잘 알려진 시소러스에 맵핑하는 작업을 소개하고 있는데, 이들 6개의 시소러스는 이미 ‘RDF(S) 자원(시소러스를 RDF(S)로 표현하기 위해 SKOS 어휘를 사용한)’으로서 이용가능함

※AGROVOC : UN식량농업기구(FAO)에서 관리하는 시소러스로, 농업․산림․어업․

식량보존 등의 주제분야를 다룬다. 21개 언어별로 평균 4만개의 용어를 이용할 수

있고, SKOS(약 3만 2천개의 개념)로도 이용가능하며 Linked Data로 발행되었다. - 현행 매칭 시스템의 한계를 고려하여, 문헌에서 논의된 가장 잘 알려진 매칭

알고리즘을 사용하였으며, 개념 사이에서 산출된 평균 유사도(similarity) 값에 해당하는 단일한 숫자를 얻기 위하여 이들을 결합하였음

- 이 작업을 통해, AGROVOC의 Linked Data 버전에 다른 시소러스로의 신뢰성 있는 링크를 부여하는 목표를 달성하였음

14) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/59/5

Page 19: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 17

□ 주제명표목시스템을 지리 온톨로지에 맞춰 조정하는, 언어에 독립적인 접근법15) (A Language Independent Approach for Aligning Subject Heading Systems with Geographic Ontologies) ❍ 발표자 : Nuno Freire, José Borbinha, Pável Calado (Instituto Superior Técnico, 포르투갈) ❍ 주요 내용 - 주제명표목시스템은 수년간 도서관에 의해 개발되어 온, 지식을 조직화하는 도

구임. SKOS(Simple Knowledge Organization System)는 주제명표목시스템을 표현하는 실제적인 방법을 제공하며, 몇몇 도서관에서는 이러한 시스템을 open linked data로서 널리 이용할 수 있도록 앞장서고 있음

- 각각의 주제명표목은 어떠한 개념을 설명하는데, 대부분의 경우 하나의 주제명표목은 여러 개념의 조합으로 이루어짐(ex. 지리적․시간적 범위로 제한된 주제). 이러한 사례에서, 그 개념의 표시(label)는 실제로 구조화된 형태에서는 표현되지 않는 여러 개의 개념을 포함함

- 이 논문에서는 주제명표목시스템에 기술된 지리적인 개념을 지리 온톨로지에서의 관련성에 맞춰 조정하는 것을 다룬다. 접근방법은, 우선 엔티티 인식 기술을 사용하여 주제명표목에서 지명을 파악하여, 대상 지리 온톨로지 내의 지명(地名) 결정을 따랐다. 이 시스템은 기계학습(machine learning)16)에 기반하고 있으며, 현존하는 다양한 주제명표목시스템에 적용될 수 있도록 ‘언어에 독립적으로(language independent)’ 설계되었다.

- 이러한 접근방식은 미 의회도서관 주제명표목표(LCSH)의 부분집합으로서 평가되었는데, 93%의 F1 점수를 달성하였음

15) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/29/7

16) 인공지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야

Page 20: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 18

□ data.europeana.eu - 유로피아나의 Linked Open Data 실험17) ❍ 발표자 : Bernhard Haslhofer, Antoine Isaac ❍ 주요 내용 - data.europeana.eu는 유로피아나※의 메타데이터를 웹상에서 Linked Open

Data로 활용하기 위해 진행중인 프로젝트로서, 표준 웹 기술을 통해 유로피아나의 데이터 제공기관(data providers, 이하 DP)으로부터 수집된 메타데이터를 이용할 수 있게 함

※유로피아나(Europeana) : 유럽연합의 디지털도서관 프로젝트로, 유럽 전역의

1,500여개의 문화유산기관(Data Provider)으로부터 메타데이터를 수집하여 1,700

만건 이상의 자료를 검색 가능함 - 데이터는 EDM※형태로 제시되며, 기술된 자원은 URI에 의해 자체 주소를 가지고

역참조(dereferencable)가능함※※. 유로피아나의 자원들은 Linked Data Web에서 다른 자원들과 링크되어, 의미적으로 연관된 자원을 발견할 수 있도록 함.

※EDM(Europeana Data Model) : 유로피아나의메타데이터를발행․링크하기위한데이터모델

※※ 많은 도서관 및 문화유산기관들이 자관의 데이터를 발행(publish)하기 위하여

Linked Data 원칙을 따랐으며, 그 결과, 이용자들은 데이터 접근과 재사용을 용

이하게 하는 ‘역참조(dereferencing) HTTP URI'를 통해 간단하게 도서관의 자원과

기술(descriptive) 메타데이터에 접근할 수 있게 되었음

- 연구진들은 유로피아나의 DP가 자신들의 데이터를 Linked Data로 하는 것을 선택하게 하고, DP의 데이터를 EDM으로 변환하는 접근 방식을 개발하였음. (이 과정에서 유로피아나가 변환한 EDM을 웹상에서 의미적으로 연관된 자원들과 연결시키기 때문에 DP에도 이득이 됨)

- 이러한 접근방식을 통해, 유로피아나의 첫 번째 Linked Data 버전을 생산하여 해당 데이터세트를 웹상에 발행(publishing)하였고, EDM․HTTP URI 설계․RDF 저장방식 등에 관한 경험도 축적하였음

17) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/55/14

Page 21: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 19

□ Performing Statistical Methods on Linked Data18) ❍ 발표자 : Benjamin Zapilko, Brigitte Mathiak (GESIS – Leibniz Institute, 독일) ❍ 주요 내용 - 최근 수년간, 많은 정부기관은 통계정보를 linked open data의 형태로 발행

(publish)하였음(ex. Eurostat, data.gov.uk) - 많은 시각화 도구가 있음에도 불구하고, 연구자들은 자신들의 연구 질문에

답하기 위해 과학적인 통계 분석을 할 필요가 있음 - 현재, 연구자들은 통계 소프트웨어를 사용하기 위하여 테이블 기반 포맷으로 된

통계 데이터를 다운로드 받아야 하는데, 이러한 방식으로는 linked data가 제공하는 모든 혜택(ex. 해당 데이터를 다른 데이터세트와 연결하는 것)을 받을 수 없음

- 이 논문에서는 연구자들이 linked open data에 관한 통계적인 분석을 수행하는 것을 돕기 위해 특별히 설계된 접근방법을 제시함

- 분산된 자원을 SPARQL을 사용하여 결합시킴으로써, 선형회귀분석 등과 같은 간단한 통계적인 계산을 적용하고 그 결과를 사용자에게 제공할 수 있음

- 이렇게 다양한 종류로 이루어진 데이터 자료를 가지고 수행된 계산을 테스트한 결과, 여러 종류로 이루어진 통계데이터를 가지고 작업할 때 반드시 인식해야 할 ‘데이터 통합’에 관한 대표적인 문제점들을 파악할 수 있었음

□ 마이크로서비스에 기반한 디지털 큐레이션 시스템을 위한 메타데이터 (Metadata for a Micro-services-based Digital Curation System)19)

❍ 발표자 : Kevin Clair (펜실바니아 주립대학 도서관, 미국) ❍ 주요 내용 - 미국 펜실바니아 주립대학의 도서관 및 정보기술 부서에서는 대학의 디지털

큐레이션 및 보존 활동을 지원하기 위한 서비스 아키텍쳐를 개발 중임 - OpenCASA(Open Curation and Archival Services Architecture)라 불리는 이 시18) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/27/16

19) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/17/8

Page 22: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 20

스템은 캘리포니아 디지털도서관이 개척한 디지털 큐레이션에 대한 마이크로서비스 접근방법※을 바탕으로 구축되었음

※ 마이크로서비스 접근방법 : ‘디지털보존’을 ‘일련의 상호 연결된 보존 서비스’

로서 재개념화하기 위하여 캘리포니아 디지털도서관에서 개발한 모델. 개별 서

비스를 유지하기 쉽고, 특화된 환경에 최적화하기 쉽다는 장점이 있다. - 프로젝트 보고서에서 설명하고 있는 내용 * 이 시스템을 위한 메타데이터 개발에 관련된 상세한 방법 및 철학 * 이 방법이 마이크로서비스 모델의 일반적인 접근방식에 맞춰 어떻게 조정될 수 있는지 * 아키텍쳐의 현재 제작 상태, 시스템 내에 포함되어야 하는 미래의 메타데이터 서비스 * 이러한 서비스가 OpenCASA의 이해관계자들과 협력하여 어떻게 사용될 것인가

□ 메타브리지(Meta-Bridge) : 일본 내 메타데이터 정보 인프라 개발20)

❍ 발표자 : Mitsuharu Nagamori, Shigeo Sugimoto, Masahide Kanzaki, Naohisa Torigoshi (일본) ❍ 주요 내용 - ‘메타브리지(Meta-Bridge)'는 일본 총무성(Ministry of Internal Affairs and Communication)

의 자금 지원을 받아 진행중인 메타데이터 정보 인프라 구축 프로젝트임 - 프로젝트의 목표 : ①인터넷 상의 메타데이터 스키마21) 공유를 돕기 위한

인프라로서의 메타데이터 스키마 레지스트리를 구축하고, ②메타데이터 스키마의 재사용 및 메타데이터 상호운용성을 촉진하는 것

- 일본 내 주요 문화기관(도서관․박물관․기록관 등), 연구기관, 민간 부문 등 다양한 영역에서 본 프로젝트에 참여하고 있으며, 주요 내용은 ①참여기관의 메타데이터 스키마를 수집하여 ②(RDF에 기반하여 정의된) 프로젝트의 공식 스키마로 변환하는 것임.

- 보고서에서는 ①프로젝트의 배경, 목표, ②‘Meta-Bridge'라 명명된 레지스트리 시스템의 요건 및 설계에 관하여 설명하고 있음

20) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/37/9

21) 스키마(Schema) : DB구성을 설명하기 위해 일정한 언어에 의하여 관련 자료들 사이의 관계를 기술한 것

Page 23: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 21

- 메타데이터 스키마 및 메타데이터의 생애주기

* 인터넷 상에서 이용가능한 콘텐츠로서의 메타데이터는, 웹자원 등과 마찬가지로 생애주기(lifecycle)를 가짐. 본 프로젝트에서는 메타데이터의 생애주기를 '계획, 생산, 사용, 유지․보존' 단계로 설정하였음

* 메타데이터 기록은 장기간에 걸쳐 다양한 목적으로 사용되므로, 메타데이터 스키마는 오랜 기간동안 잘 유지되어야 함

- 프로젝트 추진단계 * 메타데이터 스키마 레지스트리(메타데이터 어휘와 애플리케이션 프로파일을

저장함)를 개발함. RDF 스키마는 메타데이터 어휘를 정의하기 위한 기본 틀로서 사용되며, 싱가포르 프레임워크와 RDF는 애플리케이션 프로파일을 표현하기 위해 사용됨

* 새로운 스키마를 정의하려는 이들을 위해, 메타데이터 스키마를 정의하기 위한 가이드라인을 수립. 이때, 메타데이터 상호운용성을 향상시키기 위해 현행 스키마의 재사용을 적극 권장해야 함

* 다양한 참여기관으로부터 스키마를 수집하고, 해당 스키마들을 프로젝트에서 정의된 표준 형식으로 온라인상에서 이용할 수 있도록 함

Page 24: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 22

□ BTP(Bamboo Technology Project) 콜렉션 및 콜렉션 서비스 기술22)

❍ 발표자 : Timothy W. Cole, Myung-Ja K. Han, Doug Moncur, Harriett E. Green (미국) ❍ 주요 내용 - 도서관이 더 많은 디지털 콘텐츠를 획득 및 생성함에 따라, 디지털 콜렉션을 기술

(description)하기 위한 표준 방식에 합의해야 할 필요성도 점점 더 명백해지고 있음. 콜렉션 기술을 위한 공유된 규칙은 검색뿐만 아니라 콜렉션 및 콜렉션 아이템의 재사용을 용이하게 할 수 있음

- 이전의 작업에서는 주로 콜렉션 검색을 용이하게 하고, 사람이 읽을 수 있게 콜렉션을 기술하는 표준 및 실습에 중점을 두었음

- 호주 국립 데이터 서비스(Australian National Data Service, ANDS), 그리고 이 글에서 설명할 Bamboo Technology Project(BTP) 등의 프로젝트의 등장을 계기로, ‘컴퓨터를 매개로 한 콜렉션 상호운용성’ 및 ‘컴퓨터가 주체가 된(computer-agent) 콜렉션 이용’ 역시 고려할 필요가 있음.

- 이것은 콜렉션 기술에 있어서 “‘기계가 수행할 수 있는(machine-actionable)’ 콜렉션 수준의 서비스에 대한 기술(desciption)”에 더 주목해야 한다는 것을 나타내며, 시맨틱 웹 기술(ex. RDF)에 더 많이 의존함으로써 가능한 혜택을 시사함

- 초기 프로젝트를 수행한 결과, 콘텐츠 제공자들은 aggregator가 사용하고자 하는 어떠한 기능에 적합한 '콜렉션 수준의 기술정보'를 스스로 생성하지는 않는다는 것을 알 수 있었는데, 이는 콜렉션 수준의 기술(description)정보 구축이 대규모 공동사업이 되어야 한다는 것을 시사함

- BTP의 맥락에서, 본 논문에서는 콜렉션 수준 기술의 생성 및 사용 관련 현행 관례를 논의하고, 콜렉션 내 콘텐츠의 상호운용성을 지원하는 새로운 개발 및 접근 방식을 소개함

22) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/34/11

Page 25: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 23

□ 일본 인문학 DB의 통합검색 시스템을 실현하기 위한 메타데이터 관련 도전23)

❍ 발표자 : Biligsaikhan Batjargal, Fuminori Kimura, Akira Maeda (리츠메이칸대학, 일본) ❍ 주요 내용 - 본 보고서에서는 현재 진행 중인 ‘일본 내 여러 디지털도서관, 기록관, 박물관에

통합적으로 접근하기 위한 프로젝트’의 개요를 설명함 - 일본 인문학 데이터베이스의 통합검색시스템(여러 개의 DB를 동시에 검색하여,

결과를 즉시 취합하여 제공함) 구축 관련, 시스템은 다양한 포맷으로 이루어진 여러 종류의 메타데이터를 처리할 수 있어야 함

- 이 프로젝트 보고서에서는 여러 개의 일본어 DB를 동시에 검색하고 두 개의 언어로 된 검색결과를 통합할 때, 이용자 단에서 직면하게 되는 메타데이터 관련 문제점을 논의함

- 다언어 출처로부터 검색을 수행해야 한다면, 영어와 일본어로 된 검색결과를 집적 및 통합하는 것은 복잡함

□ Linked Jazz : An Exploratory Prototype24) ❍ 발표자 : Cristina Pattuelli, Chris Weller, Genevieve Szablya (Pratt Institute, 미국) ❍ 주요 내용 - 본 프로젝트 보고서는 디지털 문화유산 자료의 검색 및 가시성을 향상시키기 위

하여 Linked Open Data(LOD) 기술을 적용하는 연구와 관련하여 현재 진행 중인 프로젝트의 초기 단계에 관한 보고임

- 프로젝트에서는 음악가들 간의 관계와 이들 공동체의 네트워크를 드러내기 위하여, 재즈 역사의 디지털 아카이브에 대한 Friend-Of-A-Friend(FOAF) 온톨로지의 적용가능성을 분석함

- 문화 관련 데이터를 연결하는 혁신적인 방식을 찾고 이들 전체를 열린 검색 23) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/25/12

24) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/54/20

Page 26: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 24

환경에서 검색 가능케 하는 것은, 새로운 의미를 생성하고 새로운 해석을 이끌어내는 전례 없는 기회를 만들어 냄

- 이 프로젝트의 목표는 풍부하고 다양한 사회적 네트워크 속에서 활동했던 음악가들의 개인적이고 직업적인 삶에 관련된 문서와 데이터 간의 의미 있는 연관성을 알아내도록 돕는 것임

- 프로젝트의 첫 번째 단계에서는 재즈 아티스트의 이름과 그들의 사회적 연결을 나타내는 RDF triples 데이터셋을 생성하는 방법을 시험해보았는데, 향후 추가적인 사례연구와 프로토타입 테스트가 필요함

□ 더블린코어를 위한 콘텐츠 표준으로서의 RDA(자원의 기술과 접근)25)

❍ 발표자 : Myung-Ja K. Han, Melanie Wacker, Judith Dartt (미국) ❍ 주요 내용 - ‘자원의 기술과 접근(Resource Description and Access, RDA)'은 모든 유형의

메타데이터 표준에 사용할 콘텐츠 표준으로서 개발되었음 - 콜롬비아대학, 시카고대학, 일리노이대학은 2010년 10월~12월 사이에 진행된

미국 국립도서관의 RDA 테스트 기간 동안 더블린코어 요소 세트로 이 새로운 표준을 평가하였음

- 보고서에서는 테스트 기간 동안 드러난 문제점과, 그에 관해 3개 기관이 각각 고심한 내용들, 사용된 테스트 셋업에 대한 기술(description), 사용된 도구, 직면한 문제(ex. 서지레코드의 기능상 요건(FRBR)의 객체간의 관계를 더블린코어 요소로 기술할 때의 어려움) 등에 관하여 설명하고 있음

25) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/45/21

Page 27: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 25

□ 음악 메타데이터를 MARC→FRBR→RDF로 변환하기26) ❍ 발표자 : Madelyn Washington, Mark Notess, Jon W. Dunn (인디애나대학, 미국) ❍ 주요 내용 - Variations/FRBR 프로젝트27)는 FRBR의 실행에 관한 공동체의 이해에 기여

하고자 하며, FRBR의 개념적 모델을 위한 구체적인 테스트베드의 역할을 함 - 본 프로젝트는 시스템 및 기관 간에 FRBR 데이터의 상호운용성 및 교환을 증진

시키는 ‘FRBR-compliant 데이터 포맷 및 인코딩’을 공동체에 제공하는 것을 목표로 함. 이 목표의 첫 번째 성과로, 프로젝트팀은 FRBR-compliant XML포맷을 개발하여 공개하였음

- 시맨틱웹 표준을 준수하는(Semantic Web-compliant) ‘도서관 legacy 메타데이터’를 생성하려는 최근의 활동에 자극을 받아서, V/FRBR 프로젝트는 모든 FRBR 기반 애플리케이션 프로파일 간의 공식적인 상호운용성 증진에 기여하게 될 ‘V/FRBR 데이터모델’을 RDF와 연결하는 작업(RDF binding)을 최근 완료하였음

- 이 논문에서는 FRBR 개념적 모델을 실행하고 포괄적 또는 음악에 특화된 환경에서 모두 사용가능한, ‘시맨틱웹 표준을 준수하며(Semantic Web-compliant), 상호 정보 교환이 가능한(interoperable) 데이터 모델’을 만들기 위해 취해진 조치에 관하여 논의함

26) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/49/22

27) Variations/FRBR project : Variations as a Testbed for the FRBR Conceptual Model (http://www.dlib.indiana.edu/projects/vfrbr/)

Page 28: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 26

4. 포스터

□ 온톨로지와 Linked Data에 기반한 ‘시맨틱 서지(Semantic Bibliography)’28)

❍ 발표자 : Haiyan Bai, Xiaodong Qiao, Bing Liang (중국과학기술정보연구소, 중국) ❍ 주요 내용 - 추진배경 : 중국 국립과학기술도서관(NSTL)의 서지 조직 및 통합의 필요성 * 중국 국립과학기술도서관(이하 NSTL)은 과학 관련 9개의 주제분야별(기초과학,

농학, 의학, 공학 등) 국립도서관으로 구성되어 있으며, 종합목록은 학술 자원(학술지, 프로시딩, 보고서 등) 중심으로 되어 있음.

* 전통적인 서지 조직 방식은 MARC 필드에 기반한 색인 및 접근점을 제공했는데, 이러한 방식은 서지에서 추출된 정보 객체를 구분하지 못하고, 이들간의 계층이나 연관성을 나타내지 못함

- 본 프로젝트의 목적은 Linked Data 원칙을 준수하여 모든 종류의 서지적 객체의 특성과 관계를 식별, 기술, 조직화하기 위한 매커니즘을 수립하는 것임. 이를 통해 최종사용자는 해당 서지정보에 접속하고 브라우징할 수 있음

* 이를 위해 아래와 같은 특성에 주목하였음 ①정보 형태의 다양성 (ex. 「해리포터」: 도서, 하드커버 번역본, 오디오북, 영화, 게임 등) ②정보 수명의 가변성 (ex. 학술지의 표제 변경, 새로운 학술지로의 합병 등) ③복합 객체의 복잡성 (ex. 도서(챕터․사진․표 등으로 구성됨), 논문(초고․수정본․

preprint․출판된 버전 등으로 구성됨)) - NSTL은 서지 조직(NSTL 서지 온톨로지 구축, 조직화 방식의 전환, linked data

발행을 포함)에 온톨로지와 linked data의 시맨틱 기술을 적용하였음.

□ Scherzo: FRBR 기반의 음악 검색 시스템29) ❍ 발표자 : Jon W. Dunn, Juliet L. Hardesty (인디애나대학, 미국)

28) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/20/24

29) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/30/25

Page 29: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 27

❍ 주요 내용 - “Scherzo"란 : 인디애나대학의 Variations/FRBR 프로젝트를 통해 만들어진

FRBR 기반의 음악 검색 시스템으로, 인디애나대학도서관의 MARC기반 목록에서 추출한 서지레코드를 자동으로 FRBR화한 DB에서 19만건의 악보 및 녹음자료를 검색할 수 있음 (http://vfrbr.info/search)

- 주요 기능 : 연주법․작곡자 등의 카테고리를 활용한 패싯 검색 기능을 통해, 음악의 특정 관심영역(ex. 작곡자, 지휘자, 연주자..)의 FRBR 관계 검색이 가능해짐. 또한 결과페이지에 저작(work)과 구현형(manifestation) 목록을 함께 제시함

□ historical engineering 아카이브즈의 메타데이터 통합: 통합 메타

데이터 레지스트리(IMR) 구축30)

❍ 발표자 : Ricardo Eito-Brun (Universidad Carlos III de Madrid, 스페인) ❍ 주요 내용 - 스페인 마드리드카를로스3세대학(Universidad Carlos III de Madrid) 의 연구팀이

수행한 ‘historical engineering 아카이브즈를 위한 통합 메타데이터 레지스트리(IMR) 구축’ 프로젝트에 관한 내용

- 토목공학 분야의 역사적 가치있는 문서군을 소장한 아카이브들의 네트워크로부터 메타데이터를 수집 및 통합하기 위한 방식을 제공함.

- 메타데이터 통합과 상호운용성을 가능하게 하기 위해, 네트워크에 참여하는 아카이브즈는 EAC-CPF31)의 최종판으로 인코딩된 전거레코드와, 일련의 시소러스에서 추출한 디스크립터32)를 공유해야 함

- 개발된 프로토타입은 HTTP를 통한 자동화된 원격 호출을 사용하여 metadata assignments(각기 다른 아카이브에서 생성된 EAD및 EAC-CPF 레코드의 부분집합이며, RDF로 인코딩되었음)를 수집하고, XML포맷의 ‘XML 토픽맵(XTM)’을 구축하기 위해 이들 데이터를 처리함.

30) http://dcevents.dublincore.org/index.php/IntConf/dc-2011/paper/view/62/32

31) EAC-CPF(Encoded Archival Context Corporate bodies, Persons, and Families)

32) 디스크립터(descriptor): 기록이나 문헌의 내용을 표현하는 색인어로서 일반적으로 통제어휘집에서 추출됨

Page 30: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 28

- 레지스트리 자체는 서로 다른 페이지를 구축하기 위해 나중에 처리될 XTM 파일로 구성되며, 최종사용자와 연구자는 레지스트리를 탐색하고 서로 다른 기록군과 콜렉션에 분산되어 있는 데이터와 정보를 검색하기 위해 사용함

- 통합 메타데이터 레지스트리(Integrated Metadata Registry, IMR)의 효용 * 분산된 아카이브즈의 네트워크에서 메타데이터의 집적 및 검색을 가능케 함 * 메타데이터를 교환․통합할 수 있도록 시맨틱 웹 표준(ex. RDF)의 적용 가능성

Page 31: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 29

<포스터>

5. 워크샵

❍ 일시/장소 : 2011. 9. 22(목)-23(금), 14:00~17:30 / 네덜란드 국립도서관 ❍ 목적 : 더블린코어 커뮤니티․작업그룹별로 진행되는 현행 작업에 대한 보고,

의제 설정, 토의

Page 32: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 30

분야 주요 안건/내용

RDA- RDA(자원의 기술과 접근) 요소 및 어휘- RDA application profile의 개발에 관한 논의- RDA와, 관련된 네임스페이스 간의 관계

Libraries - 유로피아나 데이터 모델(EDM)- EDM이 도서관에 어떻게 작용하는가에 관한 사례

LibrariesApplication Profile

- ‘서지적인 텍스트 자원을 위한 더블린코어 도서관 애플리케이션 프로파일(DC-Library Application Profile for Bibliographic Text Resource)’ 최종판 소개 및 토의

Government

- 정부 정보의 메타데이터 활용 사례 발표 및 토의 * 캐나다정부의 Open Data Portal(ODP) * 기관의 공식 기록의 메타데이터 레코드를 생산하기 위해 DC를 사용 * 공공 부문 정보의 재사용 / * 택소노미로서의 법률 * 정부간 상호운용성에 있어서 DC, W3C와 같은 공동체의 역할

Registry - Open Metadata Registry- 레지스트리 유형, 레지스트리 소프트웨어 개관 등

Translation - ‘더블린코어 문서 및 명세의 번역자를 위한 안내’ 초안에 관한 토의․검토

Education- DC-Education Application Profile- DCMI/LTSC33) Joint Taskforce- ISO MLR(Metadata for Learning Resource)

Social Tagging - 소셜 태깅 - 웹 기반 소셜 사이트

Science & Metadata

- 데이터 발행, 인용, 큐레이션을 위한 학술 메타데이터34) 개관- 학술 데이터 관련 발표(주제: 큐레이션, linked data, 어휘 등)

33) LTSC(Learning Technology Standards Committee) : IEEE 산하의 e-Learning 기술표준기관으로, 교육관련 기술 표준화

를 개발, 보급하고 있다.

34) Scientific Metadata: 학술 데이터(연구, 분석, 추적, 예측 등의 용도를 위해 방법론적으로 수집된 데이터)를 기술하기 위한 메타데이터

Page 33: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 31

6. 스페셜 세션

□ 어휘 관리 및 alignment ❍ 일시 : 2011. 9. 21(수), 09:00~17:00 / 네덜란드 국립도서관 ❍ 발표자 : Diane Ileana Hillmann, Thomas Baker, Corey A. Harper, Gordon Dunsire, Johannes Keizer, Jon Phipps ❍ 주요 내용 - 2010년 DC 회의에서, DCMI가 어휘 관리자들간의 협력을 촉진하고, vocabulary

alignment 및 상호운용성에 관한 모범 사례를 제공하는 역할을 수행해야 한다는 제안이 있었음 - linked data 공간에서 유용한 어휘들이 급증하는 것은, 어휘의 재사용(및 이를

가능케 하는 도구)이 증가해야 하고 어휘의 맵핑을 위한 핵심 참조 어휘와 도구가 필요함을 시사하며, 이 목적 달성을 위한 첫 단계로서 최근에 DCMI와 FOAF간의 협력이 발표된 바 있음

- 안건 * 어휘 관리 인프라 (어휘 관리자들의 발표 / 기반, 정책, 전략적 이슈) * 어휘 검색, 맵핑, alignment (어휘 검색 솔루션 / vocabulary alignment 및 맵핑) * 토론 (DCMI의 역할)

□ 미래의 DCMI 출판 계획 ❍ 일시 : 2011. 9. 23(금), 14:00~17:30 / 네덜란드 국립도서관 ❍ 발표자 : Stuart A. Sutton, Thomas Baker ❍ 주요 내용 : DCMI의 현재 및 미래의 출판 요구, 기회, 메커니즘에 대한 방향 모색 - Open Journal System(OJS)과 Open Conference System(OCS) 플랫폼을

활용하여 DCMI의 공식 출판 활동을 확장시키는 것이 DCMI의 사명을 얼마나 효과적으로 지원할 수 있는지를 검토

- DCMI MediaWiki의 현재 및 미래의 역할에 관한 토의 : DCMI의 영향력을 관련 실무를 담당하는 작업그룹 뿐만 아니라, 메타데이터 설계․어휘 관리 및 모범사례 등에 관심 있는 전 세계 사람들에게로 확대할 수 있는 기회를 제공함

Page 34: 더블린코어 메타데이터 국제 컨퍼런스 (DC-2011) 참석 결과보고서 · 시맨틱 웹서비스를 위한 당관 메타데이터 활용 방안 연구 2. 출장지:

도서관연구소 웹진 Vo l . 82 (2012 .2 .15) 도서관으로의 여행기 ⁃출장정보

국립중앙도서관 도서관연구소(KR IL I) 32

Ⅴ 종합의견

❍ 본 회의는 메타데이터의 상호 운용성과 관련된 국제적인 동향을 파악하고, 도서관계 등 각 분야별 Linked Data 추진 현황에 관한 정보를 습득할 수 있는 유익한 시간이었음

❍ 지식의 활용도와 유용성을 극대화하기 위하여 여러 영역간의 데이터 협력 및 공동 이용이 활발해지고 있음. 특히 각국에서 문화유산 관련기관(도서관, 기록관, 박물관 등) 간의 데이터 협력 및 통합 이용이 활발히 추진되고 있으며, 이때 각 분야별 정보의 특성을 살리면서도 데이터를 공동 활용할 수 있는 방안을 적극 모색하고 있음을 알 수 있었음

❍ 최근 많은 도서관이 자관에서 전통적으로 수행해온 지식 조직 활동의 산출물(서지데이터, 전거파일, 주제명표목 등)을 Linked Data로 구현하여 웹상에 공개하고 있음. 이러한 활동은 도서관이 구축한 데이터의 재사용․공유를 가능케 하고 다른 데이터세트와 연결하여 부가가치를 창출할 수 있게 한다는 점에서, 도서관이 지식생태계를 풍요롭게 하는 데에 기여할 수 있는 의미 있는 작업이라 여겨짐