4세대 r&d 패러다임과 도서관 서비스

67
2011 KORSA Workshop ‘ 미미 미미미미 미미’ 3,000 sec. 66 p. 45.4545 sec

Upload: suntae-kim

Post on 25-Jan-2015

850 views

Category:

Education


6 download

DESCRIPTION

2011 KORSA 발표자료 입니다. 많은 분들에게 도움이 되었으면 합니다.

TRANSCRIPT

Page 1: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

3,000 sec.

66 p.

45.4545 sec

Page 2: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

4 세대 R&D 패러다임과 도서관 서비스

2011. 9

한국과학기술정보연구원김선태 [email protected]

Page 3: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

3

목 차

• Prologue 연구데이터 ? 연구자들의 인식 , 환경변화 , 4 세대 연구패러다임

• Questionnaire SCIENCE, EU Parse.Insight, KISTI

• 과학데이터 관련동향 국가 , 연구기관 , 출판사 etc.

• 과학데이터의 수명주기와 출판• 과학데이터 관리 솔루션 사례 eSciDoc, Dataverse

• 과학데이터 서비스 사례 ED, PANGAEA

• 과학데이터 관련 연구 제안 국가 , 기관 , 개인차원의 연구

Page 4: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

Prologue

Page 5: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

5

Prologue: 연구데이터와 과학데이터

Research Data VS.

Scientific Data

Page 6: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

6

Prologue: 과학데이터

과학 기술 활동의 결과 - 관측 (observation) by 망원경 , 전자현미경 , 인공위성 등- 감시 (monitoring) by 센서 등- 조사 (investigation) by 설문조사 , 기술 / 시장조사 등- 실험 (experiment) by 가속기 , 화학 / 바이오 실험장비 등- 연구 분석 (research analysis) by 분석도구 등- 계산 (computation) by 슈퍼컴퓨터 등

< 출처 : Jinpei Cheng, http://www.nap.edu/catalog/11710.html>

형태 (type)- 수치 (numerical)- 공간 (spatial)- 도표 (graphical)- 문서 (text) 등

형식 (format) 복잡하고 범위가 넓다

Page 7: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

7

Prologue: 과학데이터 구분구분 내용

연구 데이터 컬렉션(research datacollections)

◦ 단일 혹은 복수의 연구 프로젝트에서 생성되는 데이터에서 파생◦ 원시 데이터의 가공 및 큐레이션 기능이 거의 없음◦ 이용자가 소수이거나 재정 지원 부족 등으로 인해 연구자가 프로젝트 종료 이후에 데이터를 유지할 의사가 대부분 없음 .

자원 혹은 커뮤니티데이터 컬렉션(resource or communitydata collections)

◦ 단일 학문 집단이나 세부 연구 주제를 대상으로 구축◦ 대개 학문 집단 수준의 표준에 부합하며 해당 표준의 선택이나 구축에 중요한 역할을 했을 가능성이 있음 .◦ 연구지원기관은 데이터 컬렉션의 유지를 지원하고 있으나 정책 변화의 가능성 때문에 지원 기간은 불투명함 .

참조데이터 컬렉션(reference datacollections)

◦ 다양한 분야와 기관에 있는 연구자 , 학생 , 교사를 포함한 대단위의 이용자 커뮤니티를 대상으로 구축◦ 장기적인 재정 지원 , 표준 및 관례에 대한 부합 , 그리고 전문적인 관리가 참조데이터 컬렉션에 구축에 필수적임 .

< 출처 : 미국 NSB(National Science Board) 보고서 >

Page 8: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

8

Prologue: 지금까지는

출처 : http://bit.ly/qv5j8f출처 : http://bit.ly/pgKWzT

Page 9: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

9출처 : http://bit.ly/pgA4lr

Prologue: 시대가 변하면서

Page 10: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

10

출처 : http://bit.ly/pgA4lr

Prologue: 시대가 변하면서

Page 11: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

11출처: http://acurx.tistory.com/1

Prologue: 시대가 변하면서

Page 12: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

12출처 : http://bit.ly/pthIBr

Prologue: 시대가 변하면서

Page 13: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

13

low frequency → high frequencylow resolution → high resolutionsmall range → wider range

Prologue: 하드웨어가 발달하면서

Page 14: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

14

• We are the ONE !– Climate Change, 황사 , 해양 오염 등 범 지구적 문제

• We have to SHARE !– 대형 장비의 공동 활용– Human Genome 등 연구 결과의 공유

• 그리고 이 모든 것의 중심에는 Scientific DATA 가 있다 !!!

Prologue: 그래서 이렇게

Page 15: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

15

Prologue: 그래서 이렇게

2

22.

3

4

a

cG

a

a

Empirica

l

Theoretic

al

Computatio

nal

Data-ce

ntric

Page 16: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

Questionnaire

Page 17: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

17

SCIENCE Questionnaire 1/6

56.0%

당신의 연구를 위해서타 연구자가 생산한 데이터를 얼마나 자주사용 ?

Page 18: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

18

SCIENCE Questionnaire 2/6

48.3%

당신이 사용하거나 생산하는 데이터의 최대 용량은 ?

Page 19: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

19

50.2%38.5%

SCIENCE Questionnaire 3/6

데이터를 주로 어디에 보관 ?

Page 20: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

20

76.4%48.7%

SCIENCE Questionnaire 4/6

당신은 동료연구자에게 그들의 데이터를 요청한 적이 있는가 ?

Page 21: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

21

Only8.8%

SCIENCE Questionnaire 5/6

당신 Lab 이나 연구그룹의데이터 큐레이션을 위한 예산 지원은 충분 ?

Page 22: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

22

Only26.5%

SCIENCE Questionnaire 6/6

당신이 원하는 방식으로데이터를 분석해 줄 전문가가당신의 Lab 이나 그룹에 있는가 ?

Page 23: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

23

과학데이터에 대한 연구자들의 인식

EU 프로젝트 Parse.Insight 결과 :

• 80% 연구자는 타 연구자의 데이터를 사용하고자 함• 겨우 20% 연구자만 데이터 공유를 하고자 함• 40% 연구자는 공유하는데 문제를 가지고 있음 (distrust, legal

and privacy issues)

KISTI 조사 결과 :

• 응답자 62% 가 과학데이터 보유 , 이 중 66% 는 엑셀 등 개인이 관리• 과학데이터는 주로 공유하지 않거나 (30%), 폐쇄된 커뮤니티 내에서

공유 (59%)

• 신뢰성있는 과학데이터가 제공될 경우 90% 가 활용 의사를 보임

Page 24: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

과학데이터 관련 동향

Page 25: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

25

연구비 지원기관 및 연구기관• 연구비 지원기관

- 미국 미국과학위원회 (NSF), General Grant Conditions(2007) 외 11 개 분야 정책 수립- 영국 공학자연과학위원회 (EPSRC), Funding Guide(2008) 외 7 개 분야 정책 수립

- 그 외 캐나다 , 핀란드 , 프랑스 , 스페인에서 정책 수립

• 연구기관 ( 대학 및 연구소 )- 미국 하버드대학교 / DataVerse 개발 및 보급- 핀란드 CSC's PÄTEVÄ project / 과학데이터 공동구매 컨소시엄 운영- 영국 Edinburgh Univ. / Information Services (IS) 제공- 독일 TIB / DataCite 컨소시엄 운영 . 9 개국 12 개 기관 참여 중- 독일 FIZ-Karlruhe 와 MPS / eSciDoc, 데이터 공유 및 활용 오픈소스 제공- 미국 DoE 산하 SDMC / LBNL 7 개 기관 연합 , 데이터 분석 도구 및 기반 기술 개발- 캐나다 CISTI / 캐나다 생산 과학데이터 수집 , 구축 , 서비스- 유럽 PANGAEA / 185 개 프로젝트 데이터서비스

Page 26: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

26

프로젝트 사례

• Incremental project(2009.11-2011.03) 를 통해 직접 연구데이터가 생산되는 곳에 DCC 연구그룹이 파견되어 기존 툴을 사용하도록 하고 실제 데이터를 구축 , 관리 하는데 필요한 일련의 프로세스를 함께 하면서 이론적인 것과 실제의 차이를 극복해 나가고 있음 .

• ERIS (Enhancing Repository Infrastructure in Scot-land) 는 JISC 에 의해 예산이 지원 . 2011 년 3 월 종료 . 연구자와 리포지터리 관리자의 긴밀한 협력을 통해 연구자 중심의 인프라스트럭처를 구축할 수 있는 솔루션 개발이 목적

• Open Science Case Studies 는 2009 년 11 월부터 2010 년 2 월까지 수행된 짧은 기간의 프로젝트로서 연구데이터와 결과물 공개에 있어서 무엇이 연구자에게 돌아가는 혜택인지를 연구한 프로젝트

Page 27: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

27

국제 사회에서도… ..독일 DFG (Vision of the Research Councils)

Research data should be freely accessible, they should be easy to get and they should be professionally curated on a long-term basis. < 출처 : http://bit.ly/o488Y6>

미국 : (2009 IWGDD 보고서 )-국가과학기술원원회 (NSTC) 산하에 디지털 과학데이터 보존 , 접근 , 상호운용을 위한 위원회 신설 제안

호주 : -ANDS, ARCS

유럽연합 : -DRIVER, PARADE, PARSE.Insight

중국- SDSP

Page 28: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

28

•한국과학기술정보연구원• 생물다양성 데이터 , 화합물 , 유전자 , 단백질 , 무기결정구조 (9 만건 ),

플라즈마 물성 (14 만건 ), 디지털코리언 , 전통한의학 , 식품 , 천연물질 DB 등

과학데이터 수집 및 제공

• 대용량실험데이터 구축 및 제공

• 가상세포 , 생태 데이터 축적 및 시뮬레이션 , 데이터 가시화 등 과학 데이터 관련

과제 수행

•한국표준과학연구원 국가참조표준센터• 국가적으로 개발능력이 있고 , 필요한 분야에서 총 17 개 데이터 센터 지정 ,

협력

국내 현황

Page 29: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

29

주요 국제 동향

과학데이터를 위한체계적인 국가적 인프라구축ANDS, ARCS, 중국 NSTI

과학데이터의 글로벌 유통체제 선도NASA GCMD, TIB DataCite

과학데이터 보존 및 공유연구자 분석 및 교육JISC, DCC, PARSE.Insight

자국의 과학데이터 수집 및 게이트웨이 서비스CISTI, ANDS

Page 30: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

과학데이터 Life Cycle Publication

Page 31: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

31

과학데이터의 수명주기Capture : 데이터획득 Curation : 데이터 처리 , 평가 , 선정 , 보존 ,

접근

Visualization : 가시화Analysis : 데이터 마이닝 , 시뮬레이션

Publish : 논문 /데이터

산업화 : 데이터 / 제품 / 공정

Page 32: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

32

과학데이터 출판 1/2

• 데이터관리 및 논문과의 연계를 위한 식별자 부여• 국제공인 사이트에 등록하여 접근성 보장• R&D 결과 데이터 보존

Page 33: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

33

ScienceDirect 논문정보 ScienceDirect

논문정보 상세페이지

PANGAEA과학데이터 서비스

PANGAEA 에서 과학데이터 검색 후논문정보 연결 가능

ScienceDirect논문정보

과학데이터 출판 2/2

Page 34: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

34

출판사 및 상업 포탈

세계 STM 출판 연합회 – 70% 의 출판사 , 90% 저널이 데이터를 받고 있음– 95% 출판사는 논문을 데이터에 연결시키고 있음– 5% 미만의 출판사가 데이터세트를 관리하기 위한 인프라 보유– 60% 출판사는 데이터세트 유지 및 관리 책임이 저자나 연구기관에

있다고 생각하고 있음

상업 포탈– 구글 : 2008 년부터 Public Access Scientific Data 서비스

선언 – 마이크로소프트 : Scientific Data-Set Library and Tools

개발 보급

Page 35: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

과학데이터 관리 솔루션 사례

Page 36: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

36

eSciDoc 1/3: 데이터의 흐름Idea, sketchProject proposalsPre-studies

Raw data Protocols of experiments

Pre-PrintsJournal articlesConference proceedingsDissertations, ReportsBooksMulti media objects

Teaching materialTextbooks

Patents

Processed DataCommunication (Wikis, Blogs)

Data Storag

ePublications Research data

< 출처 : https://www.escidoc.org/>

Page 37: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

37

eSciDoc 2/3 : 가상 연구 환경

Continuum of Data

IdeaExploration

Data Acquisition Experiment

AggregationAnalysis

PublicationArchiving

eSciDoc Infrastructure

eSciDoc Solutions, services, and existing tools

Collaboration

< 출처 : https://www.escidoc.org/>

Page 38: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

38

eSciDoc 3/3: 컴포넌트 구성

< 출처 : http://bit.ly/oYtunZ>

중복조사 검색 / 색인

Tech. Info 자동추출

자원배포

각종 통계 계정관리객체관리

Page 39: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

39

Dataverse 1/3: Hosting serviceDataverse Network 은 여러 개의 Dataverse 를

호스팅 함각각의 Dataverse 는 여러 개의 연구 (study) 와 연구들의

컬렉션을 가지고 있으며 각각의 연구는 데이터를 기술한 목록정보 (cataloging information) 와 실제 데이터 파일 그리고 부수적인 파일들을 가지고 있음

Page 40: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

04/10/2023 Research Data = Scientific Data 40

Dataverse 2/3: A DataVerse Network

• 연구데이터를 출판 , 인용 , 발견 (discovering) 하기 위한 오픈 소스 응용프로그램으로서 연구데이터 추출 및 분석까지 지원한다 .

• 타 연구자와 데이터를 공유하며 , 타 연구자의 연구데이터를 복제하는 것도 허용

History • The Dataverse Network Project is housed at the

Institute for Quantitative Social Science (IQSS). • 2006 년부터 개발 착수• 지금은 IQSS 의 일부가 된 Harvard-MIT Data Center 와 Harvard

University Library 가 함께 , 1999-2006 년 동안 수행한 가상데이터센터 (Virtual Data Center, VDC) 경험이 큰 밑 걸음이 되었음

Page 41: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

41

Dataverse 3/3: 5 Features among 17

Features http://thedata.org/book/features

• 루씬 검색서버를 통한 모든 Dataverse 통합검색 제공• 식별자 정보를 포함한 ‘공식적 데이터 인용사항’ 제공 및 데이터 셑

검증과 유효성 체크용 Universal Numerical fingerprint 제공• SPSS and STATA 파일포맷에 대한 분석서비스 제공 • Contributors, curators and admins 계정이 추가 될 수 있음• 타 dataverses 의 컬렉션 추가others

• 다양한 유형의 데이터 반출포맷 지원 : DDI, Dublin Core, FGDC,

Marc / z39.50 지원< 출처 : https://www.escidoc.org/>

Page 42: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

과학데이터 서비스 사례

Page 43: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

43

ED Univ. Information Services 1/7

Page 44: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

44

ED Univ. Information Services 2/7

Page 45: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

45

ED Univ. Information Services 3/7

연구데이터 목록검색 서비스- 데이터 검색- 주제별 검색- 지역별 검색- 데이터출판사별 검색

Page 46: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

46

ED Univ. Information Services 4/7

Page 47: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

47

ED Univ. Information Services 5/7

IS 가 구독하는 데이터에 대한 설명-IS subscribes to the following EDINA services

사회과학분야에서 구독중인 데이터 설명-Economic and Social Data Service (ESDS) International-Eurostat 포함해서 10 개의 데이터 제공처와 특징설명

강의에 활용할 수 있는 데이터 설명- 구글이미지 , 교육이미지갤러리 , VSM 포털 등

데이터활용 교육과정 설명

데이터와 관련된 온라인 학습사이트와 교육용 학습자료안내

Page 48: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

48

ED Univ. Information Services 6/7

연구데이터는 어떻게 관리되어야 하는가 ?- 왜 관리해야 하는지 ? 연구데이터의 정의- 예산지원기관의 정책 . 데이터 관리계획- 데이터문서화 및 메타데이터 . 데이터저장 및 백업

데이터공유 및 보존-왜 데이터를 공유하는가 ? 데이터공유방법-접근 및 이용제한 . 장기보존 . 데이터기탁

교육과 지원- 교육과정- 데이터관리를 위한 여러 가지 툴과 유틸리티 제공

Page 49: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

49

ED Univ. Information Services 7/7

고성능 컴퓨팅-Eddie 라고 알려짐- 연구자들의 계산관련 요구사항 지원- 병렬컴퓨팅으로 빠른 계산지원- 정신과학 분야 뇌 영상 스캔파일 처리 28 시간 VS. 469 일

Page 50: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

과학데이터 서비스 사례

Page 51: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

PANGAEA® 1/4: 개요

• Open Access 라이브러리로 운영되는 정보 시스템

• 지구시스템 연구로부터 지구참조 데이터를 보존 , 출판 , 배포하는 것을 목적으로 함

• 모든 콘텐트에 대한 장기보존을 보장

• 2011 년 8 월 15 일 현재 185 개 프로젝트 데이터를 서비스 하고 있음

• < 출처 : http://www.pangaea.de/projects/>

Page 52: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

52

• 세계 해양 환경 과학 데이터센터 (The World Data Center for Ma-rine Environmental Sciences, WDC-MARE) 는 PANGAEA 를 데이터 아카이빙과 배포 시스템으로 사용하고 있음

• Earth System Science Data (ESSD) 저널의 아카이브로 지정되었음 .

PANGAEA® 2/4: Archive and Distribution System

Page 53: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

53

• 과학데이터의 해석 , 가시화 , 탐색을 위해 여러 가지 소프트웨어를 제공하고 있음

• 제공되는 툴들은 무료이며 , PANGAEA 정보시스템과 함께 사용되는 것이 권고되고 있음

PANGAEA® 3/4: Software

Page 54: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

54

• 데이터 관리 및 아카이빙 정책은 아래 기준을 따름Principles and Responsibilities of ICSU World Data CentersOECD Principles and Guidelines for Access to Research Data from Public Funding.

• PANGAEA data library 에 데이터를 제출하는 저자들은 모든 데이터가 creative commons license. 를 적용하여 제공된다는 데 동의함A. Principles and Responsibilities of ICSU World Data Centers1) WDCs in the United States are designated as WDCA, in Russia as WDC-B,

in other European countries as WDC-C or WDC-C1, in Japan or India as WDC-C2, and in China as WDC-D

2) WDC 운영에 필요한 자원은 해당 국가나 나라에서 전담3) 데이터 가용성 및 백업을 위해 WDCs 사이 데이터 교환4) WDC 안에는 보안과 관련된 데이터가 존재하지 않음5) 데이터 사용에 있어 최초 생성자에게 우선권이 있으나 WDC 에 의해 수집된 이후 2 년을

초과할 수 없음6) WDCs 는 모든 국가의 연구자에게 데이터를 무료로 제공하며 , 비용이 발생 하더라도

데이터 복사나 전송에 필요한 비용을 초과하지 않는다 .

PANGAEA® 4/4: Data Policy

Page 55: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

과학데이터 관련 연구제안

Page 56: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

56

The Rutgers University Libraries 1/2

• The Rutgers University Libraries, New Jersey– 이미 운영하고 있는 IR 확장을 통한 연구데이터 관리를 제안

(Fedora Commons repository software)– 연구자 지원을 위한 전문가로 구성된 조직구성의 필요성 제안– Rutgers research data portal 운영 중– METS(Metadata Encoding and Transmission Standard)

어플리케이션 프로파일을 이용해서 자원을 관리– The RUcore application profile includes events 무슨 이벤트가 발생했는가 ? 이벤트와 관련된 사람은 누구인가 ? 이벤트와 관련된 자원은 무엇인가 ? 언제 , 어디에서 이벤트가 발행하였는가 ?

Page 57: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

57

The team consists of members with expertise in • 저장소 프로그래밍 , 디자인• 디지털 큐레이션 , 메타데이터 , 프로젝트 관리• 지적 재산권 관리 , 연구자와의 커뮤니케이션

팀을 구성하는 전문가들은 데이터와 관련하여 다양한 전문성을 가지고 있으나 , 연구데이터의 속성 (the nature of research data) 에 대한 공유는 매우 중요함

• how it is created• how users will work with data• how it can be organized• how it can be managed• how it can be sustained in the repository.

The Rutgers University Libraries 2/2

Page 58: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

58

University of California

캘리포니아 디지털 도서관의 부속인 캘리포니아 대학 큐레이션 센터는 많은 연구자들이 연구데이터를 관리하는데 사용하는 엑셀의 확장기능 개발을 위해 아래 기관과 공동연구를 기획하고 있음

• University of California (UC) researchers• the National Science Foundation (NSF) DataONE

community• Microsoft (MS) Research• to create an open-source MS Excel extension

(“add-in”),

Page 59: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

59

앞으로 해야 할 일• 국가 및 연구비 지원기관 , 기관차원의 데이터 보존 및 영속적 접근을

보장하는 정책개발

• 국가차원의 연구데이터 공유활용체제 구축

• 기관에서는 문헌데이터 제공 서비스는 기본 연구데이터 관리시스템 개발 Legacy 시스템과의 연동 서비스개발 연구데이터 통합검색 및 활용 인프라 구축 이제는 데이터 공동구매 및 제공

• 데이터 수집 및 활용을 위한 이용자 교육프로그램 개발

• 데이터 분석가 양성 및 현장지원

Page 60: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

60

우리에게 필요한 연구 1/3

국가차원의 연구

• 국제적인 과학데이터 유통 서비스 연구

• 국가과학데이터 공유융합 체제구축 연구

• 데이터 공개 정책 및 보상체계 연구

• Small Scale Win 프로젝트 수행

Page 61: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

61

우리에게 필요한 연구 2/3

기관차원의 연구

• 데이터 공개 정책 및 보상체계 연구

• 연구자 요구사항 도출 및 서비스 로드맵 수립

• 문헌과 데이터의 통합서비스 연구

• 외부 자원 연계서비스 개발

• 데이터 수집활용을 위한 교육프로그램 개발

• Small Scale Win 프로젝트 수행

Page 62: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

62

우리에게 필요한 연구 3/3

개인 연구자 차원

• 기록물 측면에서의 과학데이터 관리 및 활용방안 연구 (NAK/S 8:2007(v1.0) 대비 )( 데이터도 기록물이라는 관점에서의 연구 )

• 문헌정보 ( 학술논문 , 보고서 등 ) 와 연구데이터의 연계방안 연구 ( 관련연구 : Data Library, LAIRD: Linking Articles into Research Data)

• 연구데이터의 관계기술을 위한 용어 연구 ( 관련 자원의 발견 서비스 )

• 원시데이터 (Raw Data) 검색 연구 ( 논문의 Full-Text 색인 )

• 과학데이터의 Linked Data 제공방안 연구 ( 데이터의 글로벌 유통과 확장 )

• 시스템 간 과학데이터 검색을 위한 CQL 개발 연구 ( 시스템 상호운용성 확보 )

• 과학데이터 식별을 위한 Z39.88 메타태그 확장 및 Z39.88 의 OpenAPI 검색 확장 연구 ( 문헌정보 중심의 서비스에 데이터 서비스 확장 , OpenAPI 통합 인터페이스 개발 )

Page 63: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

63

과학데이터 보존 및 활용모델

< 출처 : http://bit.ly/qNc695>

Page 64: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

64

As we move into the second decade of the 21st cen-tury, we face an extraordinary range of challenges— healthcare, education, energy and the environment, digital access, cyber-security and privacy, public safety, and more.

If we are to achieve dramatic breakthroughs, new approaches will be required. We need to embrace the next, fourth paradigm of science, called for a new scientific methodology focused on the power of data-intensive science.

CRAIG MUNDIE, Microsoft, in the 4th paradigm

Page 65: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

65

< 그림출처 : Google 이미지 >

고맙습니다 !

Page 66: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

66

참고문헌• 김선태 외 3 인 . “ 과학데이터 보존 및 활용모델에 관한 연구 .” 한국비블리아학회지 , 제 21 권 , 제 4

호 (2010)• 김선태 , 이태영 . “ 관측분야 과학데이터 관련 메타데이터 상호운용성 확보를 위한 OpenURL

메타태그 연구” , 정보관리연구 , 제 42 권 제 3 호 (2011)• 김선태 , 이태영 . “ 연구데이터 관련 OpenURL 학술 서비스유형 메타태그 확장 연구” ,

정보관리연구 , 제 42 권 제 4 호 (2011) ( 발행예정 )

• Agnew, G. and Womack, R. (2011). Managing Research Data Lifecycles through Context. Rutgers University

• Cruse, P., Kunze, J. and Strasser, C. (2011). An Excel Add -in to Make Scientific Data Publishable, Shareable and Archiveable. University of California Curation

• Science Staff. “Challenges and Opportunities.” Science, Vol.331, No.6018(2011), pp.692-693.

• Joan Starr. “DataCite Metadata Kernel for the Publication and Citation of Research Data.” DataCite Metadata Working Group, 2010

• Toby Green. “We Need Publishing Standards for Datasets and Data Tables.” 2009• Tom Kuipers, Jeffrey van der Hoeven. “PARSE insight: Insight into digital preserva-

tion of research output in Europe - survey report.” 2009• Mark Ware, Michael Mabe. "An overview of scientific and scholarly journal publish-

ing." The stm report, 2009

Page 67: 4세대 r&d 패러다임과 도서관 서비스

2011 KORSA Workshop ‘ 미래 도서관의 전망’

67

참조 싸이트• eSciDoc start page https://www.escidoc.org/• The Dataverse Network Project http://thedata.org/• PANGAEA http://www.pangaea.de/• The University of Edinburgh Information Services http://bit.ly/o3Hljn• Strategies for Preservation of and Open Access to Scientific Data in

China:• Summary of a Workshop http://bit.ly/ommleR• Z39.88-2004: The OpenURL Framework for Context-Sensitive Services

http://bit.ly/fRJxpZ• The data deluge http://econ.st/fIQR7G • Data, data everywhere http://econ.st/eNjRcn• Announcing launch of Release 6.1.2 of RSC Publishing Platform

http://bit.ly/gERVuN• CQL: Contextual Query Language (SRU Version 1.2 Specifications)

http://1.usa.gov/lcbz0C • Elsevier Announces the “Article of the Future” http://bit.ly/dF7jSB • The Directory of Open Access Repositories - OpenDOAR http://opendoar.org/