학술데이터 공유 플랫폼_datanest_ccgs2015

30
학술데이터의 공유플랫폼 : Datanest 2015. 10. 15 Dr. 김선태 [email protected] 한국과학기술정보연구원

Upload: suntae-kim

Post on 13-Apr-2017

495 views

Category:

Education


2 download

TRANSCRIPT

학술데이터의 공유플랫폼 :Datanest

2015. 10. 15

Dr. 김선태[email protected]

한국과학기술정보연구원

목 차

• 학술데이터의 공유를 둘러싼Open Paradigm

• 학술데이터의 공유 플랫폼 : Datanest

2

Terms

• 학술데이터 Scholarly Data

• 연구데이터 Research Data

• 과학데이터 Scientific Data

• 연구 과학 데이터 Research Scientific Data

• Data Science

• Open Science

• Open Data

• Open Access

3

연구데이터는 어떻게 만들어 지는가? (1/2)

4

연구데이터는 어떻게 만들어 지는가? (2/2)

5

거대강입자가속기(LHC) 제임스 웹 망원경

미국 중력파 검출장치 ‘LIGO’

연구데이터의 종류

6

연구 패러다임의 변화

7

• 1960년 Peter Naur è ‘computer science’의 대체 용어로 처음 사용. ‘datalogy’ 개념으로 사용

• 2015년 10월 현재 è 구조적 혹은 비구조적인 다양한형식의 방대한 데이터로부터 지식과 통찰력(insights)를 추출하는 분야와 이의 행위를 돕는 시스템과 관련된 다양한 분야

• 데이터 과학은 규모가 큰 빅 데이터에만 특화된 것이아님. 빅 데이터를 처리하기 위한 방법론들은 데이터과학의 특화된 분야 중 하나일 뿐

• 데이터 과학은 비즈니스 환경에서 폭발적으로 사용되고 있지만 많은 학자와 저널리스트들은 ‘데이터 과학’과 ‘통계학’의 차이점이 명확하지 않기 때문에 데이터과학이 부각되는 것을 비판 Data science (출처: https://en.wikipedia.org/wiki/Data_science)

Data Science (1/3)

8

수학, 통계학계량분석화학

정보 과학, 컴퓨터 과학신호처리

가능성 모델기계학습, 통계학습데이터 마이닝

데이터베이스데이터 엔지니어링

패턴 인식과 학습가시화미래분석

불확실성 모델링데이터 웨어하우징

데이터 압축컴퓨터 프로그래밍

인공 지능고성능 컴퓨팅 …

농업의료

마케팅 최적화이상행위 감지

위기관리마케팅 분석

공공 정책 …

기후 변화나 황사, 해양 오염 등 범 지구적문제 해결 노력

다양한 분야에서문제점을 조사하고의사결정을 지원하는데 사용

Data Science (2/3)

9

Data Science (3/3)

• 기후 데이터의 경우, 과거에는 기후 분야를 연구하는 과학자들이 주 사용

• 오늘날에는 물과 공공용지(public land), 건강, 해양 분야등의 자원 관리자들이 그들의 의사결정과 연구를 위해 기후 데이터 접근 요청

• 정책 수립 분야에서도 기후 변화 대응 전략을 수립하기 위하여 데이터 접근 필요

• 기하급수적으로 발생하는 기후 데이터에 대한 물리적인보존과 공유에 대한 이슈가 활발출처: Overpeck, J. T., Meehl, G. A., Bony, S., and Easterling, D. R., “Climate Data Challenges in the 21st Century”, Science, Vol. 331, 2011.

10

Open Science principles

11

(그림출처: https://en.wikipedia.org/wiki/Open_science)

Open Data (1/2)

12

일부 데이터에 한해서 저작권이나 특허와 같은제한 조건 없이 데이터 사용자가 원하는 데로 데이터의 재사용과 재 출판이 가능하도록 하자는운동

이 운동의 사상은 그 역사가 오래 됨해당 용어의 사용은 인터넷과 월드 와이드 웹의도래와 ‘Data.gov’, ‘Data.gov.uk’와 같은 정부의 공공데이터 개방과 발맞추어 시작

두 가지 측면에서 의미- 과학의 활성화 측면- 국가 데이터 개방과 재활용 측면

‘과학 데이터(scientific data)로의 자유로운 접근’ 개념67개국 참여 / 1957년 7월 - 1958년 12월 / IGY(International Geophysical Year) 프로젝트 수행과정에서 세계 데이터 센터(World Data Center) 시스템을 만드는과정에서 공식적으로 탄생

Open Data 키워드를 사용하고 있다. 데이터 공개와 재 사용성을 보장하기 위해서는 데이터의 체계적인 관리 필요

Open Data (2/2)

13

오픈 데이터는오픈 사이언스를 가능케 하는 핵심 원칙 중 하나

데이터 중심 연구를 지원 과학의 활성화를 가능케 하는 운동

오픈 데이터와 오픈 사이언스를 통해다양한 범 지구적 문제를 해결할 수 있는 협동연구 가능

황사나 기후 변화와 같은 범 지구적 문제해양 오염이나 생태계 변화 등의 환경 문제는한 분야의 데이터 뿐 아니라기상, 해양, 천문, 지리정보, 생태 등 다양한 분야의 데이터를융합하여 분석함으로써 해결 가능

주요 선진국은공공자금이 투입된 연구 결과물의 체계적인 관리와 재사용을 보장하기 위해서연구 데이터(research data) 관리

이러한 저변 노력이 오픈 데이터와 오픈 사이언스 운동을 활성화 시킬 것

Open Access

14

연구자에게 다가올(?) 세상

15

연구자는 무엇을 원하는가?

16

데이터의 중요성과 접근성

17

SCIENCE 저널 – Data 설문조사

18

SCIENCE 저널 – Data 설문조사

19

SCIENCE 저널 – Data 설문조사

20

SCIENCE 저널 – Data 설문조사

21

SCIENCE 저널 – Data 설문조사

22

What is Datanest ?Research Data Repository

23

DatanestData Model Architecture

24

Object Relations

25

Datanest Major Modules

26

DatanestData Mgmt. Process

27

Datanest System Architecture

28

Datanest Lifecycle Actors’ Role

29

경청해 주셔서 고맙습니다.

Q & A30