オープンサイエンスを支えるデータライブラリアン...

44
オープンサイエンスを支える データライブラリアン 池内 有為 筑波大学大学院図書館情報メディア研究科 [email protected] http://oui-oui.jp 16回図書館総合展 大学の知の発信システムの構築に向けて - 機関リポジトリの新たな可能性を探る 2. 研究データへのアプローチ:エジンバラ大学図書館の実践事例を中心に 2014 6th Nov.

Upload: ui-ikeuchi

Post on 05-Jul-2015

672 views

Category:

Science


3 download

DESCRIPTION

第16回図書館総合展(2014)の下記フォーラム発表スライドです。 大学の知の発信システムの構築に向けて - 機関リポジトリの新たな可能性を探る 2. 研究データへのアプローチ:エジンバラ大学図書館の実践事例を中心に http://2014.libraryfair.jp/node/2113

TRANSCRIPT

Page 1: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

オープンサイエンスを支える データライブラリアン

池内 有為 筑波大学大学院図書館情報メディア研究科 [email protected] http://oui-oui.jp

第16回図書館総合展 大学の知の発信システムの構築に向けて - 機関リポジトリの新たな可能性を探る 2. 研究データへのアプローチ:エジンバラ大学図書館の実践事例を中心に

2014 6th Nov.

Page 2: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

オープンサイエンスの動向

Page 3: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データの洪水

3 Data Deluge

The Economist. Feb 25th 2010

Giddings, J. Five top reasons to protect your data and practice safe. http://goo.gl/q4Pb1y

2年

35 ZB (2020)

Unlocking the Value of Research Data: A Report from the Thomson Reuters Industry Forum July 2013, p.3 .

0.7ZB (2009) �

Page 4: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

研究データ共有

4 Research Data Sharing

“Technical Infrastructure needed for Big New Biology to fully emerge” Data issues in the life sciences. ZooKeys. 150, p.15-51. �

Fienberg, S.E. et al. Sharing Research Data. 1985, 234p.

Page 5: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

研究の効率化

5

ヒトゲノムプロジェクト アトラス実験(ヒッグス粒子の発見)

GEOSS(全球地球観測システム) ヴァーチャル天文台

Efficiency

Page 6: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

研究開発費

6 Research and Development Funding 2014 Global R&D Funding Forecast. 2013, p. 6. http://www.rdmag.com/sites/rdmag.com/files/gff-2014-5_7%20875x10_0.pdf

トップ40ヶ国で 1兆5,760億ドル

Funding

Page 7: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

失われるデータ

7 Vines, T H; et al. The availability of research data declines rapidly with article age. Current Biology. 19 December 2013, http://dx.doi.org/10.1016/j.cub.2013.11.014 Missing Data

20年で8割(n=516)

Page 8: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

研究の透明性の向上

8

Wadman, M. 医学生物学論文の70%以上が、再現できない! 三枝小夜子訳. Natureダイジェスト. 2013, 10(11), p. 28-29.

Policy: NIH Plans to enhance reproducibility. Nature. 2014. Vol. 505, Issue 7485.

Transparency

Page 9: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

研究データ公開の義務化・要求

9 Policies and Mandates

Page 10: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

市民科学の拡大

http://goo.gl/ioBVY2

10 Citizen Science

NCBI GEO DataSets

Butte, A, Translating a trillion points of data into therapies, diagnostics and new insights into disease. IDCC2014. http://goo.gl/sA54Q3

Page 11: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

オープンサイエンスの動向 1.  技術やインフラの向上

2. データ公開による効率化と信頼性の向上 3. データ公開の義務化

4. 市民科学の拡大

11 Research Data Sharing

Page 12: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

なぜ大学図書館が支援するのか?

Page 13: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データマネージメント計画(DMP)

13 Ferreira, F. et al. Data governance in e-science. LIBER conference 2014. http://goo.gl/n0fbo2 より作成 Data Management Plan

DMPのセクション 英国 DCC

豪州 ANU

米国 NSF(Eng.)

米国 NSF(Bio.)

倫理とプライバシー ● ● 予算 ● ● データ共有とライセンシング ● ● ● ● データストレージ/保存/ セキュリティ ● ● ● ● データの所有者とステークホルダー ● ● ● 責任 ● ● ● データ形式とメタデータ ● ● ● ● 研究の生産物/文献 ● ● ●

Page 14: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

既存のデータリポジトリ

14 Data Repository

Page 15: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データの登録先

15

�������� !" #��$%&$'"

��������� ����������������������

���

���

���

���

���

�� ��������� ��

����� �������������������� ������������� ����� �!"

#������������� ��� �� ���������� ����

������������ ��

$����

��������������� ��������� ��������������� ��������� � �� ����������������������� ���������������� Robinson, N.

Discovery, Access, and Citation of Published Research Data. 2013.�Data Repository

Page 16: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

研究データ共有の障壁

http://www.youtube.com/watch?v=N2zK3sAtr-4

資金

技術

時間

移行

機密

倫理

基盤

永続性

Barriers

著作権

認識?

Page 17: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

大学のデータリポジトリ

17 University Data Repository https://purr.purdue.edu

Page 18: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データジャーナル

18

Philosophical Transactions The Royal Society http://rstl.royalsocietypublishing.org

Scientific Data Nature Publishing Group http://www.nature.com/sdata/

Data Journal

Page 19: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データの引用

19 Data Citation

Page 20: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データの業績化・評価

20

NSF(米国国立科学財団) 2013年1月から業績としてデータが記載可能に “Publication” → “Products” “GPG Summary of Changes”. NSF 13-1 January 2013

Hahnel, M. The reuse factor. Nature. 502(7471), p.298. doi:10.1038/502298a

Evaluation and Impact

Lin, J. Making data count. PLoS Blogs. Oct 7, 2014, http://goo.gl/JBOkjB

Page 21: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

なぜ図書館が支援するのか? 1. 助成機関によるデータ管理計画の義務化 –  研究資金獲得

2. 技術的支援のニーズ –  資料の組織化や機関リポジトリ運営,研究支援の経験

3. データ引用・業績化 –  学術情報流通の変化 –  研究者・大学の評価向上につながる可能性

21 Supporting Researchers

Page 22: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

海外の動向

Page 23: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

米国の状況:機関リポジトリ

23 Antell, K; et al. Dealing with data: science librarians' participation in data management at Association of Research Libraries institutions. C & R L. 2014, 75 (4) , p. 562より作成

※ARL(北米研究図書館協会)加盟館の図書館員を対象とした2012年の調査

Page 24: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

米国の状況:データリポジトリ

24 Antell, K; et al. Dealing with data: science librarians' participation in data management at Association of Research Libraries institutions. C & R L. 2014, 75 (4) , p. 562より作成

※ARL(北米研究図書館協会)加盟館の図書館員を対象とした2012年の調査

Page 25: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

米国の状況:データ管理支援

25 Antell, K; et al. Dealing with data: science librarians' participation in data management at Association of Research Libraries institutions. C & R L. 2014, 75 (4) , p. 562より作成

※ARL(北米研究図書館協会)加盟館の図書館員を対象とした2012年の調査

Page 26: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データ管理支援サービス

26 Research Data Management Service

Page 27: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データ管理計画作成支援ツール

27 Research Data Management (RDM) tool

DMPTool UC https://dmp.cdlib.org

DMPonline DCC https://dmponline.dcc.ac.uk

Page 28: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

大学のデータリポジトリ

28 University Data Repository

Page 29: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

大学のデータリポジトリ

29 University Data Repository http://www.dcc.ac.uk/resources/external/category/repository-platforms

Page 30: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データ共有を支える国際機関

30

デジタルキュレーションセンター

研究データ同盟

Organizations for Research Data Sharing

国際科学会議:世界データシステム

Page 31: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

大学図書館による支援内容

1. 研究データ管理支援 –  Webサイト –  ガイダンス

2. 「データ管理計画(DMP)」作成支援

3. データリポジトリの運営

31 Supporting Research Data Management

Page 32: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

機関リポジトリ推進委員会の調査

32 Coming Soon!

Page 33: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

日本の状況

Page 34: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

研究不正への対応

34 http://www.mext.go.jp/b_menu/houdou/26/08/1351568.htm Scientific Misconduct

Page 35: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

研究不正への対応

35 Scientific Misconduct

症例データレポジトリ UMIN-ICDR 東京大学附属病院 2013年11月~

“臨床研究不正防止のために”

2014年11月6日 http://goo.gl/4RIqMS

データ保存の法制化?

Page 36: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

データ協力依頼(≠義務化)

36

事業や補助金 掲載開始年

文部科学省委託事業 2008年度~

JST戦略的創造研究推進事業 さきがけ、CREST 2011年度~

厚生労働省科学研究費補助金 2011年度~

科学研究費助成事業(特別推進、基盤、挑戦、若手) 2012年度~

JST戦略的創造研究推進事業(ALCA) 2013年度~

高祖歩美. 生命科学分野におけるデータ共有の現状と課題. 情報管理. 2013, 56(5), p.296より作成 Funders

Page 37: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

分野リポジトリ

37 http://ssjda.iss.u-tokyo.ac.jp Data Repository

Page 38: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

機関リポジトリ

38 http://www.nii.ac.jp/irp/list/ Institutional Repositories

379 2014年10月31日現在

Page 39: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

JaLC:研究データへのDOI付与

39

研究データへのDOI登録実験プロジェクト

DOIs for Research Data

Page 40: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

日本の大学の状況 1.  研究不正への対応

2. 助成機関等による義務化の可能性

3. 機関リポジトリ等の活用

40 Research Data Management in Japan

Page 41: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

研究データ管理の疑問点

Page 42: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

42

Published Publishing

文献 データ

Supporting Data Publishing

Page 43: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

43

データ形式・サイズ どんなデータがどれくらい集まる? いつまで保存すればいい?

導入コスト ストレージは? スタッフ数は?

データリポジトリの最適な運営 機関リポジトリ or 専用リポジトリ(CKAN)? メタデータはDataCite or DC? セキュリティやライセンシングは?

研究者へのアドボカシー 研究データ管理の重要性を理解しているのか? どうやってデータを登録してもらうのか?

図書館員に必要な知識と技術 サブジェクトライブラリアンなしでも大丈夫?

Page 44: オープンサイエンスを支えるデータライブラリアン 第16回図書館総合展(2014)

44 http://www.ed.ac.uk/schools-departments/information-services/research-support/data-library

Since 1983