esj62自由集会・オープンデータからオープンサイエンスへ

36
ESJ62自由集会:オープンデータと生態学 2015/03/21 オープンデータ から オープンサイエンスへ (独)農業環境技術研究所& OSGeo財団日本支部 岩崎 亘典

Upload: nobusuke-iwasaki

Post on 16-Jul-2015

1.075 views

Category:

Education


1 download

TRANSCRIPT

ESJ62自由集会:オープンデータと生態学 2015/03/21

オープンデータからオープンサイエンスへ

(独)農業環境技術研究所&

OSGeo財団日本支部

岩崎 亘典

今日の発表内容

• オープンサイエンスとは?

– オープンサイエンスの成立背景

• オープンサイエンスの実例

– データ提供型

– データ収集型

• オープンサイエンスの現状と問題点

– 特に日本国内の情勢

• まとめにかえて

2Agenda

ESJ62自由集会:オープンデータと生態学 2015/03/21

オープンサイエンスとは?

オープンデータの定義

• 共通見解がほぼできている。

– 共通ルールとしてのCreative CommonsやOpen Data Commons

4オープンサイエンスってなに?

オープンサイエンスの定義

• 明確な定義はまだない

– 考え方や運動といえる

• 17世紀に学術誌ができた時、第1次オープンサイエンス革命とする意見もあり

– 総じていえば科学の民主化と進展

5オープンサイエンスとは?

http://openscienceasap.org/ http://en.wikipedia.org/wiki/Open_science

“Open science is the idea that scientific knowledge of all kinds should be openly shared as early as is practical in the discovery process.” Michael Nielsen

第1次オープンサイエンス革命以前

• 科学者は暗号で成果を発表

– ガレリオは土星の輪の発見をアナグラムで公開

• smaismrmilmepoetaleumibunenugttauiras

• Altissimum planetam tergeminum observavi(「私は、最も遠い惑星が三重星になっていることを観測した」) http://ja.wikipedia.org/wiki/土星の環

• それをケプラーが間違った解読をしたり

– SALVE UMBISTINEUM GEMINATUM MARTIA PROLES(二つのノブ、火星の子どもたちにあいさつを) オープンサイエンス革命、

» しかも火星に衛星が2つあったというオチ

6オープンサイエンスとは?

オープンサイエンスの構成要素

• 以下のような特徴を持つ

– 背景としてのネットの普及

7オープンサイエンスとは?

"Open Science - Prinzipien" by Andreas E. Neuhold - Own work. Licensed under CC BY 3.0 via Wikimedia Commons - http://commons.wikimedia.org/wiki/File:Open_Science_-_Prinzipien.png#/media/File:Open_Science_-_Prinzipien.png

オープンサイエンスの成立背景

• Big Dataの生成

– 個人や研究チームだけでは分析できない、膨大で多様なデータ

• 科学データ共有によるイノベーションの期待と成果の還元

– 研究費の元はほとんど税金。国民のもの。

• 国際的にはデータ公開の義務化が進んでいる

– シリアルズ・クライシス(雑誌価格の高騰)

• ITC技術の発達

– データドリブン・サイエンスの進展

8オープンサイエンスとは?

OECDの動向

• 2004 年に、先進国を含む OECD 加盟国の全ての科学担当大臣が、公的資金によるアーカイブデータは公的に利用可能であるべきと宣言

– Science, Technology and Innovation for the 21st Century. Meeting of the OECD Committee for Scientific and Technological Policy at Ministerial Level, 29-30 January 2004 - Final Communique

» http://www.oecd.org/science/sci-tech/sciencetechnologyandinnovationforthe21stcenturymeetingoftheoecdcommitteeforscientificandtechnologicalpolicyatministeriallevel29-30january2004-finalcommunique.htm

9オープンサイエンスとは?

http://www8.cao.go.jp/cstp/sonota/openscience/3kai/3_openscience_shiryou_4_4.pdf

OECDの動向

• 2007 年にOECD Principles and Guidelines for Access to Research Data from Public Funding as a soft-law recommendation を発表

– http://www.oecd.org/sti/sci-tech/38500813.pdf

10オープンサイエンスとは?

http://www8.cao.go.jp/cstp/sonota/openscience/3kai/3_openscience_shiryou_4_4.pdf

G8 科学大臣会合(2013 年 6 月 12 日)における共同声明

• G8 Science Ministers Statement London UK 12 June 2013

– 科学的研究のオープンデータ、オープンアクセスに関する協力と合意

• https://www.gov.uk/government/publications/g8-science-ministers-statement-london-12-june-2013

11オープンサイエンスとは?

http://www8.cao.go.jp/cstp/sonota/openscience/3kai/3_openscience_shiryou_4_4.pdf

米国・NIH(国立衛生研究所)の取り組み

• 2003 年 10 月、NIH「Data Sharing Policy」を制定

– NIH のファンド申請時に「Data Sharing Plan」の作成を義務化

» NIH Data Sharing Policy and Implementation Guidance.

• http://grants.nih.gov/grants/policy/data_sharing/data_sharing_guidance.Htm

12オープンサイエンスとは?

http://www8.cao.go.jp/cstp/sonota/openscience/3kai/3_openscience_shiryou_4_4.pdf

NSF(国立科学財団)の取り組み

• 2011 年 1 月、NSF のファンド申請者に「Data Management Plan」の作成を義務化

– Data の範囲は研究データ、出版物(論文)、サンプル、収集物、ソフトウェア、モデル等

» National Science Foundation. Dissemination and Sharing of Research Results.

• http://www.nsf.gov/bfa/dias/policy/dmp.jsp

» アメリカのいろんな発表がオープンデータになってるのは、この影響?

13オープンサイエンスとは?

http://www8.cao.go.jp/cstp/sonota/openscience/3kai/3_openscience_shiryou_4_4.pdf

GRC(Global Research Council)(JSPS、JSTが参画)

• 2013 年 5 月の第 2 回会合において、公的研究費による研究論文のオープンアクセスを実施するアク ションプランを採択。– Action Plan towards Open Access to Publications

• http://www.dfg.de/download/pdf/dfg_magazin/internationales/130528_grc_annual_meeting/grc_action_plan_open_access.pdf

• 2015 年は日本が議長国(JSPS)– 共同議長:南アフリカ

14オープンサイエンスとは?

http://www8.cao.go.jp/cstp/sonota/openscience/3kai/3_openscience_shiryou_4_4.pdf

ESJ62自由集会:オープンデータと生態学 2015/03/21

オープンサイエンスの実例

オープンサイエンスの類型

• データ提供型

– 研究者がデータを提供し、分類などを助けてもらう

– Galaxy Zooなど

• http://www.galaxyzoo.org/

• データ収集型

– ユーザーにデータ提供を依頼し、その分析を行う

– eBirdなど

• http://ebird.org/content/ebird/

16オープンサイエンスの実例

Garaxy Zoo

• ボランティアによる銀河の分類

17データ提供型オープンサイエンス

SNAPSHOT SERENGET

• 自動撮影カメラ画像の分類

– http://www.snapshotserengeti.org/

18データ提供型オープンサイエンス

ZOONIVERSE

19データ提供型オープンサイエンス

eBird

• 鳥類に関するデータの提供と可視化

– 研究でも使われる

20データ収集型オープンサイエンス

iNaturalist

• 生物に関する情報の投稿と情報共有

– デフォルトライセンスはCC BY 3.0

• http://www.inaturalist.org/

21データ収集型オープンサイエンス

ESJ62自由集会:オープンデータと生態学 2015/03/21

オープンサイエンスの現状と問題

オープンサイエンスの問題

• 上手くいかない事例も多々

– というか、そっちの方が多い

• qwiki(量子コンピューターのWiki)

– 誰も書かない

• Natureの公開ピアレビュー

– みんな読むだけ

• 理由→インセンティブが無い!

– 「データを公開することは、通常であれば自分のキャリアにとって何の得にもならないどころか、自分を不利にするのだ」• マイケル・ニールセン オープンサイエンス革命、pp.16

– オープンサイエンスのツール開発も評価されない

23オープンサイエンスの現状と問題

日本におけるオープンサイエンスの現状

• データ収集型の試みが幾つかあるが、まだ黎明期

• 国としての“オープンサイエンス”の検討開始– 3/23に報告が出される予定

• http://www8.cao.go.jp/cstp/sonota/openscience/index.html

24オープンサイエンスの現状と問題

国際的動向を踏まえたオープンサイエンスに関する検討会

• オープンデータ・オープンアクセスの推進

25オープンサイエンスの現状と問題

http://www8.cao.go.jp/cstp/sonota/openscience/2kai/2_openscience_shiryou_1_2.pdf

東さんの発表の例でいえば

オープンデータの世界では、

• 業者の著作権ではなく、発注者の著作権

になった。

オープンサイエンスの世界でも

• 科学者の著作権ではなく、資金提供団体の著作権

になる?

26オープンサイエンスの現状と問題

日本におけるオープンサイエンスの今後

• “オープンサイエンス”は義務化される

– いわば黒船である

• だからといって上手くいくとは限らない

– 積極的にコミットするモチベーションがない

• “使いにくい”オープンデータ・・・。

• データと論文が公開されただけで “オープンサイエンス”?

– 必要条件であっても十分条件ではない

27オープンサイエンスの現状と問題

ESJ62自由集会:オープンデータと生態学 2015/03/21

このままでオープンデータ・オープンアクセスになっても、オープンサイエンスが成り立つの?

(´・ω・`)

オープンデータは上手くやってるよね

29オープンサイエンの現状と問題

http://www.sapporosmile.com/projects/code-for-sapporo/

• モチベーションを上げる仕組みも必要

日本におけるオープンサイエンスの今後

• “オープンサイエンス”は義務化される

– いわば、黒船である

• だからといって上手くいくとは限らない

– 積極的にコミットするモチベーションがない

• “使いにくい”オープンデータ・・・。

• データと論文が公開されただけで “オープンサイエンス”?

– 必要条件であっても十分条件ではない

“知の構築方法を変えるチャンスを目の前にしているのだ” マイケル・ニールセン、オープンサイエンス革命 pp.324

30オープンサイエンの現状と問題

ESJ62自由集会:オープンデータと生態学 2015/03/21

まとめにかえて

オープンデータとオープンサイエンス

• オープンサイエンス

– オープンデータやオープンアクセスを基盤とした”新しい科学”

• 黒船としての“オープンサイエンス”

– 国内でも、データの公開が推奨または義務づけられるだろう

• 今ならば先行者利得もある!

• “義務”では上手くいかない

– どの様にモチベーションを上げるか

• 中堅以上ががんばってほしい!

• “新しい科学”の発見のチャンス!!

32まとめ

ESJ62自由集会:オープンデータと生態学 2015/03/21

One more thing…

ESJ62自由集会:オープンデータと生態学 2015/03/21

で、おまえはどうするのだ?

言うからには自分もやらないと!

• 明治時代土地利用データをGitHubで公開– https://github.com/wata909/habs_test

• 100m間隔の点データ

• 1/20万水戸の部分を先行公開– 閲覧も可能

» http://wata909.github.io/habs_test/rapid544000.html

• ファイル形式はGeoJSON– PostgreSQL形式も公開予定。shpは公開しません

• ライセンスは CC BY 2.1

– ただし暫定版• 精度検証はこれからです。

本研究は科研費研究費25292213の助成を受けたものです

35まとめ

明治時代土地利用データをGitHubで公開

• 今ならやった者勝ち!(蟷螂の斧でもOK)

– 公開部分は一銭もかかってない(除く私の人件費)

– Special Thanks @monomotiさん!

– これもオープンサイエンス!

36まとめ