オープンデータとは(wata909版)

30
この 作品 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。 オープンデータとは @wata909 †1 2015/11学術分野における オープンデータ普及に関する参考資料 †1 あえて無印。あくまで個人の意見であり、所属するいかなる機関・組織の見解を示すものではありません。 この 作品 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。

Upload: iwasaki-nobusuke

Post on 24-Jan-2018

1.050 views

Category:

Science


0 download

TRANSCRIPT

Page 1: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。

オープンデータとは@wata909 †1

2015/11版学術分野におけるオープンデータ普及に関する参考資料

†1 あえて無印。あくまで個人の意見であり、所属するいかなる機関・組織の見解を示すものではありません。

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。

Page 2: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 2

この資料は、いまいちピンとこない「オープンデータ」という「パソコン用語」みたいな言葉を、なぜ一部の人たちが使い始め、学術分野でも「必要だ」と言い始めているのかを、とてもざっくりと説明した資料です

Page 3: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。

上の資料があまりにもよくまとまっていたので、学術版を作ってみました。

元からの変更点は緑色下線で示してあります。元資料も、是非一読ください。

http://www.slideshare.net/yamatech/ss-54596195

Page 4: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 4

ちなみに、政府も、地方自治体も、国際的にも、数年来こういう議論を続けています。

ぶっちゃけ、日本の学術分野は、国際的にも、国内的にも、遅れています。取り残されています。

Page 5: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 5

なお本資料は@wata909が個人的見解に基づいて作成しました。

所属するいかなる組織、機関等の見解とも無関係です。参考にさせていただいた北海道オープンデータワークショップ様の見解とも無関係なことを、ご了承ください。

Page 6: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。

✤自由に使える

✤再利用できる

✤再配布できる

6

オープンデータとは何か

誰もが データの事である

しかし、論文として、すでに、様々なデータが公表=オープンにされているのでは?

Page 7: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 7

『オープン』と『公表』

あいている、ひらいた、利用できる

= オープン[Open]

= パブリッシュ[Publish]

書籍・雑誌を刊行、出版、公にすること、公表

論文は、情報をパブリッシュであって、オープンでは無い

Page 8: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 8

学術分野がオープンデータを取り組む必要性

「必要性」というよりも

オープンガバメント

研究者が保持するデータは、公的資金により行われたものの場合、本来公共的な資源であり、それらを広く公表し有効活用してもらうことが公共団体にとって(学問にとっても)有益であるという考え

ー開かれた行政ー

Page 9: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 9

学術分野がオープンデータを取り組む必要性

「必要性」というよりも

オープンサイエンス

研究者が保持するデータは、公的資金により行われたものの場合、本来公共的な資源であり、それらを広く公表し有効活用してもらうことが公共団体にとって(学問にとっても)有益であるという考え

ー科学の民主化ー

ここを

と置き換えていいかどうかは、なお議論が必要

Page 10: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 10

データをオープンにするとは

誰でも利用できる汎用形式にする

特定のアプリケーションに依存した形式ではなく、汎用フォーマットを使うということ。さらにそれが機械判別可能な形であれば情報集約しやすい。複数フォーマットならなお良い。

その1:

Page 11: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 11

データをオープンにするとは

誰でもいつでもアクセスできる様にする

ホームページ等に公表し、いつでもアクセスできる様にする。ただし、データ量等の問題があるのであれば、誰にでも渡せるようにしておく。

その2:

Page 12: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 12

データをオープンにするとは

誰でも再利用・再配布することができる様にする

要はコピーペーストを良しとする。また、それらを改変しても良しとする。たとえそれが、どこかの企業に商用利用されても問題ない。そういうことをしっかりと宣言する。

その3:

Page 13: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 13

なんでもオープンにすべきか

原則オープンだが、例外もある

オープンにするため、情報管理=データ管理を徹底

非公開情報、すなわち国民の生命や生活、個人情報に悪影響をもたらすものや、知的財産=国民の財産を脅かすおそれのあるものはオープンにすべきではない

特別なことではなく、研究者が常日頃からやっていること

Page 14: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 14

なんでもオープンにすべきか

原則オープンだが、例外もある

オープンにするため、情報管理=データ管理を徹底

非公開情報、すなわち国民の生命や生活、個人情報に悪影響をもたらすものや、知的財産=国民の財産を脅かすおそれのあるものはオープンにすべきではない

特別なことではなく、研究者が常日頃からやってなくてはならないこと

Page 15: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 15

それは面倒なことか

論文にすべき情報を論文にすることと同じオープンにすべき情報をオープンにするだけ

しいていうのであれば、汎用フォーマットを利用するのが望ましい。別に、汎用フォーマットでなくても良い

Page 16: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 16

リスクは無いのか

オープンにしないリスクの方がある

最低でもパブリッシュしてなければ批判にさらされるのは、周知の事実。パブリッシュしたならば、今後は、オープンにしてくれという要望は必ず起きる。ネット社会となった現代は、知る権利、利用する権利のあるものを非公表・非公開にした方がリスキーである。

Page 17: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 17

必ずやらなきゃダメなのか

必ずその時はきます→早ければ来年きます

今は、まだ、「オープンデータ」という言葉が、やっと表に出はじめたばかりで、一部(我々の様な)の人たちが声を出し始めたに過ぎませんが、「論文投稿」が当たり前になった時の様に、確実にこの流れは主流になるため、いつかはやることになるでしょう。

Page 18: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 18

何で来年くるのか?

第5期科学技術基本計画に向けた中間取りまとめに明記されています

公的研究資金による研究成果のうち、論文及び論文のエビデンスとしての研究データについては、国際的な協調の下、原則公開とし、その他の研究開発成果としての研究データについても可能な範囲で公開することを推奨する。

第5期科学技術基本計画に向けた中間取りまとめ、オープンサイエンスの推進のための環境整備より引用http://www8.cao.go.jp/cstp/tyousakai/kihon5/chukan/honbun.pdf

Page 19: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 19

メリットはあるのか

メリットは新しい研究や発見ができる可能性がある

Galaxy Zoo

タンパク質の構造計算ゲーム「Foldit」

研究のデータをオープンにすることで、それらを利用し、市民が研究に参加し、新しい発見が行われた事例もあります。

ただし、まだまだ発展途上

新しいパラダイムを作ること自体も研究です

Page 20: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 20

そう言っても新しいことなんか、簡単にできるの?

皆さんはこの文書をなにで見てますか

パソコンはマニアの為のものでした。今では無くては仕事ができません。1999年携帯電話は初めてカラーになりました。当時は不必要と言われましたが今は普通です。2008年iPhoneが国内販売されました。当時はマニアだけと言われましたが今では普通です。

ハードウェアが成熟しソフトウェアの時代が来ています必ず最初は「意味があるのか」と言われて来ました

Page 21: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 21

オープンにして悪用されかねない

その懸念わかります

しかし、悪用されてまずいデータはすべて非公開のはずです。そう考えると、オープンデータになり得るデータは論文のエビデンスとしての研究データ、となるようなものばかりになるはずです。

まずは、論文化された「生データ」を提供するだけです

Page 22: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 22

将来的には

論文にならなくても、データを流通させる仕組みが必要だと思います。

すでに、遺伝子の塩基配列などは、論文化する前に公開する仕組みができあがっています。

仕組みをちゃんと作れば、うまく回ります。

Page 23: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 23

大丈夫です。すでに世界的潮流なので、

乗り遅れることを心配しましょう。

(大丈夫じゃない?)

Page 24: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 24

これからの学術分野のあるべき姿

オープンバイデフォルト

研究とは、公表すること、パブリッシュすることです。そこについては、他分野よりも蓄積があります。あとは、オープンにすればいいだけです。

そして、オープンにすると新しい可能性がはじまります

Page 25: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 25

ここからDisりです

Page 26: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 26

ちなみに日本の学術分野の現状

オープンの意味として、「すべてオープンではない」という点を強調しながら、分野で異なるオープンクローズ戦略、オープン化のインセンティブを論じる。

日本学術会議オープンサイエンスの取組に関する検討委員会第5回議事要旨より引用http://www.scj.go.jp/ja/member/iinkai/openscience/pdf23/opscience-youshi2305.pdf

意味不明です(;´Д`)

Page 27: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 27

ちなみに日本学術会議とえいば

「提言 地理教育におけるオープンデータの利活用と地図力/GIS 技能の育成 ‐地域の課題を分析し地域づくリに参画する人材育成‐」

なんてのを出してます。

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-22-t199-3.pdf

Page 28: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 28

前述の提言に関係された皆様を批判する意図はありません。が、

日本学術会議が、組織として『オープンデータの利活用』といっている一方で、『オープンの意味として、「すべてオープンではない」という点を強調』とかいっているのは、「我が国の人文・社会科学、自然科学全分野の科学者の意見をまとめ、国内外に対して発信する日本の代表機関」として、お粗末じゃねーの、と思うわけです。

Page 29: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 29

端的にいって「他人のデータは欲しい」けど、「自分のデータは出

さない」というのは、お上品にいうとフリーライダー、直接的にいうと盗人もしくは泥棒だと思います。

ただし、日本の科学者の現状こんなもん、というのも確かですよ、はい。そんな状況で、国際的議論にどうついてくの、という話しです。

Page 30: オープンデータとは(Wata909版)

この作品はクリエイティブ・コモンズ表示 4.0

国際ライセンスの下に提供されています。 30

もっと詳しく知りたいときは

・・・・・どうしよう(笑)

まずはデータを公開しましょう。基盤はいろいろあります。いまなら、先行者利益があるかも!?

オチがこれかよと。若い人、わからんぞw

http://www6.plala.or.jp/private-hp/samuraidamasii/tamasiitop/robotyuugoku/robotyuugoku.htm