オープンデータとは(wata909版)
TRANSCRIPT
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。
オープンデータとは@wata909 †1
2015/11版学術分野におけるオープンデータ普及に関する参考資料
†1 あえて無印。あくまで個人の意見であり、所属するいかなる機関・組織の見解を示すものではありません。
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 2
この資料は、いまいちピンとこない「オープンデータ」という「パソコン用語」みたいな言葉を、なぜ一部の人たちが使い始め、学術分野でも「必要だ」と言い始めているのかを、とてもざっくりと説明した資料です
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。
上の資料があまりにもよくまとまっていたので、学術版を作ってみました。
元からの変更点は緑色下線で示してあります。元資料も、是非一読ください。
http://www.slideshare.net/yamatech/ss-54596195
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 4
ちなみに、政府も、地方自治体も、国際的にも、数年来こういう議論を続けています。
ぶっちゃけ、日本の学術分野は、国際的にも、国内的にも、遅れています。取り残されています。
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 5
なお本資料は@wata909が個人的見解に基づいて作成しました。
所属するいかなる組織、機関等の見解とも無関係です。参考にさせていただいた北海道オープンデータワークショップ様の見解とも無関係なことを、ご了承ください。
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。
✤自由に使える
✤再利用できる
✤再配布できる
6
オープンデータとは何か
誰もが データの事である
しかし、論文として、すでに、様々なデータが公表=オープンにされているのでは?
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 7
『オープン』と『公表』
あいている、ひらいた、利用できる
= オープン[Open]
= パブリッシュ[Publish]
書籍・雑誌を刊行、出版、公にすること、公表
論文は、情報をパブリッシュであって、オープンでは無い
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 8
学術分野がオープンデータを取り組む必要性
「必要性」というよりも
オープンガバメント
研究者が保持するデータは、公的資金により行われたものの場合、本来公共的な資源であり、それらを広く公表し有効活用してもらうことが公共団体にとって(学問にとっても)有益であるという考え
ー開かれた行政ー
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 9
学術分野がオープンデータを取り組む必要性
「必要性」というよりも
オープンサイエンス
研究者が保持するデータは、公的資金により行われたものの場合、本来公共的な資源であり、それらを広く公表し有効活用してもらうことが公共団体にとって(学問にとっても)有益であるという考え
ー科学の民主化ー
ここを
と置き換えていいかどうかは、なお議論が必要
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 10
データをオープンにするとは
誰でも利用できる汎用形式にする
特定のアプリケーションに依存した形式ではなく、汎用フォーマットを使うということ。さらにそれが機械判別可能な形であれば情報集約しやすい。複数フォーマットならなお良い。
その1:
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 11
データをオープンにするとは
誰でもいつでもアクセスできる様にする
ホームページ等に公表し、いつでもアクセスできる様にする。ただし、データ量等の問題があるのであれば、誰にでも渡せるようにしておく。
その2:
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 12
データをオープンにするとは
誰でも再利用・再配布することができる様にする
要はコピーペーストを良しとする。また、それらを改変しても良しとする。たとえそれが、どこかの企業に商用利用されても問題ない。そういうことをしっかりと宣言する。
その3:
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 13
なんでもオープンにすべきか
原則オープンだが、例外もある
オープンにするため、情報管理=データ管理を徹底
非公開情報、すなわち国民の生命や生活、個人情報に悪影響をもたらすものや、知的財産=国民の財産を脅かすおそれのあるものはオープンにすべきではない
特別なことではなく、研究者が常日頃からやっていること
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 14
なんでもオープンにすべきか
原則オープンだが、例外もある
オープンにするため、情報管理=データ管理を徹底
非公開情報、すなわち国民の生命や生活、個人情報に悪影響をもたらすものや、知的財産=国民の財産を脅かすおそれのあるものはオープンにすべきではない
特別なことではなく、研究者が常日頃からやってなくてはならないこと
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 15
それは面倒なことか
論文にすべき情報を論文にすることと同じオープンにすべき情報をオープンにするだけ
しいていうのであれば、汎用フォーマットを利用するのが望ましい。別に、汎用フォーマットでなくても良い
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 16
リスクは無いのか
オープンにしないリスクの方がある
最低でもパブリッシュしてなければ批判にさらされるのは、周知の事実。パブリッシュしたならば、今後は、オープンにしてくれという要望は必ず起きる。ネット社会となった現代は、知る権利、利用する権利のあるものを非公表・非公開にした方がリスキーである。
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 17
必ずやらなきゃダメなのか
必ずその時はきます→早ければ来年きます
今は、まだ、「オープンデータ」という言葉が、やっと表に出はじめたばかりで、一部(我々の様な)の人たちが声を出し始めたに過ぎませんが、「論文投稿」が当たり前になった時の様に、確実にこの流れは主流になるため、いつかはやることになるでしょう。
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 18
何で来年くるのか?
第5期科学技術基本計画に向けた中間取りまとめに明記されています
公的研究資金による研究成果のうち、論文及び論文のエビデンスとしての研究データについては、国際的な協調の下、原則公開とし、その他の研究開発成果としての研究データについても可能な範囲で公開することを推奨する。
第5期科学技術基本計画に向けた中間取りまとめ、オープンサイエンスの推進のための環境整備より引用http://www8.cao.go.jp/cstp/tyousakai/kihon5/chukan/honbun.pdf
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 19
メリットはあるのか
メリットは新しい研究や発見ができる可能性がある
Galaxy Zoo
タンパク質の構造計算ゲーム「Foldit」
研究のデータをオープンにすることで、それらを利用し、市民が研究に参加し、新しい発見が行われた事例もあります。
ただし、まだまだ発展途上
新しいパラダイムを作ること自体も研究です
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 20
そう言っても新しいことなんか、簡単にできるの?
皆さんはこの文書をなにで見てますか
パソコンはマニアの為のものでした。今では無くては仕事ができません。1999年携帯電話は初めてカラーになりました。当時は不必要と言われましたが今は普通です。2008年iPhoneが国内販売されました。当時はマニアだけと言われましたが今では普通です。
ハードウェアが成熟しソフトウェアの時代が来ています必ず最初は「意味があるのか」と言われて来ました
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 21
オープンにして悪用されかねない
その懸念わかります
しかし、悪用されてまずいデータはすべて非公開のはずです。そう考えると、オープンデータになり得るデータは論文のエビデンスとしての研究データ、となるようなものばかりになるはずです。
まずは、論文化された「生データ」を提供するだけです
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 22
将来的には
論文にならなくても、データを流通させる仕組みが必要だと思います。
すでに、遺伝子の塩基配列などは、論文化する前に公開する仕組みができあがっています。
仕組みをちゃんと作れば、うまく回ります。
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 23
大丈夫です。すでに世界的潮流なので、
乗り遅れることを心配しましょう。
(大丈夫じゃない?)
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 24
これからの学術分野のあるべき姿
オープンバイデフォルト
研究とは、公表すること、パブリッシュすることです。そこについては、他分野よりも蓄積があります。あとは、オープンにすればいいだけです。
そして、オープンにすると新しい可能性がはじまります
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 25
ここからDisりです
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 26
ちなみに日本の学術分野の現状
オープンの意味として、「すべてオープンではない」という点を強調しながら、分野で異なるオープンクローズ戦略、オープン化のインセンティブを論じる。
日本学術会議オープンサイエンスの取組に関する検討委員会第5回議事要旨より引用http://www.scj.go.jp/ja/member/iinkai/openscience/pdf23/opscience-youshi2305.pdf
意味不明です(;´Д`)
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 27
ちなみに日本学術会議とえいば
「提言 地理教育におけるオープンデータの利活用と地図力/GIS 技能の育成 ‐地域の課題を分析し地域づくリに参画する人材育成‐」
なんてのを出してます。
http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-22-t199-3.pdf
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 28
前述の提言に関係された皆様を批判する意図はありません。が、
日本学術会議が、組織として『オープンデータの利活用』といっている一方で、『オープンの意味として、「すべてオープンではない」という点を強調』とかいっているのは、「我が国の人文・社会科学、自然科学全分野の科学者の意見をまとめ、国内外に対して発信する日本の代表機関」として、お粗末じゃねーの、と思うわけです。
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 29
端的にいって「他人のデータは欲しい」けど、「自分のデータは出
さない」というのは、お上品にいうとフリーライダー、直接的にいうと盗人もしくは泥棒だと思います。
ただし、日本の科学者の現状こんなもん、というのも確かですよ、はい。そんな状況で、国際的議論にどうついてくの、という話しです。
この作品はクリエイティブ・コモンズ表示 4.0
国際ライセンスの下に提供されています。 30
もっと詳しく知りたいときは
・・・・・どうしよう(笑)
まずはデータを公開しましょう。基盤はいろいろあります。いまなら、先行者利益があるかも!?
オチがこれかよと。若い人、わからんぞw
http://www6.plala.or.jp/private-hp/samuraidamasii/tamasiitop/robotyuugoku/robotyuugoku.htm