"オープン"を文化に...

78
" オオオオ " オオオオ オオオオオオオオオオオオオオオオオオオオオ ~~ オオオオ [email protected] オオオオオオオオ (NII) ORCID: 0000-0002-2909-7163 オオオオオオオ × オオオオオオオオオオオオオオ , オオオオオオオオオオオオオオオオ , 2015 オ 12 オ 11 オ

Upload: hideaki-takeda

Post on 17-Jan-2017

1.407 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

" オープン " を文化に ~インターネットがつくる新しいデータの世界~武田英明

[email protected]

国立情報学研究所 (NII)

ORCID: 0000-0002-2909-7163

オープンデータ × サイエンスデータ活用セミナー , 新潟大学駅南キャンパスときめいと , 2015 年 12 月 11 日

Page 2: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

Who am I?

• 武田英明– 国立情報学研究所 情報学プリンシプル研究系 教授

• 専門は人工知能、 Web 情報学、セマンティック Web

– 国立情報学研究所 学術リポジトリ推進室 室員– 特定非営利活動法人リンクト・オープン・データ・イニシアティブ 理事長– 独立行政法人 情報処理推進機構 専門員– 内閣官房 オープンデータ実務者会議 構成員– 一般社団法人オープン&ビッグデータ活用・地方創生推進機構 技術部会 副査– ジャパン・リンク・センター 共同運営委員長– ORCID 理事

オープンデータ研究データ共有

Linke

d Op

en D

ata

Page 3: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

いまなぜオープンデータ、オープンサイエンスなのだろう

Page 4: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

2 つの例

Page 5: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

東日本大震災の教訓~東京電力計画データの例~1.東京電力が計画停電の予定を PDF で公開

Page 6: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

東日本大震災の教訓~東京電力計画データの例~2.誰かが csv に変換して公開

http://code.xenophy.com/?p=1323

Page 7: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

東日本大震災の教訓~東京電力計画データの例~3.誰かがアプリケーションにして公開

Page 8: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

小保方氏問題• 匿名者からの論文捏造指摘• 2 ちゃんねるなどでの多人数による検証

– Nnature Article vs. 博士論文– 博士論文 vs. 外部の論文、 Web

Page 9: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

小保方問題(の一部)

小保方晴子の STAP 細胞論文の疑惑  http://stapcells.blogspot.jp/  (2015/12/07 アクセス) より

• Nature Article :画像の流用

• 博士論文: Web サイトからの無断利用– “Background” の文章のほとんどが http:// NIHのサイト( Stem Cell Basics )からの剽窃 

http://stemcells.nih.gov/info/basics/pages/basics1.aspx– Figure 1 も、 NIH サイト(Appendix A: Early Development )の Figure A5 の図 (© 2001 Terese

Winslow, Caitlin Duckwall) から剽窃(盗用)– 小保方晴子氏の博士論文のFig2 は、幹細胞研究会のホームページに掲載の図を切り貼りして作製したもの– …

Page 10: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

どちらも Internet/Web 普及以前では起こらなかった

Page 11: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

Internet/web が我々の社会・生活を変えた

Page 12: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

Law

Norm

Mar

ket

Architecture

four modalities of regulation (Lawrence Lessig)

Page 13: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

Architecture としての Internet/Web

• 分散性 (Internet/Web)• オープン性 (Internet/Web)• 経済性 (Internet/Web)• 簡単さ (Web)

Page 14: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

分散性• どこにも中央がないこと

– Cf. 中央集権型システム・ネットワーク• 物理的な分散性

– 中央のないネットワーク• 管理の分散性

– どこにもコントールされない

Page 15: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープン性• オープン性:自由に参加できる,自由に関係をつくれる.

– これはインターネットの特性の一つ“インターネット精神”

自由に参加できる 自由に関係が作れる

インターネット ノード(計算機)のネットワークへの追加

どの計算機間でも通信ができる

Web だれでもWebページを作れる

Webページ間のハイパーリンクが自由にできる

Page 16: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

経済性• 経済性:やりとりする情報量にコストが比例しない

–これもインターネットの特性–既存の情報提供メディアのコストは提供する情報量と範囲に依存–個人にとっての魅力

• 個人のとっては初めての情報提供メディア–企業にとっての魅力的

• ローコスト

Page 17: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

簡単さ• 簡単さ:専門家でなくても使える

– これはインターネットにはない特性• インターネットは計算機専門家のための技術• Web は非計算機専門家のための技術

Page 18: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

Architecture としての Internet/Web

• 分散性• オープン性• 経済性• 簡単さ

オープン /フラットな Architecture

Page 19: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

Law

Norm

Mar

ket

Architecture

four modalities of regulation (Lawrence Lessig)

Internet/Web時代の社会

オープン性 /フラット性

Page 20: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンで /フラットな社会への変化• 国・統治のあり方

– オープンガバメント• 経済活動のあり方

– オープンイノベーション• 科学技術のあり方

– オープンサイエンス

Page 21: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンガバメント• 透明性 (transparency)• 市民参加 (participation)• 政府内および官民の協働 (collaboration)

– President Barack Obama, Memorandum for the Heads of Executive Departments and Agencies, 2012/2

Page 22: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンガバメント

オープンデータ ガバメントデータ

透明性/市民参加/連携

オープン・(ガバメント)・データ

Page 23: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

科学のオープン性• 社会からの要請

– 社会における知の共有– 公的資金の説明責任

• 科学内部からの要請–科学の自律的発展のため

• “ 巨人の肩にのる” • “Standing on the shoulders of giants”

–再現性

データ・情報の共有 データ・情報のオープン化

Page 24: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープン・データとは何か

Page 25: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンデータとは• データを公開するということ?• 情報公開とは違うの?

Page 26: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンデータとは• オープンデータとは、誰でも自由に使えて再利用もでき、かつ再配布できるようなデータである。課すべき決まりは、たかだか「作者のクレジットを残す」あるいは「同じ条件で配布する」程度である。

http://opendatahandbook.org/ja/what-is-open-data/

• “A piece of data or content is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and/or share-alike.”  http://opendefinition.org/

Page 27: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンデータとは• 利用できる、そしてアクセスできる

– データ全体を丸ごと使えないといけないし、再作成に必要以上のコストがかかってはいけない。望ましいのは、インターネット経由でダウンロードできるようにすることだ。また、データは使いやすく変更可能な形式で存在しなければならない。• 再利用と再配布ができる

– データを提供するにあたって、再利用や再配布を許可しなければならない。また、他のデータセットと組み合わせて使うことも許可しなければならない。• 誰でも使える

– 誰もが利用、再利用、再配布をできなければならない。データの使い道、人種、所属団体などによる差別をしてはいけない。たとえば「非営利目的での利用に限る」などという制限をすると商用での利用を制限してしまうし「教育目的での利用に限る」などの制限も許されない。http://opendatahandbook.org/ja/what-is-open-data/

Page 28: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

データは情報流通社会の資源

自由に利用 自由に再加工 自由に再配布

石黒毅雄さん

Page 29: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンデータに必要なもの• オープンライセンス• 機械可読フォーマット

Page 30: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンライセンス• 情報を最小限の制約以外で自由に使うことを許すライセンス

CC0権利放棄CC BY表示CC BY-SA表示 - 継承CC BY-NC表示 – 非営利 CC BY-ND表示 – 改変禁止CC BY-NC-SA表示 - 非営利 - 継承 CC BY-NC-ND表示 - 非営利 - 改変禁止

全ての権利の主張

CCライセンスいくつかの権利の主張オープンライセンス

Page 31: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

機械可読フォーマット• 再利用性を高める

– 内容を切ったり、はったりできること• 機械(コンピュータ)が内容を処理できる形式が望ましい

– 特定のプログラムで処理できる– オープンなフォーマットで公開– Web のようにつながる

Page 32: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンデータへの5つのステップ

どんなフォーマットでよいからオープンラインセスでデータ公開 例: PDF, jpg

コンピュータが処理可能なフォーマットで公開例: xls, doc

オープンに利用できるフォーマットで公開 例: csv

RDF (と SPARQL )でデータ公開 例: RDFa, RDF ストア

他へのリンクを入れたデータを公開

ライセンスをつけずにデータを Web で公開

Page 33: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープン・(ガバメント)・データ

Page 34: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

日本政府の動き

Page 35: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

電子行政オープンデータ戦略• 1.透明性・信頼性の向上

– 公共データが二次利用可能な形で提供されることにより、国民が自ら又は民間のサービスを通じて、政府の政策等に関して十分な分析、判断を行うことが可能になる。それにより、行政の透明性が高まり、行政への国民からの信頼を高めることができる。• 2.国民参加・官民協働の推進

– 広範な主体による公共データの活用が進展し、官民の情報共有が図られることにより、官民の協働による公共サービスの提供、さらには行政が提供した情報による民間サービスの創出が促進される。これにより、創意工夫を活かした多様な公共サービスが迅速かつ効率的に提供され、厳しい財政状況、諸活動におけるニーズや価値観の多様化、情報通信技術の高度化等我が国を取り巻く諸状況にも適切に対応することができる。• 3.経済の活性化・行政の効率化

– 公共データを二次利用可能な形で提供することにより、市場における編集、加工、分析等の各段階を通じて、様々な新ビジネスの創出や企業活動の効率化等が促され、我が国全体の経済活性化が図られる。また、国や地方公共団体においても、政策決定等において公共データを用いて分析等を行うことで、業務の効率化、高度化が図られる。

電子行政オープンデータ戦略に関する提言 , 2012 年(平成 24 年)6月 20 日電子行政に関するタスクフォース

Page 36: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

G8 オープンデータ憲章• 原則1:原則としてのオープンデータ

– 15.我々は、以下のことを実施する。• …この憲章で示されているように、政府のデータ全ては、原則としてオープン化して公表されるという期待を醸成する。

• 原則2:質と量– 18.我々は、以下のことを実施することとする。

• 時宜を得た、包括的かつ正確な質の高いオープンデータを公表する。…• …データの情報は平易で明瞭な用語で記述されていることを保証する。• …データの特性が十分に説明されることを確保する。• 可能な限り早くデータを公表し、…

• 原則3:全ての者が利用できる– 22.我々は以下のことを実施する。

• 可能であればオープンなフォーマットでデータを公表することとし、…• 可能な限り多くのデータを公表することとし、…

• 原則4:改善されたガバナンスのためのデータの公表– 25.我々は以下のことを実施する。

• お互いに、また国家間で技術的専門性と経験を共有することにより…• …我々のデータ収集や基準、公表プロセスについて透明化する

• 原則5:技術革新のためのデータの公表 2013 年 6 月

Page 37: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

日本政府の取り組み• 内閣官房

– ロードマップ– 電子行政オープンデータ実務者会議– 政府ポータルの立ち上げ– 政府標準利用規約

• 総務省– 一般社団法人オープン&ビッグデータ活用・地方創生推進機構– 実証実験

• 経産省– OPEN DATA METI ( 経産省データポータル)– IMI 共通語彙基盤

Page 38: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

 データカタログ(ポータルサイト)の整備・運用

電子行政オープンデータ推進のためのロードマップ(工程表)平成 25 年度下期 平成 26 年度

地方公共団体のデータの公開に関する考え方の整理・提示

平成 25 年度上期

機械判読に適したデータ形式での公開の拡大

平成 27 年度以降

統計情報データベース以外のデータも、今後インターネットを通じて公開するデータについて、機械判読に適した構造・データ形式でも公開 (重点分野(白書、防災・減災情報、地理空間情報、人の移動に関する情報、予算・決算・調達情報)から優先的に取り組む。)併せて当該データの URL リストの公開も行う。 API の整備も考慮。

普及・啓発、評価

実務者会議の検討を踏まえ、各府省ホームページにおける利用ルールの見直し(二次利用を認めるのを原則とし、制限のあるコンテンツは個別に表示) その他のルールについて、考え方の整理に基づく対応

可能な部分からより高度なデータ形式での公開を順次拡大

独立行政法人、地方公共団体等への周知・普及(有効事例の創出・普及を含む。)

全府省

実務者会議の検討を踏まえ、英語表記のコンテンツの充実

データカタログ(ポータルサイト)の整備

新規にインターネットを通じて公開するコストが低いデータや利用者のニーズ(要望)の強いデータについて、公開できないもの・二次利用が認められないものを除き、公開を拡大

実証事業等によるデータカタログに求められる機能等の検討・検証 内閣官房、総務省、経済産業省

実務者会議 取組の実施に当たって必要な事項の検討・整理レビュー、フォローアップを踏まえた必要な取組の検討・整理

二次利用を促進する利用ルールの整備

公開データの拡大

全府省

全府省 全府省

内閣官房、全府省

全府省全府省

内閣官房、関係府省内閣官房、関係府省

内閣官房、関係府省内閣官房、関係府省

ニーズの発掘・喚起、新たなサービス・ビジネスの創出等のための普及行事の開催・参加等の利活用の支援 内閣官房、全府省

コードの公開の促進、コードの対応関係の整理等の活用促進 全府省

有用な情報を紹介するサイト(リンク集等)の構築 内閣官房、関係府省

実務者会議の検討を踏まえ、重点分野について、公開するデータの拡大関係府省

別紙

実務者会議の検討を踏まえ、取組の費用・効果の把握、評価を実施レビュー、フォローアップを踏まえた必要な取組内容の見直し 内閣官房、全府省

ニーズ・意見を把握し、取組に反映させる仕組みの構築 内閣官房、全府省

連係

統計情報データベースを通じた情報提供を含む統計情報の電子的提供の推進 最適化計画(改定)に基づく取組の推進 関係府省

重点分野以外のデータについて、機械判読に適した構造・データ形式での公開を拡大 全府省

地理情報を活用した統計データの拡充、統計データの機械アクセス性等の利便性の向上 総務省、関係府省

組織によって異なる用語やその定義の標準化、ツール等の整備 内閣官房、総務省、経済産業省

関係府省

 試行データカタログ(ポータルサイト)による公開内閣官房、全府省

他の先進国と同水準のオープンデータの公開と利用を実現

平成 27 年度末

吸収

38

Page 39: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

●  我が国は「電子行政オープンデータ戦略」、「世界最先端 IT 国家創造宣言」等に基づきオープンデータを推進●  これまでの間、  ・ 公共データの二次利用を可能とするルールの策定( 2014 年 6 月)  ・ データカタログサイトの整備(試行版 :201 3年 12 月、本格版 :2014 年 10 月)  ・ 「地方公共団体オープンデータ推進ガイドライン」の公表( 2015 年2月) 等 ⇒ データ公開面では一定の成果を挙げつつあるものの、今後は利活用面にも焦点を当てる必要あり 

<重点的に取り組む事項>

<データの利活用の推進>今後のオープンデータの展開に向けた基本的考え方

これまでの取組を継承しつつ、利活

用を見据えた効果的・効率的な展開

を図る必要

「課題解決型のオープンデータの推

進」に発想を転換

府省庁の重要施策等の検討に当たっ

ては、課題の発見(見える化)・解

決の一手段としてオープンデータの

活用可否を検討(政策決定過程に

オープンデータをビルトイン化)

このような発想の転換とともに、

「重点的に取り組む事項」を整理し、

政府一体となって取り組む

<データ公開の推進> 政府のみならず、独立行政法人、公益

企業等におけるオープンデータも推進 公開データ(データカタログサイト

等)の質・量両面での拡充 ① 従来の Web 中心から Web 非掲載データへの拡

 ②機械判読可能な形式のファイルや外国語データの

  比率向上 

 ③国際ランキング (19 位 ) の向上に向けた取組強化

 (政府標準利用規約の見直し、評価項目の見直し

  の提案)

 ④制度上の制約 ( 要承認、有料等 ) が存在するデー

  の整理

 ⑤ KPI の見直しや各府省庁の目標設定

新たなオープンデータの展開に向けて(概要)

国内の取組① オープンデータの利活用の普及・啓発 ・活用事例の収集・情報提供(オープンデータ 100 の選定、開発者 フォーラムの設置等) ・横展開のためのオープンデータ伝道 師の任命・支援② 利活用に係る評価指標のあり方、 KPI の項目や目標値の設定 

国際展開の推進①アプリやシステム、ノウハウ等をパッケージ化し、アジア等へ発信② 国際的評価指標(グローバルインデックス)づくりに参画、海外展開

地方公共団体の取組への支援 ①民間有識者等の人材の派遣、横展開の支援  (※地方創生 IT 利活用推進プランにも盛り込み) ②自治体特有のデータ形式 ( タグ、分類等 ) の標準化  ③法令に基づき自治体が作成するデータの公開の可    否が不明確なものの整理

< >

(平成 27 年 6 月 30 日 高度情報通信ネットワーク社会推進戦略本部決定)

Page 40: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

政府標準利用規約(第 1.0 版)• 1.基本的なコンテンツの利用ルール• ホームページで公開しているコンテンツは、2.の別の理由ルールが適用されるコンテンツを除き、1)~7)に従って、自由に利用(複製、翻案等)できる。

• 1)出典の記載– ア 利用する際は、出典を記載すること。– イ コンテンツを編集・加工等して利用する場合は、出典とは別に、編集・加工等を行ったことを記載すること。

また、編集・加工した情報を、あたかも国が作成したかのような態様で公表・利用することは禁止。• 2)第三者の権利を侵害しないようにすること

– コンテンツの中に第三者(国以外の者)が著作権等の権利を有しているものがある場合、利用者の責任で当該第三者から利用の許諾を得ること。

• 3)一定の利用形態の禁止– 法令、条例又は公序良俗に反する利用や国家・国民の安全に脅威を与える利用は禁止。

• 4)個別法令による利用の制約があるコンテンツについての注意• 5)準拠法と合意管轄• 6)免責• 7)その他

– 本利用ルールについては、平成 27 年度に見直しの検討を行うものとする。

• 2.別の利用ルールが適用されるコンテンツについて• 各府省において、1.とは異なる利用ルールが適用されるコンテンツを定めることができる。• (その具体的・合理的な根拠と併せ、該当するコンテンツを示すことが必要。)

2.0 で削除予定!

Page 41: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

IMI 共通語彙基盤

Page 42: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

自治体におけるオープンデータ

Page 43: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンデータによる情報流通• これまでの公共情報の流通

公共機関など

市民

情報提供 必要なデータを 必要な方法で

請求、要望

様々な要望に応えるのは大変我々の要望に応えてくれないなあ

Page 44: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンデータによる情報流通

公共機関など市民

データ公開 アプリ公開

要求、要望のシェア

サードバーティ=市民、プログラマー、企業

データのみ公開

欲しい方式(形式、アプリ)へ

Page 45: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

公開データ 公開アプリケーション

Page 46: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

http://fukuno.jig.jp/2012/wcconcierge(c)taisukef CED

Page 47: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

(C)福野泰介 / @taisukef

Page 48: "オープン"を文化に ~インターネットがつくる新しいデータの世界~
Page 49: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

日本のオープンデータ都市

http://fukuno.jig.jp/2013/opendatamap

Page 50: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

科学データのデータ共有とオープンデータ

Page 51: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

Data Life Cycle

• データは作られ , 共有され , 公開され , 保存される– 多くは共有からオープンに公開へ– 一部(プラバシーデータ、セキュリティデータ)は共有のまま

• データのライフサイクルを通じたサポート

Data ShareCreate Publish Preserve

Research Phase In Progress Results

StakeholderResearch Institute

Researcher/R. Group

Page 52: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

リポジトリ

データ共有のアーキテクチャ識別子 (ID)

データフォーマット

メタデータID

メタデータ・スキーマ

レイヤーを跨いだ有機的な連携各レイヤーでの相互運用性

Page 53: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

メタデータ記述言語、メタデータ DB 、メタデータ変換 …

ス スキーマ記述言語、スキーマの収集・検索、スキーマ変換…

システム開発、コミュニティ、 API …

管理 運営組織、システム、 ID連携 …

リポジトリ

データ共有のアーキテクチャ識別子 (ID)

データフォーマット

メタデータメタデータ・スキーマ

DOI ORCID FundRef

DataCite CrossRef JaLC Dublin Core DCAT Linked DataOrganization Schema Technology

競争と協調Dspace Fedora CKAN Weko

Page 54: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

DOI (Digital Object Identifier)• デジタルオブジェクトの識別子とその解決を行うサービス

– 識別子の付与– デジタルオブジェクトの識別子から存在する URIへの変換

• 分散型管理– International DOI Foundation (IDF)

• 全体 DB の管理、 RA をまとめ役– Registration Agency (RA)

• DOI の登録業務を請け負う組織– 登録者

• コンテンツを持っている組織

http://dx.doi.org/10.1000/182

DOI: 10.1000/182

Page 55: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

ORCID: 0000-0002-2909-7163

http://orcid.org/0000-0002-2909-7163

Page 56: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

データの公開、共有の技術

Linked DataLinked Open Data (LOD)

Page 57: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

オープンデータへの5つのステップ

どんなフォーマットでよいからオープンラインセスでデータ公開 例: PDF, jpg

コンピュータが処理可能なフォーマットで公開例: xls, doc

オープンに利用できるフォーマットで公開 例: csv

RDF (と SPARQL )でデータ公開 例: RDFa, RDF ストア

他へのリンクを入れたデータを公開

Page 58: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

文書の Web

Page 59: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

データの Web

このデータに対応する別のデータ

このデータに別のデータと同じ

この属性の意味は?

異なるデータ源のデータが相互に結びつく

Page 60: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

沢山のデータがあっても、つながっていない…

Page 61: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

Linked Open Data (LOD)• オープンでリンクできるデータ

–今の Web が“文書の Web” 、 LOD は“データの Web”• Linked   Data の 4原則

– 事物を URI を使って名前付けしよう– 事物の参照が HTTP URI でできるようにしよう– URI を参照したときに関連情報が手に入るようにしよう– 外部へのリンクも含めよう

(必ずしもオープンとは限らない⇒ Linked Data )

Page 62: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

Linked Data の記述のしかた• RDF(+RDFS, OWL) の利用

– 簡便な記述方法: <主語 > <述語 > <目的語 > .

<http://www-kasm.nii.ac.jp/~takeda#me> rdfs:type foaf:Person .<http://www-kasm.nii.ac.jp/~takeda#me> foaf:name “ 武田英明” .<http://www-kasm.nii.ac.jp/~takeda#me> foaf:gender “male” .<http://www-kasm.nii.ac.jp/~takeda#me> foaf:knows <http://southampton.rkbexplorer.com/id/person07113> .

http://www-kasm.nii.ac.jp/~takeda#me

http://southampton.rkbexplorer.com/id/person07113

foaf:knows

foaf:Person

rdfs:type

“ 武田英明” “male”

foaf:name foaf:gender

Page 63: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

“1955-06-08”

Linked Data の記述http://www-kasm.nii.ac.jp/

~takeda#mehttp://southampton.rkbexplorer.com/

id/person-07113

foaf:knows

foaf:Person

rdfs:type

foaf:name foaf:gender

<http://dbpedia.org/resource/Tim_Berners-Lee>

owl:sameAs

dbpprop:birthDatedbpprop:birthPlacedbpprop:name

dbpedia:Computer_scientistdbpprop:occupation

“ 武田英明” “male”

“London, England”“Sir Tim Berners-Lee”

Page 64: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

LOD Cloud(Linking Open Data)

Page 65: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

日本の Linked Data Cloud

Page 66: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

施 設

ユーザYokohama Art Spot

RDFストア

SPARQLエンドポイント

RDFストア

SPARQLエンドポイント

XML

SPARQL

LODAC Museum

横浜 LOD

作品

所蔵館

アーティスト

アーティスト

施設

イベント

Yokohama Art Spot の構成全体マップ表示における処理

施設イベント

HTMLJavaScriptPythonSPARQLWrapper

OWLIM SE

ARC2

RDFストア

SPARQLエンドポイント

PinQA

質問

回答

ユーザ

SPARQL

JSON

SPARQL

JSON

D2R

スポット

Page 67: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

施設情報ページにおける情報取得と表示

標準化された形式で記述

ユーザに適した表示が簡単に実現可能

利用

Page 68: "オープン"を文化に ~インターネットがつくる新しいデータの世界~
Page 69: "オープン"を文化に ~インターネットがつくる新しいデータの世界~
Page 70: "オープン"を文化に ~インターネットがつくる新しいデータの世界~
Page 71: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

育なび .net

Page 72: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

育なび .net のシステム育なび .net

保育園データ

保育所空き状況データ

医療機関データ

防災・減災データ

元データは ExcelRDF に変換

RDFストア

データ格納

SPARQL を発行

レスポンス

Web サーバ ブラウザ

Page 73: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

育なび .net

公園データ

広域避難場所データ 駐車場データ

健康遊具データ

Page 74: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

ではどうしたらよいか

Page 75: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

組織の中で…• 小さいことから始めよう

– どうでもよいデータからオープン化–初めから難しいことに取り組まない

• 見てもらい、反応をもらい、仲間をつくろう

Page 76: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

組織の外で…• 様々なイベントがあるので、それに参加する

–ハッカソン• プログラマーが集まって集中的作業をする。プロジェクトのように組織的にするのではなくて、自発的に集まり、自発的に作業をする。• 元々は 1週間とか、最近は 1 日とか短いものも

– アイデアソン• みんなが集まって、アイデアを出し合う。プログラムを作るところまで行かなくてもいい。

– アンカンファレンス• 話題を決めずに発表した人が発表する

Page 77: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

まとめ• オープン化は Internet/Web時代の避けらないな道• オープンデータの5つのステップ

– オープンライセンス– 機械可読フォーマット

• 様々なオープンデータ– ガバメント・データ

• 政府標準利用規約• 共通語彙基盤

– 研究データ– …

• Linked Open Data (LOD)– “データの Web” 、つながるデータ– データの再利用性を高める

• オープンデータはデータ供給者⇔サードパーティー⇔データ利用者で育てていくもの• オープンデータへ道

– 小さく初めて大きく育てる– 市民が参加できる多くのイベント

Page 78: "オープン"を文化に ~インターネットがつくる新しいデータの世界~

さあ、皆さんもご一緒に