オープンデータの取り組み紹介
DESCRIPTION
経済産業省「平成25年度我が国情報経済社会における基盤整備事業(CG・VFX産業クラウド活用・高連携実証事業)」の一環である「Ark Project」のキックオフイベント(2014年1月25日)における講演。TRANSCRIPT
オープンデータの取り組み紹介
庄司昌彦 Masahiko SHOJI国際大学GLOCOM 主任研究員
一般社団法人オープン・ナレッジ・ファウンデーション・ジャパン 代表理事
1政府データカタログサイト試行版
オープンデータとは
2
オープンデータとは、自由に使えて再利用もでき、かつ誰でも再配布できるようなデータのことである。従うべきはせいぜい「作者のクレジットを残す」あるいは「同じ条件で配布する」程度である。
出典: http://opendefinition.org/
「公開されたデータ」ではなく、「オープンライセンスの(広く開かれた利用条件の)」データ。機械可読が望ましいが、まずは「利用できる」ということが重要。
開放資料
オープンデータに関する議論• EU指令2003年/98/EC
– “加盟国は、公的機関が保有する情報の再利用が可能な場合には、商業・非商業の目的を問わずこれらの情報が再利用可能であることを確保しなければならない”
• OECD(2005)”Modernizing Government”– 国民からの信頼性向上、新しい民主主義の模索
– 情報開示強化による一層の透明化、政策形成への一層の国民参加を期待、
– 政府と国民の協働や国民の政府への接触の改善
• OECD閣僚級会合 ソウル宣言(2008)– 文化遺産、科学データを含む公的セクターの情報やコンテンツを、よりいっそうデジタ
ル形式で入手しやすくする。
• Noveck(2010) ”Wiki Government”– 「新たな技術を積極的に活用した協働の拡大が、よりよい意思決定と積極的な問題解
決をもたらし、さらには経済と社会の成長に拍車」
• 欧州委員会プレスリリース、2011年12月12日– “欧州の政府機関は、まだ実現されていない経済的可能性の金脈(公的機関により収
集された大量のデータ)の上に座っているようなものだ。”
3
4
透明性 参加 協働
情報通信技術/インターネットが支えるデータ活用社会
オープンガバメント
開かれた政府
地域の資源を総動員し、地域の課題を自ら解決していく社会へ
5
行政
企業
社会組織
企業
社会組織
行政
「透明性・参加・協働」 米国 オバマ大統領 2009年 OpenGov覚書
「プラットフォームとしての政府」「Do It Ourselves」
米国 ティム・オライリー 2009年
「大きな社会」 英国 キャメロン首相2009年 演説
「新しい公共」「市民が支えざるを得ない社会」
日本 鳩山由紀夫首相 2010年 施政方針演説日本 小林隆(東海大学)
行政
参加型デザイン
• 概要
– ユーザーのニーズに合致し使い易
くなるよう、デザインプロセスに利害
関係者を積極的に巻き込む手法
– イノベーションキャンプ(デンマーク)
• 年金申請画面を改善し高齢者でも
セルフサービスで完結させたい
• 行政、エンジニア、専門家、ユー
ザーである高齢者が話合い、その
場でデザインを改善
• 2チーム(別テーマでさらに2チー
ム)がコンテスト形式で競い、会場
とオンライン参加者の投票で優劣
を決定
• 結果は今後のサイト改善に反映
– ペルソナ
6
イノベーションキャンプ(デンマーク政府)
筆者撮影
「鉄の三角形」からオープンなデータ循環へ
データ提供
• 一元化
• 権利処理
課題発見分析
• 対話と協働
• リテラシー向上
開発
• 解決策、価値創出
事業化支援
• 企業育成
• 市民活動支援
データ生成
• 活用を前提とした形式・内容
データ活用社会
個人の権利保護
行政内部での利用
7図:筆者作成
イギリス政府
• Show Us a Better Wayコンテスト (07年)
– 公共データの再利用・マッシュアップ方法を公募)
• Data.gov.uk開設(2009年12月)
– 政府機関のさまざまな情報をワンストップで提供
– 可視化やアプリ開発を促す
– ティム・バーナーズ=リー( world wide web 開発者)がプロジェク
ト推進
• 首相 透明性方針表明の書簡(2010年6月)
– 全契約のオンライン公表(2011年1月)
• オープンガバメントライセンスの制定(2010年9月)
• Open Data Institute設立(2012年9月)
8
ブラウン政権時代
キャメロン政権時代
9
出典:http://www.meti.go.jp/committee/kenkyukai/shoujo/it_yugo_forum_data_wg/pdf/003_06_00.pdf
データポータルサイト:Data.gov.uk
10
米国の動向• 透明性とオープンガバメントの覚書
– 2009年1月
• 原則オープンデータ化– 2013年5月大統領令
– 新たな政府の情報資産は基本的にオープンで、マシン・リーダブルに
– 行政管理予算局(OMB)がオープンデータポリシーを発行。各省庁は対応
• National Day of Civic Hacking– 2013年6月1-2日に全米で開催
– 各地のデータを集約・共有
– 行政から課題設定+データ提供
• 政府停止によるData.gov閉鎖– Sunlight Foundationブログ
「APIではなく生データが重要」
11
National Day of Civic Hacking
Data.gov
国際的な広がり
Open Government Partnership OK Festival, OK Conference
12
• 2010年9月~• 汚職撲滅と行政透明化を目指して米国・ブラジ
ル等が主導。• 約60カ国が参加(日本は不参加)
主催: Open Knowledge Foundationほか参加者: 約1,000名テーマ: 国際協力(Open Government Partnership),透明性, グリーン, 経済、OSS等2014年は7月にベルリンで開催
写真:筆者撮影図:Open Government Partnershipより
世界各国の動向(抜粋)
13
• ウルグアイ
– ラテンアメリカ初の地域会議
「Conference on Open Data in
Latin America and the
Caribbean」開催
• チュニジア
– 2011年11月Open Data チュニジ
ア発足。海外の支援を受け活動
中。
– 目的は人権保護、透明性
• リベリア– 政府はまだ紙で管理しているた
めクリエイティブにデジタル化する方法が必要
• イタリア– スパゲッティ・オープンデータ
(公務員も参加するオンライン・コミュニティ)が牽引
– 多数のローカルイニシアチブ。
– 政府の関与は弱く、活動もデータも構造化されていない
• ロシア
– オープンデータカウンシルが作
られた。行政、ビジネスマン、ア
クティビストが参加
– 1000データセットを連邦政府が
公開
• 香港
• オープンデータ不十分だが市民参加は広がっている
• 政府サイトでは統計、交通、環境データ等が公開
• ネパール
• 有志がデータポータルを立上げ
• ハッカソン等を通じ能力開発
• インド• 8月に政府データポータル開設
• 3500データセット
• アクティブな都市が多数
• フィリピン• 11-12月に政府データポータル開
設
14図:data.gov.ph
コンテストの開催 ポータルサイトの開設
15図:ニューヨーク市、ストックホルム市、ヘルシンキ市 図:パリ市、ベルリン市、台北市
G8オープンデータ憲章
16
無料の政府データは,人々がより快適な現代生活を送るための手段や製品を作るために活用することが出来(略)民間部門での改革のための触媒となり,新規の市場,ビジネス及び雇用の創出を支援する。
我々は,オープンデータが,イノベーションと繁栄を可能にし,また,市民のニーズに合致した,強固かつ相互に繋がった社会(略)ための大きな可能性をもった未開発の資源であることに合意する。
G8オープンデータ憲章 技術的別添
17翻訳:OKFJ
18
データセット別の公開の現状と今後の取組予定 (「日本のオープンデータ憲章アクションプラン」より)
http://www.kantei.go.jp/jp/singi/it2/cio/dai53/plan_jp.pdf
19
政府データカタログサイト試行版
日本政府は世界30位。加速が必要オープン・データ・センサス 2013
20
• 日本は、政府支出、企業登記情報、交通時刻表、立法の分野で低評価• どの項目もオープンライセンスの採用については「Yes」の評価を得ず• 日本はG8構成8カ国中6番目。• オープンライセンスの適用を本格的に広げることが必要。
Open Data Census 2013 by Open Knowledge Foundation
東日本大震災震災(2011年)
• 透明性
– 直ちに健康に影響が出るものではない?
– PDFではなくHTMLやCSVでの情報提供を要請
• 参加
– データ提供・編集
– IT サービス開発
21
風@福島原発 石野正剛
Sinsai.info NERV専用臨時電力供給監視装置集団 @Molokheiya
東京電力電力使用状況Chrome extensionYoshiki Takeoka
世界最先端レベルの業界• 道路交通
– 主体:自治体・国交省・警察・カーナビ →道路交通情報センター → 民間企業/メディア
– 情報:道路渋滞、工事、事故、通行履歴• → 到着時間予測、事故対策、被災時通行可能道路
• 鉄道・バス– 主体:鉄道バス会社・子会社 - - - - > 民間企業– 情報:時刻表、運行情報、
• → ナビサービス
• 気象– 気象庁 → 気象業務支援センター
→ 民間企業/メディア– 情報:気象予報、警報、過去データ、緊急地震速報
• → 高度な気象情報サービス、防災・災害対応
22利用条件の緩和、低価格化をさらに進めることはできないか?
東京アメッシュ:東京都下水道局
ゆれくる:RCソリューション
Google:クライシスレスポンス
『世界最先端IT国家創造』宣言(2013年)
23
公共データについては、オープン化を原則とする発想の転換を行い、ビジネスや官民協働のサービスでの利用がしやすいように、政府、(略)地方公共団体等が保有する多様で膨大なデータを、機械判読に適したデータ形式で、営利目的も含め自由な編集・加工等を認める利用ルールの下、インターネットを通じて公開する。
1. (行政の)透明性・信頼性向上2. 国民参加・官民協働3. 経済活性化・行政効率化電子行政
オープンデータ戦略(2012年)
1. 政府自ら積極的にデータを公開2. 機械判読可能な形式で公開3. 営利・非営利目的を問わず活用促進4. 取組み可能なデータから速やかに公開
目的
原則
「電子行政オープンデータ戦略」の後の取組み
24
オープンデータ流通推進コンソーシアム
Open Data METI(経済産業省)
気象データ・ハッカソン
勝手表彰
Open Data METIオープンデータ流通推進コンソーシアム
25
オープンデータ流通推進コンソーシアムオープンデータアイディアソン
総務省次世代統計利用システム• API提供
– 政府統計の総合窓口(e-Stat)提供中の統計データを機械判読可能な形式(XML等)で提供
• 内容– 国勢調査、人口推計、就業構
造、企業統計、地域メッシュ統計 等
• クレジット表示– 「このサービスは、次世代統計
利用システムのAPI機能を使用していますが、サービスの内容は総務省統計局又は独立行政法人統計センターによって保証されたものではありません」
26
総務省統計局
復旧・復興支援制度データベース• 概要
– 2012年1月~– 復興庁ほか
• 国や地方公共団体等の様々な支援制度をワンストップで検索– 個人向け329件– 事業者向け2249件
• API公開– 活用ハッカソンを開催– Hack for Japanからの改善提
言に回答・対応– V2リリース
27
復興庁
気象庁防災情報XMLフォーマット• 概要
– 2011年5月~– 気象・地震・津波・火山等の個別
フォーマットを統一・XML化– XMLコンソーシアムと協力
• 内容例– "台風解析・予報情報"– “全般海上警報”– "気象警報・注意報"– "指定河川洪水予報"– "土砂災害警戒情報"– "記録的短時間大雨情報"– "竜巻注意情報"– "府県週間天気予報"– "緊急地震速報"– "津波警報・注意報・予報"– "噴火警報・予報"– "天気図情報"
28
気象庁
AED設置場所• 非集約
– 市役所等がバラバラに公開
– 集約サイトも集約に苦労
• 「現在の登録数(約10万台)は、日本全国約38万台※の2.5割程度に過ぎません」※平
成23年度厚生労働科学研究費補助金 循環器疾患・糖尿病等生活習慣病対策総合
研究事業 日本全国AEDマップより
• 先行事例– 米国PulsePoint
29Google検索結果PulsePoint
情報提供側の課題• 利用しにくい
– 「ネ申Excel」
– スキャン画像
– 語彙、形式の不統一
• 本当に「All Rights Reserved」なのか– 営利利用禁止
– 学術利用限定
• 無駄な業務– 紙でしか保存しない
– デジタルで作成したものを紙提出(その後手入力)
• 法的根拠の整理– 公開が定められている
• 「書面」と書いてある
– 公開が禁じられている
– 可否が定められていない
– 「目的外利用」の可否
• 所在・管理の状態– 把握されていない
– 探せない
– 死蔵されている
• マインド– 誤解・批判を避けたい
– 問題が起こるリスクの回避
30
公的機関がデータを公開しない理由
• 無関心
• 混乱
– 明確な事例がない
– どんなデータが必要なのかわからない
– 目的や便益を明確にしてほしい
• 困難
– とにかく複雑で難しい
– データ量が膨大である
– 自分の時間の大部分が取られてしまう
• 費用
• スタッフ問題
– それは私の仕事ではない
– 上司や政治家は公開を望んでいない
– やり方を知っている人がいない
• プライバシー
– プライバシー保護の懸念がある
• 既に公開している
– 情報公開制度があるではないか
• 合法性
– 公開する法的な権限を持っていない
– 私達がデータ所有者なのかわからない
– データは販売するべきである。
– 収集に膨大な時間・人・資源を投入した
– なぜデータを必要としているのかを知りたいので、直接窓口に来てほしい
– 誰かがパッケージして売払うのでは
– 誰が何を行ったかコントロールしたい
• 正確さ
– 誰かがそれを変更してしまう
– 人々が誤解する危険がある
– 市民が混乱する、データ品質が高くない
• その他
– データが優秀な技術者集団等に利用されると、デジタルデバイドがさらに深刻化する
31Tomihiko Azumaの記事を編集 http://okfn.jp/2013/10/23/reasons-to-not-release-data-sunlight-foundation/
出典: Reasons to Not Release Data, Part 1-Part 10, Sunlight Foundation
利活用・普及のための方法
1. 開発イベント– アイディアソン、ハッカソン
– データ発掘・登録
2. コンテスト– 賞金授与、開発協力、買取り、
オーソライズ
3. 仲介者・中間支援者– 需要者のニーズを把握し情報公
開を政府機関に働きかける
– ビジネスインキュベーション
– ツール開発、交流
– データの整形・加工ビジネス
4. ポータルサイト– ワンストップ提供
– 国だけではなく自治体も開設
5. コンソーシアム– 会員等にデータを提供
6. API公開– 復旧・復興支援制度データベース
(復興庁等)
7. ランク付け・進捗評価– Linked Open Data 5 Star”
8. 技術者・行政マッチング– Code for America
32
33
Berlin London Amsterdam
Vienna ParisWashington D.C.
(World Bank)
Kathmandu
Quezon
International Open Data Day 2013• カナダの有志が提唱• 世界102都市が参加• 米 19都市• 含:White House,
World Bank• 伊 13都市• 日、加、独 8都市
Shu Higashi写真は各地の報告記事より
34
• 概要
– 各地で市民が集まり、オープンデータを活用してアプリケーションを開発したり、データを発掘して公開したり、データをわかりやすく可視化したり、分析してその結果を公表したりするイベントを開催
• 日本における意義
– 地域におけるオープンデータ活用機運の醸成
– 各地の開発者コミュニティ形成と地域に密着したニーズの発掘
– サービス基盤整備の加速
– 世界への情報発信
Fukuoka
8都市、約400人が参加
• 主催(国内取りまとめ・開催支援):
– Open Knowledge Foundation Japan
• 後援:
– 日本経済団体連合会
– オープンデータ流通推進コンソーシアム
– 独立行政法人情報処理推進機構
• 協賛:
– 株式会社国際社会経済研究所
– 日本電気株式会社
– 特定非営利活動法人ASP・SaaS・クラウド コンソーシアム(ASPIC)
– クラウド・ジャパン・イニシアティブ(CJI)
– 株式会社IDCフロンティア
• 協力:
– Yahoo! JapanOKFJ
名古屋/東海
35
千葉
オープンデータデイ2013ブログより
福井県「データシティ」鯖江市
36
• 市内公園等のトイレ情報(XML)• 鯖江百景の位置情報等(XML)• 災害時の避難所の位置情報(XML)• 市内のAED情報(XML)• 鯖江市の施設(XML)• 市内のwifiの設置場所(XML)• さばえ検定100問(XML)• 人口、気温(XML)• さばかん(鯖江観光)情報(XML)• 公式ホームページのRSS• 鯖江市議会UST録画とトピック(XML)
• 市が機械可読形式データを提供
• 民間企業等が50種以上のアプリを開発
さばえぶらりATR Creative Inc.
トイレこんしぇる鯖江版 福野泰介
静岡県
データカタログサイト
福井県
県・全市町の標準化
37
• 県と17市町による電子自治体推進協議会にオープンデータ推進部会を設置
• 公開するデータの種類、内容などを今後検討。
• データ形式は、CSVに当面統一する方針
• 県政策統計・情報課– 「オープンデータ化の全国トップラ
ンナーになるよう県と市町が協力して推進し、公開したデータが県民に役立つ形になるよう取り組んでいきたい」(福井新聞)
静岡県
38岐阜県 鳥取県
具体的な取組み
39
税金はどこへ行った?
40
「税金はどこへ行った?」横浜市版
税金はどこで誰にいくら使われたか?
41
市民参加型予算編成へ
Recovery.gov YouChoose
42
伝わるインフォグラフィックス経済産業省
自分で計算してみる少子高齢化(株)シンクトナイト
日本の人口推移: bowlgraphics | TOKUMA
think tonight Inc.
復興予算流用問題(福場ひとみ+週刊ポスト)
• 主な資料– 東日本大震災復興特別会計歳出暫定
予算予定額各目明細書
• 取材手法– 「彼女は取材相手に会っていない。「す
べてインターネットと電話取材だった」というのだ。これは私の常識をまったく覆すものだった」
– 「旧知だった桜内文城衆院議員に(略)率直に疑問をぶつけてみた。」
– 「ぜんぶ電話取材ですよ」
– 「官僚の話には裏側に嘘がある。概要を聞くだけなら9割はなるほどそうか、と思えるような話でも、残りの1割に嘘がある。そこは相手とケンカしながら聞いていくわけです」
43
「19兆円復興予算をネコババした泥棒シロアリ
役人の悪行」週刊ポスト8月10日号
※各目明細書は2009年10月の閣議決定により公開化
出典:長谷川幸洋メルマガ
OpenCorporates• 欧州のオープンデータチャレ
ンジでアプリ部門3位• 欧州委員会や金融安定理事
会にも関わる• 「オープン化がデータの質を
高める」
44
Chris Taggart氏資料より
Chris Taggart氏資料より
45
Out of Sight, Out of Mind: A visualization of drone strikes inPakistan since 2004ピッチ・インタラクティブ/2013年
http://drones.pitchinteractive.com/
使用データNPO「ビューロー・オブ・インベスティゲーティブ・ジャーナリズム」、ニューアメリカ財団、リビング・アンダー・ドローンズ等からの提供
「コネクティッド・チャイナ」ロイター:2013
Data Journalism Award 2013: "Data-Journalism Section or Website"部門受賞
46http://connectedchina.reuters.com/
The Climate Corporation (アメリカ)• 農家向け保険商品Total Weather Insurance
– 農作物の収穫を妨げる原因となる悪天候に対して、年間を通じた収入補償を提供する保険
– 地域や作物ごとの収穫被害発生確率を独自に予測し農家あるいは農場ごとに保険をカスタマイズして販売
– トウモロコシ、大豆、ソルガム。種まき期の降水量、過剰降雨、干ばつ、日中の熱による影響、夜間の熱による影響、冷害や凍結などの危険要因が保険の対象
– 作物、場所、土壌のタイプが異なる個々の生産者の収穫量を左右する気象条件を動的に判定することが可能になり、その生産者の農地を保障するのに最適な、年間を通じた保険を自動的にカスタマイズ
• データ– 国立気象サービスがリアルタイムに提供する地域ごとの
250万ヶ所から得る気象データ
– 農務省が提供する過去60年の収穫量データ、
– 1,500億ヶ所の土壌情報
47
2006年に元Googleの従業員に
よって設立された企業
数学、統計、神経科学等
の博士号を持つ解析専門
家10数名も参画
米モンサントが1100億円で買収
The Climate Corporation
かなざわ育なび.net(横浜市金沢区)
• 施設・イベント情報を場所と生年月日でカスタマイズ提供
• 使用データは「二次利用可能」な条件で一般にも提供
• 行政内外からのアイデアで新サービス創出へ
48
直接取得または
WEBからオープン
データ取得
金沢区内関係各課市役所内各局 データベース
かなざわ育なび.netで活用
オープンデータとして提供
新サービスの創出
良いサービスであれば取り入れて
連携・活用
happy♪
http://kirakana.city.yokohama.lg.jp/
「地域の○○を探す」サービス
スマホから薬局を探す 高齢者入居施設を探す
49
オープンデータ活用のカギは、「地域」「モバイル」「リアルタイム」?
http://www.elbatrop.com/pharmacies http://www.bestcarehome.co.uk/
鎌倉ごみバスターズ(神奈川県鎌倉市)
• 鎌倉市の「面白法人カヤック」による、ごみ問題に取り組むためのコレクションゲームアプリ。
• 鎌倉市では、近々ごみ処理場が一基廃炉になるため市を挙げてごみ削減に取組んでおり、同市へのプレゼントとしてカヤックが作成
• 分別やリサイクルといったごみを減らすアクションを実行するとポイントがたまり、たまったポイントに応じてフィギュア風アイテム画像を獲得できる。
• 鎌倉市から提供された情報をもとに「ごみ分別辞書」「ごみ出し忘れ防止機能」も実装
50http://bmsp.kayac.com/gomibusters/
米国MRIS: Metropolitan Regional Information Systems
住む前に全てがわかる「不動産高度情報サービス」
• ワシントン・ボルチモア広域都市圏をカバーする米国最大規模のMLS(不動産情報サービス)
• MRISには価格、写真、住宅ツアー、フロアプラン、地図のほか、公的機関から入手したデータを選択・加工・編集し、利用者が理解しやすいような形式で提供
• HomesDatabaseというWebサイトを通じ一般消費者向けにもデータをわかりやすい形で提供– 毎月平均50万人が訪れ、2万人もの新たな見込み客が生まれている– 住宅、住人、経済、学校、環境、QOL、地図などの分野ごとに詳細な情報を知ることができる
51
環境に関しては、高度、年間降水量、年間降雪量、1月の平均最低気温、7月の平均最高気温、年間の降雨日数、年間の晴天日数、快適指数、大気の品質、流域の品質、一人当たりの医師の数、医療経費指標、汚染場所からの影響指数、紫外線指数などまで知ることができる
学校に関しては、住所、電話番号、対象学年、生徒数、先生一人当たりの生徒数、生徒一人当たりの支出額、各学年の生徒数、習熟度テスト(DC-CAS)の国語・数学・科学のテスト結果まで知ることができる
http://www.mrishomes.com/
Europeana
• 欧州委員会
• 欧州36カ国の図書館・美術館・文書館・映像音声等のデジタルアーカイブ2900万件の開放
• ほとんどがパブリックドメイン
• Linked Open Data
• 横断検索
52
http://www.europeana.eu/
Muse• オランダOpen Culture Data
Competitionで最優秀賞
• 著名な芸術作品を切り貼りし新しい作品を創り出すことができる– タブレットを使って、作品を選
び、好きな場所に配置し、組合せ、個性的な芸術作品を創る
• アムステルダム国立美術館が保有するコンテンツを利用
• 素材(パーツ)から、作品や作者への関心が芽ばえることを意図
53
出典:Muse App