オープンデータ推進の課題とポイント
DESCRIPTION
TRANSCRIPT
オープンデータ推進の課題とポイント〜技術的側面から〜
武田 英明[email protected] @takechan2000
国立情報学研究所 NPO法人リンクト・オープン・データ・イニシアティブ
横浜・神奈川オープンデータフォーラム、 2014年 6月 16日、横浜大桟橋
https://www.slideshare.net/takeda/ss-35898959
オープンデータへの5つのステップ
どんなフォーマットでよいからオープンラインセスでデータ公開 例: PDF, jpg
コンピュータで再編集可能なフォーマットで公開例: xls, doc
オープンに利用できるフォーマットで公開 例: csv
RDF (と SPARQL )でデータ公開 例: RDFa, RDF ストア
他へのリンクを入れたデータを公開
オープンデータに必要なもの•オープンライセンス
•機械可読フォーマット
データは情報流通社会の製品
自由に利用 自由に再加工
自由に再配布
資源
オープンライセンス•情報を最小限の制約以外で自由に使うことを許すライセンス
CC0権利放棄
CC BY表示
CC BY-SA表示 - 継承
CC BY-NC表示 – 非営利
CC BY-ND表示 – 改変禁止
CC BY-NC-SA表示 - 非営利 - 継承
CC BY-NC-ND表示 - 非営利 - 改変禁止
全ての権利の主張
CCライセンスいくつかの権利の主張
オープンライセンス
機械可読フォーマット•再利用性を高める• 内容を切ったり、はったりできること
•機械(コンピュータ)が内容を処理できる形式が望ましい• 読めるが再編集できない• プログラムで再編集できる• オープンなフォーマットで公開
• 特定のプログラム・ソフトウエアに依存しない• Webのように使えるフォーマットで公開
• Webでお互いのデータを使い合うことができる
オープンデータへの5つのステップ
どんなフォーマットでよいからオープンラインセスでデータ公開 例: PDF, jpg
コンピュータで再編集可能なフォーマットで公開例: xls, doc
オープンに利用できるフォーマットで公開 例: csv
RDF (と SPARQL )でデータ公開 例: RDFa, RDF ストア
他へのリンクを入れたデータを公開
データの書き方も重要• HTML:データの構造がきちんと表現されていないので NG• HTMLでは構造が表示のために使われることがおおい。
• Excelデータ (xls, xlsx, csv)もデータの構造を表示のために使うとデータとしては使いづらくなる• 例: Excel方眼紙
より使いやすいオープンデータへ• スキーマ・語彙・コードの共有
• データを表現するときの構造(スキーマ)、用語(語彙)、コードをお互いに使い合う
• 共通語彙基盤(経済産業省、 IPA)• 行政で使われる基礎的な用語について基準を示す• 構造化概念辞書• 個別分野でのスキーマ、語彙へのテンプレート
• Linked Open Data (LOD)• 統一した記述言語、検索言語• Webに親和性の高い仕組み
• URIの利用• httpによるアクセス (webのアクセスと同じ仕組み)
• 相互に参照できる→連携するデータ
沢山のデータがあっても、つながっていない…
行政データのオープンデータ化の推進のために•行政システムとの連携• 行政システムが常にオープンデータに使えるデータをはき出せるようにする。Open Data Ready!
•広報との連携• 情報を公開するときに人向けデータとコンピュータ向けデータの両方をだすようにする。• システム的にも• 行政フロー的にも
•市民との連携• データを出すこと、使うこと、双方の価値を高めるためのサイクルをつくる
オープンデータによる情報流通•これまでの公共情報の流通
公共機関など
市民
情報提供 必要なデータを 必要な方法で
請求、要望
様々な要望に応えるのは大変
我々の要望に応えてくれないなあ
オープンデータによる情報流通
公共機関など市民
データ公開
アプリ公開
要求、要望のシェア
サードバーティ=市民、プログラマー、企業
データのみ公開
欲しい方式(形式、アプリ)へ
公開データ 公開アプリケーション
おわりに•オープンデータへの5ステップ• まだ、歩き始めたばかり• 機械可読フォーマットの推進• より使いやすいデータへの技術的方向
• 共通語彙基盤、 LOD
•行政でのオープンデータ促進のために• システム、ワークフローへの組み込み• 利用の輪