平成26年1月21日 総務省 情報流通行政局 情報流通振興課

14
平平 平平 平平 平 平 26121 平平平 平平平平平平平 平平平平平平平 平平平平平平平平平平平平平平平平平平 平平平平平平平平平平平平平平平平平平平平 ~~ IT 平平平平平平 平平平平平平平平平平平平平平平平 平 平平平平平平平平平平平平平平平平平 平平

Upload: daire

Post on 26-Jan-2016

46 views

Category:

Documents


2 download

DESCRIPTION

IT 総合戦略本部 電子行政オープンデータ実務者会議 第4回 データ・ワーキンググループ提出資料. 資料5. 総務省オープンデータ実証実験での取組 ~データカタログサイトの本格運用に向けて~. 平成26年1月21日 総務省 情報流通行政局 情報流通振興課. 【 目次 】 1.オープンデータ実証実験の概要  (1)全体概要  (2)実証実験の例    ①統計情報・データカタログ実証    ②自治体行政情報実証  (3)オープンデータ・アプリコンテスト 2.オープンデータ実証実験での取組と 政府データカタログサイトの本格運用に向けた示唆 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

平成26年1月21日総務省情報流通行政局情報流通振興課

総務省オープンデータ実証実験での取組~データカタログサイトの本格運用に向けて

総務省オープンデータ実証実験での取組~データカタログサイトの本格運用に向けて

IT 総合戦略本部 電子行政オープンデータ実務者会議

第4回 データ・ワーキンググループ提出資料

資料5

Page 2: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

2

【目次】

1.オープンデータ実証実験の概要 (1)全体概要 (2)実証実験の例   ①統計情報・データカタログ実証   ②自治体行政情報実証 (3)オープンデータ・アプリコンテスト

2.オープンデータ実証実験での取組と  政府データカタログサイトの本格運用に向けた示唆 (1)開発者向けサイト (2)メタデータ (3) API (4)データカタログサイトと他のデータベースとの連携

Page 3: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

3

1.オープンデータ実証実験の概要

Page 4: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

4

※共通API( Application Programming Interface ):情報・データの相互運用性を確保するための共通のデータ形式や通信規約

 ・ 情報流通連携基盤共通API(第1版)について、平成 24 年度の実証実験の結果等を踏まえ、意見募集( Call for Comment )を実施(平成 25 年 10 月 10 日まで)。 http://www.opendata.gr.jp/cfc/

 ・ 平成 25 年度は、年度末の情報流通連携基盤共通API(第2版)の策定に向けて、統計情報・データカタログ実証、自治体行政情報実証、社会資本実証、観光実証、防災実証等、7本の実証実験を実施中。

情報流通連携基盤共通API

<防災情報サービス>

浸水危険エリア

避難勧告エリア

<公共交通情報サービス> <地盤情報サービス>

様々な情報の組み合わせ

遅延情報

リアルタイム位置情報

国・県・市町村の地盤情報を一覧表示

○  分野を超えたデータの流通・連携・利活用を効果的に行うために必要となる、①情報流通連携基盤共通API※(標準データ規格・標準API規格)の確立・国際標準化、②データの2次利用に関するルール(データガバナンス方式)の策定、③オープンデータ化のメリットの可視化等のための実証実験を実施。

自治体行政情報 社会資本情報 観光情報 防災情報 公共交通情報 統計情報 花粉症情報

1.オープンデータ実証実験の概要 (1)全体像

【イメージ図】

Page 5: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

【参考】 情報流通連携基盤共通APIの意義

DB

公開主体 X

【標準 API 規格なし】

DB

公開主体 Y

DB

公開主体 Z

DB

【標準 API 規格あり】

DB DB

・サービスごとにデータの取得方法を調査し、アクセスする必要・データの取得先もサービスごとに違う

・データ提供元によらず共通の問い合わせ形式でアクセス可能・データの識別子から、そのデータの取得先を問い合わせられる

公開主体 X 公開主体 Y 公開主体 Z

独自 API 独自 API 独自 API 標準 API

X 用の問い合わせ

Y 用の問い合わせ Z 用の

問い合わせ

標準 API 独自 API

標準 API

既存の独自 API に標準API を被せてもよい。また、サービスが独自にAPI を提供することを妨げない。

標準 API やDB の実装方法は、標準API 規格の範囲外。

トータルコストが上昇

各組織のデータ形式がばらばらで、加工しづらい 機械可読なデータ形式に統一すること等で二次利用が容易に。

公開主体 A

【標準データ規格なし】公開主体 B 公開主体 C 公開主体 A

【標準データ規格あり】公開主体 B 公開主体 C

○○ 市人口統計…

PDF

1985 年 ,1234人1986 年 ,1385人…

CSV昭和 60 年 ,10.4千人昭和 61 年 ,12.3千人…

CSV

…<dc:date>1985-04-01</dc:date><rdf:value>52345</rdf:value>…

標準データ規格

…<dc:date>1985-04-01</dc:date><rdf:value>12345</rdf:value>… …

<dc:date>1985-04-01</dc:date><rdf:value>10425</rdf:value>…

標準データ規格

標準データ規格

5234553854

昭和 60 昭和 61

人口統計データ要求

人口統計データ要求

人口統計データ要求

人口統計データ要求

人口統計データ要求

人口統計データ要求

DB DB DB DB DB DB

情報流通連携基盤共通 API は、(1)標準データ規格(データモデル、データ表現形式、共通ボキャブラリ)、(2)標準 API 規格から構成。

5

Page 6: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

○  オープンデータの利活用ニーズが高いと想定される、統計情報(次世代統計利用システムで提供されてるもの)や政府データカタログサイト(試行版)と情報流通連携基盤システムを接続し、両者の連携可能性を実証する。

○  これにより、次世代統計利用システムや政府データカタログサイト(試行版)が提供するデータと他のデータとをマッシュアップが可能となる環境を実現する。

○  また、統計情報については、従来は統計表ごとに検索していた、複数の統計表に対する統計情報検索を、情報流通連携基盤共通 API を 1 回呼び出すことで実現させることにより、統計情報の取得を簡素化することを目指す。

実施主体: 株式会社横須賀テレコムリサーチパーク連携主体: 内閣官房、総務省統計局、独立行政法人統計センター

情報流通連携基盤共通 API情報流通連携基盤共通 API

コンテストによるアプリケーションコンテストによるアプリケーション開発者サイト

•API仕様•サンプルコード•利用規約 等

開発者サイト•API仕様•サンプルコード•利用規約 等

提供提供

本実証で扱うデータ

統計情報統計情報 データカタログ情報データカタログ情報

統計表 #1

統計表 #2

統計表 #n

複数の統計表に対する検索を要求 結果を返却

個々の統計表に対して検索を要求

データカタログ APIデータカタログ API次世代統計利用システムAPI

次世代統計利用システムAPI

1.オープンデータ実証実験の概要 (2)例①:統計情報・データカタログ実証(概要)

6

Page 7: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

○  ユーザニーズに基づいた自治体版の「情報流通連携基盤システム」を構築し、広く地方公共団体に普及展開できるモデルを策定する。

○  広く普及展開可能なモデルを構築するためには、単に基盤システムを構築するだけでなく、情報流通連携基盤システムの設計思想のドキュメント化、ニーズの高い自治体行政情報の特定、ポータルサイトの構築、自治体職員向けの補助ツールの整備、情報サービスの構築によるメリットの可視化等を1つのパッケージとして整備する必要がある。実施主体: エヌ・ティ・ティ・データ ( LOD イニシアティブ、日本マイクロソフ

ト、インディゴ、 jig.jp )連携主体: 横浜市、鯖江市

サービス利用者

(地元住民)

情報流通連携基盤システム

データ提供者(自治体職員)

自治体行政情報データベース

①登録

ボキャブラリ

【データ規格の構築】

・識別子の検討・ボキャブラリの構築・ RDF スキーマの構築

【重点自治体行政情報の特定に係る調査等】

・利活用ニーズの調査・展開可能性の調査・ニーズのあるサービス分野の調査・公開・二次利用不可根拠の調査

【情報流通連携基盤システムの構築】・簡易なシステム設計・設計思想、手順のドキュメント化・ API 、自治体行政情報 DB の構築・データ変換ツールの整備・自治体職員向けのマニュアルの整備・アンケート・ヒアリングによる基盤ステムの検証

CKAN によるデータカタログサイト(横浜市・鯖江市)

【自治体行政情報のオープンデータ化の実証】

・重点自治体行政情報の Web 公開・データカタログサイトの構築・コンテストによるアプリケーションの開発

【「オープンデータ流通推進コンソーシアム」との連携・協力等】

データ利用者(情報サービス開発事業者)

【アプリケーションの開発】・開発者サイト構築

⑤サービス提供

【継続運用・普及に係る計画の策定等】

RDF スキーマ

マニュアルデータ変換ツール

②所在確認

③内容確認

④データ取得

7

1.オープンデータ実証実験の概要 (2)例②:自治体行政情報実証(概要)

Page 8: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

1.オープンデータ実証実験の概要 (3)オープンデータ・アプリコンテスト

○  総務省では、オープンデータのための技術・データの利用ルールの確立、オープンデータ化のメリットの可視化等のための実証実験を実施しているところ、民間における公共データの活用を促進するため、本年度実施中の7つの実証実験でオープンデータ化された公共データを活用したアプリケーションの開発を一般公募により実施。

○  応募のあったアプリケーションについて、オープンデータ流通推進コンソーシアムの利活用・普及委員会において審査を行い、優秀なものについては、平成 26 年 3月 13 日開催予定の第4回同委員会において表彰を実施。

主催

共催

総務省 及び オープンデータ流通推進コンソーシアム

株式会社エヌ・ティ・ティ・データ、富士通株式会社、日本アイ・ビー・エム株式会社、株式会社エヌ・ティ・ティ・データ経営研究所、株式会社パスコ、株式会社横須賀テレコムリサーチパーク、ウェザー・サービス株式会社

表彰

後援 オープンストリートマップ・ファウンデーション・ジャパン 、 オープンナレッジファンデーションジャパン 、 クリエイティブ・コモンズ・ジャパン 、 Code For Japan 、 Hack For Japan 、ビッグデータ・オープンデータ活用推進協議会 、特定非営利活動法人リンクト・オープン・データ・イニシアティブ、 LODチャレンジ実行委員会、独立行政法人 国立高等専門学校機構、国土交通省、気象庁   ※その他調整中

実証実験・オープンデータ化される公共データ実証実験 オープンデータ化される公共データ(例)

自治体行政情報実証 医療機関情報 /バス停情報 /AED設置場所 等社会資本実証 工事実績 / 社会資本情報 /苦情・問い合わせ 等

観光実証 観光情報 /駐車場満空情報 / タクシー平均移動時間 等防災実証 避難所情報 /過去の災害 /ライフラインの被害・復旧情報 等

公共交通実証 遅延・運休等 /走行位置 /東京駅・新宿駅の構内施設 等

統計情報・データカタログ実証 総務省統計局所管の統計情報政府データカタログサイト(試行版)の掲載情報

花粉症関連情報実証 花粉飛散量情報 /気象情報 / 花粉症患者症状情報(統計処理済) 等

スケジュール平 成 25年

11/28 (木) 告知

平 成 26年

1月上旬~下旬 開発者サイト公開・データ提供開始 ※既に6実証について公開済み

2/3 (月) 応募受付開始2/17 (月)正午【厳守】

応募締切

3/13 (木) 10時~12時

第4回 利活用・普及委員会 (受賞者による 、表プレゼンテーション彰式)

自治体行政情報

社会資本情報

観光情報防災情報

公共交通情報

統計情報

花粉症情報情報流通連携基盤

共通API

一般公募によるアプリケーションの開発

一般公募によるアプリケーションの開発

※詳細は、オープンデータ流通推進コンソーシアムのコンテスト専用ウェブサイト( http://www.opendata.gr.jp/2013contest/ )を参照。

8

Page 9: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

9

2.オープンデータ実証実験での取組と政府データカタログサイトの本格運

用に向けた示唆

Page 10: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

2.オープンデータ実証実験での取組と示唆 (1)開発者向けサイト

○  民間によるアプリケーションの作成等、オープンデータの利活用を促進するためには、単にデータを公開するだけではなく、開発者による開発のヒントとなる事項( API仕様、サンプルコード、データ一覧、利用規約、 FAQ 、フォーラム機能等)を掲載した「開発者向けサイト」を用意しておくことが重要。

○  平成 24 年度に実施した公共交通オープンデータ実証では、開発者向けサイト( API仕様、サンプルコード、データ一覧、利用規約、 FAQ 、フォーラム機能等を掲載)を公開した上で、アプリケーション開発を一般公募したところ、わずか3週間で 16 のアプリケーションが開発された。

○  本年度は、全ての実証実験において、「開発者向けサイト」を用意し、「オープンデータ・アプリコンテスト」で提供。

  

示唆①:開発者向けサイト示唆①:開発者向けサイト

10

■統計情報・データカタログ実証の開発者向けサイト

■自治体行政情報実証の開発者向けサイト

Page 11: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

【参考】 統計情報・データカタログ実証の開発者向けサイトが提供する機能

11

【 API仕様・サンプルコード】・ アプリケーションを開発する際に必要となる、データのアクセス仕様及びその利用方法をイメージ可能なサンプルコードを掲載・ 統計情報・データカタログ実証では、 SPARQL(*1) 準拠の API を提供

【データ一覧】 ・ 本実証で利用できるデータ一覧を掲載

【フォーラム機能】 ・ 開発者間の意見交換機能を提供

(*1) RDF(*2) 形式のデータに関する検索を行う言語。 W3C ( World Wide Web Consortium )が規格化している。(*2) 主語・述語・目的語という3つの組でデータを記述する枠組み。 W3Cが規格化している。

Page 12: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

2.オープンデータ実証実験での取組と示唆 (2)メタデータ

○ オープンデータ実証実験においては、メタデータの記述モデルに RDF を採用し、メタデータを記述するために利用するボキャブラリは、広く流通しているものを取り入れつつ、実証に必要なボキャブラリを追加定義する方針をとっている。

○ 統計情報・データカタログ実証においても、統計情報の記述には RDF Data Cube Vocabulary を、データカタログサイトに登録されているデータの記述には Data Catalog Vocabulary ( DCAT )(いずれも W3Cが勧告済み)の各ボキャブラリを採用している。

○  政府のデータカタログサイト試行版も、 DCAT 等、国際標準に従って、メタデータ項目が作成されている。■政府データカタログサイト試行版に掲載されているデータのメタデータ表記例「 http://www.soumu.go.jp/main_content/000224888.pdf」に掲載されている、「総務省」が作成した「総務省所管予算の概要」という PDF 資料に関する、データカタログサイトに格納されているメタデータは、以下のとおり(下記は、一部のメタデータを割愛している)。

○  メタデータを広く利用されているボキャブラリで記述するだけでなく、メタデータ項目の値の作成作業を効率化することも必要。具体的には、メタデータの値に関する一定の基準を設け、各府省の職員が各種データファイルを作成する際に、その基準に従いメタデータの値の記載も併せて行うようにする等、各府省の日常的な業務プロセスの中にメタデータ作成作業を位置づけておくことが有効。

 ⇒ 「二次利用の促進のための府省のデータ公開に関する基本的考え方(ガイドライン)」(平成 25 年 6月 25 日 各府省情報化統括責任者( CIO )連絡会議決定)の改訂。

○  あわせて、そのメタデータの値を効率的にデータカタログに登録する方法についても検討が必要。

示唆②:メタデータ示唆②:メタデータ

12

http://www.data.go.jp/

data/dataset/soumu_05_ds_131

126_00000001

dcat:distribution(参照先情報)

dcat:accessURL(参照先 URL )

dct:format(ファイルフォーマット)

予算 _平成 25 年度dcat:title( データセット名 )

PDFrdf:value( フォーマット名)

総務省所管予算の概要dcat:title( 参照先情報名 )

dct:IMT( ファイルフォーマッ

ト)

rdf:type( データ型)

dcat:Dataset(データセッ

ト)

rdf:type( データ型)

財政dct:keyword( キーワード・タグ )

dcat:Distribution( リソース・参照先情

報 )

rdf:type( データ型)

dct:creator( 作成者 )

総務省foaf:name( 作成者名 )

http://www.soumu.go.jp/main_content/000224888.pdf

publisherrdfs:label( 属性名 )

大臣官房会計課rdf:value( 属性値 )

dct:relation( 関連情報 )

Page 13: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

2.オープンデータ実証実験での取組と示唆 (3) API

○  民間によるアプリケーションの作成等、オープンデータの利活用を促進するためには、単にデータを公開するだけでなく、アプリケーションから必要なデータを自動的に取得できるよう、 API ( Application Programming Interface )を用意することが重要。

○  マッシュアップを想定し、その API の仕様は共通化しておくべき。

示唆③: API示唆③: API

13

○  オープンデータ実証実験では、単にデータを公開するだけでなく、アプリケーションから必要なデータを自動的に取得できるよう、 API ( Application Programming Interface )を用意。

○  その際、データのマッシュアップを想定し、複数のデータベースから共通の方法によりデータ取得が可能となるよう、共通の API (情報流通連携基盤共通 API )を用意。

機能名 概要SPARQL ベースの API

SPARQL-based command SPARQL1.1 準拠のデータ操作 API を提供。

REST ベースの API

Traceability/Realtime Data Management Command

トレースフォワード・トレースバックを含む、トレーサビリティに代表されるイベントを管理する機能。

Geographical Data Management Command GIS 等地理情報処理を必要とするデータ検索・取得・操作機能。

Notification Management Commandデータの登録・更新をトリガとしてデータ利用者のシステムにコールバックする( Notification )仕組み。

Security Management Command ユーザ・グループの管理と、データのアクセスルールに関する機能。

Vocabulary Management Command ボキャブラリ情報の登録・検索・取得に関する機能。

Triple Management Command RDFモデルの主語・述語・目的語からなる基本データの登録・検索・取得に関する機能。

Identification Resolution Command ID をキーとしてデータを登録・検索する機能。

■情報流通連携基盤共通 APIが提供する API機能一覧  広く利用されている規格を収集・列挙し、これらの規格との相互運用性を考慮しつつ、実証において必要になる機能を追加。

Page 14: 平成26年1月21日 総務省 情報流通行政局 情報流通振興課

2.オープンデータ実証実験での取組と示唆 (4)データカタログサイトと他のデータベースとの連携

○  既存データベースが存在する場合には、当該データベースのデータをカタログサイトに掲載する方法のほか、既存データベースとカタログサイトに共通の API を用意し、開発者が共通の問い合わせ方式によりデータ取得可能な環境を用意する方法も考えられる。

示唆④:データカタログサイトと他のデータベースとの連携示唆④:データカタログサイトと他のデータベースとの連携

14

○  統計情報・データカタログ実証では、共通の API により、既存のデータベースである次世代統計利用システムと、データカタログサイトとを連携させ、データのマッシュアップが可能となる環境を実現。 

情報流通連携基盤共通 API情報流通連携基盤共通 API

統計情報統計情報 データカタログ情報データカタログ情報

アプリケーションアプリケーション

共通のクエリ( SPARQL クエリ)

次世代統計利用システム API 用クエリ

レスポンス データカタログ API 用クエリ

レスポンス

共通のレスポンス( SPARQLレスポンス)

データカタログ APIデータカタログ API次世代統計利用システムAPI

次世代統計利用システムAPI