総合科学技術・イノベーション会議 第14回重要課題専門調査会 ·...

21
1 分野間データ連携基盤の整備に向けた方針 (目次) 1.現状認識 2.欧米の動向 3.基本的な整備方針と目指すべき姿 4.今後検討が期待される分野間連携イメージ 5.分野間データ連携基盤構築のために必要な事項と官民役割分担 (1)技術的事項 ① 協調領域として整備すべき機能と研究開発課題 ② 競争領域として開発・サービス提供が期待される機能 ③ 特に留意すべき事項 (2)ルール・制度的事項 ① データ提供インセンティブ ② データ利用権限、利活用を阻害しない仕組み ③ データ品質の基準策定 ④ データ提供者、利用者の評価 ⑤ エコシステムの形成 (3)推進体制 ① 共通語彙 ② データカタログ(メタデータ) ③ API ④ PDCAサイクルによる段階的整備 6.実現に向けたロードマップ 資料2-1

Upload: others

Post on 23-May-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

1

分野間データ連携基盤の整備に向けた方針

(目次)

1.現状認識

2.欧米の動向

3.基本的な整備方針と目指すべき姿

4.今後検討が期待される分野間連携イメージ

5.分野間データ連携基盤構築のために必要な事項と官民役割分担

(1)技術的事項

① 協調領域として整備すべき機能と研究開発課題

② 競争領域として開発・サービス提供が期待される機能

③ 特に留意すべき事項

(2)ルール・制度的事項

① データ提供インセンティブ

② データ利用権限、利活用を阻害しない仕組み

③ データ品質の基準策定

④ データ提供者、利用者の評価

⑤ エコシステムの形成

(3)推進体制

① 共通語彙

② データカタログ(メタデータ)

③ API

④ PDCAサイクルによる段階的整備

6.実現に向けたロードマップ

資料2-1

Page 2: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

2

分野間データ連携基盤の整備に向けた方針

1.現状認識

Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

全ての産業の生産性を飛躍的に向上させ、様々な社会課題を解決する社会

である。Society 5.0 を実現するためのカギは、国、自治体、民間などで

散在するデータを連携させ、ビッグデータとして扱い、分野・組織を超え

たデータ活用とサービス提供を可能とすることである。

現在、SIPなどの研究開発プロジェクトにより、農業、インフラ、防

災、自動走行などの分野において、分野内でのデータ連携の取組が進めら

れ、成果をあげつつあるが、今後、分野をまたいだデータの連携を実現さ

せるために、十分なサイバーセキュリティ対策のもと、分野間の「データ

連携基盤」の構築を進めることが急務である。

2.欧米の動向

米国では2005年にNIEM(National Information Exchange Model)

が、欧州では2011年にSEMIC(Semantic Interoperability

Community)がデータ連携標準の取り組みとして始まり、また、欧州では官

民連携によるデータ連携の仕組みとしてFIWAREが開始するなど、仕

組みの整備が進められている。これらは、データの活用、意思決定やAI

等の応用的な活用のために組織・分野横断的に使われる必須の基盤である

ことから、各国とも、データ連携基盤を将来に向けた中核政策として位置

づけている。

こ れ ま で 日 本 の デ ー タ 連 携 フ レ ー ム ワ ー ク で あ る I M I

(Infrastructure for Multilayer Interoperability:共通語彙基盤)、米

国NIEM、欧州SEMICは情報交換を行ってきたが、今後、欧米との

一層の連携拡大が必要となっている。

また、2018 年5月から施行されるEUの一般データ保護規則(GDPR:

General Data Protection Regulation)におけるデータポータビリティの

権利等の今後の動向を注視する必要がある。

Page 3: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

3

3.基本的な整備方針と目指すべき姿

CSTI及びIT総合戦略室が司令塔機能を発揮し、関係府省や民間協

議会等との連携のもと、あらゆるデータを様々な企業や組織が国民に対し

てサービス提供する際の基盤となるものとして、分野毎にとりくみが進め

られてきた「データ連携基盤」を相互に連携させる分野横断のプラットフ

ォーム「分野間データ連携基盤」の構築を、既存成果を最大限活用し、早

急に進める。

分野間データ連携基盤は、様々な企業や組織が、データカタログ(メタ

データ)等を用いて、産学官が保有するデータがどこにあるかを検索し、

API(Application Programming Interface:ネットワーク経由でデータ

提供を行うアプリケーションインターフェース)を介して様々な分野のデ

ータをワンストップで入手可能な分散・協調型の BtoBtoC 型プラットフォ

ームである。

インターオペラビリティ(相互運用性)を確保するためには、データ連

携基盤も含む全体をアーキテクチャとして推進していくことが重要であ

る。レイヤー毎に技術や課題を整理することができ、各国や他組織との議

論が円滑に行える。アーキテクチャの中ではデータ連携基盤だけではなく

ルールの整備が重要である。

Page 4: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

4

全体アーキテクチャ

なお、当該基盤の構築のプロセスにおいては、統一的な技術仕様の策定

や実装を待つことなく、迅速に(agile に)分野間のデータ連携が行われ

ることを目指すべきであり、その実現に向けて、共通語彙、API、メタ

データの仕様等を広く公開し、利用・導入される技術仕様の透明性を確保

することで、相互接続性・連携稼働性を向上し、データ連携の促進を図る。

すなわち、分野間の相互接続性の実現を優先し、分野毎のデータ連携基盤

の構築にあたって培われた開発・実運用の経験を共有しさらに当該システ

ムにその知見を取り込みながら、継続的なPDCAサイクルによる段階的

整備を迅速に(agile に)実現させることが必要である。

分野間データ連携基盤を通じて分野毎に整備されたデータ連携基盤を

横断的に検索・データ入手等できるようにするためには、分野共通のコア

語彙、分野共通で扱うドメイン語彙、ドメイン固有の応用語彙やデータ構

造を整備し、分野横断でのデータのインターオペラビリティ(相互運用性)

を確保することが必要である。

なお、データ活用促進の観点から、個人情報保護やプライバシーに配慮

しつつも、過剰な保護により利活用を阻害しないようにバランスをとり、

これまでの発想や利害関係にとらわれない新規サービスを生み出せる制

度・ルールを構築する。

戦略・政策

ルール

組織

ビジネス

利活用機能

データ

連携機能

アセットセンサー、アクチュエーターハードウェア、ネットワーク

データ収集、データ統合データクレンジング、デバイス管理

データ項目定義、データセット定義コード

カタログ、検索、AI、解析

業務プロセス業務ルール

組織間調整体制

法律規則

ビジョン重点分野

セキュリティ・認証

ライフサイクル

データ連携基盤

Page 5: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

5

これにより、分野間データ連携基盤を活用した官民によるアプリケーシ

ョンの創出等の様々なサービスへの展開、AIのための教師データとして

の活用などが期待できる。

また、欧米との連携にあたっては、オープン・クローズ戦略などの知財

戦略も意識しながら、語彙の相互互換、APIによる相互接続など、分野

間データ連携基盤の国際的なインターオペラビリティ(相互運用性)の実

現に向けた連携を検討していくことが必要である。

分野間データ連携基盤イメージ

(参考)新たな経済政策パッケージ 2017 年 12 月 8 日閣議決定

国・自治体の各行政機関や企業等の民間機関の間で散在するデータをすべて

連携することを目指し、「横断的分野」(位置、時間等)と「固有分野」(農業、イ

ンフラ等)双方について、データ標準や共通語彙基盤(IMI)の横断的な データ

活用を推進するための基盤を3年以内に整備することとし、そのためのシステ

ム開発を開始する。並行して米国、欧州のデータ連携基盤とのデータ連携を検

討し、日米欧 10 億人のデータ共通市場を創設することを目指す。

Page 6: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

6

4.今後検討が期待される分野間連携イメージ

(1)防災分野×交通分野

防災分野で基盤構築が進められているSIP4D(Shared Information

Platform for Disaster management)からの広域におけるリアルタイムな

災害情報データを三次元地理空間情報などと分野横断でのデータ連携す

ることにより、災害時の津波・洪水による浸水やインフラ被災状況等を踏

まえた、安全な避難ルートの提供・避難誘導など、様々な連携の可能性が

広がり、新たな価値創造が期待される。

(2)海洋分野×宇宙分野

航行船による現場観測データと、人工衛星による衛星観測データを組み

合わせることで互いの時間・空間分解能を補完し、統合的な海洋観測網を

形成できる。これらの観測網から、海水温、海色、海上風向・風速、海面

高度、海流、高分解能画像等を活用することで、海流予測や船の位置、経

路情報も一括してGIS(Geographic Information System)上に紐づける

ことが可能になるため、水産業における漁場推定や赤潮監視としての利用

や、海運業における船の安全や経済的な運航への利用が期待される。

Page 7: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

7

水産支援

海面高度、塩分濃度

海上気象

JAXA

現場観測データ(船舶、ブイ等による観測、DCS等によるデータ収集)

海洋観測機関(省庁、独法、自治体等)

水温、塩分、クロロフィル 等

漁業者、省庁、自治体等

海面水温海色(クロロフィル)

データ提供者 サービス

ユーザ【漁業支援サービス】漁場予測・大型クラゲ予測 等

【環境アセスメント支援サービス】海洋環境の現況把握

【赤潮警報サービス】赤潮監視、水質監視 漁業者(養殖)、

省庁、自治体、

民間事業者等

(出典:鳥取県水産試験場HP)

2000年3月に東京湾で発生した赤潮観測例(LANDSAT-5) 海洋環境とスルメイカの漁場予測

必要なプロバイダが既に存在

必要なプロバイダが不在

プロバイダが不要なサービス

(データ提供者から提供されるデータを直接ユーザが利用)

サービス分類の凡例

プロバイダによる付加価値プロダクト漁場予測、大型クラゲ漂着予測 等

船舶

海上気象

大容量通信

測位衛星通信衛星

位置情報

※総合科学技術会議における東京大学山形先生のプレゼン資料を一部改編資料3 宇宙分野と海洋分野の連携-持続可能な社会の形成に向けてhttp://www8.cao.go.jp/cstp/project/bunyabetu2006/frontier/10kai/haihu10.html

(出典:JAXA EORC)

海運支援

2

プロバイダによる付加価値プロダクト海氷予測、海上気象予測、海流予測マップ等

JAXA

海洋観測機関

(省庁、独法、自治体等) 水温、塩分、

波浪 等

【海運支援サービス】経済運航、安全運航(荒天・海氷)等

(出典:Forecast Ocean Plus)に加筆

衛星観測と現場観測を統合し海況予測等のプロダクトを作成

衛星データ

海況予測マップ

海運会社 等

海面水温、海氷

データ提供者 サービス

ユーザ

衛星通信接岸中の船舶

スーパーコンピュータスーパーコンピュータ(海流予測計算)

航行中の船舶

海流予測情報利用海流予測情報利用LLPLLP(海流予測情報を作成・

加工・販売) 海流予測情報

(出典:海流予測情報利用LLPの資料に加筆)

民間サービス会社によるプロダクト提供イメージ

プロバイダー(民間)予測の作成・配信

船舶

大容量通信

測位衛星通信衛星

位置情報

海面高度、塩分濃度

海上気象

現場観測データ(船舶、ブイ等による観測、DCS等によるデータ収集)

海上気象

※総合科学技術会議における東京大学山形先生のプレゼン資料を一部改編資料3 宇宙分野と海洋分野の連携-持続可能な社会の形成に向けてhttp://www8.cao.go.jp/cstp/project/bunyabetu2006/frontier/10kai/haihu10.html

Page 8: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

8

5.分野間データ連携基盤構築のために必要な事項と官民役割分担

分野間データ連携基盤の構築にあたり、技術的事項、ルール・制度的事項及

び推進体制について、以下、実施方針を示す。

なお、技術的事項については、分野間データ連携基盤で実装すべき機能、分

野毎のデータ連携基盤で実装すべき機能、分野間、分野毎のそれぞれに実装す

べき機能があり、これらの区分けについては今後検討する必要がある。

分野間データ連携基盤の全体イメージ

分野間データ連携基盤 分野毎データ連携基盤

・・・

機能/技術課題

推進体制

ルール・

制度

【サービス/ポータル】検索/配信、プライバシー配慮

コミュニティ

【共通管理】カタログ管理、共通語彙/コード管理、統計解析・

シミュレーション/分析、評価

原本性保証

・共通語彙(コア語彙、ドメイン語彙)/データカタログ/API整備等の推進体制と役割分担

・法制度、ガイドライン等

・共通語彙(ドメイン固有の応用語彙)/カタログ/API整備等の推進体制と役割分担

法制度、ガイドライン等

検索/配信 プライバシー配慮 コミュニティ【サービス/

ポータル】

【連携】

【共通管理】 共通語彙/コード管理

カタログ管理

原本性保証

認証・認可/匿名化/秘匿化

データ変換(データ/フォーマット

変換)

データ接続/データ統合(リアルタイム/三次元

データ対応等)

語彙・

コード

データ

カタログ 原本記録

評価品質

評価データ

統計解析・シミュレー

ション/分析

分析ツール

IPA(情報処理推進機構)

民間団体

・IMIパートナー制度・コア語彙標準定義

等・・・

標準化支援 国際連携

NIEM

ISA/SEM

IC

Shema.org

【連携】認証・認可/匿名化/秘匿化

データ接続・統合、データ変換

# 区分 機能 機能概要

1 サービス/ポータル 利用者がデータを利用し易くサポートする機能

2 検索/配信 あいまいなキーワードにて検索し、複数分野のデータを集めて配信IoTデータへの対応も含む

3 プライバシー配慮 プライバシーに配慮し、オプトイン・オプトアウト・データ利用目的の追加等の利用者・提供者とのやり取りの場を提供・記録

4 コミュニティ 利用者同士の意見交換・イノベーション協創(共同研究等)等の場を提供

5 共通管理 データ検索や連携のためにデータ連携基盤が管理する機能

6 データカタログ管理 データカタログ(データの名称、作成者、作成日など)を登録、更新

7 共通語彙/コード管理 データを共通項目名等に揃えるための語彙/コード情報を登録、保管

8 統計解析・シミュレーション/分析

分野共通のシミュレーションや相関等分析(EBPM向け相関分析含む)

9 利用者・提供者評価/データ品質基準

利用者・提供者の相互運用性、信用度等やデータの品質(完全性、正確性、有用性、最新性等)等の評価値を記録・更新。認証機能と連携しアクセスを制御

10 原本性保証 各分野で発生するデータの原本性を保証。データ流通品質を担保

11 連携 データ利用者の要求に応じて、データ提供者のデータを応答する機能

12 認証・認可/匿名化/秘匿化 提供者、利用者の認証、データ匿名化、暗号化等

13 データ接続 データ提供者、利用者との接続を行う機能。(センサデータ等のリアルタイム接続、三次元データ接続も含む)

14 データ変換 データの単位、座標系、項目名等及びデータフォーマットを揃える機能

Page 9: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

9

(1)技術的事項

価値創造、利益の源泉になりうる機能やツールについては、「競争領域」

として、個別の民間企業が独自の技術やアイデアを活かして開発すべきで

ある。

一方、データの流通や利活用の促進の基盤となる機能やツールについて

は、民業圧迫とならないように配慮した上で、まずは「協調領域」として、

内閣府・各省連携のもと、既存の取組みの成果を活かし、戦略的イノベー

ション創造プログラム(SIP)や官民研究開発投資拡大プログラム(P

RISM)等のプログラムにより、開発・実装を進める。官民協力のもと

ルールづくりと基本機能の実装を進め、今後の民間の取組みを踏まえ、順

次「競争領域」へのシフトを促す。

また、ルールづくりを率先して実施することにより、基盤としての整合

性を保ちつつ、基盤自身の肥大化を抑制し、民間活力を促進する。

① 協調領域として整備すべき機能と研究開発課題

i) 整備すべき機能

(データカタログ管理機能)

国・自治体の各行政機関、民間企業、大学や研究機関に散在するデータ

のそれぞれがどこにあるのか、どんなデータがあるかをメタデータ(項目)

に示し、データカタログとして整備する。これにより、分野間データ連携

基盤の利用者が欲しいデータを検索しアクセス可能とする。その際、Io

T機器で測定される観測系データや、アンケートなどの調査系データ、学

術データなど各種分野の違いについても配慮し、表現できるメタデータの

項目、形式を調査決定する。

(認証・認可機能)

営業機密データ、個人情報を含むデータなど、様々な特性を持つデータ

を適正に流通させるため、データ利用者とデータ提供者を認証し、あらか

じめ設定されたデータの利用権限、契約関係に基づき、適切に認可、アク

セス制御する機能を実装する。なお、高度な認証・認可機能については、

競争領域としての展開が望ましい。

(検索機能)

利用者の誰もが、欲しいデータを容易に探しだすことができるように、

データカタログ管理機能と連携し、キーワード検索の機能を提供する。ま

た、利用者の利便性向上の観点から、自然言語処理技術や機械学習技術な

Page 10: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

10

どを活用した高度な検索、リコメンド機能の開発・実装は競争領域として

展開されることが期待される。

(共通語彙・コード管理)

異なる分野間でデータを流通させ利活用するため、どの分野でも共通し

て用いられるコア語彙(例えば、人、物、住所、日付等)とコードについ

ては、IT総合戦略室主導のもと、情報処理推進機構(IPA)の共通語

彙基盤(IMI)の中で、今後益々増大するIoTデータも考慮した上で

継続的に整備する。

各分野の担当府省や関連する民間コンソーシアムは、各分野内で特定の

課題やシステムで用いられるドメイン固有の応用語彙(例えば、病床数、

時刻表など)を整備する。また、各分野の基礎的な用語であって分野を超

えた利用もなされるドメイン語彙(例えば、病院名、駅名、避難所)を整

備する。

また、語彙の整備にあたっては、日米欧での相互運用性を確保するため、

米、EUの行政主導で整備されているNIEM、SEMICに加えて、ウ

ェブ上の検索のために民間主体で整備されてきた schema.org も参照し、

相互に対応付ける。また、W3C、ITU、UN/CEFACT、ISO/

IECの関連する語彙規定の動きも参照する。

Page 11: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

11

(参考)共通のデータ構造、語彙を用いたデータ変換

(参考)データ構造、語彙、コードの整備によって得られる効果

Page 12: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

12

(統計解析/分析機能)

国の証拠に基づく政策立案(EBPM:Evidence-Based Policy Making)

や民間企業のマーケティング等で共通的に用いられる一般的な集計や相

関分析等の統計処理機能については、データ提供者、利用者の分野間デー

タ連携基盤利用のインセンティブに繋がるため、協調領域として整備しつ

つ、競争領域への展開を検討する。

(プライバシー配慮)

プライバシーに配慮し、オプトイン、オプトアウト、利用目的の追加や

更新など、利用者と提供者の間で必要なやりとりを行うためのインターフ

ェースの提供とその情報の履歴や更新状態を記録し、アクセス制御と連動

させる参照モデルを構築する。

(コミュニティ)

アプリケーション開発者などのデータ利用者が、オープンソースソフト

ウェアとして、率先してデータ処理ツールや分析ツールなどを公開・更新

する場(例えば、GitHub等のウェブサイト)を分野間データ連携基

盤上に提供する。また、分野間データ連携基盤運営者への改善要望の取り

込みや、普及活動、広報のための情報発信元としての活用が期待される。

なお、利害関係が一致するコンソーシアムやベンチャー企業に、クラウ

ド環境を期間限定で提供することで新事業のスタートアップを支援する

ことも分野間データ連携基盤の活性化のため重要である。

ii)研究開発課題

分野間データ連携基盤の実現にあたっては、データ提供者がメタデータ

を分野間データ連携基盤に登録する際の作業負荷をできるだけ省き、また、

提供者にも分野間データ連携基盤を利用するメリットが感じられる機能/

ツールを開発・実装する。これらの機能/ツールについては、オープンソー

ス化することも検討する。

(メタデータ作成支援ツール)

データ提供者が自らのデータを分野間データ連携基盤に接続する際に、

分野間データ連携基盤に登録するデータ形式であるメタデータを作成す

る必要がある。各分野において既存のデータ連携基盤が存在する場合、そ

の既存のメタデータから分野間データ連携基盤に登録すべきメタデータ

への自動変換のためのツールや、メタデータの作成に不慣れな作業者にも、

Page 13: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

13

容易に、効率的に作業が行えるよう、入力支援画面などを分野間データ連

携基盤で開発し実装することは、より多くの分野から、分野間データ連携

基盤にデータを提供してもらうために重要である。

(AIを実装した類似語推定機能)

異なる用語で記述された同義語に対して、類似語として推定し提示する

機能など、共通語彙基盤の整備だけではカバーしきれない語彙への対応は、

AI技術を活用することで、技術的に解決される可能性がある。これは、

データを統合する際や、検索する際に利用者の利便性を各段に向上させる

機能であり、開発・実装を検討する。なお、民間での取組を最大限活用し、

順次競争領域へとシフトさせることが期待される。

(原本性保証)

データ流通が加速し、例えばサプライチェーンでデータの利用・再販が

進む際、データ利用者が安心してデータ利用するために、データ品質担保

が必要になるため、データの原本性を保証するための機能を官民の適切な

役割分担のもとで研究開発を行い、分野間データ連携基盤に実装すること

を検討する。

② 競争領域として開発・サービス提供が期待される機能

(シミュレーション/分析機能)

分野間データ連携基盤の効果的な活用例として、分野毎データ連携基盤

を介して集約された複数のデータをビッグデータ化し、AIを活用した高

度なシミュレーションを行うこと等が考えられる。こうした各社独自技術

の要素が強く、利益の源泉にもなる機能については、競争領域として開発

されることが望ましい。

(高度なデータ接続/データ統合機能)

多種多様なIoTセンサーから日々生成される複数のリアルタイムデ

ータを高速に統合する機能をはじめとする革新スピードが速い技術は、国

が主導して開発・実装するよりも、競争原理が働き最新技術の導入が早い

民間企業に任せることが望ましい。

(匿名化/秘匿化機能)

個人情報を含むデータの匿名化/秘匿化については、扱うデータやその

利用目的によって、どのようなレベルで行うべきかが異なるため、分野毎

Page 14: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

14

のルールに従って、分野毎のデータ連携基盤で取り扱うべきと考えられる。

(データ接続/変換/統合機能)

汎用的に取り扱われるデータ形式(JSON、XML、CSV、GeoJSON、Shape、

GML)を対象としたフォーマット変換、同種の表形式(xls等)データのデ

ータ統合、地図データ(GISや写真画像)への地物情報の紐づけなどに

ついては、既に民間での取組が進められており、これらを活用しつつ、分

野を問わず共通的に利用が想定されるものについては、協調領域として整

備することを検討する。

(データの機械可読性向上)

データ利用者が、分野間データ連携基盤を介して収集・共有されたビッ

グデータをAI等により分析し、サービスに活用するためには、それぞれ

のデータがコンピュータで処理できるように機械可読性を確保された状

態にする必要がある。この分野はAI等の活用により、世界的にも民間企

業の取組みが活性化されている。分野間データ連携基盤上にこれら複数の

民間サービスが提供されることで、個々のサービスの競合と発展が期待さ

れる。

例えば、紙に手書きで保管されている台帳を効率よくデータ化するため

の支援ツールや、エクセル形式で保管されたデータのセルの結合解除、文

字間のスペース除去、キャプションの削除等、前処理に関する作業を軽減

するためのツールなど、汎用的で頻繁に発生する作業については、分野間

データ連携基盤において開発・実装することが求められる。

Page 15: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

15

(参考)機械可読性の乏しいデータに対するデータ化支援ツールの例

③ 特に留意すべき事項

i)分野毎データ連携基盤以外からの接続

内閣府のSIPやPRISMをはじめとする国や自治体で進められて

いる各プログラムで構築、また、今後構築される分野毎のデータ連携基盤

は、分野間データ連携基盤との相互運用性を確保するよう検討することが

望ましい。

さらに、各分野のデータ連携基盤に属さない国、自治体、大学、民間企

業が分散して保有するデータについては、分野毎データ連携基盤を経由し

なくても、直接、分野間データ連携基盤へのデータの提供、データカタロ

グの登録が可能となるよう、共通語彙基盤、API、メタデータの仕様等

を広く公開し、連携促進を図る。

ii)民間データセンターの活用

データセンターについては、その維持管理やサイバーセキュリティ対策

に必要な人的リソースの継続的な確保が懸念される。また、最先端のIC

T技術の導入の観点からも、分野毎のデータ連携基盤、分野間データ連携

基盤は競争原理が働く民間企業が運営する最新のデータセンターを活用

Page 16: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

16

することが望ましい。

iii)相互運用性の確保

既に様々なデータ、システムが稼働しているところであり、データフォ

ーマット、語彙、メタデータ、API等を全面的に標準化ありきで進める

のではなく、相互運用性を優先し、変換機能の実装など、技術的な解決手

段によって、合理的に実現するべきである。

民間等の独自のデータ提供サービス構築等を阻害することなく、できる

ところから連携を進めていくことが重要である。また、ICT技術の進展

に合わせて将来的な変更・アップグレードを前提とした考えのもとで、柔

軟なシステム構築を目指すべきである。

iv)サイバーセキュリティの確保

IoTで全てのヒトとモノがつながる Society 5.0 では、サイバー攻撃

の起点が増大するとともに、複雑につながるサプライチェーンを通じてサ

イバーリスクの範囲が拡大する。また、サイバー攻撃による影響がフィジ

カル空間にまで達するリスクがある。データ流通市場の活性化が進み、大

量のデータがグローバルサプライチェーンにおいて連携し、データの利用・

再販が進むことを想定すると、ハイレベルなサイバーセキュリティ対策を

備えた分野間データ連携基盤を構築することが重要である。

(2)ルール・制度的事項

官民データ活用基本法等のデータの流通や保護に関する制度や知財戦略、

GDPRを始めとする諸外国の動向及び分野毎データ連携基盤での制度設

計状況等も踏まえ、分野間データ連携基盤の利活用が促進されるルールや仕

組みの整備を進める。

① データ提供インセンティブ

分野間データ連携基盤をより効果的で価値のある基盤として整備する

ためには、新たなサービスやイノベーションの源泉となる価値のあるデー

タをいかに多く分野間データ連携基盤で流通できるかが鍵となる。

しかしながら、分野毎のデータ連携基盤運営者やデータ提供者にとって、

経営資源ともなるデータの提供や作業負担が発生するメタデータの登録

は、相応のメリットがないと協力が得られにくい。

このため、データ提供者への対価(課金制度や必要なコストの徴収、提

供者の評価への反映等)の還元の仕組みや、公的資金による研究開発成果

Page 17: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

17

の一次データの公開推奨(例えば、機械可読性のあるデータで、○年以内)

等のガイドライン化などを検討することが必要である。まずは、公的デー

タを率先して登録し、基盤としての魅力を向上させることが必要である。

また、分野間連携の具体的な姿を想定した上で、象徴的な案件として実

証試験をすることで良好事例を作り、外部へメリットを発信することが重

要である。

自治体提供のオープンデータ等、複数機関が同種のデータを提供する場

合には、データの相互運用性を確保するために、データ提供者向けにデー

タ変換機能などのツールで支援することや、データの登録・チェックを代

行する業者を利用できる仕組みを整備すること等が必要である。

また、データ提供者の責任範囲があいまいなことによって、データ提供

者がデータを出すことに対して感じるハードルを下げる観点から、責任範

囲に関するルール化等についても今後検討を要する。

② データ利用権限、利活用を阻害しない仕組み

分野間データ連携基盤においては、営業秘密データ(民間企業が持つ価

値の高いデータ等)、個人情報を含むデータ、オープンデータ等の様々なデ

ータを対象に分野横断で流通することを想定し、それぞれのデータの特質、

利用権限に応じたアクセス権限の付与が必要である。特に、個人情報保護、

プライバシーへの配慮をしつつも、過度な保護による利活用の阻害につな

がらないよう、分野間データ連携基盤でのデータ利用に関するルールを整

理することが必要である。

たとえば、

・ オープンデータについては利用者登録も必要とせず、フルオープンとす

る。

・ 営業秘密データについては、分野間データ連携基盤とは別に、契約プロ

セスを経た上で、提供者と利用者の双方のアクセス権を設定する。

・ 個人情報を含むデータに関しては、提供者側で匿名加工済みのデータを

分野間データ連携基盤で扱う。または、第三者提供に関する本人同意に

基づき提供されたデータに関しては、利用権限を分野間データ連携基盤

の中に継承することで、データを流通させることも検討する。また、匿

名加工済みデータの組合せにおける個人特定に対する責任については、

今後具体的な検討が必要である。

役割や責任の分界点等によるトラブルを防ぐためには契約の曖昧性を

できるだけ排除することが望ましい。契約のひな型などを含む「AI・デ

Page 18: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

18

ータの利用に関する契約ガイドライン」等を参照する等が必要である。

データの提供と利活用の促進の観点から、データ利用規約については分

野間データ連携基盤の中では可能な限り類型化し、提供者が決めた規約に

配慮しつつも、類型化された規約に合わせるように要請する。また、デー

タ利用にあたり、提供者名のクレジット表示が求められる場合があるが、

要否や表示方法のルールについては検討が必要となる。

分野間データ連携基盤上の利用権限に係るルールの検討にあたっては、

データの取り扱いに関する不正競争防止法の表記やビッグデータを活用

したサービス等のための著作物の利用に関する権利制限規定(著作権法改

正案)等の関連制度整備を踏まえることが重要である。

③ データ品質の基準策定

データ利用者が、アプリ開発やサービスを提供する際に、データの完全

性、正確性、有用性、最新性等の品質を正確に知る必要があり、データそ

のものを入手する前に、データカタログのメタデータ等でデータ品質を知

りたいというニーズがある。今後、基盤として評価の基準づくりに取り組

み、それぞれのデータ品質を統一した基準のもとで表現することが望まし

い。

その上でデータ利用者は、求める品質のデータを適切に選択することが

可能となるため、活用に関してはデータ利用者側の市場原理に任せること

ができる。

このように、データ提供者にとっては、メタデータ作成の作業負荷が大

きいものの、利用者にとっては適切なデータを発見するのに役立つため、

分野間データ連携基盤では、必須項目(作成日、作成組織、最終更新日、

ライセンス等)に加えて、データ品質を表現する任意項目を設けるととも

に、メタデータ作成を支援する仕組みや体制を整備することが必要である。

④ データ提供者・利用者の評価

データの提供/利用が安心して実施されるためには、データ提供者・利

用者の信用度等の評価基準や評価方法を整備し、個々のデータ提供者・利

用者が望んだ場合には、これら評価基準や方法を活用し、データを提供/

利用する対象を選定するための指標を提供する必要がある。信用度の評

価は、他のセキュリティ基盤と連携し、アクセス制御も合わせて行うこと

は、安心・安全なデータ流通のために重要であるが、評価そのものが、個々

のデータ提供者・利用者のメリットとなるよう検討していくことが望ま

しい。

Page 19: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

19

⑤ エコシステムの形成

国の資金に頼らず、持続的に分野間データ連携基盤を自立運用するた

めには、分野間データ連携基盤の運用・管理・保守等を考慮したエコシス

テムの形成が不可欠となる。

分野間データ連携基盤のビジョンは、官民の散在するデータに加え、我

が国の強みであるセンサー/デバイスから集められるリアルタイムデー

タをも活用し、新たなサービスの提供や、AIの学習データとしてのビッ

グデータを提供するサービスプラットフォームとして機能させることで

ある。

そのため、民業圧迫に最大限配慮し、データの変換や分析、クラウド環

境提供等の基盤としての付加価値を生む機能については、民間活力を促

すよう、ルール整備と競争領域への参加を促す必要がある。

また、サービス創出の活性化やデータ活用の更なる利便性向上のため、

利用者・提供者が基盤を通じてコミュニケーションを図りやすい場を提

供することで、分野間データ連携基盤の自律的な成長を図る。

分野間データ連携基盤の開発にあたっては、内閣府、IT総合戦略室が

司令塔機能を発揮し、官民でマルチステークホルダーの分野横断の調整・

合意形成の場を提供し、継続的な成長を促す。その上で、将来的な運営主

体に関しては、国の一定の管理の元、民間へ順次シフトすること等を検討

する必要がある。

(3)推進体制

分野間データ連携基盤の整備にあたっては、内閣府とIT総合戦略室が

司令塔機能を発揮し、SIP、PRISMを活用した官民連携体制で進める

ことを基本とする。分野横断的にデータを連携させるために、共通語彙、メ

タデータ、APIの整備が特に重要な要素となる。

分野毎のデータ連携基盤においては、分野間連携に必要となる語彙やメ

タデータ等の整備は十分に進んでおらず、各分野の責任主体は、分野毎にデ

ータ連携基盤に接続するデータセット、語彙、コード、APIについて、整

理する必要がある。

分野間データ連携を実現する上で、国や自治体がリードすべき行政デー

タにおける共通語彙基盤の整備やデータの構造化については、専門知識が必

要なため、IT総合戦略室、経済産業省、情報処理推進機構(IPA)を主

体として、民間団体等の協力も得つつ、各府省や分野毎のデータ連携基盤の

担い手等を支援する体制が想定される。一方、産業分野が主体のものづくり

やIoTデータのデータ構造、メタデータ項目の検討については、民間企業

Page 20: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

20

のコンソーシアム等で合意形成をし、主体的に進めることが想定される。

① 共通語彙

分野毎のドメイン固有の応用語彙については、分野毎のデータ連携基盤

構築を主導する国立研究開発法人や関係府省が、分野内の関係者との調整

を主体的に実施する。

分野共通で用いられるコア語彙については、IPAが相互運用性の拡充

を目指す賛同企業の集まりであるIMIパートナーとも連携し共通語彙

基盤の取組が既になされており、これを継続的に推進する。

分野横断で相互に連携するためのドメイン語彙については、関係府省が

国研などの分野毎データ連携基盤の責任主体を集め、IPAや民間コンソ

ーシアム等の支援のもとで調整する。

② データカタログ(メタデータ)

IT総合戦略室を主体として、これまでのオープンデータの取組みや、

今後、関係府省・民間団体へのヒアリング等から得る情報を元に、先行分

野を定め、行政データに関するメタデータの項目を決定する。また、主に

民間で進んでいるIoTデータへの対応に向け、データ流通市場の健全な

成長を目的とした様々な民間団体等とも連携する。

③ API

データ提供者ごとにデータ要求・取得インターフェースが異なると、各

APIに合わせた整備が必要となる。効率的なデータの利活用のため、A

PIの正規化/共通化を検討していくことが望ましい。

2017年8月にIT総合戦略室から、「API設計・運用実践 ガイド

ブック(β版)」が公開されており、これを参照することができる。

一方、既に構築中または運用中の分野毎のデータ連携基盤や個別のシ

ステムについては、NIEM、SEMIC、FIWAREなどの欧米の取

組や国際標準(OMA/NGSI等)を参考にするとともに、民間主体の

コンソーシアム等とも連携しながら、APIを介して、今後、分野間、シ

ステム間の相互運用性確保を進めていく。

④ PDCAサイクルによる段階的整備

メタデータの整備、データの構造化、語彙の整備などの利用者目線で

の段階的な整備を進め、特定分野・エリア(自治体等)での実証を行い

つつ、PDCAサイクルを回しながら分野間データ連携基盤の構築を進

Page 21: 総合科学技術・イノベーション会議 第14回重要課題専門調査会 · 分野間データ連携基盤の整備に向けた方針 1.現状認識 Society 5.0 は、サイバー空間とフィジカル空間の高度な融合により、

21

める。

分野毎のデータ連携基盤の進捗や具体的ユースケース、成功事例や実

運用経験を共有するため、定期的な連携会議を開催する。

分野間データ連携基盤の整備のためのPDCAサイクル

6.実現へ向けたロードマップ

研究項目 2018年 2019年 2020年 2021年 2022年

マイルストーン

技術研究・開発(協調領域)

ルール・制度的事項の検討・整備

推進体制の整備と実行

マスタプラン作成

語彙・コード・カタログ管理、検索、コミュニティ機能他

【フェーズ1】2020オリパラでのデモも想定した、試行に向けた研究、環境構築、有効性検証、運用開始

【フェーズ2】2023年度以降の本番運用を想定した研究、環境構築、有効性検証、運用開始

利用者・提供者評価方式等

データ利用権限、データ品質他の検討・施策整備

ビジネスモデル、エコシステムの検討

有効性検証・運用開始

共通語彙、メタデータ、API検討体制整備

2020オリパラ

マスタプラン見直し

共通語彙、メタデータ、API検討体制による分野でのコンテンツ整備、分野毎データ連携基盤との連携(順次拡大)

有効性検証・運用開始

エコシステム検証

データ連携基盤推進会議(仮称)によるPDCAサイクル実行