140606共通語彙基盤発表会

18
共共共共共共共共共 共共 CIO 共共共 共共共共共 CIO 共共共 共共 共共 1

Upload: kenji-hiramoto

Post on 07-May-2015

451 views

Category:

Government & Nonprofit


5 download

DESCRIPTION

共通語彙基盤の意味、役割、現在の取組みと、今後の方向性についての講演資料です。

TRANSCRIPT

Page 1: 140606共通語彙基盤発表会

共通語彙基盤の推進

政府 CIO補佐官経済産業省 CIO補佐官     平本 健二

1

Page 2: 140606共通語彙基盤発表会

2

田中です

恵子です

田中恵子です

旧姓は鈴木です

通称は鈴木けい子

です

戸籍では田中蕙子です

I'm Keikoたなかです

たなかけいこです

お名前は

Page 3: 140606共通語彙基盤発表会

なぜ語彙なのか?

3

Page 4: 140606共通語彙基盤発表会

① 違う表現の単語を同じ単語とみなす

ジャガイモ馬鈴薯メイクイーンポテト

人であれば同じと判断できるが、コンピュータでは判断できない

同じ意味だと管理する商品 ジャガイモ値段  50 円

管理方法1:同じ単語であると、表などで管理する管理方法2:コンピュータで、同じ意味と自動処理する

② 同じ表現であるが意味が違うモノを明確にする

避難所 水病院 水消防 水

違う部門では、同じ言葉でも、完全に同じ意味とは限らない (例:同じ「水」であっても業界で意味が異なる)

違う意味だと管理する

避難所 飲料水病院 蒸留水消防 消火用水

複数のサービスやシステムを連携するときには、核となる技術である。

語彙基盤の意義

4

Page 5: 140606共通語彙基盤発表会

様々な語彙① 政府内で共通的にルールを作るほうが望ましい語彙

住所、氏名、組織など、業務特性に依存しないもの

申請Aの記述様式  100-0013  千代田区 霞が関三丁目3-1 尚友会館2階 株式会社 田中商店 カブシキカイシャ タナカショウテン 田中 一郎 タナカ イチロウ 申請Bの記述様式  100-0013  千代田区 霞が関三丁目3-1尚友会館2階      チヨダクカスミガセキ 株式会社田中商店 タナカショウテン 代表取締役 田中 一郎 タナカ イチロウ 申請Cの記述様式  100-0013  東京都 千代田区 霞が関 3 3 1 尚友会館2階 株式会社田中商店 田中 一郎 タナカ イチロウ

100-0013  東京都千代田区霞が関3-3-1尚友会館2階株式会社田中商店代表取締役 田中一郎

入力したいデータ

各種申請の入力様式

行政の申請においても、基本的な語彙 ( 住所、氏名等 )の記載方法が異なる

5

Page 6: 140606共通語彙基盤発表会

様々な語彙② 現場の状況を整理しボトムアップで作り上げていく語彙

利用ニーズが高く、具体的な整理が各地で施行される領域 情報連携用語彙データベースプロジェクトやツールプロジェクトの中でユースケー

スをもとに整備していく。A自治体 A-自治体 1 B自治体 B- 1自治体

避難所 仮の定義避難所 避難所の総称 避難施設指定避難所 自治体があらかじめ指定した避難所 避難所 避難所 避難所福祉避難所 生活に解除などが必要な方が入る避難所 二次避難所

仮設避難所 災害時に避難所に特別に解放されてできる仮の避難所

広域応援活動拠点 広域で避難者支援を行うための活動拠点。臨時ヘリポートや備蓄倉庫等を保有。 広域応援活動拠点 地域防災拠点

避難場所 避難場所の総称

緊急避難場所

避難場所へ避難する前に、近隣の避難者が一時的に集合して様子を見る場所又は避難者が避難のために一時的に集団を形成する場所

一時集合場所 一時避難場所

広域避難場所

大地震時に発生する延焼火災やその他の危険から避難者の生命を保護するために必要な面積を有する大規模公園、緑地等のオープンスペースをいう。

広域避難場所 広域避難地 広域避難場所

帰宅困難者受入施設 帰宅困難者が一時的に滞在する施設 一時滞在施設、一時待機施設 帰宅困難者一時滞在施設

災害時帰宅支援ステーション 帰宅者に対してトイレの提供等の各種支援をする民間施設 災害時帰宅支援ステーション 災害時帰宅支援ステーション災害時帰宅支援ステーション

一時避難施設 都道府県の施設などで、市町村が一時的に利用する避難施設

一時避難施設、一時避難所、一時受入施設

都道府県と市町村の語彙が違っており、情報をマッシュアップできない

6

Page 7: 140606共通語彙基盤発表会

既存語彙や外部語彙との連携する語彙 府省、業界などで、国内、国際に通用している既存の語彙とは参照関係で連携する。

既存語彙(地図) ・・・ 博物館 ・・・ 病院 ・・・

既に普及、または今後は普及が見込まれる、ドメイン専門部門等が整備した語彙 →積極的に活用。または、連携マップを整備。

コア語彙

地理空間・施設

移動・交通

防災

財務ドメイン固有語彙

ドメイン共通語彙

ドメイン語彙は、既存の語彙に準拠等

IMI の構造を使って、詳細情報を付加できる(この部分も既存の構造があれば活用)

○既存語彙をそのまま活用

○複数語彙が並列している場合などは連携マップを整備

様々な語彙③

避難路通行規制啓開避難所・・・

防災語彙 観光業界語彙IMI

避難路通行規制開通

・・・通行止開通・・・

観光業界さん。 IMI で定義する「啓開」の情報を送ります

防災分野で使っている「啓開」は、「開通」のことですね

公共施設情報 (○ ○ 博物館)施設:博物館 名称 ○ ○ 博物館

場所 住所 都道府県 東京都

市区町村 江東区

... ...

経緯度座標 緯度 35.xxxxxxxx

経度 139.xxxxxxxx

地理識別子 識別子体系 □ □ 住所コード

識別子 13103xxxxxx

連絡先 電話番号 03-xxxx-xxxx

...

スケジュール 内容 開館時間

開始時間 09:00:00+09:00

終了時間 17:00:00+09:00

曜日 MON,TUE,THU,FRI

アクセス 最寄り駅 交通:駅 名称 △ △ 駅

... ...

防災:避難所

受入可能人数 800

救護所 True

ヘリ離着陸 False

意味を明確化して連携 7

Page 8: 140606共通語彙基盤発表会

共通語彙基盤( IMI: Infrastructure for Multi-layer Interoperability )の整備

情報を正しく効率的に交換、活用していくためには、人名、住所、物等、データを体系的、かつ、構造的に定義して行く必要がある。

検索

オープンデータ

システム連携

三鷹市立第四小学校ic: _建物 所在

ic: _場所 地名ic: _場所 地理識別子ic: _場所 住所

ic: _住所 住所 東京都三鷹市下連雀1−丁目25 1

ic: _住所 構造化住所ic: _構造化住所 国ic: _構造化住所 都道府県 東京都ic: _構造化住所 市区町村 三鷹市ic: _構造化住所 町名 下連雀ic: _構造化住所 街区符号 1ic: _構造化住所 住居番号 25ic: _構造化住所 地番 1ic: _構造化住所 方書

ic: _方書 方書ic: _方書 ビル名ic: _方書 部屋番号

ic: _構造化住所 郵便番号 181- 0013ic: _ ID構造化住所 住所ic: _構造化住所 住所コード

ic: _場所 経緯度座標ic: _経緯度座標系 測地系コードic: _経緯度座標系 緯度

ic: _緯度 度ic: _緯度 分ic: _緯度 秒

ic: _経緯度座標系 経度ic: _経度 度ic: _経度 分ic: _経度 秒

ic: _UTM場所 座標ic:UTM _UTM座標系 座標ic:UTM _UTM ID座標系 測地系ic:UTM _座標系 東距ic:UTM _ ID座標系 グリッドゾーンic:UTM _ ID座標系 グリッドゾーン格子ic:UTM _座標系 北距

ic: _MGRS場所 座標ic:MGRS _MGRS座標系 座標ic:MGRS _MGRS ID座標系 座標格子

ic: _建物 施設情報ic: _ID施設

ic: _ ID証明 識別ic: _証明 証明種類ic: _証明 発行日ic: _証明 失効日ic: _証明 発行者

ic: _施設 名称 三鷹市立第四小学校ic: _施設 種別 小学校ic: _施設 商用区分

ic: _施設 概要小・中一貫教育校「連雀学園」に属する小学校。

Type/ Sub- properties項目名( ) 項目名(エントリー名) 英語名 データタイプ データタイプ(英語) cardinality 項目説明 項目説明(英語) サンプル値 Mapping to NIEM Mapping to ISA J oinup人型 ic:人型 PersonType 人の情報を表現するためのデータ型。 nc:PersonType Person

氏名 ic: _人 氏名 PersonName ic:氏名型 ic:PersonNameType 0..1 氏名 Name of a Person - nc:PersonName性別 ic: _人 性別 PersonSex < >抽象要素 <abstract element, no type> 0..1 性別 Gender of a Person 1 nc:PersonSex gender

Substitutable Elements: Substitutable Elements:性別コード ic: _人 性別コード + PersonSexCode codes:性別コード型 codes:GenderCodeType 性別コード Gender of a Person 1 nc:PersonSexCode性別名 ic: _人 性別名 + PersonSexText ic:テキスト型 ic:TextType 性別の名称。 Gender of a Person 男 nc:PersonSexText

生年月日 ic: _人 生年月日 BirthDate ic:日付型 ic:DateType 0..1 生年月日 Date of Birth of a Person - nc:PersonBirthDate dateOfBirth死亡年月日 ic: _人 死亡年月日 DeathDate ic:日付型 ic:DateType 0..1 死亡年月日 Date of Death of a Person - nc:PersonDeathDate dateOfDeath現住所 ic: _人 現住所 PresentAddress ic:住所型 ic:AddressType 0..1 現住所 - nc:PersonResidenceAssociationTyperesidency本籍 ic: _人 本籍 LegalResidence ic:住所型 ic:AddressType 0..1 本籍 -

国籍 ic: _人 国籍 Citizenship < >抽象要素 <abstract element, no type> 0..n 国籍 A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

- nc:PersonCitizenship citizenship

Substitutable Elements: Substitutable Elements:

国籍名 ic: _人 国籍名 + CitizenshipText ic:テキスト型 ic:TextType 国籍の名称。 A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

日本国 nc:PersonCitizenshipText

国籍コード ic: _人 国籍コード + CitizenshipCode codes:国籍コード型 codes:CitizenshipCodeType 住民基本台帳で利用されている国籍コード。 A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

392 nc:PersonCitizenshipFIPS10- 4Code

ISO3166Alpha2 ic: _ISO3166Alpha2人 + ISO3166Alpha2 iso_3166:ISO3166Alpha2CodeTypeiso_3166:ISO3166Alpha2CodeType ISO3166Alpha2 2国名コード。 。文字コード。 A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

nc:PersonCitizenshipISO3166Alpha2Code

ISO3166Alpha3 ic: _ISO3166Alpha3人 + ISO3166Alpha3 iso_3166:ISO3166Alpha3CodeTypeiso_3166:ISO3166Alpha3CodeType ISO3166Alpha3 3国名コード。 。文字コード。 A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

nc:PersonCitizenshipISO3166Alpha3Code

ISO3166Numeric ic: _ISO3166Numeri人 c + ISO3166Numeric iso_3166:ISO3166Numeri CodeTypec iso_3166:ISO3166Numeri CodeTypec ISO3166Numeric 3国名コード。 。数字 桁コード。 A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

nc:PersonCitizenshipISO3166NumericCode

出生国 ic: _人 出生国 BirthCountry ic:場所型 ic:LocationType 0..1 生まれた国。 A location where a person was born. nc:PersonBirthLocation countryOfBirth出生地 ic: _人 出生地 BirthPlace ic:場所型 ic:LocationType 0..1 生まれた場所。 A location where a person was born. nc:PersonBirthLocation placeOfBirth

氏名型 ic:氏名型 PersonNameType 氏名を表現するためのデータ型。 nc:PersonNameType姓名 ic: _氏名 姓名 FullName ic:テキスト型 ic:TextType 0..1 氏名(姓、名)。 Full name of a Person 経済 太郎 nc:PersonFullName fullNameカナ姓名 ic: _氏名 カナ姓名 KanaFullName ic:カタカナテキスト型 ic:TextType 0..1 氏名(姓、名)のカナ表記。 Full name in Katakana. ケイザイタロウローマ字姓名 ic: _氏名 ローマ字姓名 RomanFullName ic:テキスト型 ic:TextType 0..1 氏名(姓、名)のローマ字表記。 Full name in Roman alphabet. Keizai Taro姓 ic: _氏名 姓 FamilyName ic:テキスト型 ic:TextType 0..1 姓。 Family name of a Person 経済 nc:PersonSurName familyNameカナ姓 ic: _氏名 カナ姓 KanaFamilyName ic:カタカナテキスト型 ic:TextType 0..1 姓のカナ表記。 Family name in Katakana. ケイザイローマ字姓 ic: _氏名 ローマ字姓 RomanFamilyName ic:テキスト型 ic:TextType 0..1 姓のローマ表記。 Family name in Roman alphabet.名 ic: _氏名 名 GivenName ic:テキスト型 ic:TextType 0..1 名。 Given name of a Person 太郎 nc:PersonGivenName given nameカナ名 ic: _氏名 カナ名 KanaGivenName ic:カタカナテキスト型 ic:TextType 0..1 名のカナ表記。 Given name in Katakana. タロウローマ字名 ic: _氏名 ローマ字名 RomanGivenName ic:テキスト型 ic:TextType 0..1 名のローマ字表記。 Given name in Roman alphabet.ミドルネーム ic: _氏名 ミドルネーム MiddleName ic:テキスト型 ic:TextType 0..1 ミドルネーム。 Middle name of a person nc:PersonMiddleName alternativeNameカナミドルネーム ic: _氏名 カナミドルネーム KanaMiddleName ic:カタカナテキスト型 ic:TextType 0..1 ミドルネームのカナ表記。 Middle name in Katakana.ローマ字ミドルネーム ic: _氏名 ローマ字ミドルネーム RomanMiddleName ic:テキスト型 ic:TextType 0..1 ミドルネームのローマ字表記。 Middle name in Roman alphabet.旧姓 ic: _氏名 旧姓 MaidenName ic:テキスト型 ic:TextType 0..1 旧姓。 Maiden name. nc:PersonMaidenName birthNameカナ旧姓 ic: _氏名 カナ旧姓 KanaMaidenName ic:カタカナテキスト型 ic:TextType 0..1 旧姓のカナ表記。 Maiden name in Katakana.ローマ字旧姓 ic: _氏名 ローマ字旧姓 RomanMaidenName ic:テキスト型 ic:TextType 0..1 旧姓のローマ字表記。 Maiden name in Roman alphabet.

語彙(ボキャブラリ)、情報交換パッケージ( IEP)

Schema.org検索エンジン大手が整備する構造化データマークアップの共通仕様

情報交換パッケージにより、システム間を連携・高速な情報連携・設計の効率化

語彙で意味を確認し、情報交換パッケージから、情報を抽出・サービス設計の効率化・安定した情報連携

語彙間の整理をしておくことで、検索を効果的に実施・検索の利便性の向上・効果的な広報の実施

共通語彙基盤は、用語の参照辞書を整備することで、各種データの同一性の確認を容易にし、その結果として、システム間の連携やオープンデータの活用を容易にできるようにする仕組み。

8

Page 9: 140606共通語彙基盤発表会

共通語彙基盤の構造 共通語彙基盤はコア語彙、共通語彙及びドメイン固有語彙から成り立つ。

コア語彙

ドメイン固有語彙各分野での利用に特化した語彙。例)病床数、時刻表 など

避難所

住所

病院

災害復旧費

ドメイン共通語彙分野固有の語彙の内、他の分野でも参照する主要な語彙。例)病院、駅名、避難所 など

コア語彙どの分野でも利用される普遍的な語彙。例)人、物、場所、日付 など 地理空間

・施設

移動・交通

防災

財務ドメイン固有語彙

ドメイン共通語彙

9

Page 10: 140606共通語彙基盤発表会

情報構造のイメージ 施設の情報は、コアのボキャブラリとドメインのボキャブラリの組み合わせで表す。

10

病院

建物

診療科

所在(住所)

施設情報

建築物情報

状況

ベッド数

小学校

建物

生徒数

所在(住所)

施設情報

建築物情報

避難所情報コアボキャブラリ

ドメインボキャブラリ

イベント

建物

スケジュール

所在(住所)

連絡先

Page 11: 140606共通語彙基盤発表会

地域情報で顕在化している課題の解決 地域マップの情報がバラバラだと、情報交換できないだけで

はなく、行政機関外のサポートも受けにくい。

11

A市の施設情報

B市の施設情報 C市の

施設情報

D市の施設情報

都道府県の持つ施設情報

上記の各情報がバラバラで検索できない

従来公開用情報が統一されるので、組み合わせて使ったり、様々な使い方が可能。

共通語彙対応すると

広域アプリや地域アプリが作りやすくなる

Page 12: 140606共通語彙基盤発表会

政策的な推進

12

Page 13: 140606共通語彙基盤発表会

共通語彙基盤に関する決定 平成 6年「行政情報化推進基本計画」閣議決定

省庁間の情報の共有及び円滑な流通に必要なデータコード、データ項目等基本的事項の標準化

平成 23年「共通語彙基盤(公共情報交換標準スキーム)プロジェクト」開始 平成 25年「世界最先端IT国家創造宣言」閣議決定

データの組み合わせや横断的利用を容易とする共通の語彙の基盤構築にも取り組む。 国民がステークホルダーとして積極的に参加できるよう、クラウドを活用したオープ

ンな利用環境を、データ・フォーマット、用語、コード、文字等の標準化・共通化、 API の公開等を行いつつ整備する。

平成 25年「情報連携用語彙データベース、ツールプロジェクト」開始

平成 26年「電子行政分野におけるオープンな利用環境整備に向けたアクションプラン」 CIO 連絡会議決定2.1 オープンな利用環境の実現 (2)用語の共通化等について

• システム間の連携やデータの二次利用を円滑にするためには、氏名、住所、組織等の普遍的用語の記述に関する情報連携用語彙の早期整備を図るとともに、各組織が運用する既存の語彙との連携方法を整理することが必要である。

• 経済産業省において、国際的な連携を踏まえた情報連携用語彙の整備を進め、整備された語彙から順次公開するとともに、平成 27年度中に情報連携用語彙 DB の運用を開始する。

• 総務省において、情報流通連携基盤共通API等の開発・実証を平成 27年度中に行う。

13

Page 14: 140606共通語彙基盤発表会

オープンな利用環境整備のためのアクションプラン 政府の情報提供基盤の抜本的な改革。

表面的な改革でなく、基盤から整理し、 2020年に機動的にサービスを創出する環境を実現

Web 用の政策関連情報データカタログ

文字(整備済み、導入フェーズ)用語

コードドメインルール 標準化・共通化した基盤

・基本情報の共通化・持続的に発展可能な標準の採用・設計・開発の共通化

新たな利便性の高いサービス・情報の組み合わせ・プロセスの見直し・ API を通じた民間サービス開発

府省のweb

サイト

テーマ別のweb

サイト

民間の webサイト

調達・制度

情報等の改革

組み合わせ自由な素材群・情報構造の共通化・見出しデータの共通化・重要な情報の集積

ハードウェア・基盤ソフト(共通プラットフォーム)

サービス政府のサービス、民間のサービス

コンテンツ

ガバナンス

従来は統一方針なく独自サービスを構築

アクションプランでは基盤から積み上げるのでサービス構築、連携、更新が容易

未整理

未整理

14

Page 15: 140606共通語彙基盤発表会

国際協調 語彙プロジェクトは、データ連携が進む中で世界的な課題。 国内外との連携が重要であり、関係各所との意見交換を実施。

7月に米国および欧州との情報交換を実施予定。

4月  ISAとの意見交換@SEMIC20146月  OMGとの意見交換@Tokyo(予定)

UN/CEFACTとの意見交換@Tokyo

15

Page 16: 140606共通語彙基盤発表会

コア語彙 2.0 (検証版)リリースについて

共通語彙基盤概要共通語彙基盤全体の概要説明書http://imi.ipa.go.jp/doc/IMI_Overview_v1.pdf

コア語彙テクニカルガイドライン技術者向けコア語彙 2.0仕様書http://imi.ipa.go.jp/doc/IMI_Core2_TechGuide_v1.pdf

コア語彙 2.0 リファレンス、スキーマサンプル( rdfs, XML Schema )http://imi.ipa.go.jp/ns/200/

Page 17: 140606共通語彙基盤発表会

コア語彙 2.0 コア語彙とドメイン語彙という、基本フレームワークは継承

し、コア語彙の内容を精査。

コア語彙1.0

適用検証

地域実証

ヒアリング

専門委員会

コア語彙2.0

実証

普及

事例収集

2013/6/13 2014/6/6

ドメイン語彙

防災、地理空間・施設、移動・交通、財務氏名、住所、 AED、施設子育て、イベント、観光、道路

改定のポイント・共通語彙の位置づけを、コアドメインの共通語彙から、ドメイン共通語彙へ変更・共通語彙の位置づけ変更に伴い、ドメイン語彙を、ドメイン共通語彙とドメイン固有語彙に変更・コア語彙内容の精査・変更・ NIEM、 ISAマッピングに加えて、 UN/CEFACTへマッピング

17

Page 18: 140606共通語彙基盤発表会

4月 5月 6月 7月 8月 9月 10月 11月 12月 1月 2月 3月

2014年度の推進方針 2012年度は、事前調査(検証用の基盤つくり) 2013年度は、基礎調査とプロト構築 2014年度は、基盤整備と実利用での検証+利用モデル普及とドメイ

ン展開 社会的ニーズが高いため、 2015年度計画も前倒しで実施

情報連携用語彙 DB検証

実証

コア語彙

氏名、住所、組織 IEP2.0

データカタログ構築 データカタログ運用

施設、設備IEP2.0 実証結果の IEP化

情報連携用語彙 DB アジャイル展開

実証、ハッカソン、コンテスト等

電子行政アクションプラン、情報流通基盤共通 API との連携検討

18