農業it 20150312a

48
分野横断的に利用可能な共通語 彙体系とその活用 武田英明 国立情報学研究所・教授 [email protected] 農研機構シンポジウム「ICT技術の開発と実用化に向けて-農業情報の共通化・標準化-,秋葉原コンベンションホール,2015年3月12

Upload: hideaki-takeda

Post on 14-Jul-2015

429 views

Category:

Technology


5 download

TRANSCRIPT

分野横断的に利用可能な共通語彙体系とその活用

武田英明

国立情報学研究所・教授

[email protected]

農研機構シンポジウム「ICT技術の開発と実用化に向けて-農業情報の共通化・標準化-」,秋葉原コンベンションホール,2015年3月12日

たった1つの記入フォームにも疑問が沢山

「氏名」「名前」「ご芳名」?

「勤務先」「所属先」?

漢字で入力?カナは?

都道府県は分ける?

まとめて書く?分けて書く?

「住所」「現住所」?

「勤務先住所」は「勤務先」の情報だよね

属性項目の表現

項目全体の構造

属性項目の値の表現

「姓」と「名」で分けて入力?一緒?

西暦?和暦?

属性項目の構造

○×会議参加登録

氏名:

住所:

性別:

勤務先:

勤務先住所:

参加日: 年 月 日

男/女

男/女?M/F?

何が問題か?

• セマンティックスの欠如

• では、セマンティックスとは?

The Semantic Webの目的

• "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation."

The Semantic Web, Scientific American, May 2001, Tim Berners-Lee, James Hendler and Ora Lassila

• The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.

http://www.w3.org/2001/sw/

Semantic Web• Webを通じてさまざまな情報交換の実現

自動化統合データの再利用

自動化統合データの再利用

Next Generation Web?

• Webの進化• HTML: 表示のためのWeb

• XML:シンタックスをもったWeb

• ?? :セマンティックスをもったWeb

• なぜセマンティックスをWebのメカニズムの中に組み込なねばならないか• 人間のためのWeb

から• 人間と機械のためのWeb

ヘcf. 機械ためだけのWeb

なぜXMLでは不十分か

• “person”, “name”とは何を意味するのか.• “name”と“名前”は同じなのだろうか.(同一性)• これは“person”の記述して十分なのだろうか(拘束条件)• …

• 結局,シンタックスだけは解決つかない

<person><name> Hideaki Takeda</name><age> 20</age>

</person>

<個人><名前>Hideaki Takeda</名前><年齢> 20</年齢>

</個人>

どうやって意味を記述するか

• 情報に関する情報を記述する仕組みが必要• メタデータ

• データに関するデータ

• 共通に理解し合える仕組みが必要• シンタックス(言語,スキーマ)

• 語彙、オントロジー

Semantic Webの階梯• RDF (Resource Description Framework)

• 最も原始的な意味記述の枠組みを提供ー>SVOモデル

• Entity-Relation Model(実体関連モデル)

• セマンティックネット

• RDF Schema

• RDFに最も原始的な概念記述の仕組みを追加

• class-subclass関係,制約

• OWL

• より一般的な概念記述の枠組みを提供

• 多様なクラス表現,多様な制約

Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

メタデータ• メタデータとは

• データに関するデータ

• さまざまなまとまりとしての情報オブジェクトに関わる言明の集まり

• メタデータの中身は• 内容:オブジェクト自身にかかわる情報.内在性

• コンテクスト:オブジェクトの生成などに関わる人,場所,理由など.外在性

• 構造:オブジェクト内部あるいはオブジェクト間の関係

Setting the State, Anne J.Gilliand-Swetland, Introduction to Metadata – Pathways to Digital Information, Murthsa Baca (ed.), Getty Information Institute.

メタデータ• オブジェクト全体へのメタデータ

• 書誌情報,Dublin Core

• オブジェクトの部分あるいは構造に対するメタデータ• 設計図,RDF,RDFS, OWL

種類:トラクター所有者:山田太郎車齢:10年

軸車体と車輪を接続

車輪

車体

Semantic Webの階梯• RDF (Resource Description Framework)

• 最も原始的な意味記述の枠組みを提供ー>SVOモデル

• Entity-Relation Model(実体関連モデル)

• セマンティックネット

• RDF Schema

• RDFに最も原始的な概念記述の仕組みを追加

• class-subclass関係,制約

• OWL

• より一般的な概念記述の枠組みを提供

• 多様なクラス表現,多様な制約

Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

RDF モデル

• 要素• Resource:

• URI(Universal Resource Identifier)でさせるもの全て

• Literal(文字列)• 必ずしもWebでアクセス可能である必要はない

• Property:

• resourceを記述する属性(attribute)

• Resourceと同様にURIあるいはLiteral

• Statement: resource, property, resourceの3つ組

RDF Model• 要素

• Resource: • URI(Universal Resource Identifier)でさせるもの全て• Literal(文字列)

• 必ずしもWebでアクセス可能である必要はない

• Property: • resourceを記述する属性(attribute)• Resourceと同様にURIあるいはLiteral

• Statement: resource, property, resourceの3つ組

http://www-kasm.nii.ac.jp/~takeda#me

http://southampton.rkbexplorer.com/

id/person-07113

foaf:knows

foaf:gender“male”

http://www-kasm.nii.ac.jp/~takeda#me

Resource Property Value

“1955-06-08”

dbpedia:Computer_scientist

RDF model

http://www-kasm.nii.ac.jp/~takeda#me

http://southampton.rkbexplorer.com/

id/person-07113

foaf:knows

foaf:Person

rdf:type

foaf:name foaf:gender

<http://dbpedia.org/resource/Tim_Berners-Lee>

owl:sameAs

dbpprop:birthDatedbpprop:birthPlacedbpprop:name

dbpprop:occupation

“武田英明” “male”

“London, England”“Sir Tim Berners-Lee”

RDF Serialization

<http://www-kasm.nii.ac.jp/~takeda#me> rdf:type foaf:Person .

<http://www-kasm.nii.ac.jp/~takeda#me> foaf:name “武田英明” .

<http://www-kasm.nii.ac.jp/~takeda#me> foaf:gender “male” .

<http://www-kasm.nii.ac.jp/~takeda#me> foaf:knows

<http://southampton.rkbexplorer.com/id/person07113> .

http://www-kasm.nii.ac.jp/~takeda#me

http://southampton.rkbexplorer.com/

id/person-07113

foaf:knows

foaf:Person

rdf:type

foaf:name foaf:gender

owl:sameAs“武田英明” “male”

Semantic Webの階梯• RDF (Resource Description Framework)

• 最も原始的な意味記述の枠組みを提供ー>SVOモデル

• Entity-Relation Model(実体関連モデル)

• セマンティックネット

• RDF Schema

• RDFに最も原始的な概念記述の仕組みを追加

• class-subclass関係,制約

• OWL

• より一般的な概念記述の枠組みを提供

• 多様なクラス表現,多様な制約

Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

RDFS (RDF Schema)

• より強力な知識表現モデルの採用

• RDF: ERモデル,セマンティックネットモデル

• RDF Schema: Frameモデル,オブジェクト指向モデル

• ただし最小限の定義のみ

• Property中心型定義

• RDFの拡張として定義

RDF Schema• rdfs:Class

• rdfs:SubclassOf

• クラスを詳細化したもの

• 複数可

• 推移性

• rdf:type

• あるクラスのインスタンスのとき

• rdf:property

• 属性にあたるもの

• 注意:propertyはグローバル

• rdfs:subPropertyOf

• propertyを詳細化したもの

• 推移性

Range(値域)

一つ指定できる

Cardinality(個数制限)はない

Domain(定義域)

複数指定できる(OR)

RDF Schema Animal

Person

ssnage

maritalStatus

s

d

MaritalStatus

r

“The class of person”

rdfs:comment

Integer

d

r

d

“Social Security Number”

rdfs:comment

t = rdf:type

d = rdfs:domain

r = rdfs:range

= class

= class instance

= property

Resource Description Framework(RDF) Schema Specification 1.0http://www.w3.org/TR/2000/CR-rdf-schema-20000327/

Married

Divorced

Single

Windowed

t

t

t

t

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .

@prefix xsd: <http://www.w3.org/2001/XMLSchema#>.

@prefix ex: <http://example.com/ex#> .

ex:Person a rdfs:Class ;

rdfs:subClassOf<http://www.w3.org/2000/03/example/classes#Animal> ;

rdfs:comment "The class of person"@en .

ex:martialStatus a rdf:Property ;

rdfs:domain ex:Person ;

rdfs:range ex:MaritalStatus .

ex:age a rdf:Property ;

rdfs:domain ex:Person ;

rdfs:range xsd:integer .

ex:ssn a rdf:Property ;

rdfs:comment "Social Security Number"@en ;

rdfs:domain ex:Person ;

rdfs:range xsd:string .

ex:MaritalStatus a rdfs:Class .

ex:Married a ex:MaritalStatus .

ex:Divorced a ex:MaritalStatus .

ex:Single a ex:MaritalStatus .

ex:Windowed a ex:MaritalStatus .

Semantic Webの階梯• RDF (Resource Description Framework)

• 最も原始的な意味記述の枠組みを提供ー>SVOモデル

• Entity-Relation Model(実体関連モデル)

• セマンティックネット

• RDF Schema

• RDFに最も原始的な概念記述の仕組みを追加

• class-subclass関係,制約

• OWL

• より一般的な概念記述の枠組みを提供

• 多様なクラス表現,多様な制約

Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

オントロジーの定義• Gruber

• 概念化の明示的な仕様

• FIPA98

• 特定のドメインの構造の明示的な仕様。

• 対象領域を参照するための語彙(論理定数と述語記号)と領域に存在する制約の表現と語彙の解釈を制限する論理的言明。

• あるトピックに関する知識の表現と通信のための語彙とその語彙で示される実在物(entity)の関係と属性の集合である。

• もっとわかり易くいえば

• 共通の概念の体系(“語彙”とその定義とそれら間の関係)

• 詳細さにおいて,

• 語彙以上,

• オブジェクト指向言語のオブジェクト未満

概念化object

box

red box blue box yellow box

on_desk(A)

on(A, B)

put(A,B)

object

box

box

color:{red, blue, yellow}

on_desk(A)

on(A, B)

put(A,B)

object

box desk

on(A/box, B/object)

put(A/box,B/object)

box

color:{red, blue, yellow}

汎用性と目的依存性のトレードオフ

知識 知識

実世界

コミュニケーション

? ?オントロジー

エージェントor人間間でのオントロジーの役割

OWL(Web Ontology Language)

• RDFSにより豊富なクラス表現と制約の方法を追加

• Description Logicのfravor

• Frame表現のfravor

• 特徴• クラス

• クラス要素:必要条件,必要十分条件の区別が可能• クラス表現:

• プロパティによる制約(クラスのスロット定義の相当)• 型制限(全称/限量),個数制限,型指定個数制限

• クラスの論理演算:和,積,否定• プロパティ

• 定義域,値域の複数指定(積)• 推移性の指定

• 定義のインポート

農業におけるオントロジー

Pascal Neveu, From Gene To The Bottle, Credible seminar 2014http://credible.i3s.unice.fr/doku.php?id=2014_workshop

農業におけるオントロジー

Pascal Neveu, From Gene To The Bottle, Credible seminar 2014http://credible.i3s.unice.fr/doku.php?id=2014_workshop

OperationOntology

ProductOntology

Semantic Web まとめ

• その目的は?• Webを通じてさまざまな情報交換の実現

• どうやって?

• メタデータとその構造化• メタデータ

• メタデータ・スキーマ

• オントロジー

• そのための言語:RDF, RDFS, OWL

• 課題は?• メタデータ・スキーマやオントロジーをどう作る?

IMI共通語彙基盤とは

IMI

30

情報システムの「各層」(電気信号→データ(文字→単語)→アプリケーション)がきちんと繋がるための「基盤」を提供する。

そのために、情報機器が交換するデータの中で用いられる「用語」について、

意味の共有を図ることが重要。

意味

•IMI: Infrastructure for Multilayer Interoperability(共通語彙基盤)

ネットワーク

共通語彙基盤(IMI)とは•情報を正しく効率的に交換、活用していくために、人名、住所、物等、データを体系的、かつ、構造的に定義するための仕組み。

31

検索

オープンデータ

システム連携

三鷹市立第四小学校ic:建物_所在

ic:場所_地名ic:場所_地理識別子ic:場所_住所

ic:住所_住所東京都三鷹市下連雀1丁目25−1

ic:住所_構造化住所ic:構造化住所_国ic:構造化住所_都道府県 東京都ic:構造化住所_市区町村 三鷹市ic:構造化住所_町名 下連雀ic:構造化住所_街区符号 1ic:構造化住所_住居番号 25ic:構造化住所_地番 1ic:構造化住所_方書

ic:方書_方書ic:方書_ビル名ic:方書_部屋番号

ic:構造化住所_郵便番号 181-0013ic:構造化住所_住所IDic:構造化住所_住所コード

ic:場所_経緯度座標ic:経緯度座標系_測地系コードic:経緯度座標系_緯度

ic:緯度_度ic:緯度_分ic:緯度_秒

ic:経緯度座標系_経度ic:経度_度ic:経度_分ic:経度_秒

ic:場所_UTM座標ic:UTM座標系_UTM座標ic:UTM座標系_UTM測地系IDic:UTM座標系_東距ic:UTM座標系_グリッドゾーンIDic:UTM座標系_グリッドゾーン格子 IDic:UTM座標系_北距

ic:場所_MGRS座標ic:MGRS座標系_MGRS座標ic:MGRS座標系_MGRS座標格子ID

ic:建物_施設情報ic:施設_ID

ic:証明_識別IDic:証明_証明種類ic:証明_発行日ic:証明_失効日ic:証明_発行者

ic:施設_名称 三鷹市立第四小学校ic:施設_種別 小学校ic:施設_商用区分

ic:施設_概要小・中一貫教育校「連雀学園」に属する小学校。

項目名(Type/Sub-properties) 項目名(エントリー名) 英語名 データタイプ データタイプ(英語) cardinality 項目説明 項目説明(英語) サンプル値 Mapping to NIEM Mapping to ISA Joinup人型 ic:人型 PersonType 人の情報を表現するためのデータ型。 nc:PersonType Person

氏名 ic:人_氏名 PersonName ic:氏名型 ic:PersonNameType 0..1 氏名 Name of a Person - nc:PersonName性別 ic:人_性別 PersonSex <抽象要素> <abstract element, no type> 0..1 性別 Gender of a Person 1 nc:PersonSex gender

Substitutable Elements: Substitutable Elements:性別コード ic:人_性別コード + PersonSexCode codes:性別コード型 codes:GenderCodeType 性別コード Gender of a Person 1 nc:PersonSexCode性別名 ic:人_性別名 + PersonSexText ic:テキスト型 ic:TextType 性別の名称。 Gender of a Person 男 nc:PersonSexText

生年月日 ic:人_生年月日 BirthDate ic:日付型 ic:DateType 0..1 生年月日 Date of Birth of a Person - nc:PersonBirthDate dateOfBirth死亡年月日 ic:人_死亡年月日 DeathDate ic:日付型 ic:DateType 0..1 死亡年月日 Date of Death of a Person - nc:PersonDeathDate dateOfDeath現住所 ic:人_現住所 PresentAddress ic:住所型 ic:AddressType 0..1 現住所 - nc:PersonResidenceAssociationTyperesidency本籍 ic:人_本籍 LegalResidence ic:住所型 ic:AddressType 0..1 本籍 -

国籍 ic:人_国籍 Citizenship <抽象要素> <abstract element, no type> 0..n 国籍A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

- nc:PersonCitizenship citizenship

Substitutable Elements: Substitutable Elements:

国籍名 ic:人_国籍名 + CitizenshipText ic:テキスト型 ic:TextType 国籍の名称。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

日本国 nc:PersonCitizenshipText

国籍コード ic:人_国籍コード + CitizenshipCode codes:国籍コード型 codes:CitizenshipCodeType 住民基本台帳で利用されている国籍コード。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

392 nc:PersonCitizenshipFIPS10-4Code

ISO3166Alpha2 ic:人_ISO3166Alpha2 + ISO3166Alpha2 iso_3166:ISO3166Alpha2CodeTypeiso_3166:ISO3166Alpha2CodeType 国名コード。ISO3166Alpha2。2文字コード。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

nc:PersonCitizenshipISO3166Alpha2Code

ISO3166Alpha3 ic:人_ISO3166Alpha3 + ISO3166Alpha3 iso_3166:ISO3166Alpha3CodeTypeiso_3166:ISO3166Alpha3CodeType 国名コード。ISO3166Alpha3。3文字コード。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

nc:PersonCitizenshipISO3166Alpha3Code

ISO3166Numeric ic:人_ISO3166Numeric + ISO3166Numeric iso_3166:ISO3166NumericCodeTypeiso_3166:ISO3166NumericCodeType 国名コード。ISO3166Numeric。数字3桁コード。A county that assigns rights, duties, and privileges to a person because ofthe birth or naturalization of the person in that country.

nc:PersonCitizenshipISO3166NumericCode

出生国 ic:人_出生国 BirthCountry ic:場所型 ic:LocationType 0..1 生まれた国。 A location where a person was born. nc:PersonBirthLocation countryOfBirth出生地 ic:人_出生地 BirthPlace ic:場所型 ic:LocationType 0..1 生まれた場所。 A location where a person was born. nc:PersonBirthLocation placeOfBirth

氏名型 ic:氏名型 PersonNameType 氏名を表現するためのデータ型。 nc:PersonNameType姓名 ic:氏名_姓名 FullName ic:テキスト型 ic:TextType 0..1 氏名(姓、名)。 Full name of a Person 経済  太郎 nc:PersonFullName fullNameカナ姓名 ic:氏名_カナ姓名 KanaFullName ic:カタカナテキスト型 ic:TextType 0..1 氏名(姓、名)のカナ表記。 Full name in Katakana. ケイザイタロウローマ字姓名 ic:氏名_ローマ字姓名 RomanFullName ic:テキスト型 ic:TextType 0..1 氏名(姓、名)のローマ字表記。 Full name in Roman alphabet. Keizai Taro姓 ic:氏名_姓 FamilyName ic:テキスト型 ic:TextType 0..1 姓。 Family name of a Person 経済 nc:PersonSurName familyNameカナ姓 ic:氏名_カナ姓 KanaFamilyName ic:カタカナテキスト型 ic:TextType 0..1 姓のカナ表記。 Family name in Katakana. ケイザイローマ字姓 ic:氏名_ローマ字姓 RomanFamilyName ic:テキスト型 ic:TextType 0..1 姓のローマ表記。 Family name in Roman alphabet.名 ic:氏名_名 GivenName ic:テキスト型 ic:TextType 0..1 名。 Given name of a Person 太郎 nc:PersonGivenName given nameカナ名 ic:氏名_カナ名 KanaGivenName ic:カタカナテキスト型 ic:TextType 0..1 名のカナ表記。 Given name in Katakana. タロウローマ字名 ic:氏名_ローマ字名 RomanGivenName ic:テキスト型 ic:TextType 0..1 名のローマ字表記。 Given name in Roman alphabet.ミドルネーム ic:氏名_ミドルネーム MiddleName ic:テキスト型 ic:TextType 0..1 ミドルネーム。 Middle name of a person nc:PersonMiddleName alternativeNameカナミドルネーム ic:氏名_カナミドルネーム KanaMiddleName ic:カタカナテキスト型 ic:TextType 0..1 ミドルネームのカナ表記。 Middle name in Katakana.ローマ字ミドルネーム ic:氏名_ローマ字ミドルネーム RomanMiddleName ic:テキスト型 ic:TextType 0..1 ミドルネームのローマ字表記。 Middle name in Roman alphabet.旧姓 ic:氏名_旧姓 MaidenName ic:テキスト型 ic:TextType 0..1 旧姓。 Maiden name. nc:PersonMaidenName birthNameカナ旧姓 ic:氏名_カナ旧姓 KanaMaidenName ic:カタカナテキスト型 ic:TextType 0..1 旧姓のカナ表記。 Maiden name in Katakana.ローマ字旧姓 ic:氏名_ローマ字旧姓 RomanMaidenName ic:テキスト型 ic:TextType 0..1 旧姓のローマ字表記。 Maiden name in Roman alphabet.

語彙(ボキャブラリ)、情報交換パッケージ(IEP)

Schema.org検索エンジン大手が整備する構造化データマークアップの共通仕様

情報交換パッケージにより、システム間を連携・高速な情報連携・設計の効率化

用語の意味を確認し、情報交換パッケージから、情報を抽出・サービス設計の効率化・安定した情報連携

用語間の整理をしておくことで、検索を効果的に実施・検索の利便性の向上・効果的な広報の実施

用語連携インタフェースは、用語の参照辞書を整備することで、各種データの同一性の確認を容易にし、その結果として、システム間の連携やオープンデータの活用を容易にできる。

IMI共通語彙とは

•構造化概念辞書• 概念辞書

• 概念の表記としての用語• 各項目は概念であって用語でない。

• クラス概念と関係概念

• 上位下位関係(上位にある概念とはより一般的概念)

• 構造化辞書• 概念は相互につながっていて、その組み合わせ(構造)で表現されている

• クラス概念は属性を示す関係概念と上位下位を示すクラス概念

• 関係概念は結びつくクラス概念と上位下位の関係概念

IMI共通語彙の構造

人型氏名性別性別コード生年月日住所

氏名型種別姓名姓名性別…

住所型種別表記郵便番号都道府県市区町村…

文字列

文字列

文字列

コード型

文字列文字列

文字列

文字列

文字列

文字列

コード型種別値

氏名型

住所型

コードリスト型

文字列

コード型

事象型 クラス概念

属性(関係概念)

クラス概念の構造

クラス概念の表記

属性の値の範囲

IMI共通語彙基盤の利用の仕組み•概念モデルとして定義

• それを必要な物理形式に変換(シリアライゼーション)

•用途に合った物理形式を選択して利用

IMI概念モデル

RDF形式 XML形式 日本語形式

オープンデータ用スキーマ データ交換用スキーマ スプレットシート用スキーマ、言語用

• 緩い定義• 他のオープンデータとの親和性

• 厳密な定義• データベーススキーマとの親和性

• 緩い定義、単純な構造• 人間可読性

共通語彙基盤の効果(1) 情報交換のための用語連携インタフェースを導入することにより、地域・組織・部門・業種・業務の壁を越えた横断的な情報連携やオープンデータ利活用が可能になる。

駅情報

病院情報(通常時) 運行情報

自治体A

災害拠点病院情報

駅情報

病院情報(通常時)

自治体B 公共交通機関

情報連携・情報提供時の課題 用語連携インタフェースの導入

情報提供主体や種別・役割ごとに表現形式やデータ形式が異なり一元的な情報活用が困難

駅情報

病院情報(通常時) 運行情報

自治体A

災害拠点病院情報

駅情報

病院情報(通常時)

自治体B 公共交通機関

×

×

×

××

バラバラの形式

統一の形式

用語連携インタフェース(統一ルール)

同一施設の情報を(種別・役割によらず)一元的・横断的に活用可能

アプリを作りづらい!

情報が見づらい! アプリの横展

開が可能!色々比較しやすい!

35

• システム間の連携のための語彙

既存語彙(地図)・・・博物館・・・病院・・・

既に普及、または今後は普及が見込まれる、ドメイン専門部門等が整備した語彙→積極的に活用。または、連携マップを整備。

コア語彙

地理空間・施設

移動・交通

防災

財務

ドメイン固有語彙

ドメイン共通語彙

ドメイン語彙は、既存の語彙に準拠等

IMIの構造を使って、詳細情報を付加できる(この部分も既存の構造があれば活用)

○既存語彙をそのまま活用

○複数語彙が並列している場合などは連携マップを整備

共通語彙基盤の効果(2)

避難路通行規制啓開避難所・・・

防災語彙 観光業界語彙IMI

避難路通行規制開通

・・・通行止開通・・・

観光業界さん。IMIで定義する「啓開」の情報を送ります

防災分野で使っている「啓開」は、「開通」のことですね

公共施設情報 (○○博物館)

施設:博物館 名称 ○○博物館

場所 住所 都道府県 東京都

市区町村 江東区

... ...

経緯度座標 緯度 35.xxxxxxxx

経度 139.xxxxxxxx

地理識別子 識別子体系 □□住所コード

識別子 13103xxxxxx

連絡先 電話番号 03-xxxx-xxxx

...

スケジュール 内容 開館時間

開始時間 09:00:00+09:00

終了時間 17:00:00+09:00

曜日 MON,TUE,THU,FRI

アクセス 最寄り駅 交通:駅 名称 △△駅

... ...

防災:避難所

受入可能人数 800

救護所 True

ヘリ離着陸 False

意味を明確化して連携

36

IMI共通語彙基盤の構造• 情報交換のための用語連携インタフェースは、社会全体で使われる用語であるコア語彙、共通語彙及びドメイン固有語彙から構成される。

コア語彙

ドメイン固有語彙各分野での利用に特化した語彙。例)農作業、品種 など

市場

住所

病院

災害復旧費

ドメイン共通語彙分野固有の語彙の内、他の分野でも参照する主要な語彙。例)商店、病院、食品名 など

コア語彙どの分野でも利用される普遍的な語彙。例)人、物、場所、施設、日付 など 地理空間

・施設

移動・交通

農業

財務

ドメイン固有語彙

ドメイン共通語彙

既存の業界・企業内語彙

対応表で用語の置き換えをすることを基本とするので、各組織は既存の用語体系を変更する必要が無い

37

コア語彙検討の状況

38

2013/6 2014/6

NIEM

EC ISA

schema.org

W3C 他

XML XML

CSV

2014/10

【海外調査、意見聴取】• 先行する語彙との整合性• 先進事例との比較• 開発経験者・有識者からの意見聴取

XML

RDF

CSV

コア

語彙

1.01

コア

語彙

2.0

コア

語彙

2.1

コア

語彙

2.2

2015/2

コア語彙検討会

内容の精査

構造の見直し

コア語彙検討会

プロジェクトからのフィードバック

海外意見聴取

コア語彙検討会

パブコメの反映

XML

RDF

CSV

コア語彙とは

• 【コア語彙】どのドメインでも広く利用される普遍的な語彙。「人」「氏名」「住所」「連絡先」「組織」「場所」「日時」「日付」「建物」「施設」「座標」など、特定のものを表現する語彙から、「数量」「面積」「重量」 「長さ」「時間」「金額」のような計量のための基礎概念を表現する語彙まで含まれる。

• 【ドメイン語彙】各ドメインでの利用に特化した語彙。ドメイン語彙の中で当該ドメインでのみ利用できる語彙を「ドメイン固有語彙」、他のドメインでも参照することのできる語彙ではあるが、コア語彙に含まれないものを「ドメイン共通語彙」と呼び区別することもある。 ドメイン固有語彙ドメイン共通語彙コア語彙場所避難所施設病院駅災害復旧費地理空間・施設防災財務移動・交通

※語彙の設計や構造は、コア語彙に特化したものではなく、共通語彙基盤の全ての語彙に共通です。

コア語彙 市場

住所

病院

災害復旧費

地理空間・施設

移動・交通

農業

財務

ドメイン固有語彙

ドメイン共通語彙

語彙の設計方針

• 日本語の語彙とする

• 意味や構造は明確になるようにする

• 業界を越えての情報交換を可能にする

• 用途に応じて適した物理形式によるデータ交換・共有が可能とするため、特定の物理形式に依存しないようにする

• 一部の項目を利用することや、項目を追加すること、他の語彙との併用が可能となるようにする

• 継承などにより、コア語彙など基本的な語彙を最大限活用できるようにする

• 既存システムの変更をすることなしに、データ交換の際に利用できるようにする

• 順次導入が可能なようにする

用語の種類

共通語彙基盤には、「クラス用語」と呼ばれる用語と「プロパティ用語」と呼ばれる用語の2種類の用語がある。これらは、どちらも、言葉として意味をもっているので「用語」と呼ぶが、その構造は大きく異なる。

• クラス用語

• 用語の内、後述のプロパティ用語を子要素としてもつ構造を持った用語。他のクラス用語を拡張することで、自身がもつプロパティ用語と拡張元のクラス用語がもつプロパティ用語の両方をもつクラス用語を定義することも可

• プロパティ用語

• 用語の内、クラス用語と他のクラス用語や値とを関連付けるもの。コア語彙においては、どのプロパティ用語もそれぞれ一つ以上のクラス用語から参照される。

クラス用語

•項目名、説明、継承、及び、プロパティ用語の集合で構成される

•各プロパティに対して、カーディナリティ(出現数)とクラス用語における意味の説明をもつ

• ※ 「クラス用語」とは、項目名のことではないことに注意

クラス用語の継承• 他のクラス用語を継承して新たなクラス用語を作成することができる

• 継承したクラス用語は、継承元のすべてのプロパティをもつ

• 継承したクラス用語は継承元にないプロパティを追加することができる

• 継承したクラス用語は継承元のクラス用語としても使用できる。例えば、データ型が「組織」となっているプロパティには、「業務組織」の値を指定することができる。

プロパティ用語• クラス用語を説明するためのクラス用語や値を表すための用語

• 項目名、データ型、及び説明から構成される

• データ型はクラス用語の型かXMLスキーマで定義される基本型をとる

• クラス用語の子要素として使用される

用語の階層構造• プロパティ用語のデータ型としてクラス用語を指定することができる。その場合、データ型であるクラス用語がまたプロパティ用語をもつので、図のような概念的な階層構造をもつ

IMI共通語彙基盤の構造• 情報交換のための用語連携インタフェースは、社会全体で使われる用語であるコア語彙、共通語彙及びドメイン固有語彙から構成される。

コア語彙

ドメイン固有語彙各分野での利用に特化した語彙。例)農作業、品種 など

市場

住所

病院

災害復旧費

ドメイン共通語彙分野固有の語彙の内、他の分野でも参照する主要な語彙。例)商店、病院、食品名 など

コア語彙どの分野でも利用される普遍的な語彙。例)人、物、場所、施設、日付 など 地理空間

・施設

移動・交通

農業

財務

ドメイン固有語彙

ドメイン共通語彙

既存の業界・企業内語彙

対応表で用語の置き換えをすることを基本とするので、各組織は既存の用語体系を変更する必要が無い

46

共通語彙まとめ

• IMI共通語彙基盤とは何であるか• 構造化概念辞書

• 概念とその表記としての用語• クラス概念と関係概念

• スキーマのテンプレート• さまざまなデータスキーマをつくるためのテンプレート

• IMI共通語彙基盤の構造• コア語彙とドメイン語彙• データモデルと物理形式

• IMI共通語彙基盤の利用方法• システム間連携• オープンデータ• 検索

農業語彙の標準化にむけて

• レイヤーに分けた取り組み• メタデータ:実際のシステム、機器で利用• メタデータ・スキーマ:システム間データ連携• オントロジー:メタデータ・スキーマ生成

• 多様な連携による取り組み• ドメイン研究者と情報研究者

• よい構造化とは• ドメインを超えた連携実現

• 研究者と開発者• 理念と実装• コミュニティづくり

• 公的機関と民間• デファクト• オープンデータ

Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/