[2cpm1-03] 人文学分野におけるメタデータの整備状況講演概要...

17
人文学・社会科学分野におけるデータインフラストラクチャー ―データカタログの整備― [2CPM1-03] 人文学分野におけるメタデータの整備状況 2020年度統計関連学会連合大会 2020年9月10日13:00-15:00 C会場 独立行政法人日本学術振興会 人文学・社会科学データインフラストラクチャー構築推進センター研究員(PO) 池内有為(文教大学文学部・専任講師)

Upload: others

Post on 05-Mar-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

人文学・社会科学分野におけるデータインフラストラクチャー―データカタログの整備―

[2CPM1-03]

人文学分野におけるメタデータの整備状況

2020年度統計関連学会連合大会2020年9月10日13:00-15:00 C会場

独立行政法人日本学術振興会人文学・社会科学データインフラストラクチャー構築推進センター研究員(PO)

池内有為(文教大学文学部・専任講師)

Page 2: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

講演概要

「JDCat*メタデータスキーマ」

1. 人文学分野の検討プロセス2. 検討方針3. 追加項目① 統制語彙(CV):トピック② 統制語彙(CV):データタイプ③ エレメントの拡張:データの言語④ 新規エレメント:所蔵者・寄託者

2

*JDCat= Japan Data Catalog for the Humanities and Social Sciences人文学・社会科学総合データカタログ

Page 3: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

1. 人文学分野の検討プロセス

3

JDCatメタデータスキーマ

• Unit of Analysis• Universe / Population• Sampling Procedure• Collection method• Date of collection• Sampling Rate

• Title• Author• Distributor• URI• Time Period(s)• Geographic Coverage

社会科学分野

Page 4: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

1. 人文学分野の検討プロセス

4

JDCatメタデータスキーマ

• Unit of Analysis• Universe / Population• Sampling Procedure• Collection method• Date of collection• Sampling Rate

• Title• Author• Distributor• URI• Time Period(s)• Geographic Coverage

• ??????• Author• Distributor• URI• Time Period(s)• Geographic Coverage

社会科学分野 人文学分野

????

Page 5: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

1. 人文学分野の検討プロセス

5

JDCatメタデータスキーマ

• Unit of Analysis• Universe / Population• Sampling Procedure• Collection method• Date of collection• Sampling Rate

• Title• Author• Distributor• URI• Time Period(s)• Geographic Coverage

• ??????• Author• Distributor• URI• Time Period(s)• Geographic Coverage

社会科学分野 人文学分野

????

(共通)

国際的な相互運用性

Page 6: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

2. メタデータスキーマの検討方針

n基本方針

① 社会科学分野およびJPCOARメタデータスキーマをベースとする

② 人文学分野の拠点機関である東京大学史料編纂所のデータを過不足なく記述する

③ 国際的な相互運用性を高める

④ 人文学分野全般に適用できるよう設計する

⑤ 長期にわたり使用できるよう設計する

6

Page 7: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

2. メタデータスキーマの検討方針

nユーザビリティ

① 国内外の人文学・社会科学を中心とした研究者にとって必要な情報を記述する

② さまざまな分野のデータ登録者(データ提供者やデータキュレータ)にとって理解や登録が容易なスキーマとする

7

Page 8: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

3. 人文学分野の追加項目

8

JDCatメタデータスキーマ

• Unit of Analysis• Universe / Population• Sampling Procedure• Collection method• Date of collection• Sampling Rate

• Title• Author• Distributor• URI• Time Period(s)• Geographic Coverage

• Topic CV• Data Type CV• Data Language• Provider

• Geographic Coverage

社会科学分野 人文学分野

????

(共通)

国際的な相互運用性

Page 9: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

3.-① トピック統制語彙(CV)の検討

n方針ü史料編纂所のデータ、及び今後データ登録が予想される人文学分野全般をカバーするCVとする

ü国際的に広く利用されているCVが望ましい

n検討対象üUKDA - HASSET、UNESCO、Getty üRDA1): CARARE、DDI、EAD、MIDASüSSHOC2)、CO-OPERAS: Dublin Core、DataCite、E-RIHS

(Heritage Sciences)、CLARIN (Language Sciences)、DARIAH (Arts and Humanities)

üEuropeana、DPLA、JAPAN SEARCH

91. Research Data Alliance “Metadata Standards Catalog” https://rdamsc.bath.ac.uk/subject-index2. SSHOC “Mapping (meta)data interoperability problems, building the SSHOC Interoperability Hub”

https://www.sshopencloud.eu/news/mapping-metadata-interoperability-problems-building-sshoc-interoperability-hub

Page 10: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

3.-① トピック統制語彙(CV)の検討

n既存CVの主な問題点ü人文学全般を扱い、かつ国際的に広く利用されているCVはみあたらない

ü日本やアジア系の語彙が不十分ü粒度にムラがある

nそこで・・・ü幅広い分野の資料を扱う図書館の分類を使用するü本来、資料を一意に分類するために用いるが、キーワード的に用いる(複数付与を可とする)

n候補üDewey Decimal Classification (DDC)ü日本十進分類法 (NDC)→日本の史資料を含む

10

Page 11: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

3.-① トピックCV:日本十進分類法第10版

11

第2次区分表 第3次区分表 (芸術・美術/文学)

Page 12: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

3.-① トピックCV:日本十進分類法第10版

n階層構造ü芸術・美術、文学はより詳細な語彙を使用可能にüデータタイプや対象時期等のエレメントを組み合わせて詳細な検索を実現する

12

70 芸術. 美術71 彫刻. オブジェ72 絵画. 書. 書道73 版画. 印章. 篆刻. 印譜74 写真. 印刷75 工芸76 音楽. 舞踊. バレエ77 演劇. 映画. 大衆芸能78 スポーツ. 体育79 諸芸. 娯楽

720絵画721日本画722東洋画723洋画724絵画材料・技法725素描. 描画726漫画. 挿絵. 児童画727グラフィックデザイン. 図案728書. 書道

第2次区分表

第3次区分表

Page 13: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

3.-② データタイプ統制語彙(CV)の検討

n社会科学分野ü内容+データ形式

13

Page 14: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

3.-② データタイプ統制語彙(CV)の検討

n方針ü社会科学分野と同様の体系とすることü人文学分野のデータを広くカバーできることü国内外の研究者、及びデータ登録者が理解しやすいこと

n検討対象ü史料編纂所Hi-CatのカテゴリüHASSET Information MaterialsüJPCOARスキーマ:資源タイプ

n問題点ü粒度ü社会科学分野とのバランス

14

Page 15: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

3.-② データタイプCV:オリジナル

15

n史料編纂所からの提案

Page 16: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

3.-③④ エレメントの拡張・追加

16

n必要な要素üデータの文字ü所蔵者・寄託者

n検討1. 既存エレメントへのあてはめ

2. 既存エレメントの拡張:Data Languageü「データの文字」をデータの言語とあわせてISO15924で記載[例:jpn, jpn-Hira, jpn-Kana]

3. 新規エレメントの追加:Providerü「所蔵者・寄託者」は、Author(作成者)、Distributor(配布者)、 Publisher(編集者)のいずれにもあてはまらない

Page 17: [2CPM1-03] 人文学分野におけるメタデータの整備状況講演概要 「JDCat*メタデータスキーマ」 1.人文学分野の検討プロセス 2.検討方針 3.追加項目

まとめ:人文学分野の検討結果

nJDCatメタデータスキーマü合計31のエレメント

n人文学分野の統制語彙 (CV)① Topic: トピック② Data Type: データタイプ

nエレメントの拡張③ Data Language: データの言語

n新規エレメント④ Provider: 所蔵者・寄託者

17