総合目録データベース z39.50 ゲートウェイサーバの概要 - catp→marc21...

15
1 総総総総総総総総総総 Z39.50 総総総総総総総総総総総総 CATP→MARC21 総総総総総総総総総総総総総総総総総総総総 総総 総総総 総総総総総総 総総総総総 [email protected] c.jp

Upload: may-neal

Post on 30-Dec-2015

93 views

Category:

Documents


0 download

DESCRIPTION

総合目録データベース Z39.50 ゲートウェイサーバの概要 - CATP→MARC21 フォーマット変換を中心に-. 国立情報学研究所 開発・事業部. コンテンツ課 阿蘓品治夫 [email protected]. 目次. 経緯 システム構成 基本仕様 CATP→MARC21 変換 課題. 経緯. プロトタイプ版 平成 13 年 6 月から公開中 CATP 教育用サーバが検索対象 改訂版 プロトタイプ版の仕様を改良 CATP 業務用サーバが検索対象 プロトタイプに代わり、平成 14 年 3 月リリース予定. システム構成. 基本仕様. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

1

総合目録データベースZ39.50 ゲートウェイサーバの概要

- CATP→MARC21 フォーマット変換を中心に-

国立情報学研究所 開発・事業部コンテンツ課 阿蘓品治夫

[email protected]            

Page 2: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

2

目次

経緯システム構成基本仕様CATP→MARC21 変換課題

Page 3: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

3

経緯– プロトタイプ版

• 平成 13 年 6 月から公開中• CATP 教育用サーバが検索対象

– 改訂版• プロトタイプ版の仕様を改良• CATP 業務用サーバが検索対象• プロトタイプに代わり、平成 14 年 3 月リリース予

Page 4: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

4

システム構成

Page 5: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

5

基本仕様• Z39.50 サポート

–Ver.2 準拠、 Init, Search, Present の 3 サービス• 検索 Search

–検索質問 / 検索属性集合• Query-type1 と Bib-1 で行う。

- 各属性の詳細は Web で公開中

–対象• 図書書誌・所蔵 及び 雑誌書誌・所蔵

- デフォルトで図書・雑誌両方を検索、個別指定可とする予定 - プロトタイプ版は教育用サーバ

Page 6: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

6

基本仕様• 返戻 Present

– 項目• エレメントセットネーム B (簡略)、 F (詳細)に対

応 - B は CATP の Edit-Type 1 に相当

– レコード構文• MARC21 、 NACSIS-CATP( 当面 SUTRS と同形式 ) 、 SUTRS

– 提供文字セット ( Port で振り分け )

• UTF-8 、 ISO2022-JP- プロトタイプ版で提供中の EUC は提供中止予定

Page 7: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

7

CATP→MARC21 変換仕様

• 方針– タイトル等のローマ字表示を実現(ヨミか

らローマナイズ形を自動作成)– ローマ字形と対になる日本語形はタグ 880

に割当– 変換仕様をプロト版より詳細化 (PTBL

等)

Page 8: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

8

CATP→MARC21 変換仕様• ローマナイズ

– 修正ヘボン式( LC 採用方式)<例> 北海道 hokkaid ( 014D ) 新聞 shinbun

- ISO2022-JP の場合は長音符号省略

– 「ヨミ」フィールドからローマナイズデータを作成

• 対象フィールド: 本タイトル( TRR) 、内容著作注記( CWR) 、 その他のタイトル( VTR )、親書誌タイトル (PTBTRR) 、 著者標目形( AHDNGR )、統一書名標目形( UTHDNGR) 、 件名( SHR)

Page 9: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

9

CATP→MARC21 変換仕様

• MARC21 フィールド 880 への割当– 「ヨミ」がある場合 = 日本語形がある場合

• ローマナイズ形を、 245 等に割当てる• TR 、 CWA 、 VTA 等(日本語形)は 880 に割

当てる• 「ヨミ」そのものは、割当てず、捨てる

Page 10: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

10

CATP→MARC21 変換仕様

CATP<BN00028060> :TR: 東京文壇事始 : 明治の回想 / 巌谷大四著 ||ト

ウキョウ ブンダン コトハジメ : メイジ ノ カイソウ

PUB: 東京 : 角川書店 , 1984.12PHYS:270p ; 19cmNOTE:参考文献 :p270PTBL:角川選書 || カドカワ センショ <BN00028071>

152//aAL:巌谷 , 大四 (1915-)||イワヤ , ダイシ <DA00033826>

CLS:NDC8:910.26 CLS:NDLC:KG314SH:NDLSH: 日本文学 -- 歴史 -- 明治時代 || ニホ

ンブンガク -- レキシ -- メイジジダイ //L

MARC21:245 10 $6880-01 $a Tōkyō bundan kotohajime :$b meiji no kaisō880 10 $6245-01/$1 $a 東京文壇事始 :$b 明治の回想/ $c 巌谷大四著260 ## $a 東京 $b 角川書店 $c 1984.12.300 ## $a 270p; $c 19cm.440 #0 $6880-02 $a Kadokawa sensho $v 152880 #0 $6440-02/$1 $a 角川選書 $v 152500 ## $a 参考文献 :p270650 #4 $6880-03 $aNihonbungaku -- rekishi -- meijijidai880 #4 $6650-03/$1 $a 日本文学 -- 歴史 -- 明治時代700 10 $6880-04 $a 巌谷 , 大四 (1915-)880 10 $6700-04/$1 $a Iwaya Daishi852 $a 名大 (FA002407) $b 中央館 $i 910.26||I B27765

( 880 フィールド割当例)

Page 11: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

11

CATP→MARC21 変換仕様

• MARC21 フィールド 880 への割当方式– 「ヨミ」が無い場合( = データ内容が欧文

の場合) 880 への割当ては発生しない。

– 「その他のヨミ」(ピンイン等)データがある場合

• 「その他のヨミ」フィールドのデータをローマナイズ形として使用する。

対象フィールド TRVR 、 CWVR 、 VTVR ・・・・

Page 12: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

12

CATP→MARC21 変換仕様

– 主なフィールドの変換ルール

• 巻冊次等( VOL ) → 020 CATP VOL: ISBN: PRICE: XISBN: ( )リピータブル

MARC21 020 ## $aISBN(VOL)$cPRICE$z XISBN (リピータブ)ル

• 内容著作注記( CW) → 505 ( 880 割当有) CATP CWT: CWA: CWR: CWVR ( )リピータブル MARC21 505 6880-XX $gCWT ( :△より前) .$tCWTR ( :△より

後) /$rCWA .--$g .$ /$r.-- ( 1 フィールドで表現)

Page 13: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

13

CATP→MARC21 変換仕様

– 主なフィールドの変換ルール

• 親書誌( PTBL ) → 440 ( 880 割当有) CATP PTBTR: PTBRR: PTBRVR: PTBNO

MARC21 440 #0 6880-XX $a PTBTRR $v PTBNO ( )リピータブル * 中位書誌( PTBNO に記録)が存在する場合 440 の繰返で対処

• 図書所蔵データ → 852 CATP LIBABL 、 FANO 、 LOC 、 VOL 、 CLN 、 RG

TN

MARC21 852 ## $a LIBABL ( FANO ) $b LOC $I VOL CLN RGTN

*複数の巻冊を所蔵する( VOL CLN RGTN の組が複数)場合、$I の繰返しで対処

Page 14: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

14

CATP→MARC21 変換仕様

– 主なフィールドの変換ルール

• 雑誌所蔵データ → 852 と 866 の対 CATP LIBABL 、 FANO 、 LOC 、 HLV 、 HLYR 、

CON

MARC21 852 ## $a LIBABL ( FANO ) $b LOC $I RGTN

866 #0 $a HLV(HLYR)CONT

Page 15: 総合目録データベース Z39.50 ゲートウェイサーバの概要 -  CATP→MARC21 フォーマット変換を中心に-

15

課題・検討事項

– ヨミの無い CATP フィールドへの対処• 出版事項( PUB )

– UMARC21 タグの順序• 245 等一般記述項目の直後に 880 を返すか(出せる

か)• タグはあくまで、タグの番号順に出すのが正統か

– その他• 更新 DatabeseUpdate の利用可能性を検討 等