総合目録データベース z39.50 ゲートウェイサーバの概要 - catp→marc21...
DESCRIPTION
総合目録データベース Z39.50 ゲートウェイサーバの概要 - CATP→MARC21 フォーマット変換を中心に-. 国立情報学研究所 開発・事業部. コンテンツ課 阿蘓品治夫 [email protected]. 目次. 経緯 システム構成 基本仕様 CATP→MARC21 変換 課題. 経緯. プロトタイプ版 平成 13 年 6 月から公開中 CATP 教育用サーバが検索対象 改訂版 プロトタイプ版の仕様を改良 CATP 業務用サーバが検索対象 プロトタイプに代わり、平成 14 年 3 月リリース予定. システム構成. 基本仕様. - PowerPoint PPT PresentationTRANSCRIPT
1
総合目録データベースZ39.50 ゲートウェイサーバの概要
- CATP→MARC21 フォーマット変換を中心に-
国立情報学研究所 開発・事業部コンテンツ課 阿蘓品治夫
2
目次
経緯システム構成基本仕様CATP→MARC21 変換課題
3
経緯– プロトタイプ版
• 平成 13 年 6 月から公開中• CATP 教育用サーバが検索対象
– 改訂版• プロトタイプ版の仕様を改良• CATP 業務用サーバが検索対象• プロトタイプに代わり、平成 14 年 3 月リリース予
定
4
システム構成
5
基本仕様• Z39.50 サポート
–Ver.2 準拠、 Init, Search, Present の 3 サービス• 検索 Search
–検索質問 / 検索属性集合• Query-type1 と Bib-1 で行う。
- 各属性の詳細は Web で公開中
–対象• 図書書誌・所蔵 及び 雑誌書誌・所蔵
- デフォルトで図書・雑誌両方を検索、個別指定可とする予定 - プロトタイプ版は教育用サーバ
6
基本仕様• 返戻 Present
– 項目• エレメントセットネーム B (簡略)、 F (詳細)に対
応 - B は CATP の Edit-Type 1 に相当
– レコード構文• MARC21 、 NACSIS-CATP( 当面 SUTRS と同形式 ) 、 SUTRS
– 提供文字セット ( Port で振り分け )
• UTF-8 、 ISO2022-JP- プロトタイプ版で提供中の EUC は提供中止予定
7
CATP→MARC21 変換仕様
• 方針– タイトル等のローマ字表示を実現(ヨミか
らローマナイズ形を自動作成)– ローマ字形と対になる日本語形はタグ 880
に割当– 変換仕様をプロト版より詳細化 (PTBL
等)
8
CATP→MARC21 変換仕様• ローマナイズ
– 修正ヘボン式( LC 採用方式)<例> 北海道 hokkaid ( 014D ) 新聞 shinbun
- ISO2022-JP の場合は長音符号省略
– 「ヨミ」フィールドからローマナイズデータを作成
• 対象フィールド: 本タイトル( TRR) 、内容著作注記( CWR) 、 その他のタイトル( VTR )、親書誌タイトル (PTBTRR) 、 著者標目形( AHDNGR )、統一書名標目形( UTHDNGR) 、 件名( SHR)
9
CATP→MARC21 変換仕様
• MARC21 フィールド 880 への割当– 「ヨミ」がある場合 = 日本語形がある場合
• ローマナイズ形を、 245 等に割当てる• TR 、 CWA 、 VTA 等(日本語形)は 880 に割
当てる• 「ヨミ」そのものは、割当てず、捨てる
10
CATP→MARC21 変換仕様
CATP<BN00028060> :TR: 東京文壇事始 : 明治の回想 / 巌谷大四著 ||ト
ウキョウ ブンダン コトハジメ : メイジ ノ カイソウ
PUB: 東京 : 角川書店 , 1984.12PHYS:270p ; 19cmNOTE:参考文献 :p270PTBL:角川選書 || カドカワ センショ <BN00028071>
152//aAL:巌谷 , 大四 (1915-)||イワヤ , ダイシ <DA00033826>
CLS:NDC8:910.26 CLS:NDLC:KG314SH:NDLSH: 日本文学 -- 歴史 -- 明治時代 || ニホ
ンブンガク -- レキシ -- メイジジダイ //L
MARC21:245 10 $6880-01 $a Tōkyō bundan kotohajime :$b meiji no kaisō880 10 $6245-01/$1 $a 東京文壇事始 :$b 明治の回想/ $c 巌谷大四著260 ## $a 東京 $b 角川書店 $c 1984.12.300 ## $a 270p; $c 19cm.440 #0 $6880-02 $a Kadokawa sensho $v 152880 #0 $6440-02/$1 $a 角川選書 $v 152500 ## $a 参考文献 :p270650 #4 $6880-03 $aNihonbungaku -- rekishi -- meijijidai880 #4 $6650-03/$1 $a 日本文学 -- 歴史 -- 明治時代700 10 $6880-04 $a 巌谷 , 大四 (1915-)880 10 $6700-04/$1 $a Iwaya Daishi852 $a 名大 (FA002407) $b 中央館 $i 910.26||I B27765
( 880 フィールド割当例)
11
CATP→MARC21 変換仕様
• MARC21 フィールド 880 への割当方式– 「ヨミ」が無い場合( = データ内容が欧文
の場合) 880 への割当ては発生しない。
– 「その他のヨミ」(ピンイン等)データがある場合
• 「その他のヨミ」フィールドのデータをローマナイズ形として使用する。
対象フィールド TRVR 、 CWVR 、 VTVR ・・・・
12
CATP→MARC21 変換仕様
– 主なフィールドの変換ルール
• 巻冊次等( VOL ) → 020 CATP VOL: ISBN: PRICE: XISBN: ( )リピータブル
MARC21 020 ## $aISBN(VOL)$cPRICE$z XISBN (リピータブ)ル
• 内容著作注記( CW) → 505 ( 880 割当有) CATP CWT: CWA: CWR: CWVR ( )リピータブル MARC21 505 6880-XX $gCWT ( :△より前) .$tCWTR ( :△より
後) /$rCWA .--$g .$ /$r.-- ( 1 フィールドで表現)
13
CATP→MARC21 変換仕様
– 主なフィールドの変換ルール
• 親書誌( PTBL ) → 440 ( 880 割当有) CATP PTBTR: PTBRR: PTBRVR: PTBNO
MARC21 440 #0 6880-XX $a PTBTRR $v PTBNO ( )リピータブル * 中位書誌( PTBNO に記録)が存在する場合 440 の繰返で対処
• 図書所蔵データ → 852 CATP LIBABL 、 FANO 、 LOC 、 VOL 、 CLN 、 RG
TN
MARC21 852 ## $a LIBABL ( FANO ) $b LOC $I VOL CLN RGTN
*複数の巻冊を所蔵する( VOL CLN RGTN の組が複数)場合、$I の繰返しで対処
14
CATP→MARC21 変換仕様
– 主なフィールドの変換ルール
• 雑誌所蔵データ → 852 と 866 の対 CATP LIBABL 、 FANO 、 LOC 、 HLV 、 HLYR 、
CON
MARC21 852 ## $a LIBABL ( FANO ) $b LOC $I RGTN
866 #0 $a HLV(HLYR)CONT
15
課題・検討事項
– ヨミの無い CATP フィールドへの対処• 出版事項( PUB )
– UMARC21 タグの順序• 245 等一般記述項目の直後に 880 を返すか(出せる
か)• タグはあくまで、タグの番号順に出すのが正統か
– その他• 更新 DatabeseUpdate の利用可能性を検討 等