z39.50 とその動向

80
2001.9.21 Web & Genome 1 Z39.50 ととととと ととととと とととと とととと とととと ととととととととととととと ・・・・ ととと とと と

Upload: rigel-pennington

Post on 30-Dec-2015

52 views

Category:

Documents


3 download

DESCRIPTION

Z39.50 とその動向. インテック・ウェブ・アンド・ゲノム・インフォマティクス株式会社 技術部 石田 茂. 内容. Z39.50 とは何か? Z39.50 はどのように使用するのか? 市場動向 Z39.50 はどのように機能するのか? Z39.50 と ILL (図書館間相互貸借) 国内利用に向けて必要な環境(合意) Z39.50 の将来. Z39.50 とは何か?. ネットワークベースの情報検索プロトコル OSI 参照モデル7層 - ASN.1 、 BER サーバ / クライアント型 - PowerPoint PPT Presentation

TRANSCRIPT

2001.9.21 Web & Genome1

Z39.50 とその動向

インテック・ウェブ・アンド・ゲノム・インフォマティクス株式会社

技術部 石田 茂

2001.9.21 Web & Genome2

内容

Z39.50 とは何か? Z39.50 はどのように使用するのか? 市場動向 Z39.50 はどのように機能するのか? Z39.50 と ILL (図書館間相互貸借) 国内利用に向けて必要な環境(合意) Z39.50 の将来

2001.9.21 Web & Genome3

Z39.50 とは何か?

ネットワークベースの情報検索プロトコル OSI 参照モデル7層 - ASN.1 、 BER サーバ / クライアント型

ANSI/NISO Z39.50-1995 (ISO 23950:1998) NISO - National Information Standards Organization ISO - International Standards Organization

米国議会図書館に Maintenance Agency 設置 Ray Denenberg がまとめ役

2001.9.21 Web & Genome4

ZIG - Z39.50 Implementors Group

Z39.50 システムの開発者グループ 改正、修正、問題認識ならびに提起等を議論 実装者合意を作成 5ヶ月に一度の会合(北米、 EU 、ワシントン

DC ) コンセンサス主導の作業方針

2001.9.21 Web & Genome5

開発経緯 1978-82

初期の開発 / 調査研究 1982-83

Linked Systems Project Protocol 1983-84

ANSI Z39 に提出 .Z39.50-1984. 承認投票に失敗 1984-87

開発継続 1988

NISO に再提出。 Z39.50-1988 として承認 1979-89

Z39 SC D

2001.9.21 Web & Genome6

開発経緯 1984-91

ISO SR → ISO 10162/10163 Search & Retrieve (1993) 1990

ZIG (実装者グループ)設立 1989-90

Z39.50 Maintenance Agency 設立 1992

Z39.50-1992 (version 2) 1990-95

version 3 開発 1995

Z39.50-1995 1998

ISO 23950

2001.9.21 Web & Genome7

目的

クライアント・サーバシステム間で情報検索の相互連携性を確保する ベンダー間の相互連携

様々な DB とユーザ IF

組織間の相互連携 様々な図書フォーマット

ユーザグループ間の相互連携 公共図書館と大学図書館 様々なコミュニティにおける図書館

コミュニティ間の相互連携 図書館、出版社、 DB サービス、美術・博物館等

2001.9.21 Web & Genome8

どのように使用するか?

抽象化 DB 標準化されたアクセスポイント

属性集合 標準化された検索式 標準化された返戻形式

スキーマ 選択可能なレコード構文 返戻時にレコードの選択が可能

レコード内容に左右されない検索処理

2001.9.21 Web & Genome9

どのように使用するか?

抽象化された DB は、実際の DB のフロントエンドとして実装される。

アプリ機能

Z39.50クライアント

Z39.50サーバ DB

Z39.50 クライアント Z39.50 サーバ

2001.9.21 Web & Genome10

補足機能

走査 永続的検索結果集合 定期的検索実行 蔵書注文 DB 更新 仕様導出、発動

2001.9.21 Web & Genome11

相互連携にみる特徴

DB 毎に異なる機能 アクセスポイント等の属性集合、実装特徴

DB 毎に異なる情報形式 US MARC, UNIMARC, SUTRS, GRS-1 所蔵情報の内包、分離

2001.9.21 Web & Genome12

Profile

標準仕様の使用方法に関する合意規定 どのアクセスポイントが有効? どの属性が有効? レコード構文には何が指定できる? どの(補足)機能が一般に利用できる? どのオプションが利用できる? 特定分野向けのデータは許容される?

2001.9.21 Web & Genome13

Profile例

ATS-1 Author, Title, Subject 初期の図書向け簡易仕様 (廃止)

GILS 行政情報所在案内サービス 汎用的な情報所在案内サービスの参照モデル

2001.9.21 Web & Genome14

Profile例

CIMI 美術館情報をコンピュータ上で交換するため

のコンソーシアムが作成 テキスト以外に画像情報も検索対象とする

CIP Catalogue Interoperability Protocol 国際的な地球観測衛星委員会が作成 地理空間情報の検索にも利用される

2001.9.21 Web & Genome15

Profile例

GEO 地理空間情報を対象

STAS 科学工学向け属性集合を規定 正確には Profile ではない

2001.9.21 Web & Genome16

主要な図書館向け Profile

ONE OPAC Network Europe 1996年作成 ノルウェー、ドイツ、英国で利用 アクセスポイントと要素集合に関する最小規定

CENL Conference of European National Librarians 1997年作成、 1998年後半に批准 ONE profile の拡張版

2001.9.21 Web & Genome17

主要な図書館向け Profile

Finnish Z39.50 profile Danish Z39.50 profile

国際的な ONE profile に対して、分類方式に関する国内仕様を追加規定

CENL と ONE の拡張版

2001.9.21 Web & Genome18

主要な図書館向け Profile

Union Catalogue Profile Union catalogue 向けに要求仕様を定義 オーストラリアで作成 1998年に受理

2001.9.21 Web & Genome19

Z39.50 の難点

複雑なプロトコル 難解な用語 元は ISO/OSI 規格に準拠

TCP/IP上で実装 難解な理論ベースのプロトコル 様々な抽象化レベル

2001.9.21 Web & Genome20

Z39.50 の難点

機能的に収斂した製品が未だ無い 今後、 Mozilla の RDF 実装が該当?

適切な専門化が極少数 製品の長期的なサイクルを考慮 標準化の前に仕様上の十分な探索がされていない

広く普及させることで困難な問題点を解決!

2001.9.21 Web & Genome21

Z39.50 の適用方法

サーバ( Target ) ゲートウェイ クライアント( Origin )

2001.9.21 Web & Genome22

サーバ( Target )

抽象化 DB を実装 特殊な開発作業 ツールキットのカスタマイズ サーバモジュールの準備 DB コンフィグレーション

実際の DB を抽象化 DB としてどのように表現するか?

Z39.50サーバ DB

Z39.50 サーバ

2001.9.21 Web & Genome23

ゲートウェイ

IF に二つの顔を持つ Z39.50 サーバに対して、 Z39.50 クライ

アントとして通信する顔 一般的なクライアントと通信する顔

クライアントプロトコルには HTML, Telnet, Z39.50…

2001.9.21 Web & Genome24

Web ゲートウェイ

HTTP サーバ

ビジネスロジック

Z39.50クライアント

Web ブラウザ Z39.50 サーバ

2001.9.21 Web & Genome25

横断的ゲートウェイ

Z39.50サーバ

ビジネスロジック

Z39.50クライアント

Z39.50クライアント

Z39.50 クライアント

Z39.50 サーバ

Z39.50クライアント

Z39.50 サーバ

Z39.50 サーバ

2001.9.21 Web & Genome26

高度なゲートウェイ

複数の Z39.50 サーバと接続する 並列検索 連続検索 検索結果のマージ

両方の IF に様々なプロトコルに対応する SQL, LDAP, HTML, DNS…

2001.9.21 Web & Genome27

高度なゲートウェイ

Z39.50サーバ

ビジネスロジック

Z39.50クライアント

SQLクライアント

Z39.50 クライアントZ39.50 サーバ

HTTPサーバ

専用プロトコル

サーバ

LDAPクライアント

Web ブラウザ

専用システム

SQL サーバ

LDAP サーバ

2001.9.21 Web & Genome28

クライアント( Origin )

グラフィカルなユーザ IF のプロトコル処理部 ユーザから複雑さは隠されている 拡張コンフィグレーションの必要性 同時に複数のサーバに接続する場合あり

アプリ機能

Z39.50クライアント

Z39.50 クライアント

2001.9.21 Web & Genome29

市場動向

統合システム 図書館システム

海外の主要なシステムは全て Z39.50 機能をもつ専用クライアントあるいは Web ゲートウェイ小規模システムにも Z39.50 を採用するものあり多くのシステムは Version 2 を採用する

INNOPAC 等の米国製システムに多い

2001.9.21 Web & Genome30

市場動向

スタンドアロン製品 ツールキットレベル製品 システムインテグレーション・コンサルタ

ント Crossnet (UK) Fretwell-Downing (UK) Indexdata (Denmark) Sunstone (Sweden) Blueangel Technologies (US) Finsiel (Italy)

2001.9.21 Web & Genome31

市場動向(国内)主な機能

メーカ /

サービスベンダー

ServerWeb G/W Proxy

Telnet G/W 採用機関 /特徴日本語 検索エンジン

NACSIS-ELS/ NII国立情報学研究所

○(NII内 ) 大学系図書館(多数)○

INNOPAC/ Innovative Interface Inc. 日本 IBM ○ ○ 早稲田大学○

LibCruiser  Pro/ NTT 東日本

○ ○ ○ ○ OpenText東京工業大学、図書館情報大学、神戸大学

Gateway-CAT/ 丸善 ○

外部連携

RLG Zephyer Server 大学系図書館(多数)

JOIS with STN/ JST 科学技術振興事業団 CAS Server

InfoLib-Global Finder/ 日商岩井インフォコ

○ ○ ○ ○ ○ OpenText

SiteSearch/

OCLC, 紀伊国屋○ ○

ERL/

Silver Platter, 紀伊国屋○ ○

Ovid/ Ovid Technologies Inc, ユサコ ○ ○ ○

○(NII内 )

○( 丸善内 )

○(JST内 )

○(JST内 )

○( 丸善経由 )

大学系図書館(多数)

LibVision V3(LVZ)/

日本 IBM、紀伊国屋、

新日鉄ソリューション大分

○ ○ ○

CharsetandLanguageNego(3)

UTF8/ISO2022-JP 対応

NACSIS-CAT,MARC21 対応

2001.9.21 Web & Genome32

Z39.50 はどのように機能するか?

機能とサービス 機能は一つ以上のサービスから構成される

2001.9.21 Web & Genome33

初期化機能

初期化サービス Z- アソシエーションの確立

クライアント サーバ初期化要求Version 、 ID/パスワード、オプション、メッセージサイズ、実装情報

初期化応答結果、 Version 、オプション、メッセージサイズ、実装情報

2001.9.21 Web & Genome34

初期化機能

使用可能なサービスとオプションを交渉する クライアントは“初期化要求”内のリストで様々な

サービスを要求する サーバは自身の機能・能力と比較調整し、可能な

サービスならびにオプションを初期化応答でクライアントに返す

2001.9.21 Web & Genome35

検索機能

検索サービス

クライアント サーバ検索要求検索式タイプ、検索式、DB, 結果集合名

検索応答ヒット件数、返戻レコード件数、ステータス情報、(レコード)

2001.9.21 Web & Genome36

返戻機能

返戻サービス

クライアント サーバ返戻要求レコード件数、開始順位、結果集合名

返戻応答レコード件数、ステータス、(レコード)

2001.9.21 Web & Genome37

返戻機能

セグメントサービス レコードを“セグメント”することで、初期化

時に設定したメッセージサイズよりも大きいレコードを転送することができる

二つのレベル Level 1: 一つのセグメントに複数のレコードを格納

Level 2: 一つのレコードを細分化して各セグメントに格納

2001.9.21 Web & Genome38

検索結果集合削除機能

削除サービス

クライアント サーバ削除要求結果集合リスト

削除応答ステータス

2001.9.21 Web & Genome39

アクセス制御機能

アクセス制御サービスクライアント サーバ

アクセス制御要求セキュリティ申請

応答(一般)

要求(一般)

アクセス制御応答セキュリティ申請応答

2001.9.21 Web & Genome40

課金・リソース制御機能

リソース制御サービス トリガリソース制御サービス リソース報告サービス

リソースの使用を制御、報告する複雑な機能 主に課金情報を作成するために使用される

2001.9.21 Web & Genome41

ソート機能

ソートサービス

クライアント サーバソート要求ソート対象の結果集合、ソート済結果集合、ソート方式

ソート応答ステータス

2001.9.21 Web & Genome42

走査機能

走査サービス

クライアント サーバ走査要求DB 、単語リスト、開始位置、単語数、 ( ステップサイズ )

走査応答ステータス、単語数、 (単語 )

2001.9.21 Web & Genome43

拡張サービス機能

拡張サービス 永続的検索結果集合 永続的検索式 定期的検索実行 蔵書注文 DB 更新 仕様導出、発動

タスクパッケージ 拡張サービス要求を作成、修正、削除するために使

2001.9.21 Web & Genome44

説明機能

説明サービス サーバ情報のアクセス手段を提供する

DB アクセスポイント 検索言語 要素集合 ...

2001.9.21 Web & Genome45

終了処理

完了サービス Z- アソシエーションを終了する

2001.9.21 Web & Genome46

属性集合

使用可能な、ドメイン固有の抽象化されたアクセスポイント

BIB-1 STAS

2001.9.21 Web & Genome47

転送プロトコル

TCP/IP (通常) TCP予約ポート番号 210

ISO OSI 現在、殆ど使用されていない

2001.9.21 Web & Genome48

BER

基本符号化規則 Basic Encoding Rules 転送データの符号化方式 可読形式のコードではない

コンピュータのみ解釈可能

型 長さ 値

2001.9.21 Web & Genome49

ASN.1

抽象構文記法1 Abstract Syntax Notation 1

データ型を定義する記述言語 実装方式とは独立した表現形式

Permissions ::= SEQUENCE OF SEQUENCE{ userId [1] IMPLICIT InternationalString, allowableFunctions [2] IMPLICIT SEQUENCE OF INTEGER{ delete (1), modifyContents (2), modifyPermissions (3), present (4),

invoke (5)}}

2001.9.21 Web & Genome50

APDU

Application Protocol Data Unit 要求と応答を含むデータパッケージ

InitializeRequest ::= SEQUENCE{ referenceId ReferenceId OPTIONAL, protocolVersion ProtocolVersion, options Options, preferredMessageSize [5] IMPLICIT INTEGER, exceptionalRecordSize [6] IMPLICIT INTEGER, idAuthentication [7] ANY OPTIONAL, -- see note below implementationId [110] IMPLICIT InternationalString OPTIONAL, implementationName [111] IMPLICIT InternationalString OPTIONAL, implementationVersion [112] IMPLICIT InternationalString OPTIONAL, userInformationField [11] EXTERNAL OPTIONAL, otherInfo OtherInformation OPTIONAL}

--Note:-- For idAuthentication, the type ANY is retained -- for compatibility with earlier versions. -- For interoperability, the following is recommended:-- IdAuthentication [7] CHOICE{-- open VisibleString,-- idPass SEQUENCE {-- groupId [0] IMPLICIT InternationalString OPTIONAL,-- userId [1] IMPLICIT InternationalString OPTIONAL,-- password [2] IMPLICIT InternationalString OPTIONAL },-- anonymous NULL,-- other EXTERNAL -- May use access control formats for 'other'. See Appendix 7 ACC.

2001.9.21 Web & Genome51

検索式

検索式タイプ Type-0: 二者間の専用タイプ Type-1: RPN ( 標準) Type-2: ISO 8777 Type-100: Z39.58 Type-101: 拡張 RPN (v 2) Type 102: Ranked List query

重み付け検索 Relevance Feedback (関連検索)

2001.9.21 Web & Genome52

Type-1 検索式

構成要素 AND,OR,NOT 論理演算子と連携した一つ以上のオペランド

オペランドは二項関係の再帰表現を構成する オペランドは7つの要素から構成される

2001.9.21 Web & Genome53

Type-1 オペランド

0. Term 検索語

1.Use Attributes アクセスポイント

2.Relation Attributes 各アクセスポイントにおける Term とデータの関係 <、=、接辞処理等

2001.9.21 Web & Genome54

Type-1 オペランド

3.Position Attributes Term のアクセスポイント中の位置 フィールドの先頭、サブフィールドの先頭等

4.Structure Attributes Term の扱い方 フレーズ、単語、日付、正規化名称等

2001.9.21 Web & Genome55

Type-1 オペランド

5.Truncation Attributes 短絡形等の適用方法 左側短絡、左右短絡、短絡なし、正規表現

6.Completeness Attributes Term が照合される対象 サブフィールドの一部、サブフィールド全体、

フィールド全体

2001.9.21 Web & Genome56

検索式の例

AND

George Alec Effinger Islam

1:1003

2:3

3:1

4:1

5:100

6:1

1:1035

2:3

3:3

4:101

5:100

6:2

2001.9.21 Web & Genome57

検索結果集合

デフォルト結果集合 名前付き結果集合 永続的結果集合

2001.9.21 Web & Genome58

DB スキーマ

抽象化 DB のレイアウトを定義

要素(返戻時の抽象化された項目) 要素仕様 要素集合名

2001.9.21 Web & Genome59

タグ

要素または部分構造に一意にラベル付ける識別子

schemaIdentifier datatype: OBJECT IDENTIFIER

2001.9.21 Web & Genome60

タグ集合

特定のデータ構造のための識別子の集合

1.schemaIdentifier datatype: OBJECT IDENTIFIER

2.elementsOrdered datatype: BOOLEAN

3.elementOrdering datatype: INTEGER

4.defaultTagType datatype: INTEGER

2001.9.21 Web & Genome61

構成仕様

返戻したいデータ構造の一部分(あるいは全体)を指示する方法

2001.9.21 Web & Genome62

実装と連携の現実

Z39.50 は幾つかのレベルで相互連携を許容する、情報検索の複雑な標準仕様である。

真の相互連携システムの実現には、多くの知識と実証作業が必要となる。

2001.9.21 Web & Genome63

Z39.50 と ILL (図書館間相互貸借)

Z39.50 と ISO ILL(ISO 10160/10161) を連携するための仕様 Z39.50/ILL Profile 1/2 検索、返戻、所蔵確認( Z39.50 )~注文、

貸出、返却( ILL )までの一連の処理をネットワーク経由で連携

2001.9.21 Web & Genome64

ILL プロトコル ISO 10160/10161-1 Peer-to-Peer 全サービスは非確認型

“要求”に対する“応答”を必要としない OSI プロトコル

ASN.1 、 BER または EDIFACT APDU転送

MIME-encoded SMTP または TCP/IP セキュリティ

Prompt-1応答 ディレクトリ情報

外部オブジェクト

2001.9.21 Web & Genome65

Z39.50で ILL

Z39.50 蔵書注文 拡張サービスによる要求・応答

ISO ILL と連携 Z39.50/ILL Profile 1

ISO ILL プロトコル APDU を転送するための Z39.50 蔵書注文拡張サービスを使用する Profile

ISO 10161 で定義される全トランザクション Z39.50/ILL Profile 2

Z39.50 蔵書注文で ILL-Request APDU でパラメータを指定するProfile

2001.9.21 Web & Genome66

使用手順

Z39.50 で検索 所蔵スキーマを用いて、 Z39.50 により所蔵情

報を返戻 Z39.50拡張サービスから ILL Request Z39.50拡張サービスから ILL Answer Z39.50/ILL Profile 1

2001.9.21 Web & Genome67

使用手順

Request後の使用手順 Status request:

STATUS-QUERY Z39.50 サーバのタスク DB からの応答:

STATUS-OR-ERROR-REPORT

2001.9.21 Web & Genome68

Harvard Law (RLG

ILL Manager) Brown U. (via OCLC

Central ILLsystem)

Colorado State U.

(RSS)

U. Penncatalogue

UnionCatalogue

(RLIN)

Directory1.1 Search 1.2 Retrieve

Holdings:U. of Penn

Colorado State

Brown U.

2.3.1 ILL-REQUEST

2.3.2 ILL-ANSWER:

will- supply

2.1.1 Z39.50 query

2.1.2 Response:

Checked Out

2.2.1

Z39.50 query

2.2.2 Response:

Item Available

2.2.3 ILL-

REQUEST

2.3.4 ILL-ANSWER

unfilled (n.o.s.)

貸出処理: ILL Protocol& Z39.50

2001.9.21 Web & Genome69

BLDSCISO ILL Gateway

RLGRLIN

NLM’sISO ILLGateway

LIBRIS(Sweden)

LocalISO ILL

Application

BLDSC ART SystemDocline

Communications Network

Kinetica(Australia)

Te Puna(N.Z.)

NAVIS (Canada)

LIDDAS

CICDistributed

System

Library Consortia

MnSCU/PALS

Bibliographic Utilities

OCLC Central ILL,DRSS

National Libraries

2001.9.21 Web & Genome70

国内利用に向けて必要な環境(合意)

2001.9.21 Web & Genome71

言語面

現状の検索式、診断レコードの国際化 8 bitバイナリデータは扱える 文字集合の符号化方式と言語の交渉

ISO2022、 ISO10646-1 日本語の場合

複数の分かち書きの可能性 多くの異表記

ローマ字、片仮名、漢字 複雑な典拠コントロール

アクセスポイント、レコード構文の対応

2001.9.21 Web & Genome72

言語面

検索式に対する ZIGの考え 欧米の ZIGにはアジア圏を考慮する必然性が無い 国際的に普及の兆し 各言語から特性を反映

2001.9.21 Web & Genome73

MARC

海外では“MARC= ISO2709 準拠” 日本語表現可能な MARC

Japan/MARC MARC21 ( UTF-8, ISO2022-JP )

書誌目録の観点から NACSIS/CAT

MARC ベンダー独自の MARC

2001.9.21 Web & Genome74

新規レコード構文を登録する場合

レコード構文の識別子( OID) 属性集合の定義、拡張(必要に応じて) 要素集合の定義( B… ) 書誌目録の場合

所蔵レコードの取り込み方法 ILL との連携の可能性

合意形成作業が(労多くとも)最も重要

2001.9.21 Web & Genome75

実運用システムの課題

ベンダー間で相互連携性を検証 NII の取り組みは、レコード数と将来の相互連携数の規模

から有望な実証事例 ネイティブなレコード構文による書誌目録の流通を促進 相互連携性テストスーツ・仕様を規定

日本語対応システム ユーザフレンドリな日本語クライアント(ゲートウェ

イ) Z39.50 の開発動機を思い起こしたい

ネットワーク経由の共同目録作成作業を支援する

2001.9.21 Web & Genome76

Z39.50 の将来

Z39.50-200x ( V4)Draft 現在作業中

ZNG - Z39.50 Next Generation XML,URI,SOAP,HTTP Stateless ASN.1,BER,RPN Query を使用しない Explain 機能を普及させたい 抽象構文、スキーマは使用し続ける Z39.50MA は公式には参加していない( LCボランティ

ア)

2001.9.21 Web & Genome77

Z39.50 の将来

Web と親和性の高い、実装の容易なプロトコルが欲しい

Stateless でいい、必要ならセッション管理を付けよう

各目録規則を適切に扱う前提は崩したくない

目録規則と流通方式(検索 / 返戻)の各技術を相互に独立して発展させたい

2001.9.21 Web & Genome78

Z39.50 の将来

現在の Z39.50 規格は、長年の図書館界における情報検索の研究成果

検索式、レコード構文の高度な、特筆すべき拡張性

ネットワーク図書館を構成する、現時点の有望な、洗練されたフレームワークであることに変わりはない!

2001.9.21 Web & Genome79

参照文献

August 1999 Z39.50 Tutorial in Stockholm January 2000 ZIG Meeting in San Antonio ANSI/NISO Z39.50-1995(JIS X 0806:1999) ISO 10160/10161-1 Interlibrary Loan Service

Definition and Protocol Specification Z39.50/ILL Profile ½ The ZNG Initiative “Z39.50 Next Generation”

2001.9.21 Web & Genome80

質疑応答