第二章 信息检索基础理论 目录:

38
第第第 第第第第第第第第 第第2.1 信信信信信信信信信信 2.2 信信信信信信信信信 2.3 信信信信信信信信信

Upload: farrah-spence

Post on 02-Jan-2016

123 views

Category:

Documents


0 download

DESCRIPTION

第二章 信息检索基础理论 目录:. 2.1 信息检索的含义及类型. 2.2 信息检索技术与策略. 2.3 信息检索语言和工具. 2.1 信息检索的含义及类型. 2.1.1 信息检索的含义 2.1.2 信息检索的类型. 2.1 信息检索的含义及类型 2.1.1 信息检索的含义. 1. 信息标引和存储过程. 信息标引是对大量无序的信息特征进行著录、标引和组织,使之有 序化,信息存储是对有关信息进行选择,并按科学的方法存储,组成检 索工具和检索文档,建立信息数据库;即组织检索系统的过程。. 2. 信息的需求分析和检索过程. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第二章 信息检索基础理论      目录:

第二章 信息检索基础理论 目录:

2.1 信息检索的含义及类型

2.2 信息检索技术与策略

2.3 信息检索语言和工具

Page 2: 第二章 信息检索基础理论      目录:

2.1 信息检索的含义及类型

2.1.1 信息检索的含义

2.1.2 信息检索的类型

Page 3: 第二章 信息检索基础理论      目录:

2.1 信息检索的含义及类型 2.1.1 信息检索的含义

1. 信息标引和存储过程

信息标引是对大量无序的信息特征进行著录、标引和组织,使之有序化,信息存储是对有关信息进行选择,并按科学的方法存储,组成检索工具和检索文档,建立信息数据库;即组织检索系统的过程。

2. 信息的需求分析和检索过程

分析用户的信息需求,利用已组织好的检索系统,按照系统提供的方法与途径检索有关信息,即信息系统的应用过程。信息检索就是根据提问制定策略和表达式,利用信息数据库获取相关信息。 信息使用情况包括:需要信息、接受信息、消费信息

★ 信息检索的实质是将描述特定用户所需信息的提问特征,与信息存储的检索标识

进行异同的比较,从中找出与提问特征一致或基本一致的信息。

Page 4: 第二章 信息检索基础理论      目录:

2.1 信息检索的含义及类型 2.1.2 信息检索的类型

2. 根据检索(组织)方式分:信息检索分手工信息检索和机器(计算机)信息检索。 2. 根据检索(组织)方式分:信息检索分手工信息检索和机器(计算机)信息检索。

1. 根据检索的内容和查找的对象,信息检索可分为:数据信息检索、事实信息检索、文献信息检索。1. 根据检索的内容和查找的对象,信息检索可分为:数据信息检索、事实信息检索、文献信息检索。

3. 根据检索要求区分:信息检索分为强相关检索和弱相关检索。 *3. 根据检索要求区分:信息检索分为强相关检索和弱相关检索。 *

4. 按照检索的运行性质,信息检索分为定题检索和回溯检索。4. 按照检索的运行性质,信息检索分为定题检索和回溯检索。

5 、按照检索的信息形式,信息检索分为文本检索和多媒体检索。 *5 、按照检索的信息形式,信息检索分为文本检索和多媒体检索。 *

Page 5: 第二章 信息检索基础理论      目录:

2.2 信息检索的技术与策略

2.2.1 信息检索基本技术 在计算机信息检索系统中,比较通用的有浏览、简单检索和高级检索等功能

* 。浏览功能是由信息工作者将各种信息按一定的方式组织起来,按信息的主题、分类等方式编制成树状结构体系,供用户层层点击,进入不同分支查看检索结果列表。简单检索和高级检索是利用检索词(或检索式)进行检索,返回与之相符的检索结果。利用检索词(或检索式)检索时通常会用到布尔逻辑检索、截词检索、词间位置检索和限定字段检索等检索技术。

Page 6: 第二章 信息检索基础理论      目录:

精确与模糊检索

精确与模糊检索

2.2 信息检索的技术与策略 2.2.1 信息检索基本技术

基本技术

词间位置检索 词间位置检索

加权

检索

加权

检索

布尔逻辑检索

布尔逻辑检索

限定字段检索 限定字段检索

限定范围检索

限定范围检索

截词检索 截词检索

Page 7: 第二章 信息检索基础理论      目录:

2.2 信息检索的技术与策略 2.2.1 信息检索基本技术

1. 布尔逻辑检索

逻辑与( A*B ) 检出的记录必须同时含有所有检索词。缩小检索主题范围,提高查准率

逻辑或( A+B )检出记录只需满足检索项中任何一个或同时满足。概念相加,扩大检索范围,避免漏检,提高查全率

逻辑非( A-B ) 从原检索范围中剔除一部分不需要的内容

2. 截词检索

截词符:“ *” 、“ ?” 或“ $” 、“ !”

前方截词 ( 截词符在词根前 ) :

“*ood” : food 、 blood…

后截词 ( 截词符在词根后 ) :

“Comput*” : compute 、 computer 、 computerized 、 computerization…

中间截词(截词符在检索词中间):

“co?e” :

“co*e” :

Page 8: 第二章 信息检索基础理论      目录:

2.2 信息检索的技术与策略 2.2.1 信息检索基本技术

3. 词间位置检索

W(With) 算符:

A(W)B 表示 A 、 B 两词必须紧挨且位置关系不可颠倒。

X(W)ray : x ray 和 x-ray

IBM(W)PC : IBM PC 和 IBM-PC

A(nW)B 表示 A 、 B 间最多可插入 n 个单词且位置关系不可颠倒。

Computer(1W)retrieval : computer information retrieval , computer document retrieval

N(Near) 算符

A(N)B 表示 A 、 B 两词必须紧密相邻,词间不容许插入任何词,但词序可颠倒。

A(nN)B 表示 A 、 B 两词间可插入 n 个单词,且词序可变。

A(1N)B : A in B , B of A 。

Cotton(2N)processing : cotton processing 、 processing of cotton 、 processing of Chinese cotton 。

F(Field) 算符

A(F)B 表示 A 、 B 检索词必须同时出现在同一记录的同一字段(仅限题名、文摘字段),词序、中间可插入单词数不限,但需指定

所要查找的字段(如 AB 、 TI 、 DE 、 AU 等)。

Page 9: 第二章 信息检索基础理论      目录:

2.2 信息检索的技术与策略 2.2.1 信息检索基本技术

Pollution(F)control/AB 表示检索出文摘字段中同时含有 pollution 和 control 两词的文献记录。

L(Link) 算符、 SAME 算符

4. 限定字段检索

限定子段检索指在检索时,计算机只在限定字段内进行匹配运算,以提高检索效率和查准率。

5. 限定范围检索

通过限制数字信息的检索范围,以达到优化检索的方法。

6. 加权检索

基本方法:在每个检索词后给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,

然后计算存在的检索词的权值总和。权值之和达到或超过预先给定的阈值,该记录即为命中记录。

7. 精确与模糊检索

Page 10: 第二章 信息检索基础理论      目录:

2.2 信息检索的技术与策略

2.2.2 信息检索策略 检索策略就是在分析课题内容的基础上,确定检索系统、检索途径和检索词,

并科学安排各词之间的位置关系、逻辑联系和查找步骤等。

Page 11: 第二章 信息检索基础理论      目录:

根据检索需求,选择

相应的数据库。

2.2 信息检索的技术与策略 2.2.2 信息检索策略

信息需求分析

选择数据库

确定检索词

编制检索式、执行检索 调整检索式,优化策略

1 、检索策略的制定

当命中文献太多时,可进行缩检,对检索策略进行细化;当命中文献太少时,应进

行扩检,对检索策略扩展 。

利用布尔逻辑运算符、位置运算符、截

词符和字段符等,对各检索词进行准确、

合理地逻辑和位置组合编制出检索提问

式,执行检索。

检索词的选取应适当尽可能地考虑

其相关的同义词、近义词作为检索

词,避免使用低频词或高频词。选

用国外惯用的技术术语。尽量使用

代码,以提高查全率。

信息需求分析是让检索

者了解检索目的,明确课题的主

题或主要内容,课题所涉及的学

科范围,所需信息的数量、出版

类型、年代范围、涉及语种、已

知的有关作者、机构,课题对查

新、查准和查全的指标要求等。

Page 12: 第二章 信息检索基础理论      目录:

内容特征途径内容特征途径

主题途径主题途径

代码途径代码途径分类途径分类途径

检索效果是指检索结果的有效程度,反映了检索系统

的检索性能和检索能力。评价检索效果常用的指标有收

录范围、查全率、查准率、响应时间和输出形式等,其

中,查全率和查准率是最重要的也是最常用的指标。

2.2 信息检索的技术与策略 2.2.2 信息检索策略

2 、检索途径 外表特征途径外表特征途径

题名途径题名途径

责任者途径责任者途径

机构名称途径机构名称途径

编号途径编号途径

其他途径其他途径

3 、检索效果的评价

Page 13: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.1 信息检索语言

信息存储

信息检索

1 、信息检索语言的概念

信息检索语言是人们在加工、存储及检索信息时所使用的标识符号,也就是一组有规则

的、能够反映出信息内容及特征的标识符。检索语言是标引人员与检索人员之间进行交流

的媒介,也是人与检索系统之间进行交流的桥梁,实质上就是双方之间约定的共同语言。

2 、信息检索语言的作用

检索系统

信息检索语言

信息检索语言

文献信息

主题 标引主题

标引检索

标引

标引

Page 14: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.1 信息检索语言

分 类 语 言

3. 信息检索语言的种类

就其结构原理来划分,信息检索语言主要有 :

名称语言

主 题 语 言

代号语言 引文语言

等级体系分类语言 分面组配分类语言

标题词语言 元词语言 叙词语言 关键词语言

Page 15: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.1 信息检索语言

描 述 文 献 外 部 特 征 的 语 言

3. 信息检索语言的种类

按照信息特征描述划分,信息检索语言主要有 :

书名、刊名、篇名等

文献类型 文献出版类型

分类语言

描 述 文 献 内 部 特 征 的 语 言

著者、编者、译者等 号码(报告号、专利号、标准号等)

主题语言

标题词语言

叙词语言 关键词语言

元词语言

Page 16: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.1 信息检索语言

1 )构成

4. 信息检索语言的构成及其要求

表达基本概

念意义的词

控制语言使用的语法,

据此把基本的词汇组

合起来表达更为复杂

的概念意义,主要体

现为各种标引规则、

组配规则、引用次序

从语言学的角度分析信息检索语言的构成应分为三个部分

用于组成词汇的形

式化符号,通常有

字母、数字或文字

等。

Page 17: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.1 信息检索语言

2 )要求

4. 信息检索语言的构成及其要求

专指性

检索语言应该能够联

系和沟通标引与检索两方面,即要求

在语言的使用上应具有相当的一致性,

能保证取得共同的理解和准确无误的

沟通。对此的具体要求有:

文献保

障和用

户保障

检索语言应该能够描述文

献和提问的特征,即要有充分的表达能力,

能全面、准确地描述任何复杂 的文献

信息以及提问内容。

具体要求如下:

惟一

性 灵活

性 易用

性 严谨

Page 18: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

1. 检索工具的定义与类型

检索工具是人们用来报道、存储和查找各类信息的工具。包括传统的二次、

三次印刷型检索工具,缩微阅读检索工具,基于计算机的光盘检索系统、联机检索

系统,以及基于 Internet 的网络信息检索系统、网上工具书、搜索引

擎、 Archie 、 Wais 等各种信息检索工具和检索系统。

按照检索手段的不同,检索工具可分为手工检索工具、机械检索工具和计算

机检索系统。

按照著录形式的不同可分为:目录型检索工具、题录型检索工具、索引型检

索工具、文摘型检索工具、全文型检索工具等。

按照载体形式的不同可分为:书本式检索工具、卡片式检索工具、缩微式检

索工具和机读式检索工具等。

Page 19: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

题录报道和揭示单篇文

献的外表特征,是在目录的

基础上发展起来的一种检索

工具。它与目录的主要不同

点在于著录的对象不同,目

录的著录对象是整部文献,

而题录的著录对象是文献中

的论文或部分内容。例如:

美国《化学题录》、《中文

科技期刊题录数据库》等。

目录通常是以文献的“本”、

“种”、“件”等为单位,对

一批相关文献外表特征的揭示

和报道 .

例如:《全国新书目》、《全

国总书目》、《全国报刊简明

目录》等。

文摘是系统著录、报道、

积累和揭示文献信息外表特征

和内容特征的检索工具,是重

要的二次文献。它是对文献中

的论文或内容进行浓缩,概括

地描述其主要论点、数据、结

论等,并注明其出处,按一定

的规则编排起来的一种检索工

具。文摘分三种:指示性文摘、

报道性文摘和评论性文摘。例

如:《新华文摘》、《经济学

文摘》等 。

文 摘按著录内容划分按著录内容划分按著录内容划分按著录内容划分

题 录

2. 手工检索工具

1 )检索类工具书

目 录

索 引

索 引 是 将 文 献 信

息中的题名、人名、

地名、字句及参考

文献等分别摘录出

来,并注明出处,

按一定的规则编排

起来的一种检索工

具。

例如:《经济科学

论文索引》《社会

科学引文索引》等。

Page 20: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

1 )检索类工具书——目录

Page 21: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

1 )检索类工具书——题录

Page 22: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

1 )检索类工具书——题录 Ei CPX Web ( 《工程索引》网络版记录题录显示格式 )

Page 23: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

1 )检索类工具书——文摘

Page 24: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

1 )检索类工具书——文摘 Ei CPX Web ( 《工程索引》网络版记录文摘显示格式 )

Page 25: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

1 )检索类工具书——索引 Ei CPX Web ( 《工程索引》网络版索引显示格式 )

Page 26: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

2 )词语类工具书 词语类工具书包括各类字典、词典,主要提供字词的形、音、义和使用方法,以及学科名词术

语的含义、演变和发展。字典以字为单位,按一定次序排列,说明形体、读音、意义和用法;词典,

也作辞典,以词语为单位,按一定次序排列,解释词汇的概念、含义和用法。

例如:《辞海》、《汉语成语大词典》、《社会科学大词典》等。

3 )资料类工具书 资料类工具书能够为读者提供各种基本知识或某一课题的具体资料。主要包括百科全书、年鉴、

手册、名录、类书、政书等。 百科全书是人类知识的总汇,

是记录人类知识最全面、最系统

的大型综合性工具书。它概述了

人类一切知识领域的基本资料,

对每一学科提供定义、原理、方

法、历史及现状、系统和参考书

目等方面的资料,被誉为“工具

书之王”、“没有围墙的大学”。

年鉴是汇辑一

年内时事动态、

学科发展和各

项统计资料等

重要资料,按

年度出版的工

具书。

手册也称

指南、便览、

大全等,是把

某一学科或某

一专题的概括

性又具体实用

的知识、资料

和数据汇编在

—起。

政书是汇集历代或某

一朝代的政治、军事、经

济、文化、外交等方面的

法律、法令和法规制度史

料的工具书。

类 书 是 收 录 古 代 文 献

资 料 , 按 类 别 或 韵 目 编

排 , 提 供 检 索 、 征 引 使

用 的 工 具 书 。

名 录 是 专 门 收

录 人 名 、 地 名 、

机 构 名 以 及 其

他 事 物 名 , 按

照 一 定 规 则 进

行 排 序 , 并 予

以 简 要 揭 示 和

介 绍 的 工 具 书 。

Page 27: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

4 )表谱类工具书 表谱类工具书是以表格或其他较为整齐的形式,记录史实、时间、地理等资料,并附以简略的

文字说明,以反映史实和时间。

主要包括年表、历表和专门性历史表谱三种类型。

年表是按年代顺序编

制,专供查考历史年代、

历史纪元及历史大事的

检索工具。如《中华人

民共和国大事记》等。

历表是一种把不

同历法的历日按一定的次序

汇编在一起,以相互对照的

表格,提供查 找和换算不

同历法的年、月、日的工具

书。《中国先秦史历表》

专门性历史表

谱主要用于查考

人物、职官、地

理和数据等专题

资料,如《中西

回史日历》等。

Page 28: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

5 )图录类工具书 图录类工具书是以图形、图像、符号等为主体,附以简略的文字说明,以反映各种事物、人物

的空间特征和形象特征的工具书。

它包括地图、历史图录、文物图 录、人物图 录、艺术图录、科技图像等。

地图是地球表面自然和

社会现象在平面图上的

缩影,以反映各种事物

和景象的地理分布及其

在空间与时间上的相互

制约、内在联系和发展

动态。

历史图录是以图

形、图像等揭示

历史人物和事物

的工具书。

Page 29: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

2. 手工检索工具

6 )边缘类工具书

边缘类工具书主要指那些介于工具书与非工具书之间,既具有一般图书的阅读

功能,又具有工具书的查检功用的文献。它主要包括资料汇编、史书、方志等。资

料汇编有针对性地摘编文献信息的片断或全文,按专题或学科分类编排,提供读者

阅读或查检。包括法规资料汇编、条约资料汇编、统计资料汇编等。

Page 30: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

3. 机械检索工具

机械检索工具是手工检索工具向计算机检索系统过渡的中间检索工具。它主要

包括两种类型:机电检索工具(如打孔机)和光电检索工具(如缩微机)。机械检

索工具利用机械装置改进信息资源的存储和检索方式,但是只能对某一固定存储形

式的信息资源进行特定检索,过分依赖于设备,检索操作复杂,成本很高,并且检

索质量和效率也不理想。所以很快被计算机检索系统所取代。

Page 31: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

4. 数据库

1 )数据库的概念

数据库( DB , Database )是长期储存在计算机内,有组织的、可共享的数据集合。数

据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度,较高的数据独立性和

易扩展性,并可在一定范围内为各种用户所共享。

数据库管理系统( DBMS , Database Management System )是位于用户与操作系统之间的一

个数据管理软件。① 数据定义,用户通过它可以定义数据库中的数据对象;

② 数据操纵功能,使用它可以实现如插入、删除和修改等数据库的基本操作;

③ 数据库的运行管理,包括数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复;

④ 数据库的建立和维护等。

基本功

● 数据库系统( DBS , Database system )是指在计算机系统中引入数据库后构成的计算机应用

系统。数据库系统一般由数据库、操作系统、数据库管理系统及相关管理工具、应用系统、数据库管理员

和用户构成。

Page 32: 第二章 信息检索基础理论      目录:

书目数据库

2.3 信息检索的语言和工具 2.3.2 检索工具

4. 数据库

2 )数据库的类型

按服务模式划分图像数据库

全文数据

按信息处理层次划分

文摘数据

按收录的文献类型划分

期刊论文数据

书目及图书全文数据

专利数据库

学位论文数据库

产品数据

按收录文献信息的范围划分

综合性数据库 专业性数据库

文本数据库

数值数据库

声音数据库

视频数据库

多媒体数据库

单机数据库 联机数据库网络数据库

按媒体信息划

Page 33: 第二章 信息检索基础理论      目录:

是数据库中数据组织存

储的基本形式,是数据和信

息的有序集合,由若干条记

录组成,一个或若干个文档

构成一个数据库。通常一个

数据库至少包括一个顺排文

档和一个或多个倒排文档。

2.3 信息检索的语言和工具 2.3.2 检索工具

4. 数据库

3 )数据库的结构

文 档 记 录

字 段

是数据库的基本单元,是对某

一实体属性进行描述的结果。一

个数据库可以有一个或多个文档,

一个文档由若干条记录构成,而

一条记录由若干字段组成。在文

摘数据库中,一条记录相当于检

索刊物中的—条文摘款目。

是记录的基本组成单元,是有关一篇

文献或称一条记录的基本数据单元,每一

个字段都反映该篇文献的一个方面的信息,

组合在一起形成对一篇文献信息的内容特

征和外表特征的完整描述。在文摘数据库

中,一条记录应包含原始文献的题名、作

者、出处、出版时间、分类号、文摘、主

题词或关键词等字段。每一个字段都有一

个相应的标识符,以便计算机识别。

Page 34: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

5. 计算机检索系统 计算机检索系统是借助计算机技术、通信技术、光盘技术、网络技术等信息技术建立的存储和检索信息的

检索工具。检索系统由硬件和软件组成,硬件主要包括计算机主服务器、检索终端、数据输出设备等。软件主

要包括检索程序和数据库等。检索软件是检索系统的灵魂,负责管理数据库和处理检索提问,它决定系统的检

索能力。

计算机检索系统一般可分为光盘检索系统、联机检索系统和网络检索系统等。 1 )光盘检索系统 光盘检索系统是指利用计算机、光盘驱动器和光盘数据库及其检索软件建立起来的信息检索系统,由计

算机、光盘数据库、检索软件等组成。

光盘网络检索系统由光盘服务器、计算机局域网、光盘库或光盘塔、检索软件等组成。 与手工检索相比,光盘检索的可检信息量大,一套《四库全书》印刷版有 3 000 多册,而光 盘版 10 多

张盘片即可容纳下。光盘检索功能强大,检索入口多,检索速度快,检索及输出灵活 方便。与联机检索相比,

光盘检索价格低廉,检索方法简单容易,规格统一,容易复 制,便于保存。其缺点是时效性不够,检索范围

受光盘数据库的限制,更新不够及时,一般是定期更新(快者 1 个月,慢者 1 年),因此信息的获得比国际

联机检索慢。

Page 35: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

5. 计算机检索系统

2 )联机检索系统

回溯检索是用户对

检索系统中积累多年

的文献信息数据库进

行检索,查找一定时

间范围内或特定时间

以前的文献信息的一

种联机检索方式。

是指用户利用终端设备(包括检索终端、调制解调器和打印机),通过国际(卫星)通信网络,与本地

计算机检索系统或远程计算机检索系统的主机连接,从而检索世界各地存储在计算机数据库中的信息资料。

联机检索系统是一个典型的计算机检索系统,能完成数据收集、分析、加工处理、存储、传递通信和检索信

息的全过程,由联机服务中心的主计算机、检索终端、通信网络、联机数据库、检索软件等组成。我国国内

用户采用该方法查找国外计算机检索系统中的信息被称为国际联机检索。 联机检索系统主要有以下四种服务方式:

定题检索是指

在回溯检索的基础

上,定期从文献数

据库中检索出回溯

检索日之后出现的

新的文献信息的一

种联机检索方式。

联机订购。联机检

索的结果通常是一些

文摘或题录形式的二

次文献。联机检索系

统可以为用户提供原

始文献的联机订购服

务。

电子邮件 联机检索

系统为用户提供 E-mail

和电子邮政的功能。用

户输入 E-mail 号码和通

信内容,就可以在几秒

钟内接收到本需耗时几

天的信件投递。

Page 36: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

5. 计算机检索系统

网络检索是指通过因特网检索和获取网上电子信息。网络检索系统是通过因特网提供网络

数据库、出版物、书目、动态信息等网上信息资源查询和利用的检索系统。一般由计算机服务

器、用户终端、通信网络、网络数据库等组成,其特点是方法简单、灵活 、方便、时效性强、

费用低。

3 )网络检索系统

发出检索请求

返回检索结果

数 据 库数 据 库服务器服务器客户机

客户机 / 服务器请求与响应示意图

返回检索结果

匹 配 检 索

Page 37: 第二章 信息检索基础理论      目录:

2.3 信息检索的语言和工具 2.3.2 检索工具

5. 计算机检索系统 早期的网络检索工具主要是基于传输和下载网上信息,包括远程登录( Telnet )、文件传输服务

( FTP )、电子邮件( E—mail )、电子公告栏( BBS )、新闻组( USENET )等。 FTP 获取信

息资源的最大问题是查找需要的资料必须预先知道这些资料存放在哪个文件服务器中,随着 FTP 服务器

的增多,这个问题变得越来越严重 ,于是人们就开发出 Archie 、 WAIS 、 Gopher 系统,以解决寻找

FTP 资源的困难。

Archie Server 又称为文档查询服务器,是检索匿名 FTP 资源的工具。为了从匿名 FTP 服务器上

下载一个文件,用户必须知道这个文件的所在地,即必须知道该文件存放在哪台服务器的哪个目录

上。 Archie 就是帮助用户在因特网的 FTP 服务器上寻找文件的工具,用户只要给出所要查找文件的全

名或部分名字, Archie Server 就会查找在哪些 FTP 服务器上存放着这样的文件,然后用户可以使用

FTP 软件下载该文件。 WAIS (广域消息服务)是一种数据库索引查询服务。 Archie 所处理的只是文

件名,而 WAIS 则可以对文件内容进行查询。 Gopher 是基于菜单驱动的因特网文本信息检索工具,提

供的信息仍然有限。

具有 WWW 检索功能的检索系统是随着网上巨量信息的出现而开发的,常用的如网络数据库检索系

统、搜索引擎、多媒体信息检索系统等。

3 )网络检索系统

Page 38: 第二章 信息检索基础理论      目录: