sewm2006 中文 web 检索评测

SEWM2006 中文Web检索评测

李静静北京大学网络实验室

主要内容

Web 检索评测介绍CWT200g & CWT20g

评测结果总结及讨论

三个问题

为什么要评测？– 社会问题：用户是否需要某个系统？– 经济问题：某个系统值得用么？

评测什么？– 查询处理时间 , 检索结果输出 , 查全率 , 查准

率等如何评测？

– 规范的测试集– 评估方法 , 如 P@n, R-P 等

TREC的四个目标

大规模测试集为基础，推动信息检索的研究经由开放式的论坛，使与会者能交流研究的成果

与心得，以增进学术界、产业界与政府的交流互通

经由对真实检索环境的模拟与重要改进，加速将实验室研究技术转化为商业产品

发展适当且具应用性的评估技术，供各界遵循采用，包括开发更适用于现有系统的新的评估技术

SEWM2006中文Web检索评测目标

– 研究有效的主题提取方法针对用户给定的广泛查询，找到一组最佳的主页

– 研究有效的导航搜索方法找到用户需要的特定页面

– 研究评估系统的稳定性– 研究不同的方法在不同的数据集中的优劣及其原因

构建了 CWT200g 和 CWT20g 参加者对自己采用的每一种检索方法都尽可能提交针对这

大小两个数据集的运行结果

主题提取（ Topic Distillation）

对于一个特定主题发现一组关键资源– 注重以站点作为资源的查询– 要求是在前十个结果中寻找尽可能多的不同站点（用

它们的网站的入口页面表示）判断是否一个好的首页面 , 应该考查结果是否符

合下面三个条件 :– 是否大部分切合主题；– 提供主题的可靠的信息；– 不是一个更大的切合主题站点的一部分

导航搜索方法 (Navigation search)

主页查询 (Home Page finding ， HP)– 通常是一个网站的主页

指定页面查询 (Named Page finding ， NP ）– 满足用户需求的特定页面

评测准则– 第一个正确答案出现位置的倒数平均值（ MRR ）

主要内容

测试集使用框架

CWT200g/CWT20g文档集

CWT200g– 根据天网搜索引擎在 2005 年 11 月份数据中的 62

7,036 个站点为数据基础– 容量 :197GB– 覆盖 29,100 个网站， 37,482,913 个网页– 网页本身是压缩保存 , 以天网格式保存

CWT20g文档集– 是 CWT200g文档集的一部分– 与 CWT200g 采用相同主题集，答案集不一样

CWT200g文档集的构建 -前期处理

原始列表

有效列表

无重列表基本列表

无错列表天网数据

种子列表

有效性过滤

MD5重复过滤非正式站点过滤(non-80, IP)

错误站点过滤站点统计

自动/手动垃圾站点过滤

CWT200g文档集的构建 -网页抓取 (中期 )

多线程抓取

广度优先抓取，限制抓取 3层

单个网站抓取容量不限，抓完停止

抓取了部分动态网页

CWT200g文件集的构建 -后期处理

全局MD5消重 ( 网页级消重 )– 充分消除冗余

先抓取后采样– 提高采样准确性

采用压缩的天网格式保存– 进一步提高信息量

TD主题示例

<num>Number:TD182

<desc>Description:

中国法律援助的现状，需求等报道，及寻求法律援助的论坛等

</top>

导航搜索主题示例 (HP/NP)

<top><num>Number:NP878<title> 都江堰在线 </title></top>

<top><num>Number:NP815<title> 法学视野中的高校学生申诉制度 </title></top>

sewm2006 中文 web 检索评测

Documents

第 4 章信号检测技术

标准呜特 · 4.3...

六通道车辆检测器dorfile.dahuatech.com/dor/201808221451870.pdf车辆检测器对应的振荡频率、灵敏度及存在时间等参数可调。...

sewm2008 中文 web 检索评测

第 20 章　自动检测系统

石油石化领域理化检测测量不确定度...

3.4 流量检测仪表

涡流检测 eddy current testing 简称 et 1...

食品安全快速检测仪及检测试剂盒生产项目竣工...

第七讲检索可视化和检索评价

3.2 压力检测仪表

免疫学检测（ p186 ）

检验检测统计直报系统填报指南

朗途测评中山大学就业指导中心主页 →...

检测系统定量项目性能评价傅应裕

网络安全等级保护测评机构管理办法6...

·¯况检测标书_2018911… · web vie

环境检测第三方检测机构第三方检测...

预调、测量、检测和管理刀具 | zoller

韶关市艾滋病检测筛查实验室网络建设...