超星集团副总经理 叶艳鸣

Post on 03-Jan-2016

111 Views

Category:

Documents

4 Downloads

Preview:

Click to see full reader

DESCRIPTION

超星集团副总经理 叶艳鸣. 海量资源带来的困惑. 基于知识挖掘的发现. 海量资源带来的困惑 —— 由一组数字说起. 估计现在一年全世界所产生的新信息量大约有 4 千万万亿( 4X10 19 ) 字节 引自 Howie DiBlasi 的 “你知道吗”. 1.8 千万亿兆 字节. 2011 年 全球信息总量突破. 这超过了人类过去 五千年信息量的总和. That is more than in the Previous 5,000 years. 新的科学技术知识 大约每 2 年翻一番. 人类的学习和阅读迈进“无纸化时代”. 数字资源浪潮. - PowerPoint PPT Presentation

TRANSCRIPT

超星集团副总经理 叶艳鸣

海量资源带来的困惑海量资源带来的困惑 ظ

基于知识挖掘的发现基于知识挖掘的发现 ظ

海量资源带来的困海量资源带来的困 ظ惑惑

—— —— 由一组数字说由一组数字说起起

估计现在一年全世界所产生的新信息量大约有4 千万万亿( 4X101

9)字节

引自 Howie DiBlasi的“你知道吗”

1.81.8 千万亿兆千万亿兆字节1.81.8 千万亿兆千万亿兆字节

2011 年全球信息总量突破

这超过了人类过去五千年信息量的总和

That is more than in thePrevious 5,000 years.

新的科学技术知识新的科学技术知识大约每大约每 22年翻一番年翻一番

人类的学习和阅读迈进“无纸化时代”

数字资源浪潮

>1 万个

数据库

疑惑

引自电子科技大学图书馆 秦鸿

我们如何面对?

基于知识挖掘的发现系基于知识挖掘的发现系 ظ统统

意外惊喜

洞察全局

价值再生

发现的意义

—— 杨晓光 北京航空航天大学航空推进系教授 博士生导师图书馆馆长

国外主要发现系统国外主要发现系统

产品 Summon EDS Primo Central

全球用户数量 300多家 400多家 600多家

国外代表性用户

哥伦比亚大学、普林斯顿大学、密歇根大学、康奈尔大学、悉尼大学等

利物浦大学、墨尔本大学、北卡罗来纳大学、乔治亚大学、詹姆斯麦迪逊大学等

哈佛大学、英国牛津大学、英国国家图书馆等

大陆地区用户北京大学、西安交通大学、浙江大学。

中山大学图书馆。 清华大学、上海交通大学。

•Summon:元数据仓 •EDS Basi c I ndex:元数据仓

•Pri mo:用户馆藏索引

•360Li nk:期刊全文链接 •OPAC vi a EDS:整合图书OPAC馆 系统

•Pri mo Central:远程元数据集中索引

•360Core:电子期刊导航 •EBSCO Li nkSource:链接解析器

•SFX:开放链接服务

•360Li nk Ebooks:电子书链接

•EBSCO A-to-Z:资源导航 •bX 学术推荐服务(可选)

•360Core Ebooks:电子图书导航

•EHI S:联邦检索工具(可选)

•MetaLi b:联邦检索搜索引擎(可选)• Oracl e 内嵌 使用许可

中文支持 支持中文简繁互检 Uni code支持 ,具备中文分词与繁简通检功能。

支持中文切分和中文简繁体汉字通检

子系统

国外发现系统对比

300 家 400 家 600 家

国外发现系统的中文资源量中文资源量

中文资源量在中文资源量在 summon 和超星发现系统中对比和超星发现系统中对比Summon

超星发现系统

测试时间:测试时间: 20122012年年 77 月月

中文资源量在中文资源量在 primoprimo 和超星发现系统中对比和超星发现系统中对比primoprimo 不支持空检索,通过检索词“文化”进行对比不支持空检索,通过检索词“文化”进行对比

Primo 超星发现系统

测试时间: 2012年 9月 7 日

中文资源量在中文资源量在 EDS 和超星发现系统中对比和超星发现系统中对比通过检索词“文化”进行对比通过检索词“文化”进行对比

EDS 超星发现系统

测试时间: 2012年 9月 5 日

超星发现系统

西安交通大学图书馆首页

全面地全面地发现中文资源

元数据更新:两次 / 周

12年 12月 1 日数据量

13年 2 月 1 日数据量

每月更新 300 万条

精准地精准地发现中文资源

40 万主题词表

10 亿条引文数据

600 万作者库

3500 条学科分类表

600 个数据库收录来源表

20 万刊名表

2500 万学术专业词库

8 万同义词表

重要索引库

30 万机构库

专业级强大词表库支持精准发现

完善的中文引证分析

参考与引证

文章被引用的生命曲线

《图书馆学导论》于良芝 2003 科学出版社

区分自引他引

自引量 (3)

实现期刊 - 期刊到图书 - 图书、图书 - 期刊、期刊 - 图书

的引用分析完善中文期刊引用分析: 4000 万到 7600 万提供作者、出版社、刊名、作者单位、主题词、 学科、

分类等的引用分析最终实现图书、期刊、学位论文、会议论文……之间

互引的立体引用关系

引文分析

灵活的分面分析功能

可视化的知识关联图谱

知识点与知识点的关联

知识点与知识点的关联

知识点与人的关联

人与人的关联

1990—1995 年 2009—2013 年

不同时期图书馆学领域高产出作者变化

1990—1995 年 2009—2013 年

不同时期图书馆学领域研究热点变化

知识关联的意义在于知识关联的意义在于发现发现人与人、人与知识、知识与知识、人与人、人与知识、知识与知识、机构与人、机构与机构等之间的机构与人、机构与机构等之间的相相互关系。互关系。

学术趋势分析学术趋势分析

java 研究变化趋势

网格计算与云计算发展相关性分析

多主题分析

手扶拖拉机:一个不靠谱的领域

湖南大学的学术产出趋势分析

清华大学的专利情况

智能的辅助搜索

同时检索了“茅草枯”同时检索了“茅草枯”

无缝对接各类全文获取系统

无缝对接无缝对接

OPAC: OPAC: 本馆纸书本馆纸书

数据库数据库 : : CNKICNKI 、万方、维普、方正、万方、维普、方正…… ..

读秀读秀 : : 图书补缺图书补缺

百链百链 : : 期刊等文献补缺 期刊等文献补缺

发现系统发现系统

发现系统是知识挖掘与数据分析发现系统不是简单的整合发现系统不是简单的整合发现系统不是简单的整合发现系统不是简单的整合

从资源到知识的发现层次观目录级发现

文献级发现

知识级发现

知识发现的主要方向知识发现的主要方向

……

三、发现系统功能构想

500台服务器1.2PB存储8T内存

4000个 CPU核心

10亿引文2 亿中文元数据超星分布式存储

200名研发人员4 个研究所7 年搜索与挖掘

200亿级搜索引擎10亿数据实时分析30000并发 / 毫秒级

超星发现系统

资源补缺 云服务

知识挖掘 数据分析 知识挖掘 数据分析整合

百链

发现系统院校展示发现系统院校展示

北京航空航天大学北京航空航天大学

天津大学天津大学

北京师范大学北京师范大学

哈尔滨工业大学哈尔滨工业大学

吉林大学吉林大学

电子科技大学电子科技大学

39所 985院校中

采用超星发现系统已经有31所!

超星发现超星发现为创新插上飞翔的翅膀为创新插上飞翔的翅膀

意外惊喜意外惊喜 洞察全局洞察全局 价值再生价值再生

谢 谢谢 谢

top related