基于本体论体系的中医药 一体化语言系统 中国中医研究

16
基基基 基基 基基基基基 体体 基基基基基 一体统 基基基基基基

Upload: ocean-peterson

Post on 01-Jan-2016

69 views

Category:

Documents


0 download

DESCRIPTION

基于本体论体系的中医药 一体化语言系统 中国中医研究. 一、研究目的与意义 : 现状:中医药学科历经千年,产生了大量的 概念与术语 ,多种语义词汇差异,阻碍了中医药数字化的发展。 目的与意义 : 以中医药学科体系为核心,遵循中医药学科理论体系,建立中国第一个计算机化的、可持续发展的、包含中医药及其相关学科语言的中医药学语言集成系统,形成中医药学的语言系统平台 。 本系统的建成将为中医药学的标准化工作、为中医药学数据的文本挖掘、为中医药学多源数据库歧义词检索及语义检索奠定基础 。. 二、研究思路:. 以中医药学科的整体系统为基础; 利用 本体论 的方法; - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 基于本体论体系的中医药 一体化语言系统 中国中医研究

基于本体论体系的中医药一体化语言系统

中国中医研究

Page 2: 基于本体论体系的中医药 一体化语言系统 中国中医研究

一、研究目的与意义: 现状:中医药学科历经千年,产生了大量的概念与术语,多种语义词汇差异,阻碍了中医药数字化的发展。 目的与意义: 以中医药学科体系为核心,遵循中医药学科理论体系,建立中国第一个计算机化的、可持续发展的、包含中医药及其相关学科语言的中医药学语言集成系统,形成中医药学的语言系统平台。 本系统的建成将为中医药学的标准化工作、为中医药学数据的文本挖掘、为中医药学多源数据库歧义词检索及语义检索奠定基础。

Page 3: 基于本体论体系的中医药 一体化语言系统 中国中医研究

二、研究思路:• 以中医药学科的整体系统为基础;• 利用本体论的方法;• 借鉴(UMLS)美国一体化语言系统的思

路;• 根据中医药语言学特点,建立大型语料数

据 库,并设计语义类型与语义关联关系。• 将语言学与中医药学知识体系有机的结合

在一起,建立中医药一体化语言系统。

Page 4: 基于本体论体系的中医药 一体化语言系统 中国中医研究

三、方法:从四方面入手研究

中医药

一体化

语言

中医药一体化语言系统

系统中医药为核心

以中医药为核心,其他学科叠加:中医药信息化过程中使用与利用的所有相关的学科与概念、术语

中医药语言结构体系一体化:建立、融入中医药术语表达方式一体化:词条属性中医药概念定义与释义形式一体化:回答是 什 么、关联关系是什么、学科中的位置是什么相同概念词一体化:无论文字、图表、正名与 异名、正确与误用

海量语言术语集成为基础:制定收词范围、顺序规范化网状结构解释概念的语义归类与关联:多水平控制:词汇、形态、语义、语用;本体论与诠释论相结合

设计分层结构与网状立体结构;符合语言体系,限定与约定复杂度;采用归纳定性,将同类事物合并;参照 UMLS的整体结构,保持兼容性与包容性;系统保持灵活性与可扩展性 ;Protégé

程序

Page 5: 基于本体论体系的中医药 一体化语言系统 中国中医研究

四、研究内容:

设计词条属性结构

总体系统设计

概念词属性定义

四种可控词表的

结构比较

中医药概念的语义类型设计( 105种)

建立中医药一级分类体系

( 13)

中医药语义的关联关系( 58种)

事件与物质二大类的结构

展开

以中医五、六版教材的学科分类

为依据

立体表达关系等级关系相关关系(时间、空间、概念、功能、物理)

完成概念词属性设计

语料库(收词 40万)

语用关系( 5万)

中医学科结构

标准

词典

教材

临床术语

其他

定义实现

语义表达

Page 6: 基于本体论体系的中医药 一体化语言系统 中国中医研究

中医药一体化语言系统

中心

中药组 方剂组 中医基础组 疾病证候组

项目专题组全面管理 质量审核组

办公室会务 整体设计组

诊断治则治法组

上海中医药大学

南京中医药大学

陕西中医药研究

成都中医药大学

福建中医学院

湖北中医学院

江西中医研究

上海中医文献馆

北京中医药大学

河南中医药研究院

广州中医药大学

初审

复审

总审

五、组织机构与管理

任务分配

加工编辑

全国十三家大学、科研单位( 100)

Page 7: 基于本体论体系的中医药 一体化语言系统 中国中医研究

六、研究成果:• 建立了六个专题的中医药一体化语言系统

(中医基础、治则治法、诊断、疾病、方剂、中药) ;

• 进行了本系统结构设计;• 建立了实现本系统的技术标准与操作手册;• 完成了三个专题的结构设计;中医基础部分

已召开了专家论证会;

Page 8: 基于本体论体系的中医药 一体化语言系统 中国中医研究

实现结构与概念关联:中医基础

Page 9: 基于本体论体系的中医药 一体化语言系统 中国中医研究

成果

语料库收词: 61.09 万条。加工词条: 50074 条。

方剂 27987 条

中药 12610 条

中医基础 3739 条

治法诊法 2378 条

疾病 2524 条

Page 10: 基于本体论体系的中医药 一体化语言系统 中国中医研究

七、应用与推广:语言集成与规范 建立数据 库基础语言平台

检索查询应用工具 数据挖掘与知识再现支撑条件

Page 11: 基于本体论体系的中医药 一体化语言系统 中国中医研究

小结:• ( 1 )首次提出中医药学一体化语言系统设

计思想与原则;• ( 2 )首次提出中医药学一体化语言系统的

选词原则与词条属性定义;• ( 3 )首次提出中医药学一体化语言系统的

语义类型与语义关联设计。• ( 4 )解决了海量数据的收集与编辑加工。 本项研究在国内领域属于先进技术;成果将

广泛应用于中医药标准化建设、中医药数据利用等领域中,具有良好的应用前景 。

Page 12: 基于本体论体系的中医药 一体化语言系统 中国中医研究

谢谢!

Page 13: 基于本体论体系的中医药 一体化语言系统 中国中医研究

中医药语言现状

(现代文献收词已超过 60 万条)

多样性(同名异物) (异物同名)

无标准化(缺少国标)

无统一机读词库

缺少系统结构

Page 14: 基于本体论体系的中医药 一体化语言系统 中国中医研究

借鉴美国 UMLS(医学一体化语言系统)

• 医学文献计算机化 60 年• 1986 年起步开始研制医

学语言一体化。• 超级叙词表• 语义网络• 情报源图谱• 专家词典• 2002 年(第 13 版)收

录了 60 多个生物医学受控词表中 776940 个概念共 210 万个词

Page 15: 基于本体论体系的中医药 一体化语言系统 中国中医研究

本体论• 哲学上的概念,用于描述事物的本

质。• 在近一、二十年来,本体论已被计

算机领域所采用,用于知识表达、知识共享。

• 本体论是一种回答:存在是什么?

Page 16: 基于本体论体系的中医药 一体化语言系统 中国中医研究

不同体系的融入