基于意象图式的文本蕴涵识别初探

16
基基基基基基基基基基基基基基基 基基基 基基基

Upload: zanta

Post on 05-Jan-2016

78 views

Category:

Documents


0 download

DESCRIPTION

基于意象图式的文本蕴涵识别初探. 倪盛俭,姬东鸿. 1 前言. 文本蕴涵识别( RTE )重要性和现有研究的不足(文本蕴涵概念参考第 8 页例子) 有学者指出 RTE 是大部分 NLP 应用研究的核心,( Pazienza 等, 2005 ) 缺乏对图式理据的挖掘(本文的切入点)。 下文结构:先简单说明本文涉及的各类图式概念,然后说明图式怎样成为 RTE 的理据,最后是总结,进一步明确本研究的意义。. 2 图式. 图式特点: 理想性、整体性、不易变动性 ,同时具有开放性、选择性、普遍性 等 。(Ungerer&Schmid,1996) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 基于意象图式的文本蕴涵识别初探

基于意象图式的文本蕴涵识别初探

倪盛俭,姬东鸿

Page 2: 基于意象图式的文本蕴涵识别初探

1 前言文本蕴涵识别( RTE )重要性和现有研究的

不足(文本蕴涵概念参考第 8 页例子)• 有学者指出 RTE 是大部分 NLP 应用研究的

核心,( Pazienza 等, 2005 )• 缺乏对图式理据的挖掘(本文的切入点)。• 下文结构:先简单说明本文涉及的各类图

式概念,然后说明图式怎样成为 RTE 的理据,最后是总结,进一步明确本研究的意义。

Page 3: 基于意象图式的文本蕴涵识别初探

2 图式• 图式特点:理想性、整体性、不易变动性,

同时具有开放性、选择性、普遍性等。( Ungerer & Schmid , 1996 )

• 作用:扩展词语理解的(可预测)语境,为 RTE 服务。

Page 4: 基于意象图式的文本蕴涵识别初探

2.1 物性结构

• 主要作用: 描述实体(特别是人工物)语义内容。• 物性结构的四部分内容:构成角色、形式角色

(体现非论元性语义依存关系)、功用角色和施成角色(体现论元性语义依存关系)。

• 物性结构是桥接词汇、句法和常识的有效手段之一,这种特性使得它可以对蕴涵识别做出贡献。

• 具体概念( Pustejovsky , 1996, 2006 ;宋作艳,2011 )

Page 5: 基于意象图式的文本蕴涵识别初探

2.2 理想认知模型• 在 Lakoff ( 1987 )一书中首次得到全面、

系统描述。理想认知模型是是组织知识的手段。

• 王寅:较为复杂的心智结构,具有体验性、完形性和内在性(是心智中认识事体的方式)(王寅, 2005:140 )

• 作用:储存和表达抽象概念的语义内容(概念结构)。

Page 6: 基于意象图式的文本蕴涵识别初探

2.3 框架和框架关系• 社会语境中事件结构的描述和理解。• 每一个格框架刻画一个抽象、具有图式化

特征的小“情景”或“语境”。• 框架关系:继承、利用(预设)、视角、

子框架关系(母框架相当于小型脚本,包含条件和因果关系)等。

Page 7: 基于意象图式的文本蕴涵识别初探

2.4 脚本• 多个框架构成脚本,脚本是框架的序列。• 不同于脚本的特点弱式脚本强式脚本最强式脚本

Page 8: 基于意象图式的文本蕴涵识别初探

3 RTE 中的图式理据• 文本语义预设、文本语用预设、文本语义蕴

涵、文本规约会话含义、文本非规约会话含义和文本结果蕴涵。

• 3.1 RTE 的 QS 理据• ( 1 )明天天气:浙北地区将有大雪,浙南

大部分地区将有小雪。(文本 T- 蕴涵文本)• ( 1 ) a 温州明天很可能会下小雪。(假设

H- 被蕴涵文本)(文本蕴涵概念)

Page 9: 基于意象图式的文本蕴涵识别初探

“ 温州”物性结构草图

Page 10: 基于意象图式的文本蕴涵识别初探

3.2 RTE 的 ICM 理据• Lakoff 认为“母亲”的 ICM 至少应当包括

以下子模型:•   生殖模型——生孩子•   遗传模型——提供基因•   养育模型——养育孩子•   婚姻模型——父亲的妻子• 宗谱模型——孩子最亲近的女性长辈

( Lakoff , 1987 : 74 )

Page 11: 基于意象图式的文本蕴涵识别初探

• ( 2 ) A生了 B 。• ( 2a ) B身上有 A 的基因。(或“ B 继

承了 A 的基因”)• ( 2b ) A养育了 B 。(或“ A 对 B 有养育之恩”)

Page 12: 基于意象图式的文本蕴涵识别初探

2.3 RTE 的框架(关系)理据• ( 3 )他于是就退学了 , 以示抗议 ,但至今没有找到工作。( T )

• ( 3a )至今没有人聘用他。( H )•  “雇佣”框架两个不同视角:“找工

作”框架和“聘用”框架触发“雇佣”框架。

• “ 至今没有人聘用他。”和“他至今没有找到工作。”

Page 13: 基于意象图式的文本蕴涵识别初探

2.4 RTE 的脚本理据根据 Schank & Abelson ,从顾客角度,饭店脚本的草图包括以

下内容: •   脚本:饭店•   角色:顾客,服务员,厨师,出纳员( cashier )•   理由:取得并享受食物,充饥。•   场景 1 :进入(饭店)•    顾客进入饭店,寻找空位,就坐。•   场景 2 :点菜•    接受菜单,看菜单,决定吃什么,点菜•   场景 3 :吃•    收到食物,吃食物•   场景 4 :从饭店出来 •    要求结账,拿到账单,给女服务员消费,走到出纳处,把钱给出纳,从饭店出来。

(不同场景见具有条件、因果关系)

Page 14: 基于意象图式的文本蕴涵识别初探

• ( 4 ) A :小徐,一起去吃饭吧。 B :我刚从小观园回来呢。

• ( 4a ) B已经吃过饭。• (默认理论、关联理论、非标记性)

Page 15: 基于意象图式的文本蕴涵识别初探

结语• 认知模式主要是意象图式形式 (而不是命题

形式 ) ,语言中无处不在的隐喻、换喻运作是基于意象图式之上的。(本 PPT没有体现)

• 意象图示的重要性和构建各类意象图式库的必要性。(未来工作)

• 图示理据的研究还需结合 NLP 的方法特点。• 不足:例示性,等。

Page 16: 基于意象图式的文本蕴涵识别初探

敬请指点谢谢!