厦门大学博硕士论文摘要库语文辞书词性标注与语义完整性研究 iii includes...

17
学校编号 10384 分类号 密级 200101011 UDC 语文辞书词性标注与语义完整性研究 The Study about Integrity of Marking Parts of Speech and Semantic System 指导教师姓名 苏新春 教授 专 业 名 称 语言学及应用语言学 论文提交时间 2004 年 5 论文答辩时间 2004 年 学位授予日期 2004 年 答辩委员会主席 2004 年 厦门大学博硕士论文摘要库

Upload: others

Post on 13-Feb-2020

16 views

Category:

Documents


0 download

TRANSCRIPT

学校编号 10384 分类号 密级

学 号 200101011 UDC

厦 门 大 学

硕 士 学 位 论 文

语文辞书词性标注与语义完整性研究

The Study about Integrity of Marking Parts of Speech

and Semantic System

黄 启 庆

指导教师姓名 苏新春 教授

专 业 名 称 语言学及应用语言学

论文提交时间 2004 年 5 月

论文答辩时间 2004 年 月

学位授予日期 2004 年 月

答辩委员会主席

评 阅 人

2004 年 月

厦门大学博硕士论文摘要库

厦门大学学位论文原创性声明

兹呈交的学位论文 是本人在导师指导下独立完成的研

究成果 本人在论文写作中参考的其他个人或集体的研究成

果 均在文中以明确方式标明 本人依法享有和承担由此论

文而产生的权利和责任

声明人 签名

年 月 日

厦门大学博硕士论文摘要库

语文辞书词性标注与语义完整性研究

I

内 容 提 要

目前 在辞书中全面标注词性是当今我国语文辞书编撰的一大趋势 本

文利用数据库技术 通过统计和对比 采用定量与定性相结合的方法 从辞

书词性标注和义项划分的完整性这个角度来展 的

我国语文辞书词性标注走过了一个由尝试标注--有意识部分标注--全

面系统地标注词性的艰难历程 在语文辞书里标注词性有着重要的意义和必

要性 但在实践中 却遇到了如词类的划分 词与非词的区分 词的兼类等

一些难以一时克服的问题 本文通过对比分析 现代汉语规范字典 和 现

代汉语词典 中已经标注数词和量词的条目 认为一部辞书要想真正地逼近

现代汉语 使词性标注和义项划分完整而和谐 在词性标注时 首先要以一

个词的语法功能为划分词类的唯一标准 其次 在遇到一些古代用法时 应

参照古汉语语法系统进行词性标注 再次 辞书义项的概括 增删等应保证

一个词的义系的完整性 这个义系包括词的词汇意义和语法意义 后 我

们对 现代汉语规范字典 中几组语法性质相同的词进行考察 发现它标注

的词性并不完全相同 破坏了整个语义场词义系统的完整性

本文认为 词性标注也是一个语义学问题 一个词中的每个义位都不

能脱离它的用法而发挥作用 一部好的辞书应尽可能全面地反映这些义位和

用法 保证三个 完整 即

1 整个语言语义系统的完整

2 每一个语义场语义系统的完整

3 每一个词的义系的完整

厦门大学博硕士论文摘要库

Abstract

II

Abstract

In contemporary Chinese dictionary compilation, it is generally tended to

completely mark the parts of speech, whereas a lot of problems keep arising in

this field. By resorting to database the present thesis mainly deals with the parts

of speech and integrated levels of semantic meaning in dictionaries. The

quantitative and qualitative ways are applied. The present author holds that a

high-quality contemporary Chinese dictionary should realistically reflect and

approach contemporary Chinese. To mark the parts of speech in dictionary

compilation in China has experienced hardship from tentative mark to conscious

and partly mark and finally to systematically mark. It is significant and necessary

to mark the parts of speech in dictionary compilation. But the problems like the

differentiation of the parts of speech, the distinction of word and non-word and

词的兼类, etc cannot be instantly solved. The thesis compared the items of

marked numerals and classifier measure words from the Contemporary Staroach

contemporary Chndard Chinese Dictionary and the Contemporary Chinese

Dictionary, and found that in order to appinese and to make the parts of speech

marking and division of levels of semantic meaning integrated and harmonious,

the following suggestions should be referred to. First of all, the grammatical

function of a word should be the only standard in marking parts of speech.

Secondly, when the ancient usage of a word is involved, the ancient Chinese

grammatical system should be referred to in order to mark its part of speech.

Thirdly, the summary, addition and deletion of the items in a dictionary should

be based on and guarantee the integrity of the semantic system of a word, which

厦门大学博硕士论文摘要库

语文辞书词性标注与语义完整性研究

III

includes the lexical meaning and grammatical meaning of the word. At last, after

the observation of the pairs of words with same parts of speech in the

Contemporary Standard Chinese Dictionary, the present thesis found that they

are not completely same and therefore the integrity of the semantic system is

destroyed.

In conclusion, the present thesis holds that a good dictionary should

completely reflect these semantic items and usage as possible and three

“integrity” should be guaranteed. They are:

1.The integrity of the semantic system of the language.

2.The integrity of the semantic system of the semantic field.

3.The integrity of the semantic system of each word.

Key Words:marking parts of speech;summarization of items;integrity.

厦门大学博硕士论文摘要库

Contents

IV

目 录

内容提要 中文

内容提要 英文

第1章 我国语文辞书词性标注的实践和已有研究 7

1.1 我国语文辞书词性标注的实践 7

1.2 辞书词性标注的意义 9

1.3 辞书词性标注的基础研究 14

1.4 本文研究的对象 材料来源及方法 23

第2章 现规 及 现汉 的词性标注实践 26

2.1 现规 的词性标注情况介绍 26

2.2 与郭锐等所标词类数量的对比分析 29

2.3 现规 与 现汉 部分词类的对比分析 31

第3章 词性标注完整性应以词的语法功能为依据

两部辞书对数词的标注 34

第4章 义项概括完整性应语义系统完整性为准绳

两部辞书对量词的标注 44

4.1 两个前提条件 44

4.2 辞书对量词的标注及其义项的统计 47

4.3 现规 对 现汉 义项的处理和改进 50

4.4 两部辞书未同标为量词的字目之间义项的比较 70

第5章 结束语 81

参考文献 84

后 记 86

厦门大学博硕士论文摘要库

语文辞书词性标注与语义完整性研究

V

Contents Proface 6 Chapter one the practice and the reseach of marking parts of

speech in Chinese dictionary 7

1.1 the practice of marking parts of speech 7

1.2 signification of marking parts of speech in dictionary

9

1.3 the background-research of marking parts of speech

14

1.4 the object and mathod of this thesis

23

Chapter two the practice of marking parts of speach the

Contemporary Staroach contemporary Chndard

Chinese Dictionary and the Contemporary Chinese

Dictionary 26

2.1 the introduction of marking parts of speech in the the

Contemporary Standard Chinese Dictionary 26

2.2 the comparison and analysis of the quantity between

the Contemporary Standard Chinese Dictionary and Guorei’s

29

2.3 the comparison and analysis of the Contemporary Staroach

contemporary Chndard Chinese Dictionary and the

Contemporary Chinese Dictionary 31

厦门大学博硕士论文摘要库

Contents

VI

Chapter three the marking of numerals of the two dictionaries

34

Chapter four the marking of classifier measure words of

the two dictionaries 44

4.1 the two premises 44

4.2 the statistics of items of the classifier measure words marked

from dictionaries 47

4.3 the disposal and improvement of items of the Contemporary

Staroach contemporary Chndard Chinese Dictionary compared

with the Contemporary Chinese Dictionary 50

4.4 the comparison of the items of entris not marked classifier

measure words simultaneously 70

Chapter five conclusion 81

References 84

Postscript 86

厦门大学博硕士论文摘要库

语文辞书词性标注与语义完整性研究

1

第1章 我国语文辞书词性标注的实践和已有研究

词性标注是为教材 词表 大型语料库尤其是辞书中的每一个词目(entry)

注出词的语法类别 指明其语法特点的实践活动 为方便海外留学生学习汉

语 一般在对外汉语教材中都尽量地为重要的词标注了词性 暂不举例 词

表中标注词性的如 汉语水平词汇与汉字等级大纲 (国家汉办 1992) 现

代汉语八百词 (吕叔湘 1980)等 在自然语言处理中 北京大学计算语言所

经过 16 年的研究 依据语法功能 将其搜集到的 7.3 万多个词语进行了归

类 建成了电子版的 现代汉语语法信息词典 详细地描述了每个词的语

法属性 并在此基础上 他们又着手大规模语料库的建设 到 2002 年 2 月

底完成了 2700 多万字的语料切分和标注 尽管他们标注词性的具体目的并

不一样 但在词性标注时 所遇到的问题却大同小异 本文将以 现代汉语

规范字典 和 现代汉语词典 后分别简称 现规 和 现汉 中的词性

标注为主要考察对象 力求就其中的一个问题 即辞书词性标注与词义完整

性的关系做一番考究

1 1 我国语文辞书词性标注的实践

词性标注是一项兼及语法学和词典学 在词的分类基础上进行的一种

实践活动 1898 年 马氏文通 的发表 标志着我国第一个汉语语法体系

的诞生 此后 对汉语语法的研究一直在探索过程中 取得了一定的成就

在词类问题上也经过了三番五次的讨论 其中规模较大的一次是在上世纪

50 年代 论题是 汉语究竟有没有词类 绝大多数的汉语工作者都承认汉

厦门大学博硕士论文摘要库

第 1 章 我国语文辞书词性标注的实践和已有研究

2

语是有词类的 但这种承认在上世纪 80 年代还只是停留在理论上 而没有

一个体现在极其重要的实践活动中 具有较大权威性的 现汉 也只是标注

了一部分虚词

符淮青的 <现代汉语词典>在词语释义方面的贡献 一文中认为早在

上世纪三四十年代 国语词典 王云五大辞典 就已经 始尝试词性标

注了 [1]但现在大都普遍认为 现汉 是我国第一部有意识地标注词性的

语文辞书 [2]吕叔湘先生在主持 现汉 编写时 原定是要标出词性的

一是打算区别词与非词 二是逐一标出词性 只是标注起来发现困难确实较

多 一时不能很好地解决 同时也觉得对于从小就学会说汉语的读者 这

两件事在学话和读书的时候已经基本上心领神会 犯错误的机会不大 因此

就作罢了 但他对虚词的词性标注仍作要求 虚词如不利用词类名称

会给注解造成困难 可以把词类名称用作注解的一部分 实际上后来不仅

对所有的虚词标注了词性 而且也对实词中的量词 代词进行了词性标注

尽管如此 现汉 仍是一部部分标注词性的语文辞书

对外汉语学习词典标注词性始于 80 年代 1982 年 由北京语言学院编

写 商务印书馆出版的 简明汉英词典 第一次系统地为汉语词语标注了

词性 [3] 在词典中为汉语的词标注词性 并区别出能独立运用的 自

由词 和不能独立运用的 非自由词 这在汉语词典编写史上是个创举

具有 拓性的意义 比传统的词典编写方法确是前进了一步 [4]以后相继

出版的 现代汉语常用词用法词典 (北京语言学院) 汉语水平词汇等级

大纲 (国家汉办) 汉语常用词用法词典 (北京大学)等辞书 词表基本上

沿用了 简明英汉词典 的作法 1995 年由上海外语教育出版社出版了一

部供外国人学习汉语使用的中型单语词典 现代汉语学习词典 在词性标

注方面也作了有益的尝试

见 现代汉语学习词典 前言 见 <现代汉语词典>编写体例(修订稿)

厦门大学博硕士论文摘要库

语文辞书词性标注与语义完整性研究

3

汉语语文辞书全面标注词性的辞书出现于 90 年代 其中具有代表性的

有 实用汉语词典 (新蕾出版社 1992) 古今汉语字典 (汉语大词典出

版社 1993) 现代汉语用法词典 (江苏少儿出版社 1994) 新编古今汉

语大词典 (上海辞书出版社 1995) 现代汉语规范字典 (语文出版社

1997) 董大年主编的 现代汉语分类词典 汉语大词典出版社 1998 年

郭良夫主编 应用汉语词典 商务印书馆 2000 张寿康与林杏光的 现

代汉语实词搭配词典 商务印书馆 1992 张卫国与冀小军的 现代汉语

辞海 人民中国出版社 1994 等

从上面词性标注的实践情况看 我国的语文辞书走过了一个由尝试标注

有意识部分标注 全面系统地标注词性的艰难历程 虽然还存在一些

问题 但这较为艰难的一步毕竟迈出去了 做总比不做好 万事 头难

只要 了头 随着科学的发展和研究的深入 总有一天会完备起来的 [5]

行动大于意义!

1 2 语文辞书词性标注的意义

真正将辞书中词性标注问题提出来并给予研究的是在上世纪 80 年代

理论与实践几乎同步 至今已走过了 20 多个春秋 笔者共搜集到有关词性

标注研究的大小论文仅 30 多篇 早的一篇是钟梫的 汉语词典标注词性

问题 ( 辞书研究 1980 年第 1 期) 后来 在 1983 年 辞书研究 (1983

年第 5 期) 了一个 语文词典词性标注专辑 收录了几篇文章 第二次大

的讨论是在 1999 年召 的一次专门以词性标注问题为讨论对象的会议 并

有几篇文章在 辞书研究 (1999 年第 1 期) 辟专辑刊出 这些已有研究大

都已认识到了词性标注的意义和难度 在基本问题上如词的分类 词与非词

的区分标准 词的兼类等一些涉及到汉语本体理论的 给予了极大的关注

厦门大学博硕士论文摘要库

第 1 章 我国语文辞书词性标注的实践和已有研究

4

这些已有的研究我们认为应该及时给予总结的

为深入了解使用者对词典的需求 新加坡一学者对四十位经验丰富的小

学华文教师进行问卷调查 结果发现目前中国大陆 台湾等地出版的华语词

典与汉英双语词典皆无法满足以华语作为第二语言学习者的需求 其中有一

项 在进行语言技能活动时经常检索的词典信息 栏中 表明对语法信息的

检索占有着较大的分量 [6]以汉语为第二语言学习并使用的人 肯定对语法

有着较高的要求 同样的 对国内汉语学习者和工作者来说 辞书也不是没

有标注词性的必要

较早论述词性标注必要性的是徐永真和林立 前者就词典中为虚词标注

词性进行了说明 词序和虚词的使用是汉语中主要的语法手段 因此虚词

在整个汉语词汇总量中所占比例虽不大 而作用很大 使用频率也很高 郑

林曦同志发表在 1982 年 1 月 14 日 人民日报 上的 印书印报得用多少字

一文 举出 常用的前四十二字 其中虚词和主要用作虚词的字就有 14 个

占 30% 可见 语文词典(且不说专门的虚词词典)对虚词的释义不能不加以

重视 [7]林立认为 一个词包括形 音 义和能四个因素 并引陈望道先

生的话说 在品格的意义和功能之中 尢当注意功能 为 现汉 中的部

分词性标注找到了根据 为易于说明 我们将从辞书编纂和辞书使用者两个

角度来概括词性标注的意义

从辞书编纂的角度来看

1 有助于辞书中词语每个义项信息的完整 如上文所述 一个词本身

就包括形 音 义 能四个因素 词的内涵包括词的意义和语法功能两个

方面 仅仅解释词义只解决了一个方面的问题 虽然是重要的 但不全面

标注词性 概括地揭示词的语法功能 与词的释义一起 才构成了较为完整

的信息 [2]郭锐经过 16 年的研究 认为 词类的本质是词的表述功能 表

述功能实际上就是词性 相应于表述功能的分层 词性也应分成两个层

厦门大学博硕士论文摘要库

语文辞书词性标注与语义完整性研究

5

面 我们把对应于内在表述功能的词性叫词汇层面的词性 把对应于外在表

述功能的词性叫句法层面的词性 词汇层面的词性就是词语固有的词性 需

在词典中标明 [8]由此不难看出词的语法意义是一个词的义项的一部

分 没有给予标注或作出其他说明应该是一种不完整的释义

2 有助于辞书中每一个词的义项的完备 标注词性能够使辞书编者自

觉地从词的语法功能的角度考虑义项的确立和分合 检验释义的准确性及释

义与例句的协调等等 有利于进一步提高辞书编写的科学性和实用性 [2]

而郭锐对其论述的更为具体 词类划分以词的同一性为基础 分析词性可

为分析词义提供一个新的角度 弥补单纯的词义分析的不足 [9]如其举例

结果 在一定阶段 事物发展所达到的最后状态 优良的成绩 是长期刻苦学习

的 |经过一番争论 他还是让步了 ( 现汉 )

前一 结果 为名词 后一 结果 为连词 应分为两个义项

胡说 瞎说 信口 没有根据的或没有道理的话 这纯属 不必理会 ( 现

汉 )

是动词 按释义是名词 但实际上 这纯属~ 也是动词性的一种

用法 如这纯属胡闹(诈骗 狡辩等) 所以两个义项应该合在一起 单保留

动词一项

智慧 辨析判断 发明创造的能力 人民的 是无穷的|领导干部要善于集中群众

的 ( 现汉 )

从释义上看 智慧 是名词 但它还有一个形容词用法 如

a.中华民族是一个勤劳智慧的伟大民族 在世界科技史上曾留下了光辉灿烂的业

绩 ( 人民日报 1995 年 1 月 13 日)

b.若论这个小姐模样儿 聪明智慧 根基家当 倒也配的过 ( 红楼梦 第 29

回)

上面两个例子中的 智慧 就是形容词 因此应增加这一义项

厦门大学博硕士论文摘要库

第 1 章 我国语文辞书词性标注的实践和已有研究

6

通过上面的分析可以看出 从词性的角度来概括词的义项可能会更加完

备 科学一些

3 有助于词义 词性 例证三者的统一 [10]这里的词义是词典中对

词义揭示所用的释义语言或方式 释义是与词的词性相关的 不同词性的词

应采取相应的释义方式 一般情况下用来释义的词语基本上应与被释词的词

性相同 即释义语言与被释词的词性之间的协调 如

变迁 情况或阶段的变化转移 陵谷 |人事 |时代 ( 现汉 )

变迁 很明显是动词 但这里的释义用语却是名词性的 应用动词性

的释义用语来解释 如(情况或阶段)变化转移

词语互助法是一种传统的注释方法 标注词性后两词的词性应该相同

如 现汉 中 夸赞 一词的解释是 夸奖 夸奖 的释词是 称赞

三者同为动词 当然由于种种原因 二者有时也未必一致

例证更应与被释词的词性一致 如 现汉 里的 规范化 被释为 使

合于一定的标准 例证为 实行~服务 这里显然用的是其形容词的用法

导致了词义 词性与例证的不一致

从辞书使用者角度来看

周艺的一篇文章概括得非常好 主要有以下几点 [11]

1 词典标明词类 是对汉语词汇进行科学的分类 是研究汉语的需

2 语词汇标明词类可以帮助读者正确理解词的含义和功能 辨别同

形同音或同形异音的不同类词的区别之所在

3 词目标明词类 可以指导语言实践 帮助读者正确使用汉语

4 词目标明词类 有利于各国人民和友好人士学习汉语

根据语言习得理论 我们认为一个人在学习母语时 是在潜移默化中和

不断地自我纠正中趋向正确的 一旦成熟之后 大脑中对每个词的词义 用

厦门大学博硕士论文摘要库

语文辞书词性标注与语义完整性研究

7

法及感情色彩都有一个较为自足的系统来保证顺利完成交际和表达 因此我

们作为第一语言使用者 每个词的语法特征是潜意识地存在我们大脑中的

当我们表达和交际时 我们会不自觉地自动提取出来组词成句 因此从这一

角度来看许多第一语言学习者对辞书词性标注的要求并不大 或者可以说

一语言学习者对母语中许多词的词性的把握比辞书中标注的词性更加准确

但那毕竟是一种潜意识的存在状态

可是对把汉语作为第二语言来学习的人来说 情况就不同了 每一种语

言都有着一整套属于自己的系统 包括词汇 语法 词义 语音 字形等

每一种语言也都对应着一整套与之相应的思维方式 第二语言学习者首先要

受到母语的负面影响 这样便要求供对外汉语学习者使用的工具书或教材提

供更加明确的语言信息 其二 汉语是一种缺乏形态变化的语言 主要靠词

序和虚词来表达 这是一种较具有隐蔽性的语法手段 对其规律的掌握需要

时日 得意而忘言 得鱼而忘筌 中国传统文化十分强调对 意 的获得

而不太重视形上的东西 为表达某种意思 用 不择手段 这个词来形容想

来也不太过分 近而产生了许多灵活的用法 从表面上看似有一种 一词多

类 词无定类 类无定词 的局面 因此 对第二语言学习者来说犹如 蜀

道之难 因此在对外汉语学习词典和教材中标注词性显得尤为必要

1 3 辞书词性标注的基础研究

词性标注的基础是词的语法分类 即词类的划分 这是一个老大难的问

题 如果解决了词类划分的问题 那么词性标注问题可以说已经解决了一大

半 但遗憾的是 词类划分经过半个多世纪的讨论和研究 至今尚未完全清

晰 本文根据已有研究 简单地概括如下

厦门大学博硕士论文摘要库

第 1 章 我国语文辞书词性标注的实践和已有研究

8

1 3 1 汉语词类划分的困难

汉语词类没有解决好不是语言学家的无能 而是与汉语本身有着非常密

切的关系 既有主观原因 也有客观上的原因

主观上的原因 吕叔湘先生说的好 他说 认识问题的复杂性 我想

该是解决问题的第一步 第二步呢 就要占有材料 说句笑话 咱们都是拿

着小本钱做大买卖 尽管议论纷纷 引证的事例左右离不了大路边儿上的那

些个 而议论之所以纷纭 恐怕也正是由于本钱有限 [12]即我们过去的工

作可能是理论谈得多 实际工作做得少 对汉语词类的实际情况摸得不深刻

全面

客观上的原因 与汉语自身的特点是分不 的 语言的发展变化本身是

一个连续统 但汉语曾一度过着 文白分居 的日子 考直到上个世纪的白

话文运动以后二者才始得 破镜重圆 分分合合中也受到了其他国家或民

族语言的影响 因此我们现在使用的现代汉语尚加杂着许多文言成分和其他

语言成分

主要归纳如下

1 汉语缺少形式标记 没有形态变化 硬将西方的语法理论尤其是

词类理论套在汉语上面 大有削足适履之感 不符合汉语的无形态标记特点

我们只有立足汉语实际 认真挖掘 其实 印欧语系的形式标记也是一种语

法功能的外现 是可视的 我们在划分词类时只好根据句子和词的组合情况

即一个词所处的语法位置来判断它的词性 因此没有西方语言的那种直观

性 这给词类的划分造成了一定的困难

2 汉语历史层次较复杂 既有口语成分 也有书面语成分 书面语

又有文言成分和欧化成分 使词的语法功能和句法规则复杂化 要从如此驳

杂的对象中整理出条理来 的确是困难的 而且即使整理出一些条理来 任

何人都可以随手拣起不少“例外”来加以非难 随便举一个例子 如鲁迅的语

厦门大学博硕士论文摘要库

Degree papers are in the “Xiamen University Electronic Theses and Dissertations Database”. Fulltexts are available in the following ways: 1. If your library is a CALIS member libraries, please log on http://etd.calis.edu.cn/ and submitrequests online, or consult the interlibrary loan department in your library. 2. For users of non-CALIS member libraries, please mail to [email protected] for delivery details.

厦门大学博硕士论文摘要库