ch3 語料庫證據支援的詞語搭配研究

34
語語語語語語語語 語語語語語語語語 語語語語語語 語語語語語語 語語語 語語語 語語語 語語語 03 03 語語語 語語語

Upload: ungian-iunn

Post on 20-Jun-2015

689 views

Category:

Education


1 download

TRANSCRIPT

Page 1: Ch3 語料庫證據支援的詞語搭配研究

語料庫證據支持的語料庫證據支持的詞語搭配研究詞語搭配研究

報告人:台碩二報告人:台碩二 03 03 黃淑美黃淑美

Page 2: Ch3 語料庫證據支援的詞語搭配研究

引言引言 詞語搭配是語料庫語言學研究活動中,最為詞語搭配是語料庫語言學研究活動中,最為

活躍的研究領域,處於他的中心位置。活躍的研究領域,處於他的中心位置。 實踐上:實踐上: 計算機技術的語料庫使得成千上萬的連續文本可計算機技術的語料庫使得成千上萬的連續文本可

被有效地儲存和檢索,詞語搭配的研究便成了極被有效地儲存和檢索,詞語搭配的研究便成了極富活力的研究領域。富活力的研究領域。

理論上:理論上: 重要的語言學觀點對語詞搭配研究起了指導和推重要的語言學觀點對語詞搭配研究起了指導和推

動的作用。動的作用。

Page 3: Ch3 語料庫證據支援的詞語搭配研究

重要的語言學觀點重要的語言學觀點

語言交際主要是詞語驅動的。人们的交際語言交際主要是詞語驅動的。人们的交際活動主要是選擇合適的語詞,包括詞語的活動主要是選擇合適的語詞,包括詞語的適當語法型式,來實現意義的一個過程 。適當語法型式,來實現意義的一個過程 。

語言學研究應以詞語研究為出發點語言學研究應以詞語研究為出發點 有必要將語言使用與運作看成是一個詞語有必要將語言使用與運作看成是一個詞語

網絡系統網絡系統 語言學應研究真實使用中的語言語言學應研究真實使用中的語言

Page 4: Ch3 語料庫證據支援的詞語搭配研究

詞語搭配的界定詞語搭配的界定

廣義與狹義的界定廣義與狹義的界定 廣義的界定:廣義的界定: 以新弗斯學派的韓禮德和辛克萊為代表。以新弗斯學派的韓禮德和辛克萊為代表。

認為詞與詞的共現聯系是最重要的或者說認為詞與詞的共現聯系是最重要的或者說惟一的標準。只要一個詞與另一個詞共現惟一的標準。只要一個詞與另一個詞共現達到統計學上的顯著程度,它們就構成搭達到統計學上的顯著程度,它們就構成搭配。配。

Page 5: Ch3 語料庫證據支援的詞語搭配研究

詞語搭配的界定詞語搭配的界定

狹義的界定狹義的界定 以杰爾默為代表以杰爾默為代表 主張搭配研究必須參照語法限制聯系。其主張搭配研究必須參照語法限制聯系。其

一是語法限制作用、其二是詞語的決定作一是語法限制作用、其二是詞語的決定作用。其意義是說,只有處於同一語法結構用。其意義是說,只有處於同一語法結構中的詞項才可能構成搭配。中的詞項才可能構成搭配。

Page 6: Ch3 語料庫證據支援的詞語搭配研究

詞語搭配的界定特點詞語搭配的界定特點

詞在組合軸上的共現詞在組合軸上的共現 組合軸上詞語的有限組合組合軸上詞語的有限組合 語言使用的因循性語言使用的因循性 意義—形式的綜合體意義—形式的綜合體 詞語的反覆共現及其統計度量詞語的反覆共現及其統計度量 不同語域裡詞語使用特點的反映不同語域裡詞語使用特點的反映

Page 7: Ch3 語料庫證據支援的詞語搭配研究

詞在組合軸上的共現詞在組合軸上的共現

在語言學研究中組合軸上研究的是詞語間在語言學研究中組合軸上研究的是詞語間實際上業已發生的組合聯繫,是真實而典實際上業已發生的組合聯繫,是真實而典型的東西。型的東西。

強大的語料庫可供使用,使研究者發現,強大的語料庫可供使用,使研究者發現,組合聯系有豐富的形式和內容,組合軸所組合聯系有豐富的形式和內容,組合軸所實現的意義也十分豐富。實現的意義也十分豐富。

Page 8: Ch3 語料庫證據支援的詞語搭配研究

組合軸上詞語的有限組合組合軸上詞語的有限組合

組合軸上的詞語組合分為三類:自由組合、組合軸上的詞語組合分為三類:自由組合、有限組合、成語。有限組合、成語。

區分的標準:搭配力、結構可變性、語義區分的標準:搭配力、結構可變性、語義明晰性。明晰性。

有限組合的特點:詞語的搭配是明晰的,有限組合的特點:詞語的搭配是明晰的,搭配伙伴間語義上的相互限定聯系較強。搭配伙伴間語義上的相互限定聯系較強。在結構上:容忍一定程度的替代、位移和在結構上:容忍一定程度的替代、位移和擴展。擴展。

Page 9: Ch3 語料庫證據支援的詞語搭配研究

語言使用的因循性語言使用的因循性

因循性:詞語搭配在很大程度上是一種習因循性:詞語搭配在很大程度上是一種習慣性或常規性的詞語,行為方式這就是它慣性或常規性的詞語,行為方式這就是它的因循性。的因循性。

Page 10: Ch3 語料庫證據支援的詞語搭配研究

因循性可從三方面來探討因循性可從三方面來探討

詞語搭配方式直接受社會文化方式的影響。詞語搭配方式直接受社會文化方式的影響。 詞語搭配是學術文化習慣的反映。詞語搭配是學術文化習慣的反映。 詞語搭配是語言內部運作機制的一種因循詞語搭配是語言內部運作機制的一種因循

習慣。習慣。

Page 11: Ch3 語料庫證據支援的詞語搭配研究

意義—形式的綜合體意義—形式的綜合體

語言交際中的一切形式選擇都是為了實現語言交際中的一切形式選擇都是為了實現意義。詞語搭配也是如此。意義。詞語搭配也是如此。

一定的語言形式實現一定的意義;一定的一定的語言形式實現一定的意義;一定的意義以一定的語形式為載體。意義以一定的語形式為載體。

詞語搭配是意義—形式的綜合體,就是說詞語搭配是意義—形式的綜合體,就是說它的意義與形式不可分割,二者融合為一它的意義與形式不可分割,二者融合為一個統一的整體。個統一的整體。

Page 12: Ch3 語料庫證據支援的詞語搭配研究

意義有三類意義有三類

概念意義:表述我們在客觀世界裡的經歷概念意義:表述我們在客觀世界裡的經歷和內心世界裡的想像和內心世界裡的想像

人際意義:表述的是交際雙方用語言做事,人際意義:表述的是交際雙方用語言做事,使交際得以進行下去的活動。使交際得以進行下去的活動。

篇章意義:直接聯系於語篇信息的安排和篇章意義:直接聯系於語篇信息的安排和組織。組織。

詞語搭配同時表達這三種意義詞語搭配同時表達這三種意義

Page 13: Ch3 語料庫證據支援的詞語搭配研究

形式形式

即是語法或是句法即是語法或是句法 語法和句法對詞語搭配具有限制的作用語法和句法對詞語搭配具有限制的作用 語法不能憑空杜撰必須有大量的詞語搭配語法不能憑空杜撰必須有大量的詞語搭配

實例作依據,才能概括確定一個類聯接。實例作依據,才能概括確定一個類聯接。 詞語搭配的界定必須限定在類聯接的框架詞語搭配的界定必須限定在類聯接的框架

內。類聯接就是詞語搭配出現於其中的語內。類聯接就是詞語搭配出現於其中的語法結構與框架。法結構與框架。

Page 14: Ch3 語料庫證據支援的詞語搭配研究

類聯接類聯接

弗斯所提出弗斯所提出 語法範籌的結合語法範籌的結合 不是與詞語搭配平行的抽象而是高一級的不是與詞語搭配平行的抽象而是高一級的抽象抽象

是關於句法結構和範籌的陳述是關於句法結構和範籌的陳述 搭配是類聯接的具體表現搭配是類聯接的具體表現

Page 15: Ch3 語料庫證據支援的詞語搭配研究

詞語的反覆共現及其統計度量詞語的反覆共現及其統計度量

文本中反覆共現的詞,才是語料庫研究中文本中反覆共現的詞,才是語料庫研究中一般意義上的搭配。因為詞語搭配揭示的一般意義上的搭配。因為詞語搭配揭示的是語言使用的典型性和道地性,只有反覆是語言使用的典型性和道地性,只有反覆共現的詞語間才可以說具有搭配聯系,反共現的詞語間才可以說具有搭配聯系,反映了語言使用的典型性和道地性。映了語言使用的典型性和道地性。

反覆共現這個界定標準是一種客觀的標準、反覆共現這個界定標準是一種客觀的標準、數據驅動的標準。數據驅動的標準。

Page 16: Ch3 語料庫證據支援的詞語搭配研究

不同語域裡詞語使用特點的反映不同語域裡詞語使用特點的反映

詞語搭配會受到語域的影響。詞語搭配會受到語域的影響。 韓禮德將弗明的語境,發展成語域的概念。韓禮德將弗明的語境,發展成語域的概念。

Page 17: Ch3 語料庫證據支援的詞語搭配研究

語域的系統分述語域的系統分述

域:指語言使用的習慣環境域:指語言使用的習慣環境 旨:指的是語言交際者之間的角色聯系與旨:指的是語言交際者之間的角色聯系與

交際目的。交際目的。 式:指的是交際的渠道或媒介,如口語和式:指的是交際的渠道或媒介,如口語和書面語。書面語。

Page 18: Ch3 語料庫證據支援的詞語搭配研究

語域語域

任何語言使用都受到語域因素的影響和制任何語言使用都受到語域因素的影響和制約,不同語域的語言使用呈現著不同的特約,不同語域的語言使用呈現著不同的特點和規律,詞語搭配也是如此。點和規律,詞語搭配也是如此。

例如:房地產商的廣告用詞和醫學界用詞例如:房地產商的廣告用詞和醫學界用詞就是不同的語域範圍就是不同的語域範圍

Page 19: Ch3 語料庫證據支援的詞語搭配研究

詞語搭配的界定特點詞語搭配的界定特點 詞語搭配是組合軸上融意義與形式於一體的詞項詞語搭配是組合軸上融意義與形式於一體的詞項

共現共現 詞語搭配是因循性的語言使用詞語搭配是因循性的語言使用 詞語搭配是文本中反覆重現的詞項結合方式詞語搭配是文本中反覆重現的詞項結合方式 詞語搭配在很大程度上受語域的影響或制約詞語搭配在很大程度上受語域的影響或制約 詞語搭配是一個詞語序列的重現詞語搭配是一個詞語序列的重現 詞項間相互搭配的連系可由統計度量確定詞項間相互搭配的連系可由統計度量確定

Page 20: Ch3 語料庫證據支援的詞語搭配研究

詞語搭配的定義詞語搭配的定義

詞語搭配是在文本中為實現一定的意義,詞語搭配是在文本中為實現一定的意義,從而以一定的語法形式因循組合使用的一從而以一定的語法形式因循組合使用的一個的詞語序列。構成該序列的詞語相互預個的詞語序列。構成該序列的詞語相互預期,以大於偶然的機率共現。期,以大於偶然的機率共現。

Page 21: Ch3 語料庫證據支援的詞語搭配研究

基本路徑與方法基本路徑與方法

提取焦點詞在語料庫中的所有搭配詞提取焦點詞在語料庫中的所有搭配詞 跨距的長度跨距的長度 統計檢驗統計檢驗 偶然共現詞的排除偶然共現詞的排除 定性分析與定量分析相結合的研究定性分析與定量分析相結合的研究

Page 22: Ch3 語料庫證據支援的詞語搭配研究

提取焦點詞在語料庫中的所有搭配提取焦點詞在語料庫中的所有搭配詞詞

焦點詞又叫搜索詞(焦點詞又叫搜索詞( search wordsearch word )或關)或關鍵詞(鍵詞( key word key word ))

只要在計算機中輸入感興趣的某個詞在語只要在計算機中輸入感興趣的某個詞在語料庫中查詢,計算機就會顯示出詞語索引。料庫中查詢,計算機就會顯示出詞語索引。

選取那些焦點詞完成由研究者根據其研究選取那些焦點詞完成由研究者根據其研究內容和研究目的而定。內容和研究目的而定。

Page 23: Ch3 語料庫證據支援的詞語搭配研究

搭配詞搭配詞 跨距指的是焦點詞左右的語境,以詞為單位計算,跨距指的是焦點詞左右的語境,以詞為單位計算,

不包括標點符號。不包括標點符號。 例如:將跨距定為例如:將跨距定為 -4/+4-4/+4,意思是說焦點詞左右,意思是說焦點詞左右各取各取 44個詞為其語境就是跨距個詞為其語境就是跨距

所有落入跨距內的詞都是焦點詞共現的詞項。所有落入跨距內的詞都是焦點詞共現的詞項。 有些共現詞與焦點詞具有句法限制聯系也具有統有些共現詞與焦點詞具有句法限制聯系也具有統

計上的顯著意義,就是研究者所要的搭配詞。計上的顯著意義,就是研究者所要的搭配詞。

Page 24: Ch3 語料庫證據支援的詞語搭配研究

跨距的長度跨距的長度 跨距長度的界定直接關係於搭配詞提取的結果。跨距長度的界定直接關係於搭配詞提取的結果。 一個詞與焦點詞的距離越遠,它和焦點詞之間的一個詞與焦點詞的距離越遠,它和焦點詞之間的

相互吸引力或是相互遇見力就越弱。相互吸引力或是相互遇見力就越弱。 跨距基於語料庫證據的詞語搭配研究必不可少而跨距基於語料庫證據的詞語搭配研究必不可少而且非常有用的一種手段。且非常有用的一種手段。

多數研究項目表明將跨距定在多數研究項目表明將跨距定在 -4/+4-4/+4或或 -5/+5-5/+5是是較為合適的較為合適的

Page 25: Ch3 語料庫證據支援的詞語搭配研究

統計檢驗統計檢驗

統計檢驗的對象是顯著搭配統計檢驗的對象是顯著搭配 顯著搭配:是指那些其構成成分共現的次顯著搭配:是指那些其構成成分共現的次數比人们根據它們在文本中各自出現的頻數比人们根據它們在文本中各自出現的頻數遇測的還要多的詞語序列數遇測的還要多的詞語序列

Page 26: Ch3 語料庫證據支援的詞語搭配研究

檢驗方法檢驗方法

搭配序列的頻數搭配序列的頻數÷÷焦點詞的頻數焦點詞的頻數 所得的商越接近所得的商越接近 11,所檢驗的搭配出現的概,所檢驗的搭配出現的概率就越大。率就越大。

根據搭配詞的相對頻數。根據搭配詞的相對頻數。 相對頻數指的是一個搭配詞在語料庫中的總相對頻數指的是一個搭配詞在語料庫中的總頻數與其期望頻數的比率。頻數與其期望頻數的比率。

一個搭配序列在庫中實際出現的頻數越高於一個搭配序列在庫中實際出現的頻數越高於其期望頻數,它就越顯著。其期望頻數,它就越顯著。

Page 27: Ch3 語料庫證據支援的詞語搭配研究

期望頻數期望頻數

EE == C×C× (( 2S+12S+1 ) ) ×N÷W×N÷W WW:一個語料庫中包含的總詞數:一個語料庫中包含的總詞數 CC:某個搭配詞與焦點詞共現的頻數:某個搭配詞與焦點詞共現的頻數 2S2S:限定的跨距:限定的跨距 NN :焦點詞在語料庫中出現的頻數:焦點詞在語料庫中出現的頻數 EE :焦點詞共現的期望頻數:焦點詞共現的期望頻數

Page 28: Ch3 語料庫證據支援的詞語搭配研究

偶然共現詞的排除偶然共現詞的排除

偶然共現詞:那些對焦點詞沒有共現作用偶然共現詞:那些對焦點詞沒有共現作用但又落入界定跨距內的詞項但又落入界定跨距內的詞項

排除方法:排除方法: (( 11 )通過統計檢驗)通過統計檢驗 (( 22 )對統計檢驗設置起點頻數,在辛克)對統計檢驗設置起點頻數,在辛克

萊 的研究中將起點頻數設為萊 的研究中將起點頻數設為 33 。。

Page 29: Ch3 語料庫證據支援的詞語搭配研究

定性分析與定量分析相結合的研究定性分析與定量分析相結合的研究

定量研究:定量研究: 研究過程中借助計算機更快地、更有效地,研究過程中借助計算機更快地、更有效地,

對詞語行為進行檢索統計與分析。對詞語行為進行檢索統計與分析。 定性研究:定性研究: 根據詞語搭配的主要界定特點,如因循性、根據詞語搭配的主要界定特點,如因循性、

意義意義 -- 形式限制、語域限制性等。對共現的形式限制、語域限制性等。對共現的詞語進行分析和描述。詞語進行分析和描述。

Page 30: Ch3 語料庫證據支援的詞語搭配研究

詞語搭配研究的語意學意義詞語搭配研究的語意學意義

融詞彙與語法於一體融詞彙與語法於一體 客觀、具體的典型意義研究客觀、具體的典型意義研究 對孕於形式中的功能進行研究對孕於形式中的功能進行研究

Page 31: Ch3 語料庫證據支援的詞語搭配研究

融詞彙與語法於一體融詞彙與語法於一體

任何詞彙行為的描述都應參照該詞常用的任何詞彙行為的描述都應參照該詞常用的語法結構來進行。語法結構來進行。

任何語法結構的描述應基於相關詞語的真任何語法結構的描述應基於相關詞語的真實行為而進行。實行為而進行。

詞語搭配這個語言單位正是語法與詞彙的詞語搭配這個語言單位正是語法與詞彙的匯合點匯合點

Page 32: Ch3 語料庫證據支援的詞語搭配研究

客觀、具體的典型意義研究客觀、具體的典型意義研究 強大的語料庫證據及其有效的研究方法和手段,強大的語料庫證據及其有效的研究方法和手段,

使詞語使用的典型語境和形式都呈現在研究者面使詞語使用的典型語境和形式都呈現在研究者面前。前。

研究者可以依據大量的真實搭配實例,對詞語所研究者可以依據大量的真實搭配實例,對詞語所實現的典型意義進行分析概括和歸納。實現的典型意義進行分析概括和歸納。

詞語搭配的研究焦點是在語言交際中被經常使用詞語搭配的研究焦點是在語言交際中被經常使用的、普遍的習慣的搭配形式及其意義。的、普遍的習慣的搭配形式及其意義。

Page 33: Ch3 語料庫證據支援的詞語搭配研究

對孕於形式中的功能進行研究對孕於形式中的功能進行研究 所謂功能就是指用語言做事所謂功能就是指用語言做事 詞語與詞語的搭配對篇章具有信息組織的作用詞語與詞語的搭配對篇章具有信息組織的作用 通過觀察搭配序列的形式構成,檢查搭配序列通過觀察搭配序列的形式構成,檢查搭配序列

所處的語境,參照整個語篇的結構從而確定搭所處的語境,參照整個語篇的結構從而確定搭配序列實現的語篇意義和功能。配序列實現的語篇意義和功能。

形式意義和功能都孕育在搭配序列中,三者是形式意義和功能都孕育在搭配序列中,三者是不可分割的一體。不可分割的一體。

Page 34: Ch3 語料庫證據支援的詞語搭配研究

結論結論

詞語搭配是語料庫語言學實踐中最富活力詞語搭配是語料庫語言學實踐中最富活力的研究活動之一,它揭示了一種新的、科的研究活動之一,它揭示了一種新的、科學的研究語言的思想、方法和原則學的研究語言的思想、方法和原則

本章對這些內容進行了概述,對含義進行本章對這些內容進行了概述,對含義進行了探討,對理念進行了界定,對思想和方了探討,對理念進行了界定,對思想和方法進行介紹。法進行介紹。