運用聯合知識庫分析聯合報...

35
運用聯合知識庫分析聯合報 新聞標題日語借詞出現的頻率 發表人:李松山 2009.12.01

Upload: others

Post on 10-Feb-2020

12 views

Category:

Documents


0 download

TRANSCRIPT

運用聯合知識庫分析聯合報新聞標題日語借詞出現的頻率

發表人:李松山

2009.12.01

問題意識

新聞標題國、台語夾用的情形。

新聞標題使用日語借詞的台語。

日語借詞在新聞標題出現的頻率。

日語借詞新聞標題頻率代表的意義。

新聞標題國、台語夾用的情形

精通台語和國語的台灣人而言,夾用台語在國語的言談中,已成為普遍現象,國語言談在公共場合中,夾用台語詞彙,是普遍的溝通方式;而在新聞標題中,為數不少利用國、台語夾用的手法來表現,使用兩種語言做為傳播媒體與讀者之間溝通的橋樑。

新聞標題使用日語借詞的台語

日治期間台語大量吸收日語詞彙,很多日語詞彙變成台語借詞,這種台語詞彙來自日語的借用詞彙,在逐漸轉化的語言變遷中,日語成為台語外來語,吸收成台語詞彙,殘留在台語中的日語,除了表現在口語傳達上,也進入文字傳播在報章雜誌上,不論是標題或內文中,時常可見日語成份的台語詞彙。

台語日語借詞收集與分類

從收集到三千多則新聞標題的台語詞彙中,和山口要收錄的1633個台灣閩南語日語借詞語料,運用聯合知識庫的關鍵字搜尋功能,範圍限定在研究期間 (2006.07.01-2008.06.31)內,兩相比對篩選出兩者都使用過的聯合報新聞標題底層是日語借詞的台語詞彙共八十八則,依據湯璧綺對日語借詞的分類分成三大類:

一、日語中的外來語(日語發音)

直接翻釋歐美語言原有詞彙的意義即意譯,加上音譯利用日語片假名來標示書寫的語詞,其中,排除在1868年明治維新之前,就已進入日本的大量漢語外來語。

例如:出國tshit-thô愛會記得tsahパスポート(護照)khaカメラ(相機)。

有夠熱!ビール(啤酒)來兩杯。

詞目數23個,詞頻數936次。

二、日語漢字(日語發音)

向日語借用的漢字詞,按照日語原來的讀音讀出的語詞,不用漢字去翻釋外語的音而得到的新詞,按照原詞的音節完整的對譯出來。

例如:出國tshit-thô愛會記得tsah當地的おみやげお土産(土產)返來。

Kah衫收入去たんす箪笥(衣櫥)內底。

詞目數31個,詞頻數878次。

三、日語漢字(台語發音)

原詞的語言形式經過漢字化而保留下來,日語的漢字依照台語的讀音讀出的語詞,也就是用台語的語音來直讀日語漢字。

例如:阮阿爸足無閒,不時愛當值(值班)閣愛出張(出差)。食飯飽緊去kah宿題(家庭作業)寫寫咧。

詞目數34個,詞頻數1172次。

建立日語借詞語料庫

日語借詞在新聞標題出現的頻率

統計出詞彙使用次數及該詞出現的頻率。

語詞頻率是指在同一標準下,某一個語詞使用次數的多寡比例,本文所指稱的詞頻是在統計的語料內該詞彙出現的次數,其方法是以累積方式,取得詞目數以及每一詞彙出現的頻次,詞頻率是詞彙出現的百分比,亦即該詞彙出現的次數除以語料庫斷出的詞頻總數。

日語借詞新聞標題頻率代表的意義

透過分布比率分析,對詞彙進行歸納統計使用的頻率,建立日語借詞詞頻表,根據詞頻表進行詞頻分析。

根據本文語料庫收集到八十八則日語借詞的詞目,運用聯合知識庫的關鍵字搜尋功能,在統計期間內以詳目式加導言的形式呈現,聯合報的新聞標題及內文,並逐條核對各詞目的使用次數,經統計累積詞頻共2986次。

分類詞頻統計方式

分類詞頻分析

綜合以上三種日語借詞的分類,詞頻的高低起伏十分明顯,一、二、三類各有詞目其詞頻超過三百次以上,其中,第三類的人氣這個詞目,詞頻更高達387次,料理也有332次,光是這兩個詞目的累計詞頻就有719次,佔第三類累計詞頻率的六成一三。

詞頻三百次以下至一百次的詞目只有兩個,即第一類的巴士和第二類的看板,詞頻分別是124次和119次,其餘詞目的詞頻都在一百次以下,而詞頻在五十次到九十九次的詞目,三類加起來才十一個,詞頻在五十次以下的詞目,第一類有十七個,第二類有二十五個,第三類有二十九個,總共七十一個詞目。

分類詞目的統計方式(詞目總和)

分類詞目的統計方式(詞頻總和)

分類詞目的統計方式(詞目詞頻比)

分類詞目的統計方式分析

A.B.C.三類的詞目總和共八十八則,A. 二十三則,佔26.14%,B. 三十一則,佔35.22%,C. 三十四則,所佔比率最大,約佔38.64%。

A.B.C.三類的詞頻總和共2986則,A. 936則,佔31.35%,B. 878則,佔29.4%,C. 1172則,所佔比率最大,約佔39.25%。

C類借詞詞目數詞頻數的百分比都是最高,而且分布平均,A類借詞詞目數少,但詞頻數的百分比卻高於B類借詞,顯現出A類借詞詞目詞頻比較高。

總詞頻詞目的統計方式(見報率)

見報率的數值分析(一)

以統計的兩年期間共730天,除以累計詞頻2986次,得出結果聯合報出現日語借詞的新聞標題,平均一天出現4.09次,換言之,每天閱讀聯合報讀者,可以見到四個日語借詞的新聞標題,其中,見報率最大的是人氣這個詞彙,平均不到兩天就出現一次,而瓦斯、料理、運將(含運匠)這三個詞彙,出現的頻率也在三天之內,五到十天之內出現的詞彙,則有巴士、看板、幼稚園、放送、紅不讓、麻吉及卡哇依(含卡哇伊)等七個,以上十一個詞彙累計詞頻達2035次,累計詞頻率則有六成八,見報率是2.79天。

見報率的數值分析(二)

十二到二十天之內出現的詞彙有九則,但是累計詞頻只剩452次,累計詞頻率則有一點五成,二十天到一年之內出現的詞彙有四十三則,累計詞頻468次,一年出現一次的詞彙有七則,累計詞頻十四次,二年才出現一次的詞彙有十七則,累計詞頻十七次,一到二年出現一次的詞彙共有二十四則,佔總詞目數的二成七,而佔總詞頻率的千分之一點零四,和前十一個詞彙佔的總詞頻率六成八,比例非常懸殊。

總詞頻詞目的統計方式(區間詞目數)

總詞頻詞目的統計方式(區間詞頻數)

結語(一)

在台灣民間庶民間的交談,日語借詞的台語詞彙仍持續被使用,但是受限於文字的表達方式,在書面呈現時受到一定程度的限制,本文中第三類的日語漢字借詞(台語發音)分類,直接用台語發日語漢字的音,沒有文字書寫上的困擾,所以不論是詞目或是詞頻的數量上都比另外兩類高,也是新聞標題語借詞最常使用的方式。

結語(二)

詞頻高的日語借詞通常是在新聞標題中出現比較多的詞彙,讀者閱讀比較容易,雖然是日語借詞但已經和台語的固有詞相連結,甚至被當成是華語,彼此之間很難界定;詞頻低的,讀者接觸機會少,有時一、兩年才會出現一次,因此閱讀難度較高,可能慢慢被淘汰,自然在新聞標題中消失。

報告結束

敬請指教