第3回 結合価文法による動詞と名詞の訳語選択能力の評価

22
ー文献紹介ー 結合価文法による動詞と名詞の 訳語選択能力の評価 長岡技術科学大学 自然言語処理研究室 高橋寛治

Upload: takahashi-kanji

Post on 04-Jul-2015

171 views

Category:

Engineering


2 download

DESCRIPTION

結合価文法による動詞と名詞の訳語選択能力の評価

TRANSCRIPT

ー文献紹介ー

結合価文法による動詞と名詞の訳語選択能力の評価

長岡技術科学大学 自然言語処理研究室 高橋寛治

文献について●結合価文法による動詞と名詞の訳語選択能力の評価

●金出地真人、徳久雅人、村上仁一、池原悟●情報処理学会研究報告 自然言語処理研究会報告、119-124、2003-1-20

はじめに動詞と名詞の訳語選択における、結合価文法の効果の定量的検証

●これまでは・・●動詞の意味解析

●「尤度」共起レベルと頻度●「制約」辞書的記述●単語の共起関係

●訳語選択において、いずれも高い精度を出していない

結合価文法のおさらい●結合価文法

●用言と格要素(名詞+助詞)の意味的関係を記述したもの

●結合価パターンの例(日本語語彙大系 構文意味辞書)

見出し語 日本語文型 英語文型

送る N1(人)がN2(休暇)を送る N1 spend N2

送る N1(人)がN2(生活)を送る N1 live N2

一般名詞意味属性体系名詞の意味的用法に着目しシソーラスで体系化

●最大12段の木構造

●2,710の意味属性の分類●約40万語の名詞

●木構造において●上位の意味属性は下位の意味属性を内包

結合価文法による訳語選択

対象とする文の用言により構文意味辞書を検索

格要素の意味属性などが最も多く一致するパターンを1つ選択

日本語パターンの格要素に対応する名詞の意味属性から名詞の訳語を決定

訳語

評価実験結合価文法の性能の調査

●結合価文法で得た英語訳と正解例の英訳語を比較●利用するシステム

●翻訳ソフト「ALT-J/E」を用いる●結果の誤りには注意

●ALT-J/Eでは、形態素解析などのその他解析のエラーがある

評価対象IPAL辞書に登録されている基本動詞および基本

名詞を含む単文の日英対訳文●基本動詞(861語)、基本名詞(1,081語)●評価実験には

●動詞に関する5242文の例文●名詞に関する例文1062文の例文

評価方法と基準●評価はALTで機械翻訳した英訳文のうちの注目単語の英訳語と対訳の英訳語を比較●基準は

●「◯」「△」「✕」の三段階

評価◯対象とする単語のALTの英語訳が、対訳例が用

いている訳語と一致する場合●例 :2つの川がこの地点で合う。●対訳 :The two rivers join at this point.●ALT訳 :Two rivers join in this point.

評価△対象とする単語のALTの英語訳が、対訳例が用

いている訳語と異なるが、意味的に正しい場合●例 :彼は準備を急いだ。●対訳 :He prepares quickly.●ALT訳 :He hurried preparation.

評価✕対象とする単語のALTの英語訳が、間違っている場合

●例 :彼ら海底に沈んでいた船を陸に揚げた。●対訳 :They salvaged the sunken vessel on the bottom of the sea.●ALT訳 :They deep-fried in land the ships that had sunk in the bottom of the sea.

実験結果

評価 ALT-J/E デフォルト訳語

◯ 49% 2572文 22% 1141文

△ 40% 2081文 33% 1740文

✕ 11% 589文 45% 2361文

合計 5242文 5242文

評価 ALT-J/E デフォルト訳語

◯ 62% 658文 58% 615文

△ 29% 312文 27% 289文

✕ 9% 92文 15% 158文

合計 1062文 1062文

動詞訳し分けの精度 名詞訳し分けの精度

正しい動詞訳語が出せなかった原因翻訳失敗の原因 割合

1 パターンが登録されていない場合 21% 26文

2 パターンの照合に失敗した場合 37% 45文

3 慣用表現が用いられている場合 11% 13文

4 形態素解析に失敗した場合 9% 11文5 係り受け解析に失敗した場合 17% 21文6 例文が2通りの意味にとれる場合 5% 6文

パターンが登録されていない場合●例 :学生が教授に教授の都合を電話で伺った。●対訳 :The student phoned the professor and asked him when he would be free.●ALT :A student listenend the professor's circumstances with a telephone to a professor.

不足しているパターンを補うことで解決

パターンの照合に失敗した場合●例  :彼は海外で夏休みを送った。●対訳 :He spend his summer vacation abord.●ALT :He saw a summer vacation of at a forein country.

送るに関して12種類あるため、選択が難しい

例文に慣用表現が用いられている●例 :彼は話の腰を折った。●対訳 :He interrupted a person's speech.●ALT :He broke the waist of talk.

パターンの追加で解決

解析のエラー結合か文法を用いる以前の問題

●形態素解析の失敗●係り受け解析の失敗

これらが正しく処理されないと結合価文法を扱うことができない。

例文がニ通りの意味にとれる場合●例 :職場の不満から彼は家族の者に当たった。●対訳 :He was hard on his family because of complaints he had about his job.●ALT :He corresponded to the person of his family from the discontent of a place of work.

原因と結果をそれぞれ節であらわす複文●結合価文法による訳し分けの限界

名詞訳語に関してALTの結果は、デフォルトより6%良い値

●IPAL辞書の名詞の約5割が多義を持たないため●結合価文法は動詞の訳語選択を目的として開発されたものである

おわりに●単文において結合価文法の動詞と名詞の訳し分け精度を調査した●動詞についてはデフォルトに比べ34%の精度の向上が見られた●結合価文法の特徴を限界まで用いることができれば、さらに精度向上が期待できる(動詞は98~99%、名詞は94%と推測)

おわりに●単文において結合価文法の動詞と名詞の訳し分け精度を調査した●動詞についてはデフォルトに比べ34%の精度の向上が見られた●結合価文法の特徴を限界まで用いることができれば、さらに精度向上が期待できる(動詞は98~99%、名詞は94%と推測)