自然言語処理における意味解析と意味理解
DESCRIPTION
言語表現の意味とその処理について考察と提案TRANSCRIPT
ー文献紹介ー
自然言語処理における意味解析と意味理解
池原悟(NTT情報通信網研究所)情報処理学会研究報告情報学基礎(FI)、Vol.87, pp.31-40、1992
長岡技術科学大学 自然言語処理研究室 高橋寛治
自然言語処理における意味解析と意味理解 2/20
はじめに言語表現の意味とその処理について考察と提案
●対象の姿とそれに対する話者の認識に着目●「対象」「認識」「表現」
●意味処理●「意味解析」+「意味理解」
自然言語処理における意味解析と意味理解 3/20
意味に関する研究の流れ
統語論チョムスキーの生成文法
↓計算機処理が
難解と分かる
統語論+意味論意味解析、意味理解、言語理解
↓意味そのものの
考察・議論がない
1960年 1970年 1992年
自然言語処理における意味解析と意味理解 4/20
本稿では●従来の意味論を振り返り、考察
●言語過程説と関係意味論●意味の意味とは?●意味処理を「意味解析・意味理解」の2つに分ける提案
自然言語処理における意味解析と意味理解 5/20
言語の過程的構造
言語規範
認識 表現
反映論
対象
意味言語過程説(時枝文法)
●言語は「対象」と、それを見て話す人の「認識」および「表現」の関係で捉えられる。
関係 関係
=慣習(自然発生)
言語過程説(時枝文法)
自然言語処理における意味解析と意味理解 6/20
言語の過程的構造
意味
深層構造
生成文法(チョムスキー)
●表層構造と深層構造の存在を仮定
変形規則
意味を変えないで変形する
生成文法(チョムスキー)
表現
表層構造
自然言語処理における意味解析と意味理解 7/20
言語規範
認識 表現
反映論
対象
意味関係 関係
=慣習(自然発生)
言語過程説(時枝文法)
言語モデルの比較
意味
深層構造
変形規則
意味を変えないで変形する
生成文法(チョムスキー)
表現
表層構造
自然言語処理における意味解析と意味理解 8/20
言語規範
認識 表現
反映論
対象
意味関係 関係
=慣習(自然発生)
言語過程説(時枝文法)
言語モデルの比較
意味
深層構造
変形規則
意味を変えないで変形する
生成文法(チョムスキー)
表現
表層構造
自然言語処理における意味解析と意味理解 9/20
言語規範
認識 表現
反映論
対象
意味関係 関係
=慣習(自然発生)
言語過程説(時枝文法)
言語モデルの比較
意味
深層構造
変形規則
意味を変えないで変形する
生成文法(チョムスキー)
表現
表層構造
自然言語処理における意味解析と意味理解 10/20
従来の意味論の分類●言語表現の扱う「対象」
●実在の有無に関わらず、話者が取り上げたもの
話者 表現対象 聞き手
話者 表現対象 追体験
言語上の実体
言語の過程的構造
反映論 文法論(言語規範) =理解=
自然言語処理における意味解析と意味理解 11/20
意味処理の分類●意味理解・・
●表現に結び付けられた認識と対象の姿を追体験
●意味処理を2つの処理に分けて考える●1.言語表現に使われた約束を特定(意味解析)●2.約束を通して表現に結び付けられた話者の認識と対象の認識を知る過程(意味理解)
自然言語処理における意味解析と意味理解 12/20
意味解析(統語構造に支援された)
a)その店は 高い 油を 売っている。
b)背の高い 男が 勤務中に 油を売っている。
貴い高価な気高い上に長い多い
脂肪(オイル)アルコールあぶらゼミ
金に換える裏切る仕掛ける
男性情夫下男
オイルを金に換える怠ける
辞書に示された言語規範(語義)話者が使用した言語規範
自然言語処理における意味解析と意味理解 13/20
意味理解(世界知識に支配された)
上野駅
ホテル
意味理解
住所 旅館 ホテル
駅 の 近く の 宿 は?
上野駅
ホテル
〒
近い
話者の認識
照合
行為、等
線路
近い
駅旅館
ホテル
聞き手の世界モデル
対象世界
自然言語処理における意味解析と意味理解 14/20
機械翻訳と意味解析
●日本語で使われた言語上の約束を、英語の約束に置き換えて人の判断を待つ
構文解析 意味解析 意味理解 意図抽出他
意味処理
言語知識 世界知識
機械翻訳対象世界の限定せず
質問応答など対象世界を限定
応用システム
自然言語処理における意味解析と意味理解 15/20
多段翻訳方式●人手による翻訳
●話者の目を通して認識された対象の姿と、対象に対する話者の意識が結び付けられている●言語の違いによって、「認識」にも相違が生じる
翻訳家は表現を通じて話者の経験を追体験
目的言語の枠組みの中で捉え直して表現
原文 訳文
自然言語処理における意味解析と意味理解 16/20
人手の翻訳のプロセスを模倣①主体的表現の処理
②表現構造の意味の処理
日本語
英語
主体的表現の分離合成方式
多段翻訳方式
多段変換方式
単語で表現単語対単語の対応付け困難
語形変化(屈折)で表現
構造の3段階抽象化慣用的表現構造(堅い構造)用言表現構造(少し堅い構造)一般構造(柔らかい構造)
自然言語処理における意味解析と意味理解 17/20
意味解析用言語知識の構成●客体表現の辞書整備
●話者によって概念化された対象を表現する言葉。名詞、動詞、形容詞などの自立語
精密な意味属性体系
・一般名詞属性2,800カテゴリー
・固有名詞属性200カテゴリー
単語意味辞書[精密な語彙情報]
400,000語(異なり見出し語)<延べ見出し語:60万語>
構文意味辞書[表現構造の辞書]
15,000パターン・・・用言見出し(用言性慣用表現を含む)
自然言語処理における意味解析と意味理解 18/20
意味解析による新機能例●意味解析により日英機械翻訳システムALT-J/Eで可能となった、動詞と名詞の訳し分けの例●動詞「掛ける」の訳し方
●彼女は花に水を掛けた。 She poured water on a flower.●母は神様に願を掛けた。 A mother made a vow to God.●私は彼らに迷惑を掛けた。 I caused them trouble.●彼らは砂をふるいに掛けた。They sifted sand.
自然言語処理における意味解析と意味理解 19/20
意味解析による新機能例●日本語自動書き換え型翻訳機能
●翻訳しやすい日本語に書き換えて翻訳●複合語翻訳機能
●多彩な複合語を一般語の組み合わせで翻訳●文脈処理による文要素補完型翻訳機能
●用言間の文脈を追跡し、省略された格要素を補完。
自然言語処理における意味解析と意味理解 20/20
あとがき●言語過程説の立場から「意味処理」を
●「意味解析」と「意味理解」に分けることを提案●「意味解析」を実現した例として
●日英機械翻訳と、単語・構文意味辞書の2つの辞書にまとめる方法を示した