20150225文献紹介 on wordnet semantic classes and dependency parsing
TRANSCRIPT
文献紹介(2015/02/24)
On WordNet Semantic Classes and Dependency Parsing
長岡技術科学大学 自然言語処理研究室
高橋 寛治
文献について
• Bengoetxea, Kepa and Agirre, Eneko and Nivre, Joakim and Zhang, Yue and Gojenola, Koldo
• On WordNet Semantic Classes and Dependency Parsing
• Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), pp.649-655
2015/2/25On WordNet Semantic Classes and
Dependency Parsing2
概要
• WordNet意味分類の依存構造解析への影響を調査• 意味情報の付与はどのような影響を与えるか?
• 3種類の解析器で影響を確認
• しかし、依存構造解析性能の向上はごくわずか
• 今後,WordNetの階層化を精巧かつ違う基準で行う必要がある
2015/2/25On WordNet Semantic Classes and
Dependency Parsing3
WordNet
• 目的• 言語学および言語処理で使用する直感的な辞書とシ
ソーラスを作ること
• 内容• 英語の語彙の意味辞書(名詞,動詞,形容詞,副
詞)• 同義語をグループで分類(synset)• synsetを階層化したソーラス
• 1980年半ばから,プロジェクトが開始(プリンストン大学)
2015/2/25On WordNet Semantic Classes and
Dependency Parsing4
はじめに
• 語彙の意味情報を英語の依存構造解析に用いた場合,何が有効か
• 様々な問題を設定• WordNetの意味情報は依存構造解析を向上させ
るか?
• 構文解析器の種類により,結果は異なるか?
• 意味情報を用いた構文解析器の組み合わせは有効か?
2015/2/25On WordNet Semantic Classes and
Dependency Parsing5
関連研究
• 構文解析に使用するおおまかな2つの知識• WordNetのような巨大な意味資源を用いる方法
• コーパスから自動で取得した情報
• 意味情報の有効性を示す関連研究• Agirreらは、内容語に付与した階層化された意
味情報により、語彙を用いる手法を超える
• Kooらは{apple, pear}{Apple, IBM}のように語を自動クラスタリングし、依存構造解析への有効性を示した
2015/2/25On WordNet Semantic Classes and
Dependency Parsing6
実験で使用するフレームワーク
• データセットの準備• PTB(Penn Tree Bank)を変換
• 依存構造解析器• MaltParser(Nivre et al., 2007)
• MST(McDonald et al., 2005)
• Zpar(Zhang and Clark,2008)
• 意味情報• WordNet
• Clusters(Koo et al.,2008)
2015/2/25On WordNet Semantic Classes and
Dependency Parsing7
データセットの変換
• Penn2MaltとLTHでPTBを句構造構文木から依存構造に変換
• Penn2Malt• シンプルに構文木から依存構造に変換
• 12種類のラベル
• LTH (Johansson and Nugues, 2007)• 42種類のラベル
• 多数のラベルが意味処理に有効
2015/2/25On WordNet Semantic Classes and
Dependency Parsing8
句構造と依存構造
2015/2/25On WordNet Semantic Classes and
Dependency Parsing9
依存構造解析器
• MaltParser• 遷移型の解析器
• 左から右へ貪欲的に解析
• MST• グラフベースの解析器
• 文全体の係り受けを最適化
• Zpar• 遷移型の解析器
• 識別学習とビームサーチを行う
2015/2/25On WordNet Semantic Classes and
Dependency Parsing10
意味情報
• WordNet• 同義語の集合(synset)
• それぞれのSynsetはSF(Semantic File)に属する
• 例) knife• Synset: knife, cutter… ,SF:Artifact
• Clusters• 半教師あり学習で、ラベルなしデータからクラ
スタリング
• 例){apple, pear}{Apple, IBM}
2015/2/25On WordNet Semantic Classes and
Dependency Parsing11
実験
• ベースライン• 単語と品詞
• 追加する素性• WordNet、clusters
• それぞれの解析器で、それぞれの素性を試す
• 評価はLAS:ラベルあり依存関係正答率、およびUAS:ラベルなし依存関係正答率を用いる
2015/2/25On WordNet Semantic Classes and
Dependency Parsing12
句構造から依存構造への変換結果
• Penn2Maltで変換した結果
• LTHで変換した結果
クラスタはMSTにおいて有効2015/2/25
On WordNet Semantic Classes and Dependency Parsing
13
解析器の組み合わせ結果
• MaltBlenderを使用• 解析器の結果をマージするツール
Penn2Malt変換結果の解析結果
組み合わせが有効(意味情報は効果がない)
LTH変換結果の解析結果
意味情報が有効(組み合わせは効果がない)
2015/2/25On WordNet Semantic Classes and
Dependency Parsing14
意味情報の依存構造解析への影響
• 1つの障害は間違った品詞付与• 人手で付与したコーパスの間違い 27,300語
• 自動付与の間違い 29,386語
• 間違った品詞付与でも、スコアが向上• 意味情報が有効
2015/2/25On WordNet Semantic Classes and
Dependency Parsing15
意味情報の依存構造解析への影響
• MSTParser+SFの場合• 間違った品詞:0.21ポイント向上(正しい品詞
付与の結果と比べて)
• Clustersを追加すると• 品詞の正誤に関係なく0.91~1.33ポイント向上
• 意味情報と構文解析アルゴリズムに関係があると考えられる
2015/2/25On WordNet Semantic Classes and
Dependency Parsing16
まとめ
• ツリーバンクの変換方法2種類、係り受け解析3種類を用いて意味情報の依存構造解析への有効性を調査
• 意味情報を用いても、依存構造解析の性能向上はわずか
• 今後は語の意味情報をより精巧にまとめる必要あると考える
2015/2/25On WordNet Semantic Classes and
Dependency Parsing17