20150225文献紹介 on wordnet semantic classes and dependency parsing

17
文献紹介 (2015/02/24) On WordNet Semantic Classes and Dependency Parsing 長岡技術科学大学 自然言語処理研究室 高橋 寛治

Upload: takahashi-kanji

Post on 20-Jul-2015

80 views

Category:

Education


1 download

TRANSCRIPT

Page 1: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

文献紹介(2015/02/24)

On WordNet Semantic Classes and Dependency Parsing

長岡技術科学大学 自然言語処理研究室

高橋 寛治

Page 2: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

文献について

• Bengoetxea, Kepa and Agirre, Eneko and Nivre, Joakim and Zhang, Yue and Gojenola, Koldo

• On WordNet Semantic Classes and Dependency Parsing

• Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), pp.649-655

2015/2/25On WordNet Semantic Classes and

Dependency Parsing2

Page 3: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

概要

• WordNet意味分類の依存構造解析への影響を調査• 意味情報の付与はどのような影響を与えるか?

• 3種類の解析器で影響を確認

• しかし、依存構造解析性能の向上はごくわずか

• 今後,WordNetの階層化を精巧かつ違う基準で行う必要がある

2015/2/25On WordNet Semantic Classes and

Dependency Parsing3

Page 4: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

WordNet

• 目的• 言語学および言語処理で使用する直感的な辞書とシ

ソーラスを作ること

• 内容• 英語の語彙の意味辞書(名詞,動詞,形容詞,副

詞)• 同義語をグループで分類(synset)• synsetを階層化したソーラス

• 1980年半ばから,プロジェクトが開始(プリンストン大学)

2015/2/25On WordNet Semantic Classes and

Dependency Parsing4

Page 5: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

はじめに

• 語彙の意味情報を英語の依存構造解析に用いた場合,何が有効か

• 様々な問題を設定• WordNetの意味情報は依存構造解析を向上させ

るか?

• 構文解析器の種類により,結果は異なるか?

• 意味情報を用いた構文解析器の組み合わせは有効か?

2015/2/25On WordNet Semantic Classes and

Dependency Parsing5

Page 6: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

関連研究

• 構文解析に使用するおおまかな2つの知識• WordNetのような巨大な意味資源を用いる方法

• コーパスから自動で取得した情報

• 意味情報の有効性を示す関連研究• Agirreらは、内容語に付与した階層化された意

味情報により、語彙を用いる手法を超える

• Kooらは{apple, pear}{Apple, IBM}のように語を自動クラスタリングし、依存構造解析への有効性を示した

2015/2/25On WordNet Semantic Classes and

Dependency Parsing6

Page 7: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

実験で使用するフレームワーク

• データセットの準備• PTB(Penn Tree Bank)を変換

• 依存構造解析器• MaltParser(Nivre et al., 2007)

• MST(McDonald et al., 2005)

• Zpar(Zhang and Clark,2008)

• 意味情報• WordNet

• Clusters(Koo et al.,2008)

2015/2/25On WordNet Semantic Classes and

Dependency Parsing7

Page 8: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

データセットの変換

• Penn2MaltとLTHでPTBを句構造構文木から依存構造に変換

• Penn2Malt• シンプルに構文木から依存構造に変換

• 12種類のラベル

• LTH (Johansson and Nugues, 2007)• 42種類のラベル

• 多数のラベルが意味処理に有効

2015/2/25On WordNet Semantic Classes and

Dependency Parsing8

Page 9: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

句構造と依存構造

2015/2/25On WordNet Semantic Classes and

Dependency Parsing9

Page 10: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

依存構造解析器

• MaltParser• 遷移型の解析器

• 左から右へ貪欲的に解析

• MST• グラフベースの解析器

• 文全体の係り受けを最適化

• Zpar• 遷移型の解析器

• 識別学習とビームサーチを行う

2015/2/25On WordNet Semantic Classes and

Dependency Parsing10

Page 11: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

意味情報

• WordNet• 同義語の集合(synset)

• それぞれのSynsetはSF(Semantic File)に属する

• 例) knife• Synset: knife, cutter… ,SF:Artifact

• Clusters• 半教師あり学習で、ラベルなしデータからクラ

スタリング

• 例){apple, pear}{Apple, IBM}

2015/2/25On WordNet Semantic Classes and

Dependency Parsing11

Page 12: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

実験

• ベースライン• 単語と品詞

• 追加する素性• WordNet、clusters

• それぞれの解析器で、それぞれの素性を試す

• 評価はLAS:ラベルあり依存関係正答率、およびUAS:ラベルなし依存関係正答率を用いる

2015/2/25On WordNet Semantic Classes and

Dependency Parsing12

Page 13: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

句構造から依存構造への変換結果

• Penn2Maltで変換した結果

• LTHで変換した結果

クラスタはMSTにおいて有効2015/2/25

On WordNet Semantic Classes and Dependency Parsing

13

Page 14: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

解析器の組み合わせ結果

• MaltBlenderを使用• 解析器の結果をマージするツール

Penn2Malt変換結果の解析結果

組み合わせが有効(意味情報は効果がない)

LTH変換結果の解析結果

意味情報が有効(組み合わせは効果がない)

2015/2/25On WordNet Semantic Classes and

Dependency Parsing14

Page 15: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

意味情報の依存構造解析への影響

• 1つの障害は間違った品詞付与• 人手で付与したコーパスの間違い 27,300語

• 自動付与の間違い 29,386語

• 間違った品詞付与でも、スコアが向上• 意味情報が有効

2015/2/25On WordNet Semantic Classes and

Dependency Parsing15

Page 16: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

意味情報の依存構造解析への影響

• MSTParser+SFの場合• 間違った品詞:0.21ポイント向上(正しい品詞

付与の結果と比べて)

• Clustersを追加すると• 品詞の正誤に関係なく0.91~1.33ポイント向上

• 意味情報と構文解析アルゴリズムに関係があると考えられる

2015/2/25On WordNet Semantic Classes and

Dependency Parsing16

Page 17: 20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing

まとめ

• ツリーバンクの変換方法2種類、係り受け解析3種類を用いて意味情報の依存構造解析への有効性を調査

• 意味情報を用いても、依存構造解析の性能向上はわずか

• 今後は語の意味情報をより精巧にまとめる必要あると考える

2015/2/25On WordNet Semantic Classes and

Dependency Parsing17