動詞項構造シソーラス・naist text corpusの紹介

6
動詞項構造シソーラス(岡山大/竹内研) NAIST Text Corpus

Post on 11-Aug-2015

848 views

Category:

Technology


2 download

TRANSCRIPT

Page 1: 動詞項構造シソーラス・NAIST Text Corpusの紹介

動詞項構造シソーラス(岡山大/竹内研)・

NAIST Text Corpus

Page 2: 動詞項構造シソーラス・NAIST Text Corpusの紹介

動詞項構造シソーラス(岡山大/竹内研)● 項構造を推測可能な動詞辞書の構築

● 現在4425語(7473語義)– 語義を仮定し,語義ごとに表層格を整理して例文を記述– 動詞の語彙概念構造を詳細化した関係で結びつける– 深層格のレベルで多重に動詞の意味を分類して関係づける– 属性と属性値で整理することで汎用化

http://cl.it.okayama-u.ac.jp/rsc/data/index.html

意味の包含関係に基づく動詞項構造の細分類

Page 3: 動詞項構造シソーラス・NAIST Text Corpusの紹介

Lexeed ID 単語 読み

20035550-4 抜ける ぬける

分類

【状態変化あり:主体の変化:属性変化:所属:引退】

半統制意味構造記述

([動作主]の働きかけで)([1]が[2]から引退し)[1]が[2]に所属してない状態 になる

表層格 意味役割 読み 項番号

がを・から

動作主起点

メンバーグループ

12

代表例文

メンバーがグループを抜ける

Page 4: 動詞項構造シソーラス・NAIST Text Corpusの紹介

語義ごとの表層格

例文

階層的細分類5階層で940分類

Page 5: 動詞項構造シソーラス・NAIST Text Corpusの紹介

NAIST Text Corpus

● 京都テキストコーパスで利用されている● 毎日新聞95年1月1日から17日までの全記事(約2万文)● 1月から12月までの社説記事(約2万文)

計約4万文に対して,● 述語と表層格(ガ格,ヲ格,ニ格)の関係● 事態性名詞と表層格(ガ格,ヲ格,ニ格)の関係● 事態性名詞の名詞クラス● 名詞句間の共参照関係● 指示連体詞・代名詞の照応関係

の情報を付与したコーパス.

Page 6: 動詞項構造シソーラス・NAIST Text Corpusの紹介

● Bridging reference● 「(Aの)B」,Bが記述されておりAが省略されている場

合,その関係を「ノ」タグを用いて表す.

● 外界照応● 「一人称」,「二人称」,「一般」の粒度でタグを付与.

– 「一人称」は「私(新聞記事の場合は著者)」– 「二人称(新聞記事の場合は読者)」

● 「一般」は「一人称」,「二人称」以外の外界要素.