動詞項構造シソーラス・naist text corpusの紹介
Post on 11-Aug-2015
848 views
TRANSCRIPT
動詞項構造シソーラス(岡山大/竹内研)・
NAIST Text Corpus
動詞項構造シソーラス(岡山大/竹内研)● 項構造を推測可能な動詞辞書の構築
● 現在4425語(7473語義)– 語義を仮定し,語義ごとに表層格を整理して例文を記述– 動詞の語彙概念構造を詳細化した関係で結びつける– 深層格のレベルで多重に動詞の意味を分類して関係づける– 属性と属性値で整理することで汎用化
http://cl.it.okayama-u.ac.jp/rsc/data/index.html
意味の包含関係に基づく動詞項構造の細分類
Lexeed ID 単語 読み
20035550-4 抜ける ぬける
分類
【状態変化あり:主体の変化:属性変化:所属:引退】
半統制意味構造記述
([動作主]の働きかけで)([1]が[2]から引退し)[1]が[2]に所属してない状態 になる
表層格 意味役割 読み 項番号
がを・から
動作主起点
メンバーグループ
12
代表例文
メンバーがグループを抜ける
語義ごとの表層格
例文
階層的細分類5階層で940分類
NAIST Text Corpus
● 京都テキストコーパスで利用されている● 毎日新聞95年1月1日から17日までの全記事(約2万文)● 1月から12月までの社説記事(約2万文)
計約4万文に対して,● 述語と表層格(ガ格,ヲ格,ニ格)の関係● 事態性名詞と表層格(ガ格,ヲ格,ニ格)の関係● 事態性名詞の名詞クラス● 名詞句間の共参照関係● 指示連体詞・代名詞の照応関係
の情報を付与したコーパス.
● Bridging reference● 「(Aの)B」,Bが記述されておりAが省略されている場
合,その関係を「ノ」タグを用いて表す.
● 外界照応● 「一人称」,「二人称」,「一般」の粒度でタグを付与.
– 「一人称」は「私(新聞記事の場合は著者)」– 「二人称(新聞記事の場合は読者)」
● 「一般」は「一人称」,「二人称」以外の外界要素.