mt勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

14

Click here to load reader

Upload: takahashi-kanji

Post on 28-May-2015

71 views

Category:

Education


0 download

DESCRIPTION

機械翻訳のための換言事例の収集

TRANSCRIPT

Page 1: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

ー文献紹介ー

換言事例の収集-日英基本構文を対象として-

白井 諭、山本 和英ATR音声言語通信研究所

言語処理学会 第7回年次大会 発表論文集

長岡技術科学大学 自然言語処理研究室 高橋寛治

Page 2: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

はじめに●日英基本構文の対応付け

●日本語語彙大系の構文大系により14,000文ほど可能●問題点

●用言の種類および用言ごとの用法の網羅性●同じ意味を表すことが可能な表現の種類の多様性●構文における制約条件の記述

Page 3: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

網羅性の問題●人間用辞書と機械用辞書の性格の違い

●人間●目的とする語彙・用法がなければ、類義表現に言い換えて辞書引き

●機械●人間と同様の機構は困難●語彙・用法を網羅的に収録

Page 4: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

多様性の問題●機械翻訳の利点の1つである訳語の統一性に起因

●訳語の統一性は、場合により訳文の単調性を招く●多様化の手法として、後編集

Page 5: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

条件記述の問題●構文体系は解析用に設計

●「犬が子犬を生む」「猫が子猫を生む」●<動物>が<動物>を生む●ガ格とヲ格の名詞の相互の関連性が失われる

●人手で設計●抽象化にばらつきが生じることがある

Page 6: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

本稿では●検討の概要と言い換え文の収集状況を報告●検討:日英対訳用例文を題材

●日本文と英文の意味的対応を制約として、日本文の別の言い方の収集

Page 7: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

収集条件●従来

●構文体系の網羅性向上を主な狙いとし内省により例文作英

●本手法●網羅的な用例の収集●多様な用例の収集

Page 8: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

網羅的な用例の収集●2段階

●様々な用法を例文という形で内省により網羅●例文に基づいて抽象化

●生成した例文が自然な表現か●同じ作業者が時間が経ってから見直し・別の作業者と相互検査

●作業に条件を加える

Page 9: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

多様な用例の収集●1つの日本語表現に対する複数の英訳を得る

●→英語表現を換言と言える●ただし

●ある英語表現が必ず特定の日本語表現から生成されなければならないわけでもない

Page 10: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

多様な用例の収集●日英の対訳対の存在を前提として、換言事例を収集

●日本語の用言に対する日英の対訳例文対を対象とする●日本語の換言は、英文に多様な和訳をつけるつもりで行う●原則として、特殊な場面設定を必要としない中立的な表現を作成

Page 11: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

収集情況と考察●和語動詞の対訳換言例文

●J0 条件が揃った。●J1 条件が満たされた。●E0 The conditions were satisfied.●E1 The conditions were met.

●イ型形容詞の対訳換言例文●J0 その2つの三角形の面積は等しい。●J1 その2つの三角形の面積は同じだ。●E0 The areas of those two triangles are the same.

●ナ型形容詞の対訳換言例文●J0 私は彼の考えと同じだ。●E0 I have the same idea as he does.

Page 12: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

用言の種類と例文数●1〜3人年の作業量

Page 13: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

考察と今後の課題●作業の習熟度

●初期は習熟度が低い → 質や量が習熟度により異なる●動詞か形容詞か●一般的か慣用的か

●換言という観点から慣用的なものも網羅しておく必要あり●多義的か個別的か

●多義は例文作成数が多い。個別は例文生成が困難。●換言の程度

Page 14: MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

おわりに●日本語用言の多様な用法とその換言事例作成の現状を紹介

●経験を積み重ねながら作業形態を進化させているため初期に作成した例文には見直すべき点がある