記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... ·...

28
3 1.はじめに 文章で自らの考えを記述する課題を伴う授業 は大学教育において重要な位置を占める。この 場合教員は学生に記述式課題を提示し、学生は 与えられた課題について考察し解答を作成す る。その際、学生は参考文献を理解し、自分の 考えをまとめ、文書作成を通じて学習内容を定 着させ理解を確実なものにするとともに、レ ポートの書き方を学んでいく。 一方、多くの大学の一般入学試験において マークセンス方式が用いられることから、生徒 は大学入学まで積極的に長文を読み書きする練 習する動機がない。見本となる文書を十分に読 まずに文書を書くことは困難であるから、大学 における長文記述課題に取り組めない学生が多 くなっている。 これを裏付ける調査が独立行政法人・メディ ア教育開発センター(現 放送大学 ICT 活用・ 遠隔教育センター)により実施されている。こ の調査では、日本語・英語・数学の基礎学力を 測定するための「プレースメントテスト」を大 学生に実施した。その結果日本語力が中学生レ ベル以下と判定される大学生の割合が非常に多 いことが示された。2004 年に行われた調査で <論 説> 記述式課題における添削支援システム ―事例ベース推論によるアプローチ― 1.はじめに 2.関連研究 2-1 添削自体を自動化するアプローチ 2-1-1 誤り検出技術 2-1-2 誤り訂正支援技術 2-1-3 添削支援手法の課題 2-2 添削環境を効率化するアプローチ 3.事例ベース推論 3-1 概論 3-2 事例ベース推論の構成と処理過程 3-3 事例ベース推論の特徴 3-4 事例ベース推論の実例 4.事例ベース推論を用いた課題添削支援システム 4-1 システムの要件 4-2 レポート添削支援機能の概要 4-3 レポート添削支援システムの概要 4-4 事例ベースの構成要素 5.実際の授業の課題に適用した実行例 6.まとめ

Upload: others

Post on 21-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

3

1.はじめに

 文章で自らの考えを記述する課題を伴う授業

は大学教育において重要な位置を占める。この

場合教員は学生に記述式課題を提示し、学生は

与えられた課題について考察し解答を作成す

る。その際、学生は参考文献を理解し、自分の

考えをまとめ、文書作成を通じて学習内容を定

着させ理解を確実なものにするとともに、レ

ポートの書き方を学んでいく。

 一方、多くの大学の一般入学試験において

マークセンス方式が用いられることから、生徒

は大学入学まで積極的に長文を読み書きする練

習する動機がない。見本となる文書を十分に読

まずに文書を書くことは困難であるから、大学

における長文記述課題に取り組めない学生が多

くなっている。

 これを裏付ける調査が独立行政法人・メディ

ア教育開発センター(現 放送大学 ICT 活用・

遠隔教育センター)により実施されている。こ

の調査では、日本語・英語・数学の基礎学力を

測定するための「プレースメントテスト」を大

学生に実施した。その結果日本語力が中学生レ

ベル以下と判定される大学生の割合が非常に多

いことが示された。2004 年に行われた調査で

<論 説>

記述式課題における添削支援システム

―事例ベース推論によるアプローチ―

中 済 光 昭

目 次

1.はじめに

2.関連研究

2-1 添削自体を自動化するアプローチ

2-1-1 誤り検出技術

2-1-2 誤り訂正支援技術

2-1-3 添削支援手法の課題

2-2 添削環境を効率化するアプローチ

3.事例ベース推論

3-1 概論

3-2 事例ベース推論の構成と処理過程

3-3 事例ベース推論の特徴

3-4 事例ベース推論の実例

4.事例ベース推論を用いた課題添削支援システム

4-1 システムの要件

4-2 レポート添削支援機能の概要

4-3 レポート添削支援システムの概要

4-4 事例ベースの構成要素

5.実際の授業の課題に適用した実行例

6.まとめ

Page 2: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

4 駒澤大学経済学論集 第 44 巻 第 2 号

は 24 大学の 7353 人が受験した。その結果中学

生以下と判定された学生の割合は、国立大学で

6% だったのに対し、私立大学では 20% に達し、

短大では実に 35% となった。2006 年の調査で

は 66% が「中学生以下」と判定された大学も

あった [1]。また OECD による学習到達度調査

PISA[2] のデータを検討した結果、基礎学力に

ついては国際的に高いレベルにあるが、応用力

の不足や問題文の意味を把握する読解力が不足

していることがわかった。

 したがって現在の大学教育では、学生が書

いた文書を添削する過程で参考文献に基づい

た合理的な思考が出来ているかを指摘し、ま

た文の不具合を修正させる作業をたくさん繰

り返し、文書力を高めていくことが求められ

る。

 このように記述式課題の添削・評価は、大学

教育において重要な位置を占めるが、学生数が

多い授業では、十分な回数の添削および修正さ

れた文書の再添削が行い難い状況である。また、

採点においても最初提出された文書をおおざっ

ぱに眺め、おおよその採点基準を作り、採点す

るといったプロセスを踏んだとしても、最初に

採点した文書と後半に採点した文書では採点基

準がぶれることがある。

 この課題を解決するために、解答の間違いの

類型、使用者のコメント・評価などを XML1 に

より定義した事例ベースによるレポート添削支

援システムの設計・試作を行ってきた [53]。本

論文では、このシステムに適用した解答の文法

エラー、誤字・脱字への対応の改善について説

明する。

 本論文の構成は次のようである。まず 2 章で

は関連研究を示す。次に 3 章で事例ベース推論

について概説する。4 章では添削を効率的に行

うための事例ベース手法を提案する。5 章で提

案手法を実際に適用した例を説明する。最後に

6 章で本論文をまとめる。

2.関連研究

 これまでにさまざまな添削支援手法が提案さ

れてきた。添削の効率化という観点から見ると、

添削自体を自動化するアプローチと添削環境を

整備するアプローチがある。前者の研究として

は文書校正支援などの研究をはじめとして古く

から多くの研究がある。

 後者の研究としては、オンラインの作文支援

環境を構築する研究、添削結果のデータベース

を構築し教育に活用するための研究などが行わ

れている。

 本章では、これらの研究について概観する。

2-1 添削自体を自動化するアプローチ [3]

 添削支援には、校正支援技術を適用すること

ができる。日本語の校正支援の技術には、文を

文字列として捉えデータ処理する方法 [6] と、

文を言語表現と捉え自然言語処理を適用する方

法 [4,5] がある。前者では、どんなデータをい

かに抽出し表示するかが問題になるのに対し

て、後者では解析の精度、すなわち、いかに解

析を誤らずに文の誤り部分を発見するかが問題

となる。

 誤りはその内容から、おおよそ以下の 4 つに

分けられる [14]。

誤字・脱字や不統一な表記

不統一な表現とあいまいな表現

不適切な内容や構成

記述内容の過不足や不正確さ

1 XML とは、個別の目的に応じたマークアップ言語群をつくるための仕様である。 マークアップ言語

とは、コンピュータ言語の一種で、文章の論理的な構造(段落など)や見栄え(フォントサイズなど)

に関する指定を、文章とともにテキストファイルに記述するための言語である。XML は、拡張可能

な言語の一つに分類されるが、その理由は、XML を使うことで使用者は自分たち自身で複数のタグ

を定義することができるからである。 XML の文脈におけるタグとは、文書の断片に意味を付加する

ためのしるしである。

Page 3: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

5記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

 これを添削支援の観点から分類すると、次の

ようになる [15]。

■ 表記レベルの誤り

■ 表現レベルの誤り

■ 内容レベルの誤り

 表記レベルの誤りは、当て字、送り仮名誤り、

誤用語、文法的に誤りとなる誤字・脱字などが、

表現レベルの誤りは、同音異義語誤り、助詞誤

り・脱落、悪文(意味が重複する語の利用、曖

昧な修飾関係など)などが、内容レベルの誤り

は、矛盾する数値、矛盾する文意、文意の誤り

などがある。技術的には、表記レベルの誤りお

よび表現レベルの誤りは、形態素解析技術や構

文解析技術の適用によって対応できる。内容レ

ベルの誤りでは、対象である内容に関する知識

による意味理解が求められる。

 ここでは、表記レベルの誤り、表現レベルの

誤り、内容レベルの誤りについて誤り検出技術

と誤り訂正技術の関連研究を概説する。

2-1-1 誤り検出技術

 まず、誤り検出技術の基盤となる関連研究と

して、形態素解析について説明する。

 形態素解析は、添削支援において基本となる

技術である。形態素解析では、文から切り出し

た単語(形態素)が属する品詞を、辞典を用い

て調べていき、結果として得られた品詞の並び

から文法的に正しい並びであるものを正解であ

るとするという方法を取る。一般的に多くの自

然言語には品詞の接続に制限が存在 2 する。こ

の性質を利用することによって単語の境界の判

別を行う。

●  正しい文を対象とした形態素解析

 文法的に正しい文を対象にした形態素解析技

術は、自然言語処理の基礎技術として早くから

研究が行われ、機械翻訳 [16]や文-音声変換 [17]

などに応用されてきた。処理の手順は以下に示

すとおりである。

1)仮文節の設定

 多くの場合、漢字と仮名で文節が構成され

ることに着目して、字種の変化部を手掛かり

に、仮の文節境界を設定する。

2)単語候補の辞書検索

 仮文節内で単語候補の右方向最長一致法

[19] などを用いて辞書と照合しながら抽出す

る。正解候補の抽出漏れと不要な多義の排除

とを調和させるため、単語の接続条件を考慮

しながら、漢字列・仮名列部分の可能な単語

候補を漏れなく検証する局所的総当り法 [20]

などを使う。

3)単語連鎖列の作成

 品詞などの接続条件が書かれた文法接続規

則表を用いて、単語候補の列から正解とみな

せる単語連鎖を作成する。漢字複合語の場合、

文法接続規則表による制約だけでは多義を絞

り込めないので、単語間の意味的係り受け解

析法 [20]、最長一致法 [21]、文節数最小法 [22]、

DP 照合法 [23]、単語共起要素法 [25] などの

多義解消法を併用する。

●  誤りを含む日本文の形態素解析

 添削支援の場合、通常の自然言語処理とは異

なり、正しい文だけではなく誤りを含む文の解

析が重要となる。形態素解析技術を添削支援に

適用する場合、解析の正確さが問題となる。文

の解析を誤ると、人間が添削を行う工程での確

認作業が増え、むしろ負荷が増えてしまう。新

聞記事の校正支援システムでは、正しい文の解

析失敗個数は、実際の誤り箇所の数より少ない

ことが求められている。

 また、誤りを誤りと検出できる精度の問題が

ある。正しい文を対象とした形態素解析をその

まま使用した場合、以下の問題が生じることが

2 例えば日本語では動詞のあとに格助詞をおくことはできない。

Page 4: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

6 駒澤大学経済学論集 第 44 巻 第 2 号

指摘されている。

正しい文対象の文法接続規則表では、

主に付属部で想定外の不当な単語列を

正解と判定してしまう。

自立部で誤りを含む箇所を短い単位の

不当な固有名詞や接辞として認定して

しまう。

辞書未登録を原因とした未知語と、解

析誤りによる未知語の発生が区別でき

ない。

 これらの問題に対し、校正支援システムでは、

次のような対応を採用する。

文法における接続判定

 付属語の列において、前方および後方の

二方向から接続判定を行うとともに、助詞

の品詞カテゴリを細分化して、ひらがな文

字の誤字・脱字が助詞候補として誤認定さ

れないようにする。

漢字複合語に関する制約記述

 漢字複合語の単語列に誤字・脱字が含ま

れると、解釈の際余った漢字が 1 文字の接

辞や名詞として認識されることがある。こ

れを避けるため、漢字複合語内の各単語の

出現位置、単語間の意味的な係り受け属性

などを単語辞書に記述して、この制約を利

用する。

利用者辞書の導入と収録単語の強化

 専門分野の用語などを登録できる利用者

辞書を用意するとともに、常用外漢字のひ

らがな表記見出し、カタカナ表記見出しな

どの単語を収録した辞書を用意する。

 次に、表記レベルの誤り検出について述べる。

●  繰り返し出現する誤りに関する検出

 繰り返し出現する誤りでは、誤りやすい表

記をあらかじめ辞書に登録しておき、それと

対比して検出する方法が用いられる。その際、

辞書には誤りの表記と正しい表記を対にして

登録しておけば、誤り発見後の訂正が容易で

ある。

 しかし、誤り検知規則として辞書に登録した

名詞の読みと同じ読み、かつ異なる漢字表記を

持つ名詞を誤りと判定してしまう問題がある。

この問題を避けるため、誤り検知規則の適用を

厳密にし、形態素解析と組み合わせた判定を行

う必要がある。

 誤り検知規則の適用条件を厳密にするには、

適用対象表現の文法的・意味的情報などの詳細

な記述が求められる。

●  単発的な誤りに関する検出

 単発的な誤りにも、予想のつくものと予想の

つかないものがある。前者に対しては、あらか

じめ登録しておくことが出来ないため、形態素

解析によって解析に失敗したところに誤りが存

在すると仮定して、誤りを発見する方法を適用

する。

 ある程度予想のつく誤りでは、それぞれ個別

に対策がとられる。以下にその例を示す。

ルールによる数詞表記のチェック

 数詞の表記では、算漢混合(一億4千万)

や桁誤り(五万兆)、位取り誤り(10,00)、

矛盾表記(“1”、“2.3”)などは容易に検

出できる。その他括弧の非対応などの書式

の誤りのチェックも容易である [29]。

カタカナ表記ルールによるチェック

 カタカナ表記には、タイプミスなどで多

様な誤りが出現する。このチェック方法と

して、変形ルールで表記を同形化し、一致

する原表記を誤りと検出する手法 [30] やカ

タカナ表記を母音列と子音列に分解し、子

音列同士、母音列同士で標準表記との類似

性を比較する手法 [31] などがある。

Page 5: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

7記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

単語の文法的接続チェック

 単語が複合語を形成する場合に出現でき

る位置を単語辞書に登録しておき、誤っ

た位置の単語を検出する。例えば、「人問

性」の「問」は複合語の中間に来ることが

ないため、誤りが検出できる。文節末尾と

次文節頭間についても、同様に文法的接続

チェックを行う。

 続いて、表現レベルの誤り検出について述べ

る。

 自然言語処理の応用の観点からみると、表記

レベルの誤りは、形態素解析技術により処理で

き、自動的に正誤チェックできるものが多い。

これに対して表現レベルの誤りでは、構文解析

や意味解析などの技術が必要であるが、特に意

味解析において正誤チェックは容易ではない。

●  文節内の誤りチェック

 文節内で誤りを検出する技術としては、以下

のものがある。

混ぜ書き語の送り仮名チェック

 送り仮名は後方に来る単語の品詞や名詞

の属性に依存して規則化される。例えば「振

込み」という単語の後方に「を」が接続す

る場合には、「振込みを」となるが、「方法」

が接続する場合には、「振込方法」となる。

このようなルールに基づいたチェックが実

現されている。

複合語内単語の意味的接続チェック

 複合語内で 1 文字の固有名詞や一般名詞

が係り受け関係を有せず存在する場合、誤

字の可能性が高い。この特性を使って誤り

チェックを行う。

同音異義語のチェック

 同音異義語とその前後に接続が可能な名

詞の意味属性を登録した連接判定テーブル

を使用して同音異義語の誤りを検出する方

法がある [32]。

●  文節間の関係に着目した誤りチェック

 文節間の関係から誤りを発見するには、文節

間の関係を解析する構文解析技術が基本とな

る。

助詞の用法の誤りチェック

 助詞の用法誤りは構文解析によって発見

するのが普通であるが、特定の助詞に限定

し、その助詞固有の性質に着目して用法の

誤りを発見する試みも行われている。

悪文のチェック

 悪文と言われる文には、長すぎる文や埋

めこみ構造が複雑でわかりにくい文などが

ある。この判定は人間でも差が出るもので

あり、現在試みられている方法も十分なも

のではない。

 最後に、内容レベルの誤りチェックについて

述べる。

 内容上の誤りをチェックするには、一般常識

や記述された対象に関する専門知識などを使用

した知識処理の支援が必要となる。新聞の記事

校正において、固有名詞が表す対象の実在性

チェックを行う事例がある。この事例では、実

在する主な人名・地名・企業名などを辞書に登

録し、形態素解析の未知語検出機能と組み合わ

せて実在しない固有名詞を検出している。

2-1-2 誤り訂正支援技術

 ここでは、誤り訂正支援技術について述べる。

 検出した誤りには、自動訂正が可能なものと

自動訂正が困難なものがある。前者ではシステ

ムが誤り部分を訂正するが、後者では可能な限

り訂正候補を提示する。

 まず、表記レベルの誤り訂正について述べる。

●  繰り返し出現する誤りに関する検出

 誤り表現と正規表現を対にして辞書に登録し

ておき、該当する誤りが検出されたとき、正規

表記に置き換える [35]。この方法は、誤りの発

見と同時に正解が得られるため、単純ではある

Page 6: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

8 駒澤大学経済学論集 第 44 巻 第 2 号

が効果の大きい方法である。

●  単発的な誤りに関する検出

 単発的な誤りのうち、数値表記ミスや括弧な

どの非対応は、書き換えルールで訂正できる。

それ以外の誤りは、文法的に接続失敗した箇所

で検出された未知語をキーとして、前後の単語

の品詞などを手掛かりに以下のようにして訂正

候補が作成される [35]。

カタカナ・英字用語辞書の照合

 辞書から誤り単語の文字ごとに連想され

る単語を抽出して評価する連想統合型照合

法 [37] により類似度が高い単語を検索し、

文法的あるいは意味的な接続関係を満たす

候補を選択する。

文法的・意味的接続関係による訂正候

補の作成

 漢字二文字単語が多い点に着目し、一文

字の漢字未知語からその漢字を含む二文字

単語を抽出し、文法的あるいは意味的な接

続関係を満たす候補を選択する。例えば、

「検察する」は、検□あるいは□察(検索、

考察など)という名詞を選択するほか、動

詞の語幹文字をキーに活用語辞書を検索し

て接続可能な送り仮名を提示する。 

マルコフ連鎖モデルによる訂正候補文

字の抽出

 大量の文を対象にあらかじめ文字の連鎖

確率を計算しておき、誤り文字の前後の数

文字に着目して、確率的に接続の可能性が

高い文字を訂正候補として提示する。この

方法は、かな文字列に比べて漢字かな文字

列で効果が大きいこと、また一重マルコフ

モデル(2 文字連鎖)に比べ、二重マルコ

フモデル(3 文字連鎖)の効果が大きいが、

次数を上げても漢字かな文での効果は頭打

ちになることなどが知られている [38]。

 次に、表現レベルでの誤り訂正について述べ

る。

● 複合語内同音異義語誤りに対する訂正候補

 訂正候補を、意味属性関係を使用して検査し、

条件が満たされる単語を選択する。例えば、「甘

受性」を「感受性」に変更するなどである。

● 文節間の誤りに対する訂正候補

 文節間の文法的・意味的関係から発見された

誤りは、不適切表現といえる。修飾関係の曖昧

さを検出した場合に、利用者に修正案を提示す

る方法 [39] が研究されているが、訂正は必ず

しも検出された部分に限定されないため自動的

に訂正するのはかなり困難である。

 この種の表現の訂正を、構成ではなく推敲の

問題とみる立場から文の改良と品質評価を試行

錯誤することによって、質のよい文を生成しよ

うとする試みがある [40]。

 さらに、改良後の品質の評価を人に任せ、不

適切と判断された場所ごとに、その理由と改良

候補を示し、人手を支援する方法が実現されて

いる [41]。この場合、修正項目の順序が計算コ

ストに大きく影響を与えるため、形態素解析で

処理できる誤りは構文解析に先立って訂正され

るなど、負荷の軽い処理を優先して実行する。

例えば、長文では形態素解析の結果から複文や

十分を構成する各短文相互の接続構造が決定さ

れ、適切な位置での分割や接続語の補完が行わ

れる [42]。この結果、長文は構文解析処理に入

る前に適切な長さの文に分解され、後の処理の

負荷が少なくなる。

2-1-3 添削支援手法の課題

 ここでは、添削支援手法の課題について述べ

る。

● 単語の境界判別の問題

 単語の境界を判別することは添削支援の基礎

となる技術である。しかし、単語の境界判別を

正しく行うためには与えられた文以外の様々な

知識、情報が必要となる場合があり、そのため

解決が困難である。

 たとえば「うらにわにはにわとりがいる」と

Page 7: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

9記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

いう文には、以下の様に意味的には受け入れら

れないものも含む文法的に正しい異なる読み方

が存在する。

裏庭 / には / 鶏 / が / いる

裏庭 / には / 二 / 羽 / トリ / が / いる

裏 / に / ワニ / は / 鶏 / が / いる

裏庭 / に / 埴輪 / 取り / が / いる

 上記最後の文の意味解釈は、" 埴輪取り " と

呼ばれる人あるいは物が存在するという状況で

は意味的に成り立つが、一般には受け入れられ

ない。それは " 埴輪取り " というものが実際に

は存在しないという経験的な知識による人間ら

しい判断である。コンピュータを用いた解析で

は、文法や単語の辞書的データを超えるような

常識も導入する場合、膨大な知識を用意する必

要があり、現実的ではない。この文の様な例で

は、正解を得るために、その文がおかれている

文脈や書き手の意図等の背景をくみとらねばな

らない。

● 品詞判別の問題

 品詞判別の困難さは、本論文の中心的なテー

マである日本語よりも英語で顕著である。たと

えば単語 "time" は「時間」という名詞としての

意味のほかにも「○倍する」という動詞として

の意味もあるため、これをどちらの意味にとる

かによって文の文法的構造や導かれる意味が

まったく違うものになってしまう。

 品詞を見分けることは、形態素解析の次のプ

ロセスである構文解析にとって非常に重要であ

る。英語では品詞の種類が文の構造と密接に関

連しているため、これらを同時に行う方法も研

究されている。

● 柔軟な文法の問題

 話し言葉や電子メールなどで使われる言葉

は、形式化された文法による日本語からかけ離

れたものが多い。たとえば「そんなことは無理

でしょう」が「んなことムリっしょ」に変化し

うる。また電子メールなどでは形態素解析に用

いられる辞書には載っていない略語やスラング

が使われていることも多い。

 また、こういった文は校正が不十分なため、

書き手の誤りが入っている場合が多くある。し

かも、こういった誤りが繰り返されれば正しい

用法とみなされる場合すらある。このような文

に対応した解析手法を頑健な解析と呼ぶ。この

ような文に対応するためには、正しい文が入力

されるという前提の設計に基づく現在の形態素

解析の手法を、誤りが含まれる様な文にも対処

可能なように根本から見直す必要があるが、言

語資源の不足のためあまり研究はされていな

い。

2-2 添削環境を効率化するアプローチ

 ここでは、添削の負荷を軽減するいくつかの

事例を説明する。

 TEachOtherS は、Web 上で動作する作文支援

システムである [43]。TEachOtherS の特徴は、

学習者・教師・システムが作文に関する知識を

互いに教授しあうという「相互教授モデル」に

基づいて、学習者の作文支援を行うことにある。

知識教授の例としては、学習者同士の相互添削、

学習者による作文構造のマークアップ(システ

ムへの教授)、システムによる作文チェックが

ある。TEachOtherS では、(a) 教師による授業、

(b) 作文、(c) 学習者同士の相互添削、(d) 教

師による学習者へのフィードバックというプロ

セスを経て実施される。(d) をどのように実施

するかは教師の方針に依存するが、作文結果を

教師が分析して、授業で一括して学生にフィー

ドバックするか、個々の作文を添削する方法を

想定している。ここで扱うのは、(c) の学習者

同士の相互添削と、(d) の教師による添削を「効

率的」に行うことである。以上のように、相互

教授モデルにおける添削とは、主として学習者

間の相互添削である。相互添削のモデルにおけ

る役割は、( i) 作文知識を他人に教授すること

により、学習者の自発的学習を促進させること、

(ii) 意味的な不整合など、システムでチェック

することが困難な誤りを添削することである。

 日本語教育のためのネットワーク型添削支援

Page 8: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

10 駒澤大学経済学論集 第 44 巻 第 2 号

システム [44] では、非同期に学習者と教員が作

文のやりとりを行い日本語の学習を行う。学習

者は文書作成ソフトを用いて作文を行い、メー

ルで教員に作文を提出する。教員はシステムの

添削ツールで作文を読み込み、添削作業を行う。

教員は添削が終わるとメールで添削データが付

加された作文を学習者に返却する。学習者はシ

ステムの閲覧ツールで添削データが付加された

作文を読み込み、添削箇所を確認する。

 インターネットを利用したレポート添削シス

テム [45] では、提出者は適当なアプリケーショ

ンソフトを用いてレポートを作成する。そして

提出者はレポートを PostScript 形式のファイル

に変換する。提出者はそのファイルをメールや

FTP で教員に提出する。教員は受け取ったレ

ポートをシステムの添削ツールで添削し、添削

データのみを提出者に返却する。そして提出者

はシステムの重ね合わせツールで添削データと

レポートを重ね合わせ添削箇所を確認する。

 前節で述べた誤り検出技術をすべて適用して

も、現実の文書の誤りを漏れなく検出すること

は困難である。そこで音声合成による支援が試

みられる。従来、新聞社などの人手校正では二

人一組での読み合わせ作業により、校正漏れを

防止する工夫が行われてきた。この仕組みを校

正支援システムに取り入れ、コンピュータが人

に代わって読み上げた音声で校正作業を支援す

るシステムがある [34]。このシステムでは、入

力された文から、校正読みにあわせた音韻情報

とポーズやアクセントの韻律情報が生成され、

合成音声機能を介して朗読音声が出力される。

校正読みは、同音・類音語を読み分ける、句読

点、特殊記号などを読むなどの点で、自然読み

と異なる。

 以上、添削環境を整備するアプローチを概観

した。これらは、添削者の作業効率を工場させ

ることができるが、添削そのものに対する負担

が軽減されるわけではない。

 さらに、添削によってレポートの提出が複数

回にわたる場合、学生のレポート提出状況、添

削状況の確認などレポートの管理の負担が増大

する。また、科目を複数教員が分担する場合レ

ポートの管理、合格基準、採点基準の統一が難

しい。

3.事例ベース推論

 2-1で述べた自然言語処理による添削支援

は、形態素解析などの自然言語処理技術で処理

可能なものについては強力に機能するが、日本

語の文構成の自由度が高いこと、誤った文を修

正することの難しさなどの問題から、ほぼ正し

い文のミスを校正する用途以外での応用が難し

い。このような問題を克服するため、事例ベー

スによる推論の適用を考える。 

 本章では、事例ベース推論の概要、処理過程、

適用事例について説明する。

3-1 概論

 本節では、事例ベース推論(Case-Based

Reasoning)について述べる。添削に関するノ

ウハウをコンピュータ上にプログラムして添削

支援システムを構築しようとすると、さまざま

な困難な問題が存在する。その理由は、それら

ノウハウの多くは、まだ分析方法や解決方法が

定式として定められないものであり、そのよう

なノウハウをアルゴリズムに変換することが困

難だからである。このような分野に対して、非

常に強力なパラダイムとして知識情報処理の分

野から提案されたものが事例ベース推論であ

る。

 1980 年代に入ると、コンピュータ性能の飛

躍的な向上が追い風となり、知識情報処理の確

立を目指して多くのエキスパートシステム 3 が

構築された。エキスパートシステムで使われて

いる技法はルールベースシステムである。構築

しようとする対象領域の知識を「もし、X なら

ば Y せよ」という形の IF-THEN ルールを専門

家からインタビューして抽出して知識ベースに

格納しておき、解くべき問題が与えられると、

3 ある分野における専門知識(判断規則や事実など)を体系的に蓄積して推論規則を適用することで、

蓄積されている既知情報から未知の判断や知見を導き出すコンピュータ・システムのことである。

Page 9: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

11記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

推論エンジンが知識ベース中の適当なルールを

実行して問題を解決する。ところが、多くのエ

キスパートシステムが構築されたのにもかかわ

らず、実際に使われているシステムの数は非常

に少ない。その主な理由は次の 2 つである。

 1 つめは、専門家の持つ知識をルールの形で

抽出したためである。専門家は、自分の頭の中

に IF-THEN ルールの形で知識をもっているわ

けではない。それを無理に IF-THEN ルールの

形で抽出するので、そこには無理や抜けが生じ

てしまい正しくルール化できないことになる。

あるいは、そのようなルールの抽出に非常にコ

ストがかかることになる。さらには、それらルー

ルの保守の負担が過大になる。

 2 つめは、いかに工夫を凝らした知識の記述

方法や推論方法を導入しても「知識ベースに書

かれていないことには答えられない」という弱

点を持つことである。専門家の知識を前もっ

て IF-THEN ルールの形で入力しておかないと、

エキスパートシステムは正しい推論を行なえな

い。 一方で、人工知能が対象とする応用問題

は一般に複雑なので、設計者が前もって起こり

うるすべての可能性を挙げることができない。

 エキスパートシステムが持つこれらの課題に

対する1つの解として、事例ベース推論を捉え

ることができる。事例ベース推論の源流は、エー

ル大学の Schank らのグループによる記憶と想

起に関する認知科学モデルに求めることができ

る。Schank は、エキスパートシステムを実現

する道として、専門家の経験則を利用する方法

と専門家のエピソード的記憶を利用する方法の

二つがあるとし、前者の欠点は知識の再構成に

あると述べ、エピソードの記憶と想起が動的に

変化していく自己組織的システムの実現が必要

であることを論じている [48]。Schank らは、専

門家は過去の自分の経験にもとづいて、過去の

類似の経験から類推して与えられた問題を解く

ことが多いと仮定する。社会に存在する知識は、

ルールの形で書ける知識と経験事例の形で保存

される 2 種類がある。例えば、法律の分野では

法律はルールの形で記述されているが、判例は

過去の判決事例、すなわち経験事例の集合であ

る。また、数学の教科書では定理はルールの形

で形式的に記述され、その後にその定理を使う

例が示される。言語の辞書には、単語の意味の

定義が一般的な記述で書かれ、その次にその単

語を使った用例が載っている。

 事例ベース推論は、Schank らの仮説に基づ

いて過去の類似問題の解法に基づいて新たな問

題を解く手法またはその過程である。一般的に

は、問題と解答のペアの形式で蓄えた事例を用

いて問題を解く推論方式である。解こうとして

いる問題に似た事例をデータベースから検索

し、それを修正して解答を得る。

 事例ベース推論は、知識を「IF-THEN 」のルー

ル形式で記述するのが難しい場合に有効な推論

方式である。エキスパートシステムの多くは、

上述の通りルールを使って推論を進めるルー

ル・ベース推論を採用している。この方式は対

象となる問題の専門家にインタビューしてルー

ルを抽出する作業が難しく、開発・保守する上

でネックになる。事例ベース推論を使うと、ルー

ルを作成する代わりに事例を集めてデータベー

スに格納しておけば済むので、この問題点を解

決できる。

  事 例 ベ ー ス 推 論 の 基 本 原 理 は、 類 推

(Analogical Reasoning)である。類推の研究と

しては、因果関係の保存に基づく類推、構造写

像理論 に基づく類推、部分同一性に基づく類

推などがよく知られているが、事例ベース推論

に影響を与えてきたのは Carbonell の誘導類推

[49](Derivational Analogy)である。誘導類推は、

過去の経験を新たな問題状況に移行するという

ことによって問題解決を行うものである。

 事例ベース推論では、特定の問題とその解決

方法の対からなる過去の事例が多数事例ベース

に格納されている。解くべき問題を与えられ

ると、過去の事例からその問題に類似のもの

をもってくる。解くべき問題と選択された過

去の問題の間の差を調べ、その差に対応して選

択された事例の解決方法の部分を変更し、それ

を与えられた問題に対する解決方法として出力

する。事例ベース推論の性能は事例ベースの大

Page 10: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

12 駒澤大学経済学論集 第 44 巻 第 2 号

きさと内容に依存する。また、過去の類似の事

例をみつける為の類似度の計算手法にも依存す

る。

3-2 事例ベース推論の構成と処理過程

 本節では、事例ベース推論の一般的な構成と

処理過程について述べる。

事例ベース推論を実現するための一般的な構成

要素は以下の通りである。

◆ 事例ベース

特徴づけられた問題解決事例の集まり

であり、成功事例だけでなく失敗事例

も含まれる。

◆ 問題解決器

特徴づけルールによって問題の特徴づ

けを行うとともに、予想される問題点

を列挙する。

◆ 事例検索器

与えられた問題の特徴と比べて、最も

よく照合する事例を事例ベースから検

索する。

◆ 事例修正器

検索された事例と問題の間で照合しな

い部分の違いを考慮しながら、領域知

識を使って、事例の解に対し修正を施

し、与えられた問題の解とする。

◆ 事例修復器

検索された事例の問題への適用に失敗

した場合、領域知識または別の事例を

使い、失敗の原因を解析して、同じ過

ちを回避するように、該当する特徴づ

けルールを変更する。さらに、修復ルー

ルによって失敗事例を修復することが

できれば、これを与えられた問題の解

として出力する。

◆ 事例格納器

事例ベース推論による問題解決は、そ

れ自身を新しい事例の獲得とみなし、

特徴づけを行ったうえで、成功事例と

して事例ベースに格納される。同様に、

失敗事例も事例ベースに格納される。

事例ベース推論のおおまかな処理は、

1)前もって問題の特徴を表すインデックス

(指標)を定義する。

2)解こうとする問題を分析してインデック

スを抽出する。

3)問題と事例がどの程度似ているのかを表

す「類似度」をインデックスを使って計算し、

最も似た事例を検索する。

4)その事例を解こうとする問題に合うよう

に修正する。 

となる。事例ベース推論の推論過程は次の 4 段

階のプロセスとして説明できる。

1)検索

問題が与えられると、記憶の中からそれを解

くのにふさわしい事例を検索する。1 つの事

例は、問題とその解法からなり、その解法が

どのようにして導き出されたかという注釈が

あるのが一般的である。

2)再利用

検索された事例から与えられた問題の解法へ

のマッピングを行う。新しい状況に合うよう、

解法を適用される必要があるかもしれない。

3)修正

マッピングができたら、その新しい解法を実

際に試して、必要ならば改良を加える。

4)記憶

新たな問題にうまく適応した解法が得られた

ら、その経験を新たな事例として記憶する。

 すなわち、事例ベース推論の推論過程では、

解くべき問題が与えられると最も適合した事例

が事例ベースから取り出され(検索フェーズ)、

それが問題に応じて適応 / 修正(再利用/修正

フェーズ)され、与えられた問題の解決案とし

て提示される。提示された解決案は実際に与え

られた問題に適用して評価され、その結果成功

したときには「新しい事例とその解決方法」と

して事例ベースに格納される(記憶フェーズ)。

 また、失敗した時には失敗した理由が解析さ

Page 11: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

13記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

れ「新しい事例と誤った解決方法と過ちを繰り

返さないためのインデックス」が事例ベースに

格納される(記憶フェーズ)。事例ベース推論

では、与えられた問題に類似な過去の事例を検

索することが重要であり、それは類似度の評価

尺度に依存する。類似性は個々の特徴が似てい

ることよりも特徴間の関係、特徴の有無等が重

要なことが多い。適応フェーズは、両者の差を

見い出すこと、古い解を適応することからなる

が、このフェーズも適用領域・分野に大きく依

存する。

 上述のように事例ベース推論では、新しい問

題が与えられると、その解法に成功するにして

も失敗するにしても、常にその結果をシステム

の事例ベースに加えていく。失敗した時には 2

度と同じ間違いをしないように失敗事例として

事例ベースに格納しておく。ある問題が与えら

れた時に、失敗事例が検索されたときは、その

失敗事例を再利用してはならないことがわか

り、別の事例を利用する。つまり事例ベース推

論では「学習」を前面に押し出してはいないが、

知識獲得の仕組みを 1 つのフェーズとして内在

しているので、事例ベース推論は推論過程と学

習過程が融合している手法だと言える。このこ

とは、これまでの知識処理システムが推論過程

と学習過程を明確に分離していたことと大きく

異なる。

3-3 事例ベース推論の特徴

 経験記述をもとにした事例ベース推論が、エ

キスパートシステムのような従来のルールに基

づく推論に対して持つ特徴としては以下が挙げ

られる。

知識は自分の経験の形で表現すれば良

いので、エキスパートから知識エンジ

ニアへの知識の伝達が容易になる。

実世界は非常に複雑なので、それを

ルールの形で記述するのは無理があ

る。その点、事例はどのような問題領

域でも常に与えられる。

ルール形式では、知識がバラバラにさ

れてルール化されるのでまとまった経

験知識を表現しにくい。 またルール

には、ある解法の理由やその因果関係

といったものを書きにくいが、事例の

形態を知識の基本単位とした時にはそ

れらが自然に埋め込められる。

「知識ベースに書かれていないことに

は答えられない」というエキスパート

システムの弱点に対しては、知識操作

の技法に必要以上にとらわれるのでは

なく、大量の過去の実例データを保存

しておき、問題を与えられると過去の

実例の中から近いものを取りだし複数

の近似解を補間し部分的に修正して、

与えられた問題の解とみなすという手

法が注目されている。この手法では、

与えられた問題がそのシステムにとっ

て初めて見るものであっても、システ

ムが過去の実例を使って近似解を作っ

てしまうので、上記知識処理システム

の弱点に対する 1 つの解決案となって

いる。

大量のデータをニューラルネットワー

ク 4 に与えてトレーニングを施すと、

未知のデータに対しても良い応答をす

ることが可能になる。ニューラルネッ

トワークを使った応用の成功例がい

ろいろな分野で報告されている。事

例ベース推論もこのパラダイムに属

しており、エキスパートシステムの弱

4 ニューラルネットワークとは、脳の神経回路網における計算方式をコンピュータで模倣するもので

ある。ニューラルネットワークの特徴は、学習と並列処理であるが、学習とはあらかじめ用意され

た学習データに基づいて、ある入力が入るとその入力に対応する出力が得られるようにネットワー

クの結合係数の値を学習することである。

Page 12: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

14 駒澤大学経済学論集 第 44 巻 第 2 号

点を克服している。一般に事例ベース

推論のアプローチと呼ばれるものは、

ニューラルネットワークや情報理論型

アプローチのように構造を持たない生

のデータをそのまま扱うのではなく、

構造を持ったより複雑なものを過去の

事例として扱っている。また、前者が

領域知識を使わないのに対し、事例

ベース推論ではシステムが豊富な領域

知識を持つことを前提にしている。

事例ベース推論には、適用領域・分野

に向き / 不向きがある。数式やルール

の形態で知識を表現できる分野に事例

ベース推論を適用するのはあまり意味

がない。一般には、適用領域の問題解

決方法が明確に定義できないが、解決

事例は数多く容易に得られるという分

野に向いている。

推論は複雑でルール化しにくいが解の

形がとても簡単な応用領域(例えば

ローン適用や故障診断)では、入力の

形が似ていれば出力も似てくる。この

ような性質を持つ分野ならば、事例

ベース推論でなく統計的手法などの方

がうまくいくことも多い。

3-4 事例ベース推論の実例

 事例ベース推論は、事例における解の誘導過

程を変換して、問題の解を再誘導することを基

本としていることから、計画や設計などの合成

に基づく問題のモデルに適しているといえる。

 例えば、知的設計支援の一つのアプローチは

理論や経験により得られる知識を抽出・整理し

て知識ベースを構築し、それを用いた推論を行

うことである。しかし、そのような知識の抽出、

整理自体が自明でなく容易でない場合も多い。

このタイプの問題を解決するもう一つのアプ

ローチとして、設計事例を記録・蓄積し、新た

な設計を行う際に、関連する過去の事例を検索、

参照して利用したり、事例の分析により設計知

識を摘出したりする事例ベース推論がある。

 弁護士が裁判で判例に基づく主張を展開する

ことも一種の事例ベース推論である。技術者が

自然界にあるものを模倣するのも、自然を問題

解決のデータベースとしていると見ることがで

きる。

 このように事例ベース推論は類推を突き詰め

たものと言える。事例ベース推論は自動推論の

強力な手法というだけではなく、人間が日々の

問題解決のために広く行っていることである。

この考え方を推し進めると、全ての推論は過去

の事例に基づいているとも言える。これは、認

知科学のプロトタイプ理論 5 の方法論である。

 これまで開発された事例ベース推論による応

用システムの概要は以下のようになる。

 CASEY[50] は患者の症状の記述が与えられる

と、それを解析して患者の心臓疾患の症状の間

の因果関係を生成するプログラムである。 

 CASEY が内部にもつ知識としては、既に診

断がされた患者の症状 45 例と詳細な心臓疾患

に関する因果関係モデルである。45 個の事例

のそれぞれの表現は、患者の症状を表す 40 の

属性とそれに対する診断内容の組で表されてい

る。属性としては、特定の症状、テストの結果、

履歴、現在施している治療方法等が含まれる。

また診断内容としては、患者の症状の因果関係

の説明と推奨する治療方法とその予測される結

果が含まれる。CASEY の処理の大まかな流れ

は、以下のようになる。

5 人間が実際にもつカテゴリーは、必要十分条件によって規定される古典的カテゴリーではなく、典

型事例とそれとの類似性によって特徴づけられるという考え方である。認知言語学の基本的なテー

ゼのひとつである。 たとえば「鳥」という語から想起されるのはカラスやスズメなどの空を飛ぶ小動物であり、ダチョ

ウやペンギンなどは典型事例から外れている。典型性の差にもとづく現象は一般にプロトタイプ効

果と呼ばれる。

Page 13: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

15記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

1)新しい患者の症状が外から与えられる。

2)CASEY は、その症状に似ている事例を

見つける。

3)症状とその事例の間の差分を解析し、そ

れらの違いを評価する。 もしその差分が重

要なものならば検索した事例を破棄する。

4)もし検索された事例が 1 つもなけれ

ば、通常のエキスパートシステムプログラム

(Heart Failure Program;HFP)に制御を渡す。

そうでなければ、検索した類似事例の診断部

分を与えられた入力に対応するように修正す

る。

5)新しい症状と診断の結果を事例ベースに

加える。そのとき、重要な特徴をインデック

スとして残しておく。

 事例ベース推論を実行する際に問題になるの

は、類似度の定義と得られた類似事例の解答を

目的の問題に合わせるための修正の仕方であ

る。汎用的な方法はないため、開発するシステ

ムごとに決めなければならない。

 事例ベース推論は、機械学習におけるルール

獲得アルゴリズムに似ている。ルール獲得アル

ゴリズムと同様、事例ベース推論 はいくつか

の事例から出発する。検索された事例と与えら

れた問題の間で共通性を識別することによっ

て、暗黙のうちに事例を一般化する。

 例えば、素うどんのレシピがきつねうどんに

マッピングされる場合、めんをゆでるという基

本を踏襲するという判断がなされ、暗黙のうち

にめんをゆでるときの一連の状況が一般化され

ている。しかし、事例ベース推論での暗黙の一

般化とルール獲得での一般化での重要な違い

は、一般化がどの時点でなされるかという点で

ある。ルール獲得アルゴリズムは、解くべき問

題が与えられる前に訓練例から一般化を行う。

すなわち、先行一般化である。この方式では、

訓練例として素うどん、きつねうどん、てんぷ

らうどんのレシピがルール獲得アルゴリズムに

与えられると、訓練時にあらゆるうどんを作る

ための汎用ルールを導き出す。それは月見うど

んを作るという問題を与えられた時点ではな

い。このようなルール獲得アルゴリズムの問題

は、訓練例から一般化する方向性が間違ってい

る可能性があること、あるいは一般化が不十分

な可能性があることである。一方、事例ベース

推論では一般化を実際に必要になるまで遅らせ

る。つまり、遅延一般化である。うどんの例で

言えば、月見うどんの問題を既に与えられてい

るため、それを事例としてそのような状況が来

れば一般化することができる。従って事例ベー

ス推論は事例を一般化する無数の方法を持つ複

雑な領域で特に威力を発揮する。

 CASEY における類似事例の決定は、以下の

ように行なわれる。

1)新しい患者の症状が与えられる。

2)その症状に関して言及しているすべての

説明や条件を事例ベースから取り出す。

3)それらの説明や条件を含む事例をすべて

取り出す。

4)個々の事例で患者の条件とマッチした数

からマッチしなかった数を引いた数の大きい

順に事例を並べる。

5)もっとも得点の高い事例について一致し

なかった点について解析を続ける。もしその

事例中のある属性が患者の症状と一致しない

時には、それが患者のどれかの特徴によって

明確に否定されない限り、その不一致は無視

される。取り出された事例が入力としての患

者の特徴について言及していない場合には、

その症状が事例中の条件で説明されるか、あ

るいはどの事例中の条件とも無関係の場合に

はその不一致は無視される。

 CASEY の特徴をまとめると以下のようにな

る。

事例を記号レベルで比較しているが、

これによって入力と事例の間の差分に

対する解析的分析が可能になり、部分

マッチングを扱えることが有効に働い

ている。

Page 14: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

16 駒澤大学経済学論集 第 44 巻 第 2 号

事例の形で、複雑な診断分析情報をま

とめているが、これは知識表現として

自然でありかつ効果的である。

因果関係モデルを導入することで、属

性間の重みづけを実現できていること

が有効である。

属性や事例に関する推論に因果関係モ

デルを導入しているが、このモデルを

構築するのは大変である。

 このように、CASEY は既存の症状の事例と

その診断を事例ベースに格納しておき新しい患

者の症状が与えられると、既往の診断中の類似

のものをみつけてきて、それを使って与えられ

た新しい症状を診断するというものである。こ

のような仕組みは、たとえば典型的な文法ミス

における修正ヒントをアドバイスするシステ

ムを作るときにも使える一般的な枠組である。

CASEY のようなシステムを教育分野に適用し、

授業での事例を蓄積し、活用していくことはノ

ウハウの集積、共有化、継承の観点から重要で

ある。

 商用ベースでは、事例ベース検索システムを

容易に構築するため構築支援ツールが発売され

ている。代表的なものとしては Inference 社の

CBR Express や Cognitive Systems 社の ReMind が

ある [51]。これらのツールはすべて検索フェー

ズの機能をサポートし、事例の適応フェーズ

や評価フェーズはサポートしていない。なぜ

なら適応フェーズや評価フェーズに関しては、

定型的な手法が確立していないためツールと

して実現できないからである。検索フェーズ

については、一般的に知られている種々の類

似事例検索手法を用意し、開発者は自分の問

題に向いている手法を選択して利用する形を

とる。開発者が対象とする問題領域を詳細に

理解し、事例や問題記述を表現する属性ベク

トルおよび属性の類似度定義を正しく行なえ

る場合は、従来の事例ベース検索ツールは非

常に有効である。しかし、対象とする問題領

域が構造化されていないときには、問題や事

例を属性ベクトルで表現することは不可能で

あり、従来の事例ベース検索ツールの提供す

る機能は必ずしも有効でない。

 NEC は、従来の事例ベース検索ツールと別

のアプローチをとるヘルプデスク向け事例ベー

ス検索ツール HMS を開発している [52]。従来

の事例ベース検索ツールは、推論支援ツールで

あるのに対し、HMS は専門家のノウハウや経

験を事例ベースやデータベースにするためのマ

ルチメディアオーサリングツールという位置づ

けとなる。すなわち、従来のマルチメディアオー

サリングツールに強力な情報検索機能がついた

ものととらえることが出来る。

 事例ベースを含む情報の検索において重要な

のは、問い合わせをするときに、その問い合わ

せの内容や状況をいかにして検索システムに伝

えるかということである。それらの内容や状況

が複雑であり自然言語で表現できない場合は、

自然言語以外の不十分な表現力の手段で入力す

ることになる。一般に事例ベース検索システム

では、検索の内容や状況は複雑となり、そのよ

うな内容を的確に表現する手段を提供する必要

がある。

 HMS では複数の階層型のメニューインデッ

クスを持たせることができる。また、異なるメ

ニューインデックスの項目を選択して複合的に

情報を検索することができる。更に、検索した

対象から逆に自分を参照しているインデックス

項目を明示する機能を有している。このように、

HMS では種々の情報検索手段を提供すること

で、従来の事例ベース検索ツール診断型のエキ

スパートシステムが持つ問題解決機能に類似し

た機能を別の形で実現している。

4.事例ベース推論を用いた課題添削支援シス

テム

 本章では、添削環境を効率化するとともに、

自然言語処理や事例ベース推論を併用する課題

添削支援システムを説明する。このシステムは、

これまで設計・試作した事例ベース推論を用い

Page 15: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

17記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

たレポート添削支援システム [53] に、形態素

解析でエラーとなる部分に対し、事例ベース推

論を用いて、より適切な添削支援情報の提供を

試みるものである。

4-1 システムの要件

 開発するシステムでは、以下の要領で添削を

行うことを要件とする。

Web ベースのレポート作成・提出を行

う。使用する環境によらず、容易にレ

ポートを作成できるようにする。

学生が提出する課題をヴァージョン管

理し、修正箇所と内容の把握を容易す

る。さらに、修正の指摘(コメント)

と対応する修正箇所の把握を容易にす

る。

個々の学生の課題の進捗状況、提出状

況、添削の進行程度、評価点などを管

理できるようにする。

課題に含まれるミスと思われる箇所お

よび修正案を教員に提示、適用する。

また修正案が不適切な場合は修正案を

訂正できるようにする。

 1 ~ 4 のうち、3 までは添削環境の効率化の

アプローチである。4.のレポート添削支援を

どう実現するかについては、

1) 提出されたレポートを自動的に添削す

る。

2)提出されたレポートに修正のヒントとな

るコメントを付帯する。評価者はそのコメン

トを編集するとともに異なるコメントを追加

する。

3)評価者が提出されたレポートにコメント

をつけると、当該部分にコメントに関連した

情報を追加する。

などが考えられる。本システムでは、学生の文

書作成能力の向上の観点から2)を採用し、対

話的に添削を進められるようにする。その際段

落を意識して書かせるために、トピックセンテ

ンスを抽出する機能、適切なキーワードに基づ

いて構成がなされているかどうかを検査する機

能、形態素解析に基づいて文法ミスや誤字・脱

字を判定する機能を実装する。

4-2 レポート添削支援機能の概要

 レポート添削にはいくつかの評価項目が考え

られる。文法ミスや誤字・脱字の他、読みやす

さや文を一意に読めるように書くことも重要で

ある。これらを評価するための指標と評価方法

を以下に示す。

◆ 文字数(字数が指定されている場合)

 文字数については機械的にカウントでき

る。

◆ 誤字・脱字・漢字誤用(誤漢字) 

◆ 表記間違い(カタカナ・ひらがなの脱

落)

◆ 送り仮名間違い

◆ 文法的誤用 

◆ 活用の間違い

◆ 語彙的誤用  

 これらの項目は形態素解析によりチェッ

クできる。

◆ 語彙量(延べ語数・異なり語数) 

◆ 漢字使用率 

◆ 段落数 

◆ 一文当たりの字数

◆ 読点の数

◆ 漢字未使用・過剰使用 

 これらの項目は、人によって多少のばら

つきがあるものの、経験的に適切な値があ

ると考えられる。また、統計的テキスト解

析の手法によってチェック可能である。す

なわち添削対象を単語やフレーズ等に分割

した後、それらの出現頻度や共起関係など

Page 16: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

18 駒澤大学経済学論集 第 44 巻 第 2 号

を抽出し、データ解析やデータマイニング

の手法で定量的に解析することができる。

◆ 文脈に合わない、不適切な語彙の使用

 この項目は内容レベルの誤りである。不

適切な語彙をチェックするため、任意の語

に対して前後に接続するだろう文脈を多数

検索し、誤用や不適切な使用かなどを検査

する。

4-3 レポート添削支援システムの概要

 前章で述べた事例ベース推論をベースとし

て、設計・試作してきたレポート添削支援シス

テムを改良した。ここでは改良したシステムの

概要について述べる。

 関連研究で述べた添削環境の効率化のアプ

ローチは、対話的なフィードバックを返すため

の支援ツールとして活用されている。このアプ

ローチは自動添削に対するいくつかの批判にこ

たえるものである。本システムも教員の添削負

担を軽減することに注力する、添削支援システ

ムとして設計されている。

 関連研究で紹介したとおり、テキストの内容

を理解する技術が未成熟であるので、その評価

には限界があるが、修正コメントを作り出せる

部分は自動化し、教員が内容についての添削に

集中するという本システムのアプローチにより

実用的な添削が可能となる。

 本システムの構成は図 1 の通りである。図 1

の中央に事例ベース推論エンジンと事例ベース

が示されている。この 2 つが本システムの中核

をなすモジュールである。

 事例ベース推論エンジンは、学生が課題の解

答を提出すると事例ベースに蓄えられた事例を

用いて、下記の順で推論プロセスを実行する。

事例ベースは、XML で定義されたタグによっ

て構造化された事例を管理する。

1)教員は課題を本システムに登録する。

2)学生は課題に対応したレポートを本シス

テムに提出する。

3)課題と提出されたレポートは関連付けら

れ、事例ベースに登録される。

4)解答文の形態素解析、係り受けの解析を

行い、文法間違いや誤字・脱字などによるエ

ラーがあれば後述する XML タグを付加した

エラーデータを作成する。

5)エラーがあった場合には、暫定的な品詞

及びエラーの状況から推定されるカテゴリ情

報を付与し、エラー事例として事例ベースに

格納する。

6)文脈に沿った語が使われているかを

チェックするため、コーパス 6 から課題に含

まれるキーワードにヒットする文を検索し、

形態素解析を適用して切り出される語の事例

データを作成する。

7)後述する事例ベース推論を実行し、検索

結果を登録された事例に関連付ける。

8)本システムは、以上のプロセスにおいて

関連付けられた情報に基づき、添削に資する

アドバイスをレポートとともに教員に提示す

る。

9)教員は本システムのアドバイスを利用し、

レポートにコメントを追加する。

10)学生はコメントに基づきレポートを修正

し、再提出する。

11)再提出されたレポートは修正前のレポー

トと関連付けられ、事例に追加される。

12)教員がレポートを承認するまで以上が繰

り返され、教員が承認すると事例へのコメン

トや修正の追加は終了する。

13)承認により、エラーがあった語が正しく

修正されている。そこでエラー事例および正

解をエラー用辞書に登録する。

 本システムの事例ベース推論のプロセスは以

下の通りである。

1)検索 : 添削すべき文章が与えられると事

例ベースの中からそれを解くのにふさわしい

6 コンピュータによる検索が可能になっている日本語や英語などの自然言語(複数の言語の場合もあ

る)の大量の言語データのこと。

Page 17: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

19記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

事例を検索する。1つの事例は、課題と提出

された解答文、解答文を形態素解析した結果

(エラーの事例も含む)、課題に含まれるキー

ワードに基づきコーパスから得られる文脈情

報および解答に対する1組以上のコメント・

修正された文章からなる。学生が解答をシス

テムに登録すると、形態素解析でのエラー事

例、課題のキーワードからコーパスを検索し

た結果を用い、修正すべき点が示された文と

提出された文章を比較し、類似する事例を検

索する。たとえば解答を形態素解析した結果、

多くの漢字変換ミスをしている場合、システ

ムが検索すべき事例は漢字変換ミスがたくさ

んみられる事例である。

2)再利用 : 形態素解析でのエラー結果及び

検索された事例から与えられたレポートへの

コメント案へのマッピングを行う。必要であ

れば新しい状況に合うよう修正案を教員に提

示する。漢字変換ミスの例で言えば、システ

ムが検索した事例に単純な打ち間違いなの

か、覚え間違いなのかについて追加すること

がある。

3)修正 : マッピングができたら、その新し

い修正レポートを指導教員が閲覧し、必要な

らば改良を加える。例えば漢字の誤変換とし

て修正案が作成されたレポートをチェックし

たところ、予期しないこととして漢字の誤用

がみつかった場合、あらたな修正案を作成す

る、あるいは他の事例の適用(他の事例から

漢字誤用でのコメントを利用する等)という

ID

図 1 事例ベース推論によるレポート添削支援システム

Page 18: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

20 駒澤大学経済学論集 第 44 巻 第 2 号

改良 / 修正を行う。

4)記憶 : 新たな問題にうまく適応した修正

案が得られたら、その修正案を新たな事例

として登録する。たとえば上記の漢字の誤

用を形態素解析のエラー事例として登録し、

将来の添削でその事例を活用する。登録さ

れた修正コメントを含む文章は学生に返却

される。必要があれば学生は再び修正した

文章を再提出する。その場合は、1)から

再度処理を行う。

4-4事例ベースの構成要素

 図 1 の通り、本システムの事例ベースは教員

が作成した課題と学生が提出した解答の対に対

し、コーパスから得られた文脈情報、教員のコ

メントとそれに基づく学生の再修正の連鎖によ

り構成される。事例ベースを構成する要素は全

て XML により構造化されて事例ベースに登録

される。ここでは事例ベースの構成要素につい

て説明する。

●  事例を整理するためのデータ

 課題、解答とそれに付随する添削のための

データを整理するため、表 1 の通り、事例に識

別番号を割り当てる。

●  形態素解析によるエラー事例データ

 文章データから情報抽出するための技術は数

多く開発されているが、その多くは形態素解析

の結果を前提としている。一方、形態素解析に

必要な辞書及び係り受け解析に必要な解析モデ

XML タグ 意 味

<case_id> </case_id> 事例の識別番号

表1 事例を構成する XML 要素

XML タグ 意 味

<sentence> </sentence> 解析対象の文字列

<response> </ response> 解析結果全体

<status> </status> 解析誤り状態。正常 0 エラー 1

<exectime> </exectime> 形態素解析実行時間

<result> </result> 形態素解析結果全体

<token_ctr> </token_ctr> 解析に基づく形態素数

<token> </token> 各形態素の情報(形態素の数、繰り返し)

<chunk> </chunk> 文節数

<chunk_id> </ chunk_id> 文節番号

<link> </link > 係り先文節番号

<relation> </relation> 係り種別

<tok_id> </tok_id> 形態素番号

<surfacechar> </surfacechar> 表出文字(形態素毎に)

<reading> </reading> 読み仮名(形態素毎に)

<baseform> </baseform> 基本形(形態素毎に)

<partsofspeech> </partsofspeech> 品詞(形態素毎に)

<pos> </pos> エラーの時に推定した品詞

<timestamp> </timestamp> 処理完了時刻

<errword> </errword> エラーとなった語

表2 エラー事例を構成する XML 要素

Page 19: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

21記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

ルは、新聞記事等の整った文語体で書かれた文

章から作られていることが多い。このため、課

題の解答文のように文法ミスや誤字・脱字が多

く使用される文章に適用した場合には解析エ

ラーが頻繁に起こる。

 解析エラーがある場合、それらの状況を把

握しデータベース化することができれば文書

の添削に役立てることができる。これらのエ

ラーは形態素解析の辞書に掲載されていない

ため、形態素解析の結果複数語に分解されて

しまうことが多いが、このデータを事例ベー

スから取り出して形態素解析時に活用するこ

とにより、一語として認識することができる

ようになる。これらの解析データの構造を表 2

の通り定義する。

●  コーパスから得られる文脈情報

 課題の意図を踏まえた内容であるかの参

考として、登録された課題に含まれる語彙

について現代日本語書き言葉均衡コーパス

KOTONOHA[59] から前文脈と後文脈を取得し、

表 3 に定義した XML 要素によりデータを整理

し、登録した事例に関連付ける。

 「KOTOHANA」の仕様は次の通りである。対

象は出版物として刊行された現代日本語の書き

言葉であり、従来から語彙調査の対象となって

きた新聞、雑誌に加えて、書籍全般を対象にす

る(白書や教科書も含む)。WEB 上の文書につ

いては Q&A 掲示板のテキストなど一部を対象

とする。収録対象の刊行年代は、最大 30 年間

(1976 ~ 2005)である。収集の中心となる書籍

では 1986 ~ 2005 年となる。これらの対象から

原則として無作為にサンプルを抽出している。

サンプリングの方法としては、対象とする期間

に出版された出版物全体を母集団とする方法

と、公共図書館に収蔵されている出版物を母集

団とする方法の二種類を併用する。コーパスの

規模は 1 億語を目標としている。抽出したサン

プルは、他の情報とともにXML文書に整形する。

●  課題/解答および教員のコメント/学生

の再修正

 教員が作成する課題や提出される解答は、

WordprocessingML[60] 形式で事例ベースに登

録される。本論文の WordprocessingML では、

XML を使用してドキュメントのテキストコン

テンツと書式を記述する。WordprocessingMLは、

文書をストーリー (メインドキュメント,コメ

ント,ヘッダー) およびプロパティ (スタイル,

番号設定定義) の集合として扱う。各ストー

リーには構造化ドキュメントタグを使用して定

義された特定の種類の構造が含まれる。構造化

ドキュメントタグの詳細については [61] を参

照されたい。

 WordprocessingML は文書の構造を表現する

ものであり、添削に必要な情報を保持するも

XML タグ 意 味

<sentence> </sentence> 解析対象の文字列

<response> </ response> 解析結果全体

<status> </status> 解析誤り状態。正常 0 エラー 1

<exectime> </exectime> 検索実行時間

<result> </result> 検索結果全体

<query> </query> 検索語

<context_ctr> </ context_ctr> ヒット件数

<context_id> </ context_id> 検索結果識別番号

<precontext> </precontext> 前文脈文

<postcontext> </postcontext> 後文脈文

<timestamp> </timestamp> 検索した時刻

表3 コーパスによる事例を構成する XML 要素

Page 20: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

22 駒澤大学経済学論集 第 44 巻 第 2 号

のではない。従って、添削に必要なデータに

XML タグを付加して弁別できるようにしなけ

ればならない。

 教員は、本システムより提案される添削情報

の修正を行うことができる。修正されたコメン

トは事例としてシステムに登録される。教員が

レポートを受領可能のレベルと判断した場合、

システムに受領を通知し、この課題と解答は事

例として完結する。

 再修正が必要な場合は、システムに却下を通

知し、学生への修正コメントを付加した添削済

レポートを学生に返却する。返却されたレポー

トが修正されシステムに再提出されると、シス

テムは前回登録されたレポートとの差分を調

べ、それを事例として登録する。これらの処理

は教員がシステムに受領を通知するまで行われ

る。

●  添削支援情報

 ここでは、添削に資する指標等のデータを

XML によって定義する。事例ベースでは、こ

れらの XML 要素を全て使って1つの事例を表

現する。本システムでは、学生へ与える課題、

学生の解答、それに対するコメントの他に次の

評価項目を事例に追加し、添削をサポートする

情報を提供する。

● 文字数 漢字使用率 語彙量(延べ語数・

異なり語数) 

● 段落数 一文当たりの字数

● 漢字誤用(誤漢字) 漢字未使用・過剰

使用 送り仮名間違い

● 文法的誤用 活用の間違い

● 語彙的誤用 文脈に合わない、不適切な

語彙の使用

● 表記間違い(カタカナ語・ひらがなの脱

落)  

● 話しことばの使用の有無

これらの評価項目を表 4 の通り XML を用いて

定義した。

5.実際の授業の課題に適用した実行例

 ここでは、実際に使われる課題と解答につい

ての実行例を説明する。課題に対し、学生から

提出された解答を本システムで処理する流れを

説明する。本システムが課題とレポートを受け

取ると、最初にレポートにシステムが生成する

事例 ID を付与する。この ID はレポートが受領

されるか、または提出期限が切れる等、事例が

XML タグ 意 味

<numofchar> </numofchar> 文字数

<kanjirate> </kanjirate> 漢字使用率

<totalnumofword> </totalnumofword> 延べ語数(語彙量)

<diffnumofword> </diffnumofword> 異なり語数(語彙量)

<numofpara> </numofpara> 段落数

<numofcharinsen> </numofcharinsen> 一文当たりの字数

<kanjimis> </kanjimis> 漢字誤用(誤漢字)

<kanjiunuse> </kanjiunuse > 漢字未使用

<excesskanji> </excesskanji> 漢字過剰使用

<wrongkana> </wrongkana> 送り仮名間違い

<misgrammar> </misgrammar> 文法的誤用

<misvocab> </misvocab> 不適切な語彙の利用

<improperexp> </improperexp> 不適切な表現(文脈に合わない語彙,

表記間違い,話し言葉等)

表4 添削に必要なデータに関する XML 要素

Page 21: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

23記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

完結するまでの様々なデータを関連付けるため

に使われる。

 授業で提起した課題に対し、解答が提出され

ると、システムは課題と解答に対し、各々 ID

をつけ、これを複合したものを事例 ID とする。

事例 ID は同じ課題であっても異なる解答が登

録されると新規に生成される。図 2 の例は、課

題の事例 No.00001 に対する解答 No.001 がある

場合を表している。

 このデータに対し、システムは解答の構文解

析を行い、文法的誤用や不適切な語彙をチェッ

クする。ここでは、解答のうち添削が必要とな

る誤字の部分を抜き出して、どのような処理が

行われるかを説明する。説明を簡潔にするため、

添削が必要な部分について説明していく。まず、

次の部分に着目する。

解析対象となる文は次のような XML データと

して表現される。

<sentence>

出荷や大股間襟の際にどこにどれだけの量の商

品が残っているかが把握できていなくて

</sentence>

この部分を形態素解析する。その結果は以下の

通りである。

出荷や大股間襟の際にどこにどれだけの量の

商品が残っているかが把握できていなくて

表 記 読み仮名 品 詞 基本形表記

出荷 しゅっか 名詞 出荷

や や 助詞 や

大 だい 接頭辞 大

股間 こかん 名詞 股間

襟 えり 名詞 襟

の の 助詞 の

際 さい 名詞 際

に に 助詞 に

どこ どこ 名詞 どこ

に に 助詞 に

どれだけ どれだけ 名詞 どれだけ

の の 助詞 の

量 りょう 名詞 量

の の 助詞 の

商品 しょうひん 名詞 商品

が が 助詞 が

残っ のこっ 動詞 残っ

て て 助詞 て

いる いる 助動詞 いる

か か 助詞 か

が が 助詞 が

把握 はあく 名詞 把握

でき でき 動詞 でき

て て 助詞 て

い い 助動詞 い

なく なく 助動詞 なく

て て 助詞 て

ERP

Fitter SnackerERP

ID 00001-001

図2 事例のサンプル

Page 22: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

24 駒澤大学経済学論集 第 44 巻 第 2 号

 次に、形態素解析の結果を使って係り受け解

析を行う。その結果は図 3 の通りである。

 点線で囲んだ部分は、形態素解析の過程で辞

書に存在する語により係り受けを解析してい

る。この部分の名詞部を1つの語としてみる場

合、辞書に存在しない語のためエラーとなる。

そこで次のようなデータを生成する。

 上記の文の形態素解析、係り受けの解析の

結果を表現する XML データの概要は以下の通

りである。chunk により文節を示し、<link> や

<relation> により係り受けを表現している。

<response> 

<status>1</ status>

<result> 

<token_ctr=”27”>

<chunk>

<chunk_id>"0"</chunk_id><link>1</link>

<relation>D</relation>

<token> 

<tok_id>0</tok_id>

<surfacechar> 出荷 </surfacechar>

<reading> しゅっか </reading>

<baseform> 出荷 </baseform>

<partsofspeech> 名詞 </partsofspeech>

</token> 

</token>

<token> 

<tok_id>1</tok_id>

<surfacechar> や </surfacechar>

<reading> や </reading>

<baseform> や </baseform>

<partsofspeech> 助詞 </partsofspeech>

</token>

・・・(略)

</chunk>

<chunk_id>1</chunk_id><link>1</link>

<relation>D</relation>

・・・(略)

<pos> 名詞 </pos>

<errword> 大股間襟の </errword>

</token_ctr>

</result>

<exectime>10</ exectime>

<timestamp>201209011200</timestamp>

</response>

続いて、次の部分に着目する。

<pos> 名詞 </pos>

<errword> 大股間襟の </errword>

どれだけの量の商品輪販売して

いいかわからなかったが

図3 形態素解析例

Page 23: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

25記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

この部分を形態素解析する。その結果は以下の

通りである。

 次に、形態素解析の結果を使って係り受け解

析を行う。その結果は以下の通りである。

 点線で囲んだ部分は、形態素解析の過程で辞

書に存在する語により係り受けを解析してい

る。この部分の名詞部を1つの語としてみる場

合、辞書に存在しない語のためエラーとなる。

そこで次のようなデータを生成する。

 さらに、課題文から語を抜き出しコーパスの

文脈情報を検索する。課題の構文解析により文

中の名詞が判別されているので、それらを検索

文字列として KOTONOHA に検索を依頼する。

例えば“在庫管理”を検索文字列として検索す

る。図 4 はその結果から 1 件目及び 43 件~ 47

件目を抜粋したものである。この表は左から表

示番号、前文脈、検索文字列、後文脈となって

おり、それ以降の項目は省略している。

表 記 読み仮名 品 詞 基本形表記

どれだけ どれだけ 名詞 どれだけ

の の 助詞 の

量 りょう 名詞 量

の の 助詞 の

商品 しょうひん 名詞 商品

輪 わ 名詞 輪

販売 はんばい 名詞 販売

し し 助動詞 し

て て 助詞 て

いい いい 形容詞 いい

か か 助詞 か

わから わから 動詞 わから

なかっ なかっ 助動詞 なかっ

た た 助動詞 た

が が 助詞 が

<pos> 名詞 </pos>

<errword> 商品輪 </errword>

表示番号

前文脈 検索文字列 後文脈

1

iuri.co.jp/atmoney/です通信網でつながる家電洗い方教える洗濯機

在庫管理

する冷蔵庫 毎日の生活に欠かせない洗濯機や冷蔵庫。電話線やアンテナで外部とつなが

・・・・・

43

タの管理)を的確に行っているケースもあれば,適正在庫を保持するためのデータを基に

在庫管理

(調達期間や販売予測量に関するデータの管理)を推し進めたり,買物歴データで顧客管

44

ち、情報通信ネットワークの利用率が高い業務は、受発注・商品管理、物流管理、販売・

在庫管理

、情報検索等であった。第1‐3‐31図 情報ネットワークによる業務処理の割合「ネ

45

のアプリケーションの急速な拡張は注目に値する。仕入 れ, 在 庫,製造,販売予測,店頭

在庫管理

,出荷・在庫調整,販売,(個人)顧客管理,インターネットによる受注など,あらゆる

46

インターネット上での事業拡大としての有効事例である と と も に,それを支える徹底した

在庫管理

システムがその発展過程で不可欠であることを示唆するものとなっている。〈インターネ

47

統制し、管理するかがロジスティクスのマネジメントにおける課題と な り ま す。 従来の

在庫管理

の考え方は各物流拠点ごとの適正在庫量、発注点在庫量、安 全 在 庫 量、発注時期、発注単

・・・・・

図4 “在庫管理”を検索文字列にして検索し

た結果の抜粋

Page 24: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

26 駒澤大学経済学論集 第 44 巻 第 2 号

 システムは前文脈と後文脈から、この語の前

後に使われる可能性が高い語を得る。この情報

に基づき、解答文に含まれるキーワードの前後

にある語を評価する。もしマッチする語がない

場合は、アドバイス情報として記憶する。検

索結果は、表 3 で定義した XML 形式で保存す

る。以下は、“在庫管理”をキーワードにして、

KOTONOHA から検索結果を得、それを表 3 で

定義した XML 要素を使って表現したものであ

る。

<response> 

<query> 在庫管理 </query>

<status>0</ status>

<result> 

<context_ctr=”98”>

<context_id>0</context_id>

<context> 

<precontext> 

iuri.co.jp/atmoney/

です通信網でつながる家電洗い方教える洗

濯機

</precontext> 

<postcontext> 

する冷蔵庫 毎日の生活に欠かせない洗濯

機や冷蔵庫。電話線やアンテナで外部とつ

なが

</postcontext> 

</context>

・・・(略)

</context_ctr>

</result>

<exectime>10</ exectime>

<timestamp>201209011200</timestamp>

</response>

 最後に、前述した事例ベース推論によってこ

れまで登録された事例を検索し、それに基づき

添削情報を追加する。これらの処理が完了する

と、以下のデータが計算される。

<numofchar>39</numofchar>

<kanjirate>0.33 </kanjirate>

<totalnumofword>15 </totalnumofword>

<diffnumofword>0 </diffnumofword>

<numofpara>1 </numofpara>

<numofcharinsen>39 </numofcharinsen>

<kanjimis>1  </kanjimis>

<kanjiunuse>0 </kanjiunuse >

<excesskanji>0 </excesskanji>

<wrongkana>1 </wrongkana>

<misgrammar>1 </misgrammar>

<misvocab>0 </misvocab>

<improperexp>1 </improperexp>

 この例では、文字数 39、漢字使用率 0.33、ワー

ド数 15、異なり語数 0、段落数 1、一文あたり

の文字数 39、漢字未使用 0、漢字過剰使用 0、

送り仮名間違い 1、文法的誤用 1、不適切な語

彙の利用 1、不適切な表現 1 となる。なお、漢

字過剰使用、送り仮名間違い、文法的誤用、不

適切な語彙の利用、不適切な表現は意味を踏ま

えた評価が必要であり、コメントを追加する際

に教員が変更できる。

 以上の処理が終わると、システムは教員にア

ドバイス情報を示す。教員はそのアドバイスを

参考にしながらレポートの意味レベルでの論理

性や整合性について添削を行う。

 この例において、教員は特にコメントをつけ

ずシステムが提示した誤字の修正を学生に提示

しようと考えたとする。その場合、教員は却

下をシステムに通知する。システムは、シス

テムが生成したコメントと教員のコメントを

WordprocessingML のコメントタグを用いて該

当する部分に埋め込み、それを学生に返却する。

この例では、学生は2か所に“誤字”のコメン

トが埋め込まれたレポートを受け取る。

 学生は誤字に気付き、次のように修正した(修

正部は斜体文字にし、下線をつけた)。

Page 25: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

27記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

システムは再提出されたレポートの事例 ID を

チェックし、過去の添削履歴を参照する。前回

提出されたレポートとの差分を調べた結果、2

か所が修正されたことを認識する。これを教員

に伝える。文脈情報から関連する語が使われて

いないことがわかり「在庫管理についてもっと

調べるように」というコメントを付与すると、

WordprocessingML のコメントタグを用いて該

当する部分にこのメッセージを埋め込む。確認

が終わると教員は却下をシステムに通知する。

システムは、システムが生成したコメントのう

ち修正された 2 か所を削除し、教員のコメント

を WordprocessingML のコメントタグを用いて

該当する部分に埋め込み、それを学生に返却す

る。

 学生は、そのコメントをみて、次のように修

正したとする(修正部は斜体文字にし、下線を

つけた)。

 システムは、再び事例ベース推論の手順を踏

んでレポートをチェックする。その結果レポー

トへ修正のアドバイスを行う必要がないことを

認識し、それを教員に示す。教員はレポートを

確認して問題がなければシステムに受領を通知

する。システムは受領通知を受け取ると、この

事例が完成したと判断して事例として事例ベー

スに登録する。

6.まとめ

 本論文では、多量のレポートを添削しなけれ

ばならないため十分な回数の添削および修正さ

れた文書の再添削が行い難い、また採点基準が

ぶれることがあるという状況を改善するため、

公開されているコーパス、レポートの間違いの

類型、使用者のコメント・評価などを XML を

ベースに定義した事例ベースで管理し、レポー

ト添削を支援するシステムについて説明した。

また、本システムがどのように機能するかを示

した。そして、開発したシステムを実際の授業

の解答例に適用した。

 システムが支援する処理を含め全ての添削作

業を教員が行う場合と比較すると、文法的誤用

や語彙の誤用など多くの学生が間違える項目に

ついては、添削負担が大幅に軽減される。さ

らに意味レベルの論理性や整合性についても、

コーパスから得られる文脈情報や過去の事例が

示されるため、ゼロからコメントを書くより少

ない手間で添削が可能となる。 

 さらに、これらの添削支援情報は、本システ

ムのロジックに基づいて示されるので、添削基

準の一貫性が保たれる。処理の半自動化により、

学生が解答を完成させてから教員が添削して返

却するまでの時間を短縮できることが期待され

る。

 次に、本システムの課題について述べる。

 本システムは試作段階にあり、事例ベース推

論部を除き未完成部分が多い。例えばユーザー

インターフェースについてワードプロセッサを

介した提出・修正の他は XML タグを表示する

にとどまっている。システムの知識がない人が

使えるようになるためには XML タグを適切な

表現に変換する等の拡張が必要である。また、

事例ベースの構成要素についてもこれで確定で

はなく、事例数がある程度増えた段階で各要素

が添削にどれだけ貢献しているかの評価を行

い、構成要素の追加・削除を行う必要がある。

特に文脈情報については、検索結果が少ない場

合、文意の論理性や妥当性を評価することが困

難であると推測できる。また今回の実行例にお

いても、キーワードの前後の文脈に課題に対応

する語彙が十分含まれていない。これについて

の分析が必要であろう。

 “出荷や在庫管理の際にどこにどれだけの量

の商品が残っているかが把握できていなくて”

 “どれだけの量の商品を販売していいかわか

らなかったが”

 “出荷や在庫管理の際にどの倉庫にどれだけ

の在庫量の商品が残っているかが把握できて

いなくて”

 “どれだけの数量の商品を販売していいかわ

からなかったが”

Page 26: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

28 駒澤大学経済学論集 第 44 巻 第 2 号

 謝辞 Jess の情報やソフトウエアを提供いた

だき、共同研究させて頂いている大学入試セン

ター石岡 恒憲氏に感謝する。本研究の一部は、

日本学術振興会科学研究費 基盤研究 (B) No.

21300320 によった。

参考文献

1. 小野,村木,林,杉森,野崎,西森,馬場,

田中,國吉,酒井 : 日本の大学生の基礎学

力構造とリメディアル教育:IT 活用学力支

援研究,メディア教育開発センター研究報

告 6 (2005)

2. Available online: http://www.mext.go.jp/b_

menu/toukei/data/pisa/index.htm

3. 池原,小原,高木:自然言語処理技術の応

用「2.文書校正支援システムにおける自

然言語処理」情報処理 Vol.34, No.10 (Oct.

1993)

4. 池原,白井,神成:日本文の誤字に対する

政界候補の抽出について,電子情報通信学

会全国大会 No.608(1983)

5. 池原,白井:単語解析プログラムによる日

本語誤字の自動検出,情報処理学会論文誌

 Vol.25 No.2 pp.298-305(Feb. 1984)

6. 牛島,日並:日本語文書推敲支援ツール「推

敲」のプロトタイピング,コンピュータソ

フトウエア Vol.3 No.1 pp.35-46 (1986)

7. 福島,大竹,大山,首藤:日本語文書作成

支援システム COMET,電子情報通信学

会技報 OS86-21 pp.15-22(1986)

8. 池原,安田,島崎,高木:日本文訂正支援

システム REVISE,情報処理学会第 33 回

全国大会 4J-9(1986)

9. 空閑:文書作成・構成支援システム 

WISE,電子情報通信学会技報 OS86-28

pp.13-18(1986)

10. 鈴木,武田:日本語文書校正支援システ

ムの設計と評価,情報処理学会論文誌 

Vol.30 No.11 pp.1402-1412(Nov. 1989)

11. 高橋,吉田:計算機マニュアル推敲査読支

援システム MAPLE の開発と運用,情報

処理学会論文誌 Vol.31 No.7 pp.1051-1062

(July 1990)

12. 福島,佐々木,赤石沢,竹元:日本語文書

校正支援システム St. WORD,情報処理学

会第 45 回全国大会 6C-1(1992)

13. 奥村,脇田,金子:日本語構成支援システ

ム「FleCS」,情報処理学会 NL 研究会 92-

NL-87 pp.83-90(1992)

14. 日本電信電話株式会社,他:マニュアル作

成の技術,NTT ラーニングシステムズ株式

会社(1990)

15. 石井:新聞における校正・校閲の実

デ ー タ に よ る 調 査,ICOT Technical

Report:TR-039(1983)

16. 長尾,他:科学技術庁機械翻訳プロジェク

トの概要,情報処理 Vol.26 No.10 pp.1203-

1213(Oct. 1985)

17. 宮崎,大山:日本文音声出力のための言

語処理方式,情報処理学会論文誌 Vol.27

No.11 pp.1053-1061(Nov. 1986)

18. 首藤,吉村:日本語の構造とその解析,情

報処理 Vol.27 No.8 pp.947-954(Aug. 1986)

19. 田中:自然言語解析の基礎,産業図書(1989)

20. 宮崎:係り受け解析を用いた複合語の自動

分割法,情報処理学会論文誌 Vol.25 No.6

pp.970-979(June. 1984)

21. 牧野,大澤:べた書き文の仮名漢字変換

システムとその同音語処理,情報処理 

Vol.22 No.1 pp.59-67(Jan. 1981)

22. 吉村,日高,吉田:文節数最小法を用いた

べた書き日本語文の形態素解析,情報処

理学会論文誌 Vol.24 No.1 pp.40-46(Jan.

1983)

23. 末田,金森:動的計画法を用いた文字列と

辞書項目の照合方式,電子情報通信学会全

国大会 S9-3(1983)

24. 小暮,匂坂,嵯峨山,佐藤:日本語テキス

トからの音声変換における言語処理,電子

情報通信学会全国大会 S9-5(1983)

25. 高橋,板橋:単語共起頻度を利用した形

態素解析,情報処理学会 NL 研究会 88-N

L-69 69-5(1988)

26. 大島,阿部,湯浦,武市:格文法による仮

Page 27: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

29記述式課題における添削支援システム ―事例ベース推論によるアプローチ―(中済)

名漢字変換の多義解消,情報処理学会論文

誌 Vol.27 No.7 pp.679-687(July 1986)

27. 勘座:校正支援システムの日本語解析処理

についての考察,情報処理学会第 46 回全

国大会 3L-1(1993)

28. 久光,新田:条件付き確率最大法を利用し

た日本語形態素解析,情報処理学会第 46

回全国大会 1B-1(1993)

29. 清水,役田,披田野,柏木:校正支援にお

ける形態素の認定,情報処理学会第 38 回

全国大会 5E-2(1988)

30. 福島,山田,小沢,他:校正支援システム

 St. WORDS の文書検査機能,情報処理学

会第 46 回全国大会 3L-3(1993)

31. 小原,高木,林,武石:日本文推敲支援技術,

NTT R&D Vol.40 No.7 pp.905-914(1991)

32. 奥:意味カテゴリを用いた複合語の同音異

義語誤り検定方式,情報処理学会第 38 回

全国大会 2J-7(1989)

33. 林,高木:日本文推敲支援機能の実現方法,

人工知能学会第 3 回全国大会 8-13(1989)

34. 宮崎,白井,大山,後藤,池原:日本文音

声出力のための言語処理,情報処理自然言

語処理シンポジウム(1983)

35. 島崎,安田,高木,池原:日本文訂正支援

システム REVISE における辞書の構成法,

情報処理学会第34回全国大会 6X-3(1987)

36. 高木,安田,島崎,松岡:日本文訂正支援

システムにおける未知語訂正候補抽出方

式, 情報処理学会第 37 回全国大会 6B-4

(1988)

37. 松雄,佐藤,津田:連想統合型照合による

単語あいまい検索法,情報処理学会第 34

回全国大会 4E-7(1987)

38. 村上,荒木,池原:日本文音節入力に対し

て 2 重マルコフ連鎖モデルを用いた漢字か

な混じり文節候補の抽出精度,電子情報通

信学会論文誌 D-II Vol.J75-D-II No.1 pp.11-

20(1992)

39. 箱守,杉江,大西:日本語の修飾関係を評

価する添削支援システムを実現するため

の基礎研究,情報処理学会論文誌 Vol.33

No.2 pp.153-161(Feb. 1992)

40. 乾,徳永,田中:文章生成における推敲の

役割,情報処理学会 NL 研究会 91-N L-83

pp.47-54(1991)

41. 林,喜久井:日本文推敲支援システムにお

ける書換え支援機能の実現方式,情報処理

学会論文誌 Vol.32 No.8 pp.962-970(Aug.

1991)

42. 武石,林:接続構造解析に基づく日本語

複文の分割,情報処理学会論文誌 Vol.33

No.5 pp.652-663(May 1992)

43. 山口,北村,加藤,棚橋:作文支援システ

ム TEachOtherS における添削の「効率化」,

 言語処理学会第 16 回年次大会 発表論

文集 pp.535-538(2010)

44. 矢野,緒方,榊原,脇田:日本語作文教育

のためのネットワーク型添削支援システム

CoCoA の構築,教育システム情報学会誌

Vol.14 No.3 pp.21-28(1997)

45. 石塚:インターネットを利用したレポート

添削システムの開発,教育システム情報学

会第 27 回全国大会論文集 pp.55-56(2002)

46. 出口,木鎌,酒井,水野:Web ベース協調

学習と集合講義を融合したブレンデッド型

学習の実践,情報処理学会シンポジウム論

文集 Vol.2005 No.6 pp.301-304(2005)

47. 吉村,井上,杉本,神門:協調学習のた

めのコンテンツ構築システム EduWiki の開

発, 情報処理学会研究報告 Vol.2006 No.9

pp.203-208(2006) 

48. Roger C. Schank:Dynamic Memory: A Theory

of Reminding and Learning in Computers and

People,Cambridge University Press (1983)

49. Carbonell, Jaime G:Derivational analogy : a

theory of reconstructive problem solving and

expertise acquisition,Computer Science

Department. Paper 1534. (1985)

50. Koton P. :Using experience in learning and

problem solving. Massachusetts Institute of

Technology, Laboratory of Computer Science

(Ph.D. diss, October 1988). MIT/LCS/TR-441

(1989).

Page 28: 記述式課題における添削支援システムrepo.komazawa-u.ac.jp/opac/repository/all/33200/... · 昧な修飾関係など)などが、内容レベルの誤り は、矛盾する数値、矛盾する文意、文意の誤り

30 駒澤大学経済学論集 第 44 巻 第 2 号

51. Available online: http://www.ai-cbr.org/

classroom/cbr-review.html#Tools

52. 柴田,二瓶,富沢,西村,島津: ヘルプ

デスク向け情報ベース構築ツール,人工

知能学会研究会資料,SIG-J-9501-19 (12/8)

(1995)

53. 中済:事例ベース推論を用いたレポート添

削支援システム,情報処理学会コンピュー

タと教育研究会(Nov. 2010)

54. Page,E.B.:The imminence of Grading Essays

by Computer, Phi Delta Kappan, pp.238-243

(1966)

55. Burstein,J., Kukich,K.,Wolff,S.,Lu,C.,Cho

dorow,M.,Braden-Haerder,L.,& Harris,M.

D.:Automated Scoring Using A Hybrid Feature

Identification Technique,In Proceedings of

the Annual Meeting of the Association of

Computatinal Linguistics(1998) Montreal,

Canada

56. Available online: http://www.ets.org/research/

erater.html

57. Ishioka,T. & Kameda,M.:Automated Japanese

Essay Scoring System:Jess, DEXA2004 (15th

International Conference on Database and

Expert Systems Applications), Zaragoza Spain,

pp.4-8(2004).

58. A. Aamodt, E. Plaza:Case-Based Reasoning:

Foundat iona l I s sues , Methodo log ica l

Variations, and System Approaches. AI

Communications. IOS Press, Vol.7:1, pp.39-59

(1994).

59. Available online: http://www.kotonoha.gr.jp/

shonagon/

60. Available online: http://msdn.microsoft.com/ja-

jp/library/bb669127.aspx

61. Available online: http://rep.oio.dk/Microsoft.

com/officeschemas/wordprocessingml_article.

htm