はじめての生成文法 《後編》

67
はじめての生成文法 《後編》 TokyoNLP #6 - 2011/6/25 中谷秀洋@サボウズ・ラボ株式会社 id:n_shuyo / @shuyo

Upload: shuyo-nakatani

Post on 01-Nov-2014

24 views

Category:

Technology


0 download

DESCRIPTION

TokyoNLP #6 での発表資料です。 前編 : http://www.slideshare.net/shuyo/tokyonlp-5

TRANSCRIPT

Page 1: はじめての生成文法 《後編》

はじめての生成文法 《後編》

TokyoNLP #6 - 2011/6/25

中谷秀洋@サボウズ・ラボ株式会社

id:n_shuyo / @shuyo

Page 2: はじめての生成文法 《後編》

おことわり

• これだけで生成文法がわかったりしません

– あくまでもダジェスト

– 通年の講義するわけにもいかないしね!

• 素人です

– 独断と偏見も多いよ

– 鵜呑みにしないでね

• 生成文法は「仮定」「仮説」のかたまり

– NGつっこみ:「それ本当? 証拠は?」

Page 3: はじめての生成文法 《後編》

ねらい

• 生成文法の流れを見てみる

– 「生成文法の目的って何?」

– 「生成文法にもいろいろあるみたいだけど」

– 「どうしてこうなった?」

• 生成文法に興味を持つ

– 「難しいってよく聞くけどホント?」

– 「ぶっちゃけ、おもしろいの?」

– 「なんかの役に立つ?」

Page 4: はじめての生成文法 《後編》

もくじ 《後編》

1. 生成文法ってどんな文法?

2. 生成文法の概略と変遷

– 生成文法 0.0 (句構造文法)

– 生成文法 1.x ([[改訂]拡大]標準理論)

– 生成文法 2.0 (GB理論/原理とパラメータのゕプローチ)

– 生成文法 3.0β (ミニマリスト・プログラム)

3. 生成文法は信じていいの?

– 自然科学とフゔンタジーのすきま

Page 5: はじめての生成文法 《後編》

前編のあらすじ

Page 6: はじめての生成文法 《後編》

なぜヒトは言葉を話せるのか まだわかっていない

• 言語獲得

– なぜ子供は言葉をかんたんに覚えられるの?

• 言語機能の生得説

– 生まれたときから「言語のための機能」を脳

に持っているんだよ! きっと!

• でも「言語のための機能」って何だろう?

Page 7: はじめての生成文法 《後編》

言語機能があるとしたら いったいどんなものだろう

• 乏しいデータからかんたんに言語獲得

– 4歳児でも、ほぼ完全に近い言葉を使う

– ンプットの違いに寄らず、個体差が小さい

• 言語専用の機能(他の認知機能とは独立)

– 認知機能の発達した大人に言語習得が難しい

• 任意の言語に対応

– 獲得速度にも差がない

Page 8: はじめての生成文法 《後編》

言語機能は「言語の共通ルール」だと チョムスキーは考えた

• 普遍文法=言語の共通ルール

– 全ての言語に共通の語の並べ方のルール

– 共通ルールを生まれたときから知っていれば

• 個別言語との差分を身につければいいだけ

• 普遍文法を明らかにすれば

言語獲得の謎は解決!

Page 9: はじめての生成文法 《後編》

生成文法ってどんな文法?

Page 10: はじめての生成文法 《後編》

チョムスキーの生成文法

• 生成文法とは、

– 普遍文法を研究するフレームワーク

• 具体的には、

– ヒトの言語の文法的現象を演繹的に記述し、

– 言語獲得を説明するための仮説群

• キーワード:

– 文法的現象 / 演繹 / 記述 / 説明

文法じゃあない?

Page 11: はじめての生成文法 《後編》

文法的現象

• 文法的現象(統語現象)

– 語を並べるときに生じる現象

• 多くは各言語に固有

– 英語と日本語の文法的現象は全く異なる

文法的現象 説明

語順 SVO, 前置詞

一致 三単現の -s とその分布

格 格変化(he/himなど)とその分布

疑問文 助動詞倒置

DO支持 疑問文・否定文のDO挿入

wh移動 文頭の疑問詞(what/whoなど)

受動文 S V O => O be V-en by S

虚辞 意味を持たない it や there を主語に

主語繰り上げ It seems that S V => S seems to V

英語の文法的現象(一部)

文法以外の現象は 対象外

(音韻・意味・形態など)

Page 12: はじめての生成文法 《後編》

演繹

演繹(えんえき、英: deduction)は、一般的・普遍

的な前提から、より個別的・特殊的な結論を得る推

論方法である。対義語は帰納。帰納の導出関係は蓋

然的に正しいのみだが、演繹の導出関係は前提を認

めるなら絶対的、必然的に正しい。したがって実際

上は、前提が間違っていたり適切でない前提が用い

られれば、誤った結論が導き出されることがある。

近代的には、演繹法とは記号論理学によって記述で

きる論法の事を指す。

わかりませんw

(Wikipedia より)

Page 13: はじめての生成文法 《後編》

「演繹」を柔らかく言うと

• 「正しいこと」の積み重ね

– 前提となる仮定(仮説・原理・公理)を認めた上で

– 順に読んでいけば、全てが正しいと言える

• 主観が入らない。人によらない

– 誰がやっても同じ理解・結論になる

• 一番重要なことは「何を前提としたか」

Page 14: はじめての生成文法 《後編》

文法により言語を「記述」する

• 次のことが出来れば、「言語を記述した」と定義

– 全ての文法的な文を文法操作で生成できる

– 非文法的な文は生成できないことを示す

• 実際には、個々の「文法的現象」について

– 適格な文を生成できることを示す

– 非文を生成できないことを示す

仮説群

生得説、普遍文法、句構造、…… 生成された

文全体

文法 操作

(演算) 辞書

(レキシコン)

その言語の 文法的な文

全て = 完全一致!

全ての文の列挙なんて できないからね!

Page 15: はじめての生成文法 《後編》

言語獲得を「説明」

• 言語獲得を次のように「説明」する

– 普遍文法 = 言語に共通のルール

– 英語を獲得 = (英語 ー 普遍文法) を身につける

• 言語獲得がかんたんということは……?

日本語

英語 ドイツ語

普遍文法=言語に共通のルール

Page 16: はじめての生成文法 《後編》

チョムスキーの生成文法

• 生成文法とは、

– ヒトの言語の文法的現象を演繹的に記述し、

– また言語獲得を説明するための仮説群

– 個別かつ例外だらけの言語それぞれが

– きちんと生成できるルールを

– できるだけ共通のものとして抜き出そう!

Page 17: はじめての生成文法 《後編》

生成文法の概略と変遷

Page 18: はじめての生成文法 《後編》

まずは

Page 19: はじめての生成文法 《後編》

言語を記述するルールを 手に入れよう

Page 20: はじめての生成文法 《後編》

句構造文法 (生成文法 0.0)

• 「文法」を表現する道具がなかった

– 「句構造」と「句構造規則」を発明

This is a pen

N

NP

Det

NP

VP

V

S

N

範疇 説明

S 文または節

N 名詞

V 動詞

P 前置詞

A 形容詞

D/Det 決定詞(冠詞)

~P ~句

Page 21: はじめての生成文法 《後編》

句構造規則

• Sからたどって、句構造を「生成」する

– 書き換え規則=句構造の枝分かれ

This is a pen

N

NP

Det

NP

VP

V

S

N

S

S → NP VP

NP VP

VP → V NP

NP V NP

NP → N

N V NP

NP → Det N

N V Det N

品詞 → 単語

This is a pen

句構造規則

Page 22: はじめての生成文法 《後編》

句構造文法

This is a pen

N

NP

Det

NP

VP

V

S

N

仮説群 生得説、普遍文法、

句構造、……、 句構造規則 生成された

文全体

文法 操作

(演算) 辞書 a, is, pen, this,

……

その言語の 文法的な文

全て =

This is a pen

こうやって 言語を記述して

いく

Page 23: はじめての生成文法 《後編》

チョムスキーの階層

• 句構造文法はチューリングマシンと等価

– どんな言語も記述できる!(原理的には)

• しかし規則が膨大になる

– 現在形・過去形・否定文・疑問文・受動態

……を生成する規則を動詞ごとに用意、とか

階層 文法 オートマトン

タイプ-0 句構造文法 チューリングマシン

タイプ-1 文脈依存文法 線形有界オートマトン

タイプ-2 文脈自由文法 プッシュダウン・オートマトン

タイプ-3 正則文法 有限オートマトン

記述力が 一番高いけど 扱うのも 一番難しい

Page 24: はじめての生成文法 《後編》

記述力のある 「文法」を手に入れた!

(原理的には)

Page 25: はじめての生成文法 《後編》

次は

Page 26: はじめての生成文法 《後編》

実際に文法ルールを 構築できるようにしよう

Page 27: はじめての生成文法 《後編》

[[改訂]拡大]標準理論 (生成文法 1.x)

• 句構造文法に「変形規則」を導入

– 例:受動文を生成する「受動変形」

• 動詞ごとに受動文を生成する規則がいらなくなる

• 文法を現実的に構築可能に!

John calls Tom

Tom is called by John

句構造規則で生成した文を変形

Page 28: はじめての生成文法 《後編》

接辞繰り下げ変形

• 助動詞(Aux)は時制・法・相(完了・進行)からなる

• 接辞(-ed や –ing)は「接辞繰り下げ変形」により直後の要素に付く

Mary love

NP VP

V

S

Aux

N Tns

[Pres]

Modal

will

Perf

have

Prog

en be ing

中村他「生成文法の新展開」(p39)より

Mary will have been loving

接辞繰り下げ変形

動詞ごとに過去・ 完了・進行の規則を用意しなくていい

Page 29: はじめての生成文法 《後編》

英語の変形規則

中井悟/上田雅信「生成文法を学ぶ人のために」(p71)より

日本語に当てはまりそうな規則は……

Page 30: はじめての生成文法 《後編》

英語の記述はだいぶ出来たけど

• こんな状態

日本語

英語 ドイツ語

Page 31: はじめての生成文法 《後編》

こうしたい!

• 「個別言語ー普遍文法」が

限りなく小さいほど嬉しい

日本語

英語 ドイツ語

Page 32: はじめての生成文法 《後編》

今のアプローチのままでは 絶対無理だ……

Page 33: はじめての生成文法 《後編》

いっそ 「全部同じ文法」 ってのはどう?

Page 34: はじめての生成文法 《後編》

GB理論/原理とパラメータのゕプローチ (生成文法 2.0)

• 普遍文法に重点を置いて、完全リニューゕル

– 前バージョン(標準理論)と互換性はありません

• 言語を「共通部分」と「可変部分」に分離

– 共通部分 → 原理

• 全ての言語の文法的現象を共通の原理で記述

– 可変部分 → パラメータ

• パラメータ:主に2値

• 脳内に「言語のデゖップスッチ」があるメージ

Page 35: はじめての生成文法 《後編》

Xバー理論

• 句構造規則に変わるもの

– X’ と書いて「Xバー」と読む

• 右の XP ツリーが基本形

– X,Y,Z は範疇のテンプレート

• X,Y,Z = N, V, P, ……

– Y, Z は空も可

ZP X

X’

XP

YP

最初は 𝑋 と

書いていたけど、

印刷の都合で 𝑋′ と

書くように

Page 36: はじめての生成文法 《後編》

Xバーの構造例

love

V

VP

DP

I’

I

IP

[Pres]

D’

D

dog

NP

John

DP

V’

the

X=I, Y=DP, Z=VP ※) I は「屈折辞」(時制などを含む範疇)で Xバーでは文は IP で表すと仮定している

X=V, Y= ∅, Z=DP

X=D, Y= ∅, Z=NP

構造は全て Xバーで

Page 37: はじめての生成文法 《後編》

句構造規則 vs. Xバー理論

• 句構造規則

– いろんなパターン

S → NP VP VP → V NP NP → N NP → Det N :

• Xバー

– 1種類だけ!

– 原理(共通ルール化)

にできる!

XP → YP X' X' → XP ZP

Page 38: はじめての生成文法 《後編》

α移動

• 変形規則に変わるもの

–αは「なんでもいい」の意味(テンプレート)

• 「任意の句を任意の位置に移動する」

– そんなんでいいの!?

John calls Tom

calls Tom John

ダメでしょう……

Page 39: はじめての生成文法 《後編》

フゖルタ

• α移動で生成された「文」のうち、非文

法的な文を「フゖルタ」で制約する

– フゖルタは共通原理として仮定する

John calls Tom

John calls Tom

John Tom calls

calls John Tom

calls Tome John

Tom John calls

Tom calls John

α移動

× John calls Tom フ

ィルタ

Page 40: はじめての生成文法 《後編》

フゖルタ

• さまざまなフゖルタがあるが、詳細は省略

– 拡大投射原理

– 空範疇原理

– θ基準

– 格フゖルタ

– 束縛原理

– 下接の条件

– :

Page 41: はじめての生成文法 《後編》

パラメータ

• 各言語固有の現象は「パラメータ」で切り替える

– パラメータ=(主に)2値の「スッチ」

• 例)語順のパラメータ(主要部位置パラメータ)

ZP X

X’

XP

YP

ZP X

X’

XP

YP

パラメータ = 主要部(X)は補部(ZP)の前 パラメータ = 主要部(X)は補部(ZP)の後

SVOはこっち

SOVはこっち

Page 42: はじめての生成文法 《後編》

パラメータ

• さまざまなパラメータがあるけど(ry

– 主要部位置パラメータ

– 空主語パラメータ

– whパラメータ

– :

ベイカー「言語のレシピ」より パラメータの階層図

ベイカー「言語のレシピ」を読むと、「あーほんとにパラメータだけで全ての言語が記述できるんだ~」という気分になれます♪

Page 43: はじめての生成文法 《後編》

原理とパラメータのゕプローチ/GB理論 (生成文法 2.0)

• パラメータが違うだけの「一種類の文法」

– 句構造規則 → Xバー理論

– 変形規則 → α移動+フゖルタ(制約)

• 記述力も一定以上(少なくとも英語は)

日本語

英語 ドイツ語

Page 44: はじめての生成文法 《後編》

問題点

• 説明的妥当性(言語獲得の容易さ)は文句な

– パラメータを決めるだけ

• しかし、原理が膨大かつ複雑怪奇に

– 言語の例外をカバー&全ての言語を共通の原

理で記述しているうちに……

Page 45: はじめての生成文法 《後編》

文法を1つにするのに 夢中で

Page 46: はじめての生成文法 《後編》

「生得しているとしたら?」 ということを

あまり考えてなかったなあ

Page 47: はじめての生成文法 《後編》

……

Page 48: はじめての生成文法 《後編》

よし!

Page 49: はじめての生成文法 《後編》

ミニマリスト・プログラム(MP) (生成文法 3.0β)

• 生得性に重点を置いて、完全リニューゕル

– ヒトの言語器官はどういう条件を満たさなければ

ならないか?

– その必要最小限の条件だけから、普遍文法を構成

することができるのではないか?

• これまでのバージョン(標準理論、GB理論)

と互換性はありません

– またかよ

Page 50: はじめての生成文法 《後編》

Bare Phrase Structure (最小句構造、裸句構造)

• Xバー理論の N’ とか D’ とかって、「最小限

の条件」から説明つかないよね?

the book

D

N’

N

D’

the book

the

Xバー理論 Bare Phrase Structure

NP

DP • そういう余計な情報は

一切加えない

Page 51: はじめての生成文法 《後編》

Move F(素性移動)

• 時間の都合で、詳細は省略

– GBでの「α移動」の代わり

Page 52: はじめての生成文法 《後編》

last resort(最後の手段)

• GB理論の「α移動」では

– 任意の要素を、

– 任意の位置に自由に移動

• 各種制約によってフゖルタリング

• MP の「素性移動」は

– 移動が必要な要素のみを、

– 移動が可能な位置に移動

• 移動は「認可が必要な素性」によって引き起こされる (詳細は省略)

Page 53: はじめての生成文法 《後編》

3つの生成文法を 比べてみよう

Page 54: はじめての生成文法 《後編》

生成文法で愛をささやく

• I love you の構造を見てみよう

– 全部似てるけど、MP が一番シンプル?

– でもこれは時制などなどを考慮していない手抜き

I love you

N

N

VP

V

S

I love you

N

N

VP

V

IP

I love you

love

love

標準理論 GB理論 ミニマリスト・プログラム

I’

I

Page 55: はじめての生成文法 《後編》

ちゃんと手抜き無しで やってみた

Page 56: はじめての生成文法 《後編》

標準理論版

I love

NP VP

V

S

Aux

N

you

NP Tns

Pres

Page 57: はじめての生成文法 《後編》

GB理論版

love

V’

V

VP

DP I’

I

IP

you

NP [Pres]

D’

D

I

NP

[]

Page 58: はじめての生成文法 《後編》

ミニマリスト・プログラム版

FF(you)

[Acc] tlove

𝑣 VP

𝑣’

N I’

I

IP

I [D]

[Nom] [φ]

you

NP 𝑣

𝑣 love [Pres] [Acc]

𝑣P

tI [EPP] [Nom] [Pres] [φ]

Page 59: はじめての生成文法 《後編》

どうしてこうなった……

Page 60: はじめての生成文法 《後編》

ミニマリスト・プログラム

• 記述力はまだ GB 理論におよばない

• 抽象性が高すぎて実感が困難

• 発展途上

– まとまった書籍は [Chomsky 1995] か、それをベースにしたもの(つまり新しくない)

– 用語の日本語訳がまだ定まっていないものも多い

• 専門家になる気がないなら、GB でやめとくのがいいかも

Page 61: はじめての生成文法 《後編》

生成文法って信じていいの?

Page 62: はじめての生成文法 《後編》

生成文法って本当なの?

• そもそも範囲はかなり限定されている

– 理想的母語話者を想定

– 意味や言語使用を捨象

• 生成文法を演繹的に導出したわけではない

– 状況証拠オンリー(反論多数←こっちも状況証拠)

– ゕブダクション(仮説形成) = 何も証明していない

言語獲得の研究には、2つの極端な立場がある。一つは、合理主義者

(rationalist)の立場であり、デカルトからチョムスキーに至る。人間には

生まれつき豊かな言語能力が備わると考える。もう一つは、経験主義者

(empiricist)の立場であり、人間はいわば白紙状態で生まれると主張する。

おそらく、真実はその中間にあるだろう。 テイラー/瀬戸「認知文法のエッセンス」より

Page 63: はじめての生成文法 《後編》

生成文法への批判

• トマセロによる生成文法批判

– 普遍文法とか言っときながら英語ばっかり!

– 生成文法家以外には認識されたことすらない概念

ばかり!

– 「名詞」や「動詞」の言語普遍性すら怪しいのだ

から、普遍文法なんてあるわけない!

• ピンカー&ジャッケンドフによるMP批判

– Xバーはある!

Page 64: はじめての生成文法 《後編》

生成文法にこだわる必要はない

• 生成文法には “fork” がいっぱいある

– 主辞駆動句構造文法 (Head-driven Phrase Structure Grammar, HPSG)

• 語彙が規則を持っている。文法≒辞書(レキシコン)

• 記述力のある文法でありながら、コンピュータで扱える

– 文法がオープンソースで開発&公開されている

• 対案もあれこれ

– 認知言語/認知文法

• カテゴリー、プロトタプ、メタフゔー、メトニミー

• 音韻と意味のレベルのみ認める

– 「品詞」も意味的に定義(無茶しやがって……)

Page 65: はじめての生成文法 《後編》

じゃあ生成文法ってウソ?

• 機械学習諸分野で「真のモデル」や「真の分布」って見たことあるの?

– 自分は持ってないのに、他の分野には「真のモデル」を求めるなんて、ゕンフェゕだよね

• 言語学習分野では役に立っている

– 精緻に記述された英文法(標準理論ベース)

• 個人的にはおもしろければOK!

“Essentially, all models are wrong,

but some are useful.” http://lingpipe-blog.com/2011/03/11/what-is-a-mathematical-model/

Page 66: はじめての生成文法 《後編》

まとめ

• 生成文法はきもかわいい刺激的でおもしろい

– 恐ろしく高い目標に肉薄したら、目標をもっと高くして仕切り直し×2とか野心的すぎる……

– 60年前は句構造文法すらなかったのに!

• 直接なにかの役には……立たないかなあw

– 間接的なら、

• FSNLP/黒本が楽勝に!(統計的な内容除く)

• モデル設計に気付きや根拠を与えてくれる(ことを期待)

• 「言語処理と言語学(生成文法)」は 「機械学習と数学」みたいな関係かな(メージ)

Page 67: はじめての生成文法 《後編》

参考文献

• 中島文雄「英語の構造」, 1980

• 中井悟/上田雅信「生成文法を学ぶ人のために」, 2004

• 大津由紀雄/他「言語研究入門 -生成文法を学ぶ人のために」, 2002

• A. ラドフォード「入門ミニマリスト統語論」, 2004/2006

• M. C. ベカー「言語のレシピ – 多様性にひそむ普遍性をもとめて」, 2001/2003

• M. D. Hauser/N. Chomsky/W. T. Fitch “The Faculty of Language: What Is It, Who Has It, and How Did It Evolve?”, 2002

• M. Tomasello “What kind of evidence could refute the UG hypothesis?”, 2004

• S. Pinker/R. Jackendoff “The faculty of language: what’s special about it?”, 2005

• S. Pinker “Language Instinct – How the Mind Creates Language”, 1994 (邦題「言語を生み出す本能」, 1995)

• 中村捷/金子義明/菊地朗「生成文法の新展開―ミニマリスト・プログラム」, 2001

• 山梨正明/有馬道子「現代言語学の潮流」, 2003

• 吉村公宏「はじめての認知言語学」, 2004

• J. R. テラー/瀬戸賢一「認知文法のエッセンス」, 2008

• 酒井邦嘉「言語の脳科学―脳はどのようにことばを生みだすか」, 2002

• N. Chomsky “The Minimalist Program”, 1995

• R. D. Levine/W. D. Meurers "Head-Driven Phrase Structure Grammar: Linguistic Approach, Formal Foundations, and Computational Realization", 2006

• M. Tomasello “Language is Not an Instinct”, 1995