はじめての生成文法 《後編》
DESCRIPTION
TokyoNLP #6 での発表資料です。 前編 : http://www.slideshare.net/shuyo/tokyonlp-5TRANSCRIPT
はじめての生成文法 《後編》
TokyoNLP #6 - 2011/6/25
中谷秀洋@サボウズ・ラボ株式会社
id:n_shuyo / @shuyo
おことわり
• これだけで生成文法がわかったりしません
– あくまでもダジェスト
– 通年の講義するわけにもいかないしね!
• 素人です
– 独断と偏見も多いよ
– 鵜呑みにしないでね
• 生成文法は「仮定」「仮説」のかたまり
– NGつっこみ:「それ本当? 証拠は?」
ねらい
• 生成文法の流れを見てみる
– 「生成文法の目的って何?」
– 「生成文法にもいろいろあるみたいだけど」
– 「どうしてこうなった?」
• 生成文法に興味を持つ
– 「難しいってよく聞くけどホント?」
– 「ぶっちゃけ、おもしろいの?」
– 「なんかの役に立つ?」
もくじ 《後編》
1. 生成文法ってどんな文法?
2. 生成文法の概略と変遷
– 生成文法 0.0 (句構造文法)
– 生成文法 1.x ([[改訂]拡大]標準理論)
– 生成文法 2.0 (GB理論/原理とパラメータのゕプローチ)
– 生成文法 3.0β (ミニマリスト・プログラム)
3. 生成文法は信じていいの?
– 自然科学とフゔンタジーのすきま
前編のあらすじ
なぜヒトは言葉を話せるのか まだわかっていない
• 言語獲得
– なぜ子供は言葉をかんたんに覚えられるの?
• 言語機能の生得説
– 生まれたときから「言語のための機能」を脳
に持っているんだよ! きっと!
• でも「言語のための機能」って何だろう?
言語機能があるとしたら いったいどんなものだろう
• 乏しいデータからかんたんに言語獲得
– 4歳児でも、ほぼ完全に近い言葉を使う
– ンプットの違いに寄らず、個体差が小さい
• 言語専用の機能(他の認知機能とは独立)
– 認知機能の発達した大人に言語習得が難しい
• 任意の言語に対応
– 獲得速度にも差がない
言語機能は「言語の共通ルール」だと チョムスキーは考えた
• 普遍文法=言語の共通ルール
– 全ての言語に共通の語の並べ方のルール
– 共通ルールを生まれたときから知っていれば
• 個別言語との差分を身につければいいだけ
• 普遍文法を明らかにすれば
言語獲得の謎は解決!
生成文法ってどんな文法?
チョムスキーの生成文法
• 生成文法とは、
– 普遍文法を研究するフレームワーク
• 具体的には、
– ヒトの言語の文法的現象を演繹的に記述し、
– 言語獲得を説明するための仮説群
• キーワード:
– 文法的現象 / 演繹 / 記述 / 説明
文法じゃあない?
文法的現象
• 文法的現象(統語現象)
– 語を並べるときに生じる現象
• 多くは各言語に固有
– 英語と日本語の文法的現象は全く異なる
文法的現象 説明
語順 SVO, 前置詞
一致 三単現の -s とその分布
格 格変化(he/himなど)とその分布
疑問文 助動詞倒置
DO支持 疑問文・否定文のDO挿入
wh移動 文頭の疑問詞(what/whoなど)
受動文 S V O => O be V-en by S
虚辞 意味を持たない it や there を主語に
主語繰り上げ It seems that S V => S seems to V
英語の文法的現象(一部)
文法以外の現象は 対象外
(音韻・意味・形態など)
演繹
演繹(えんえき、英: deduction)は、一般的・普遍
的な前提から、より個別的・特殊的な結論を得る推
論方法である。対義語は帰納。帰納の導出関係は蓋
然的に正しいのみだが、演繹の導出関係は前提を認
めるなら絶対的、必然的に正しい。したがって実際
上は、前提が間違っていたり適切でない前提が用い
られれば、誤った結論が導き出されることがある。
近代的には、演繹法とは記号論理学によって記述で
きる論法の事を指す。
わかりませんw
(Wikipedia より)
「演繹」を柔らかく言うと
• 「正しいこと」の積み重ね
– 前提となる仮定(仮説・原理・公理)を認めた上で
– 順に読んでいけば、全てが正しいと言える
• 主観が入らない。人によらない
– 誰がやっても同じ理解・結論になる
• 一番重要なことは「何を前提としたか」
文法により言語を「記述」する
• 次のことが出来れば、「言語を記述した」と定義
– 全ての文法的な文を文法操作で生成できる
– 非文法的な文は生成できないことを示す
• 実際には、個々の「文法的現象」について
– 適格な文を生成できることを示す
– 非文を生成できないことを示す
仮説群
生得説、普遍文法、句構造、…… 生成された
文全体
文法 操作
(演算) 辞書
(レキシコン)
その言語の 文法的な文
全て = 完全一致!
全ての文の列挙なんて できないからね!
言語獲得を「説明」
• 言語獲得を次のように「説明」する
– 普遍文法 = 言語に共通のルール
– 英語を獲得 = (英語 ー 普遍文法) を身につける
• 言語獲得がかんたんということは……?
日本語
英語 ドイツ語
普遍文法=言語に共通のルール
チョムスキーの生成文法
• 生成文法とは、
– ヒトの言語の文法的現象を演繹的に記述し、
– また言語獲得を説明するための仮説群
– 個別かつ例外だらけの言語それぞれが
– きちんと生成できるルールを
– できるだけ共通のものとして抜き出そう!
≒
生成文法の概略と変遷
まずは
言語を記述するルールを 手に入れよう
句構造文法 (生成文法 0.0)
• 「文法」を表現する道具がなかった
– 「句構造」と「句構造規則」を発明
This is a pen
N
NP
Det
NP
VP
V
S
N
範疇 説明
S 文または節
N 名詞
V 動詞
P 前置詞
A 形容詞
D/Det 決定詞(冠詞)
~P ~句
句構造規則
• Sからたどって、句構造を「生成」する
– 書き換え規則=句構造の枝分かれ
This is a pen
N
NP
Det
NP
VP
V
S
N
S
S → NP VP
NP VP
VP → V NP
NP V NP
NP → N
N V NP
NP → Det N
N V Det N
品詞 → 単語
This is a pen
句構造規則
句構造文法
This is a pen
N
NP
Det
NP
VP
V
S
N
仮説群 生得説、普遍文法、
句構造、……、 句構造規則 生成された
文全体
文法 操作
(演算) 辞書 a, is, pen, this,
……
その言語の 文法的な文
全て =
∈
This is a pen
∈
こうやって 言語を記述して
いく
チョムスキーの階層
• 句構造文法はチューリングマシンと等価
– どんな言語も記述できる!(原理的には)
• しかし規則が膨大になる
– 現在形・過去形・否定文・疑問文・受動態
……を生成する規則を動詞ごとに用意、とか
階層 文法 オートマトン
タイプ-0 句構造文法 チューリングマシン
タイプ-1 文脈依存文法 線形有界オートマトン
タイプ-2 文脈自由文法 プッシュダウン・オートマトン
タイプ-3 正則文法 有限オートマトン
記述力が 一番高いけど 扱うのも 一番難しい
記述力のある 「文法」を手に入れた!
(原理的には)
次は
実際に文法ルールを 構築できるようにしよう
[[改訂]拡大]標準理論 (生成文法 1.x)
• 句構造文法に「変形規則」を導入
– 例:受動文を生成する「受動変形」
• 動詞ごとに受動文を生成する規則がいらなくなる
• 文法を現実的に構築可能に!
John calls Tom
Tom is called by John
句構造規則で生成した文を変形
接辞繰り下げ変形
• 助動詞(Aux)は時制・法・相(完了・進行)からなる
• 接辞(-ed や –ing)は「接辞繰り下げ変形」により直後の要素に付く
Mary love
NP VP
V
S
Aux
N Tns
[Pres]
Modal
will
Perf
have
Prog
en be ing
中村他「生成文法の新展開」(p39)より
Mary will have been loving
接辞繰り下げ変形
動詞ごとに過去・ 完了・進行の規則を用意しなくていい
英語の変形規則
中井悟/上田雅信「生成文法を学ぶ人のために」(p71)より
日本語に当てはまりそうな規則は……
英語の記述はだいぶ出来たけど
• こんな状態
日本語
英語 ドイツ語
こうしたい!
• 「個別言語ー普遍文法」が
限りなく小さいほど嬉しい
日本語
英語 ドイツ語
今のアプローチのままでは 絶対無理だ……
いっそ 「全部同じ文法」 ってのはどう?
GB理論/原理とパラメータのゕプローチ (生成文法 2.0)
• 普遍文法に重点を置いて、完全リニューゕル
– 前バージョン(標準理論)と互換性はありません
• 言語を「共通部分」と「可変部分」に分離
– 共通部分 → 原理
• 全ての言語の文法的現象を共通の原理で記述
– 可変部分 → パラメータ
• パラメータ:主に2値
• 脳内に「言語のデゖップスッチ」があるメージ
Xバー理論
• 句構造規則に変わるもの
– X’ と書いて「Xバー」と読む
• 右の XP ツリーが基本形
– X,Y,Z は範疇のテンプレート
• X,Y,Z = N, V, P, ……
– Y, Z は空も可
ZP X
X’
XP
YP
最初は 𝑋 と
書いていたけど、
印刷の都合で 𝑋′ と
書くように
Xバーの構造例
love
V
VP
DP
I’
I
IP
∅
[Pres]
D’
D
dog
NP
∅
John
DP
V’
the
X=I, Y=DP, Z=VP ※) I は「屈折辞」(時制などを含む範疇)で Xバーでは文は IP で表すと仮定している
X=V, Y= ∅, Z=DP
X=D, Y= ∅, Z=NP
構造は全て Xバーで
句構造規則 vs. Xバー理論
• 句構造規則
– いろんなパターン
S → NP VP VP → V NP NP → N NP → Det N :
• Xバー
– 1種類だけ!
– 原理(共通ルール化)
にできる!
XP → YP X' X' → XP ZP
α移動
• 変形規則に変わるもの
–αは「なんでもいい」の意味(テンプレート)
• 「任意の句を任意の位置に移動する」
– そんなんでいいの!?
John calls Tom
calls Tom John
ダメでしょう……
フゖルタ
• α移動で生成された「文」のうち、非文
法的な文を「フゖルタ」で制約する
– フゖルタは共通原理として仮定する
John calls Tom
John calls Tom
John Tom calls
calls John Tom
calls Tome John
Tom John calls
Tom calls John
α移動
× John calls Tom フ
ィルタ
フゖルタ
• さまざまなフゖルタがあるが、詳細は省略
– 拡大投射原理
– 空範疇原理
– θ基準
– 格フゖルタ
– 束縛原理
– 下接の条件
– :
パラメータ
• 各言語固有の現象は「パラメータ」で切り替える
– パラメータ=(主に)2値の「スッチ」
• 例)語順のパラメータ(主要部位置パラメータ)
ZP X
X’
XP
YP
ZP X
X’
XP
YP
パラメータ = 主要部(X)は補部(ZP)の前 パラメータ = 主要部(X)は補部(ZP)の後
SVOはこっち
SOVはこっち
パラメータ
• さまざまなパラメータがあるけど(ry
– 主要部位置パラメータ
– 空主語パラメータ
– whパラメータ
– :
ベイカー「言語のレシピ」より パラメータの階層図
ベイカー「言語のレシピ」を読むと、「あーほんとにパラメータだけで全ての言語が記述できるんだ~」という気分になれます♪
原理とパラメータのゕプローチ/GB理論 (生成文法 2.0)
• パラメータが違うだけの「一種類の文法」
– 句構造規則 → Xバー理論
– 変形規則 → α移動+フゖルタ(制約)
• 記述力も一定以上(少なくとも英語は)
日本語
英語 ドイツ語
問題点
• 説明的妥当性(言語獲得の容易さ)は文句な
し
– パラメータを決めるだけ
• しかし、原理が膨大かつ複雑怪奇に
– 言語の例外をカバー&全ての言語を共通の原
理で記述しているうちに……
文法を1つにするのに 夢中で
「生得しているとしたら?」 ということを
あまり考えてなかったなあ
……
よし!
ミニマリスト・プログラム(MP) (生成文法 3.0β)
• 生得性に重点を置いて、完全リニューゕル
– ヒトの言語器官はどういう条件を満たさなければ
ならないか?
– その必要最小限の条件だけから、普遍文法を構成
することができるのではないか?
• これまでのバージョン(標準理論、GB理論)
と互換性はありません
– またかよ
Bare Phrase Structure (最小句構造、裸句構造)
• Xバー理論の N’ とか D’ とかって、「最小限
の条件」から説明つかないよね?
the book
D
N’
N
D’
the book
the
Xバー理論 Bare Phrase Structure
NP
DP • そういう余計な情報は
一切加えない
Move F(素性移動)
• 時間の都合で、詳細は省略
– GBでの「α移動」の代わり
last resort(最後の手段)
• GB理論の「α移動」では
– 任意の要素を、
– 任意の位置に自由に移動
• 各種制約によってフゖルタリング
• MP の「素性移動」は
– 移動が必要な要素のみを、
– 移動が可能な位置に移動
• 移動は「認可が必要な素性」によって引き起こされる (詳細は省略)
3つの生成文法を 比べてみよう
生成文法で愛をささやく
• I love you の構造を見てみよう
– 全部似てるけど、MP が一番シンプル?
– でもこれは時制などなどを考慮していない手抜き
I love you
N
N
VP
V
S
I love you
N
N
VP
V
IP
I love you
love
love
標準理論 GB理論 ミニマリスト・プログラム
I’
I
ちゃんと手抜き無しで やってみた
標準理論版
I love
NP VP
V
S
Aux
N
you
NP Tns
Pres
GB理論版
love
V’
V
VP
DP I’
I
IP
∅
you
NP [Pres]
D’
D
I
NP
∅
[]
ミニマリスト・プログラム版
FF(you)
[Acc] tlove
𝑣 VP
𝑣’
N I’
I
IP
I [D]
[Nom] [φ]
you
NP 𝑣
𝑣 love [Pres] [Acc]
𝑣P
tI [EPP] [Nom] [Pres] [φ]
どうしてこうなった……
ミニマリスト・プログラム
• 記述力はまだ GB 理論におよばない
• 抽象性が高すぎて実感が困難
• 発展途上
– まとまった書籍は [Chomsky 1995] か、それをベースにしたもの(つまり新しくない)
– 用語の日本語訳がまだ定まっていないものも多い
• 専門家になる気がないなら、GB でやめとくのがいいかも
生成文法って信じていいの?
生成文法って本当なの?
• そもそも範囲はかなり限定されている
– 理想的母語話者を想定
– 意味や言語使用を捨象
• 生成文法を演繹的に導出したわけではない
– 状況証拠オンリー(反論多数←こっちも状況証拠)
– ゕブダクション(仮説形成) = 何も証明していない
言語獲得の研究には、2つの極端な立場がある。一つは、合理主義者
(rationalist)の立場であり、デカルトからチョムスキーに至る。人間には
生まれつき豊かな言語能力が備わると考える。もう一つは、経験主義者
(empiricist)の立場であり、人間はいわば白紙状態で生まれると主張する。
おそらく、真実はその中間にあるだろう。 テイラー/瀬戸「認知文法のエッセンス」より
生成文法への批判
• トマセロによる生成文法批判
– 普遍文法とか言っときながら英語ばっかり!
– 生成文法家以外には認識されたことすらない概念
ばかり!
– 「名詞」や「動詞」の言語普遍性すら怪しいのだ
から、普遍文法なんてあるわけない!
• ピンカー&ジャッケンドフによるMP批判
– Xバーはある!
生成文法にこだわる必要はない
• 生成文法には “fork” がいっぱいある
– 主辞駆動句構造文法 (Head-driven Phrase Structure Grammar, HPSG)
• 語彙が規則を持っている。文法≒辞書(レキシコン)
• 記述力のある文法でありながら、コンピュータで扱える
– 文法がオープンソースで開発&公開されている
• 対案もあれこれ
– 認知言語/認知文法
• カテゴリー、プロトタプ、メタフゔー、メトニミー
• 音韻と意味のレベルのみ認める
– 「品詞」も意味的に定義(無茶しやがって……)
じゃあ生成文法ってウソ?
• 機械学習諸分野で「真のモデル」や「真の分布」って見たことあるの?
– 自分は持ってないのに、他の分野には「真のモデル」を求めるなんて、ゕンフェゕだよね
• 言語学習分野では役に立っている
– 精緻に記述された英文法(標準理論ベース)
• 個人的にはおもしろければOK!
“Essentially, all models are wrong,
but some are useful.” http://lingpipe-blog.com/2011/03/11/what-is-a-mathematical-model/
まとめ
• 生成文法はきもかわいい刺激的でおもしろい
– 恐ろしく高い目標に肉薄したら、目標をもっと高くして仕切り直し×2とか野心的すぎる……
– 60年前は句構造文法すらなかったのに!
• 直接なにかの役には……立たないかなあw
– 間接的なら、
• FSNLP/黒本が楽勝に!(統計的な内容除く)
• モデル設計に気付きや根拠を与えてくれる(ことを期待)
• 「言語処理と言語学(生成文法)」は 「機械学習と数学」みたいな関係かな(メージ)
参考文献
• 中島文雄「英語の構造」, 1980
• 中井悟/上田雅信「生成文法を学ぶ人のために」, 2004
• 大津由紀雄/他「言語研究入門 -生成文法を学ぶ人のために」, 2002
• A. ラドフォード「入門ミニマリスト統語論」, 2004/2006
• M. C. ベカー「言語のレシピ – 多様性にひそむ普遍性をもとめて」, 2001/2003
• M. D. Hauser/N. Chomsky/W. T. Fitch “The Faculty of Language: What Is It, Who Has It, and How Did It Evolve?”, 2002
• M. Tomasello “What kind of evidence could refute the UG hypothesis?”, 2004
• S. Pinker/R. Jackendoff “The faculty of language: what’s special about it?”, 2005
• S. Pinker “Language Instinct – How the Mind Creates Language”, 1994 (邦題「言語を生み出す本能」, 1995)
• 中村捷/金子義明/菊地朗「生成文法の新展開―ミニマリスト・プログラム」, 2001
• 山梨正明/有馬道子「現代言語学の潮流」, 2003
• 吉村公宏「はじめての認知言語学」, 2004
• J. R. テラー/瀬戸賢一「認知文法のエッセンス」, 2008
• 酒井邦嘉「言語の脳科学―脳はどのようにことばを生みだすか」, 2002
• N. Chomsky “The Minimalist Program”, 1995
• R. D. Levine/W. D. Meurers "Head-Driven Phrase Structure Grammar: Linguistic Approach, Formal Foundations, and Computational Realization", 2006
• M. Tomasello “Language is Not an Instinct”, 1995