bybee and eddington 2006のχ2検定について

2
Bybee and Eddington 2006 χ 2 二乗検定について 1 χ 2 二乗検定 χ 2 検定とは,統計学における検定手法のひとつで,適合度の検定など,用途はいくつか あるが,言語学ではおもに独立性の検定のために用いられる. χ 2 検定の特徴は,標本が正規分布に従うことを前提としないことにある;したがって, χ 2 検定は標本が正規分布に従わないものにも適用できる.ここに類似する表現 X, Y が出 身の異なる作家 A, B の著作にどのように用いられるか見てみるものとする.そのとき, 用例数は表 1(a) の通りであったとする.表現 X, Y は作家 A, B で異なる用いられ方をさ れていると推定しているが,この差はそれを言うのに十分だろうか?  もし,表現 X, Y が作家 A, B に区別なく用いられているのであれば,A, B X, Y それぞれの項目の合計 の比は等しくなるはずであり,それは表 1(b) のごとくになるはずである. 1 (a) X Y A 16 40 56 B 30 20 50 46 60 104 (b) X Y A 24 32 56 B 22 28 50 46 60 104 このとき, χ 2 検定によって,この否定したい仮説が正しくないか(あるいは正しくない と言えないか)確かめることができる. χ 2 検定は,それじたい,実際と理論のずれがどのていどのものであるか示すものであ る.表 1(a) と表 1(b) について, χ 2 = i, j (O ij - E ij ) 2 E ij = 7.2186147... である(ただし,O は表 1(a)E は表 1(b)i, j はそれぞれ表の行と列を示す).自由度 1 のとき,95% の確率で仮説が正しくない χ 2 の値は,3.84 であって,今回の χ 2 値より小 さい.よって,区別はないという仮説はまずあり得ないと見てよく,けっきょく X, Y 区別はあると考えてよい. 1

Upload: kazuhiro-okada

Post on 11-Mar-2016

220 views

Category:

Documents


6 download

DESCRIPTION

Bybee and Eddington 2006のχ2検定について検討する.

TRANSCRIPT

Page 1: Bybee and Eddington 2006のχ2検定について

Bybee and Eddington 2006のχ2二乗検定について

1 χ2 二乗検定χ2 検定とは,統計学における検定手法のひとつで,適合度の検定など,用途はいくつか

あるが,言語学ではおもに独立性の検定のために用いられる.χ2 検定の特徴は,標本が正規分布に従うことを前提としないことにある;したがって,χ2 検定は標本が正規分布に従わないものにも適用できる.ここに類似する表現 X, Yが出身の異なる作家 A, B の著作にどのように用いられるか見てみるものとする.そのとき,用例数は表 1(a)の通りであったとする.表現 X, Yは作家 A, Bで異なる用いられ方をされていると推定しているが,この差はそれを言うのに十分だろうか?  もし,表現 X, Y

が作家 A, Bに区別なく用いられているのであれば,A, Bと X, Yそれぞれの項目の合計の比は等しくなるはずであり,それは表 1(b)のごとくになるはずである.

表 1

(a)

X Y 計A 16 40 56

B 30 20 50

計 46 60 104

(b)

X Y 計A 24 32 56

B 22 28 50

計 46 60 104

このとき,χ2 検定によって,この否定したい仮説が正しくないか(あるいは正しくないと言えないか)確かめることができる.χ2 検定は,それじたい,実際と理論のずれがどのていどのものであるか示すものであ

る.表 1(a)と表 1(b)について,

χ2 =∑

i, j

(Oi j − Ei j)2

Ei j= 7.2186147...

である(ただし,Oは表 1(a),Eは表 1(b),i, jはそれぞれ表の行と列を示す).自由度 1

のとき,95%の確率で仮説が正しくない χ2 の値は,3.84であって,今回の χ2 値より小さい.よって,区別はないという仮説はまずあり得ないと見てよく,けっきょく X, Yの区別はあると考えてよい.

1

Page 2: Bybee and Eddington 2006のχ2検定について

2 Bybee and Eddington 2006の χ2 検定についてBybee and Eddington 2006では,スペイン語の prefabの容認性をめぐって,quedarse

と ponerseの高頻度語・低頻度関連語・低頻度無関連語についてリッカート法*1に基づいたアンケート調査を行い,おのおの回答数を示している.このとき,おのおのの選好を χ2 検定で比較しているが,理解しにくい点がいくつか

ある.Bybee 2006 に要約されるところを見ると(述べられることは Bybee and Eddington

2006とほぼ同じである),

1. 頻回な句はもっとも容認できると判定される(χ2(1) = 51.4, p < 0.0001).2. 頻回な句と意味的に類似した低頻度語句とには,有意差が見られた(χ2(1) =

6.22, p < 0.013).3. 低頻度語の句のあいだで,頻回な語と意味的な類似を持つ語のほうが,意味的な類似を持たない語よりも多いという有意差が見られた(χ2 = 32.9, p < 0.0001).

リッカート法の調査結果について,じかに χ2 検定を適用することは,あまりないようであるが,それを措いても 1.は χ2 検定では示せないというような問題がある.χ2 検定は検出力があまりつよくないので,等確率を仮定することによって両者の同一性を見ることはできても,あらかじめ確率が仮定されているものでないことについて,大小を示すことまではできないからである.また,さきに示したクロス表は n× nの表に拡張可能だが,いずれについても,その

手法では Bybee 2006の示す χ2 値が算出できなかった(χ2 のあとの括弧は一般に自由度を示すが,自由度 1 は 2 × 2 の表のばあいであり,これについても理解しかねる).no

responseを含めるかも分明でない.標準的でない計算方法を使ったのであれば,追確認をするためにも,計算手法を示さねばならないだろう.

• Bybee, J.L., Eddington, D. 2006. A usage-based approach to Spanish verbs of

’Becoming’. Language 82: 323–355.

• Bybee, J.L. 2006. From usage to grammar: The mind’s response to repetition.

Language 82: 711–733.

*1 幾段階に分けて主観的なよしあしの評価を答える.

2