ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

40
ホホホホ ホホホホホホ 『』 ホホホホホ 84~6 (2 ホホ ホホホホホホホホホホホホ atsushi [at] si.aoyama.ac.jp Twitter: @aterao ホホホホホホホホホホホホ ホホホホホホ 「」 14 ホ

Upload: tal

Post on 23-Jan-2016

120 views

Category:

Documents


0 download

DESCRIPTION

青山学院大学社会情報学部 「統計入門」第 14 回. ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2). 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp Twitter: @ aterao. 4. 2つの平均値の差の検定. 2つ の群があるとき,その母集団平均に差があるかどうか の検定.適用例は多い. 例:参加者を2群に分け,異なった処置をし(異なった薬剤,異なった教育方法など),興味ある変数(医学的指標,テスト成績など)に関して,2群に差があるかどうかを検定する. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

ホーエル『初等統計学』第8章4節~6節 仮説の検定(2)

寺尾 敦青山学院大学社会情報学部

atsushi [at] si.aoyama.ac.jpTwitter: @aterao

青山学院大学社会情報学部「統計入門」第 14 回

Page 2: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

4.2つの平均値の差の検定• 2つの群があるとき,その母集団平均に差

があるかどうかの検定.適用例は多い.– 例:参加者を2群に分け,異なった処置をし

(異なった薬剤,異なった教育方法など),興味ある変数(医学的指標,テスト成績など)に関して,2群に差があるかどうかを検定する.

– 標本平均を計算することのできる連続型変数を測定する.「成功」と「失敗」のように計数を行う変数の場合には,割合の差の検定(後述)あるいは分割表の検定(第 10 章)を行う.

Page 3: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

平均値の差の検定での母集団• 2群の背後に,それぞれ母集団を想定する.– 例:2つの教育方法の効果を比較するとき,第1

の方法で教育された無限に多くの人と,第2の方法で教育された無限に多くの人を考える.研究への参加者はこれら母集団から抽出された標本である.

– 研究者は,「今回の研究に参加した人に関しては,2つの教育方法で成績に差が生じました」と言いたいのではない.もっと一般化した結論を述べたい.想定する母集団は結論を一般化する範囲と一致する(例:日本人の成人英語学習者)

Page 4: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

平均値の差の検定での帰無仮説• 2群の標本平均を利用して,母集団での平

均に関する検定を行う.帰無仮説 H0 : μ1= μ2

対立仮説 H1 : μ1 ≠ μ2 (両側検定の場合)• 2群の母集団平均( μ1 および μ2 )が同

一であるとしても,標本平均では2群間に差が生じることが一般的.その差が小さければ帰無仮説は棄却できない.

Page 5: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

2つの標本• 第1群の標本は,第1群の母集団から無

作為抽出されたと考える.– 大きさ n1 の標本:– 標本平均:

• 第2群の標本は,第2群の母集団から無作為抽出されたと考える.– 大きさ n2 の標本:– 標本平均:

) , , ,(111211 nxxx

) , , ,(222221 nxxx

1x

2x

Page 6: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

2つの標本平均の分布• 標本を抽出し,2群それぞれの平均を計算

することを何度も繰り返したとする.– 第1群の標本平均の分布:

• σ12 は第1群の母集団分散

– 第2群の標本平均の分布:• σ2

2 は第2群の母集団分散

• 第1群と第2群の標本平均の差の分布は?– 2つの独立な確率変数の,差の分布を考える.

),(1

21

1 nN

),(2

22

2 nN

Page 7: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

独立な確率変数の差の分布• 正規分布に従う2つの独立な確率変数– 確率変数 X1 の分布:– 確率変数 X2 の分布:

• 差 X1 – X2 の分布

– 平均は「差」だが,分散は「和」になっていることに注意!

),( 211 N

),( 222 N

) ,( 22

2121 N

Page 8: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

独立な確率変数の和の分布• 和 X1 + X2 の分布

– 平均も分散も「和」– 和および差の分布の平均は,期待値の性質か

ら明らか.分散については次のスライド.

) ,( 22

2121 N

][][][

][][][

2121

2121

XEXEXXE

XEXEXXE

Page 9: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

確率変数の和・差の分散• 2つの独立な確率変数 X1 , X2 の,和およ

び差の分散.

)])([(2][][

)])([(2])[(])[(

)])((2)()[(

])}()[{(

])}()[{(][

221121

22112

222

11

22112

222

11

22211

2212121

XXEXVXV

XXEXEXE

XXXXE

XXE

XXEXXV

確率変数 X1 , X2 の共分散(第9章).独立ならばゼロ

Page 10: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

標本平均の差の分布• 標本平均は確率変数なので,確率変数の

差の分布に関する性質を適用できる.

– 第1群の標本平均の分布:

– 第2群の標本平均の分布:

– 標本平均の差の分布:

) ,(1

21

1 nN

) ,(2

22

2 nN

) ,(2

22

1

21

21 nnN

Page 11: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

標準化と検定• 標本平均の差の分布:

• 得られた標本平均の差を標準化すれば,標準正規分布を用いた検定を行うことができる.

) ,(2

22

1

21

21 nnN

2

22

1

21

2121 )()(

nn

xxz

Page 12: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

• 帰無仮説が正しいと仮定すると, μ1 – μ2 = 0 より,

• 母集団分散が未知の場合– 大標本(目安として n1 > 25 , n2 > 25 )では,標本

分散で代用する.– 小標本でも標本分散で代用するが,正規分布のかわ

りに t 分布を用いた検定を行う.(後述)

2

22

1

21

21

2

22

1

21

2121 )()(

nn

xx

nn

xxz

Page 13: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

検定での注意• 大標本では,2群の母集団分布が正規分

布でなくてもよい.– 中心極限定理により,平均値に関しては正規

分布が利用できる.• 2群のスコアは,2つの母集団から,そ

れぞれ独立に抽出したものでなくてはならない.– 例:同一人物の右足の長さと左足の長さは関

連があるから(右足が短い人は左足も短い),これら2変数は独立ではない.(テキストp.173 )

Page 14: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

例題(テキスト p.172-175 )• 2種類の電球A,Bの寿命を,それぞれ

100 個ずつテストする.• 問題意識:2つの銘柄の間で,平均寿命

に差はあるのか?帰無仮説 H0 : μ1= μ2

対立仮説 H1 : μ1 ≠ μ2

Page 15: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

• 標本平均と標準偏差– 銘柄A

– 銘柄B

• 検定統計量(帰無仮説が正しいと仮定)

90 ,1160 11 sx

80 ,1140 22 sx

96.167.112

20

10080

10090

1140116022

z

有意ではない

Page 16: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

5.2つの割合の差の検定• 2つの群があるとき,その母集団割合に

差があるかどうかの検定.– 参加者を2群に分け,異なった処置をし(異

なった薬剤,異なった教育方法など),興味ある変数(医学的指標,テスト成績など)に関して,2群に差があるかどうかを検定する(平均の差の検定と同じ興味!).

– 平均の差の検定とは異なり,「成功」と「失敗」のように計数を行う変数を測定する(例:投薬効果の「あり」「なし」).

Page 17: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

割合の差の検定での帰無仮説• 2群の標本割合を利用して,母集団での割

合に関する検定を行う.帰無仮説 H0 : p1= p2

対立仮説 H1 : p1 ≠ p2 (両側検定の場合)• 2群の母集団割合( p1 および p2 )が同

一であるとしても,標本割合では2群間に差が生じることが一般的.その差が小さければ帰無仮説は棄却できない.

Page 18: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

2つの標本• 第1群の標本は,第1群の母集団から無

作為抽出されたと考える.– 大きさ n1 の標本:– 「成功」を1,「失敗」を0.各 x1i ( i = 1,

2, n1 )は,いずれかの値をとる.– 成功回数:

– 標本割合:

) , , ,(111211 nxxx

1112111 nxxxk

1

11ˆ

n

kp

2項分布で学習したこと!

Page 19: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

• 第2群の標本は,第2群の母集団から無作為抽出されたと考える.– 大きさ n2 の標本:– 「成功」を1,「失敗」を0.各 x2j ( j = 1,

2, n2 )は,いずれかの値をとる.– 成功回数:

– 標本割合:

) , , ,(222221 nxxx

2222212 nxxxk

2

22ˆ

n

kp

Page 20: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

2つの標本割合の分布• (大)標本を抽出し,2群それぞれの標本割

合を計算することを何度も繰り返したとする.– 第1群の標本割合の分布:

– 第2群の標本割合の分布:

• 第1群と第2群の標本割合の差の分布は?– 2つの独立な確率変数の,差の分布を考える.

))1(

,(1

111 n

pppN

))1(

,(2

222 n

pppN

中心極限定理による

Page 21: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

標本割合の差の分布• 標本割合は確率変数なので,確率変数の

差の分布に関する性質を適用できる.

– 第1群の標本割合の分布:

– 第2群の標本割合の分布:

– 標本割合の差の分布: ) ,(2

22

1

1121 n

qp

n

qpppN

),(1

111 n

qppN

),(2

222 n

qppN

11 1 pq

22 1 pq

Page 22: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

標準化と検定• 標本割合の差の分布:

• 得られた標本割合の差を標準化すれば,標準正規分布を用いた検定を行うことができる.

2

22

1

11

2121 )()ˆˆ(

nqp

nqp

ppppz

) ,(2

22

1

1121 n

qp

n

qpppN

Page 23: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

• 帰無仮説( p1 = p2 )が正しいと仮定すると, p1 = p2 = p,   q = 1 - p として,

21

21

2

22

1

11

2121

11

ˆˆ)()ˆˆ(

nnpq

pp

nqp

nqp

ppppz

21212

22

1

11 11

nnpq

n

pq

n

pq

n

qp

n

qp

Page 24: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

• 母集団割合が未知の場合– 大標本(目安として n1 > 25 , n2 > 25 )では,

標本割合で代用する.ただし,2群を合併して母集団割合を推定する(下の式).

– 小標本の場合は分割表の検定(第 10 章) にする.

21

21ˆnn

kkp

2121

21

21

21

21

111

ˆˆ

nnnnkk

nnkk

ppz

Page 25: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

例題(テキスト p.176-177 )• 2種類の薬A,Bの効果を,それぞれ 200

人ずつに投与してテストする.– 効果は「あり」か「なし」のいずれかで測定.

• 問題意識:2つの薬の間で,効果に差はあるのか?帰無仮説 H0 : p1= p2 (母集団では,効果

「あり」の割合は等しい)対立仮説 H1 : p1 ≠ p2

Page 26: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

• 標本割合と母集団割合(推定値)– 薬A:

– 薬B:

• 検定統計量(帰無仮説が正しいと仮定)

96.122.2045.0

10.0

2001

2001

29.071.0

66.076.0

z

有意である

76.0200

152ˆ1 p

66.0200

132ˆ 2 p

71.0200200

132152ˆ

p

母集団割合の推定値

Page 27: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

6.小標本法• 小標本での,特定の母平均に関する検定

H0 : μ = μ0

H1 : μ ≠ μ0 (両側検定の場合)• 標本平均の標準化

• 母集団分散 σ2 が未知の場合には,標本分散で置き換える.この検定統計量の分布は自由度 n-1 の t 分布である.

nX

Z

0

ns

Xt 0

Page 28: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

例題(テキスト p.178-179 )• ミサイルの新しい推進燃料を, 10 個の実験用ミサイルでテストする.– 平均飛行距離を測定

• 問題意識:新しい推進燃料での平均飛行距離は,これまでの燃料での平均飛行距離( 340マイル)よりも長いのか?帰無仮説 H0 : μ= 340

対立仮説 H1 : μ > 340 (片側検定)

Page 29: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

• 標本平均と標本(不偏)分散– 標本平均:– 標本分散:

• 検定統計量

360x)20( s4002 s

16.31020

340360

n

s

xt

帰無仮説が正しいとき,自由度 9 の t 分布に従う.有意水準5%,片側検定での棄却限界値は t = 1.833したがって,有意である.

Page 30: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

小標本での平均値の差の検定• 平均値の差の検定での検定統計量 z

• 小標本で母集団分散が未知の場合,標本分散を使う.ただし,単なる置き換えでは t 分布にならないため(ベーレンス-フィッシャー[Behrens-Fisher] 問題),2つの母分散が等しいと仮定してその推定を行う.

2

22

1

21

21

2

22

1

21

2121 )()(

nn

xx

nn

xxz

Page 31: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

2

22

1

21

21

nn

xxz

において,2つの母集団分散が等しい( σ12 = σ2

2 = σ2 )とさらに仮定すると,

21

2

21

2

2

1

2

21

11nn

xx

nn

xxz

母集団平均が等しいと仮定したときの,標準化された2つの平均の差

この σ2 を,標本から計算された2つの分散s1

2 および s22 を用いて推定する.

Page 32: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

222

211

222

211

222

211

)1()1(

][)1(][)1(

])1()1[(

nn

sEnsEn

snsnE

2群それぞれにおける平均からの偏差平方和の,和の期待値を計算する.

σ12 = σ2

2 = σ2 のとき,2

21 )2( nn

2

)1()1(

21

222

211

nn

snsn

したがって,

は,母集団分散 σ2 の不偏推定量である.

Page 33: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

21

2

21

2

2

1

2

21

11nn

xx

nn

xxz

仮定0:2群の母平均が等しい(検定の帰無仮説)仮定1:2群の母分散が等しい

仮定2:母集団の分布は正規分布( t 分布を利用するために必要な仮定)

2121

222

211

21

112

)1()1(nnnn

snsn

xxt

は,自由度 n1 + n2 – 2 の t 分布に従う.

テキストp.179

公式(6)

Page 34: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

検定での注意• 小標本での,2つの平均値の差についての,

t 分布を利用した検定( t 検定 と呼ぶ)では,2つの前提条件が満たされている必要がある.1. 母集団分布は正規分布2. 母集団分散が等しい

• 前提条件1は確認しないことが多いが,前提条件2は確認する(次のスライド).

Page 35: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

• 等分散の検定:小標本での平均値の差の検定では, t 検定を実行する前に,2つの母集団分散が等しいかどうかの検定を行う.– 標本分散の比をとって F 検定( F 分布を使用).– テキストでは省略されている.

• 2つの母集団分散が等しいという検定において,帰無仮説( σ1

2 = σ22 )が棄却されてし

まったときには,ウェルチ( Welch )の検定と呼ばれる検定を行うことが多い.

Page 36: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

例題(テキスト p.179-180 )• パイプまたは葉巻喫煙者11人と,紙巻きタバコの喫煙者39人で,肺に吸い込む煙の量を比較する.–血液中の COHb濃度を測定

• 問題意識:パイプまたは葉巻喫煙者と,紙巻きタバコの喫煙者で,肺に吸い込む煙の量に違いはあるのか?帰無仮説 H0 : μ1= μ2

対立仮説 H1 : μ1 ≠ μ2 (両側検定)

Page 37: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

• 標本平均と標本(不偏)分散–パイプまたは葉巻:–紙巻きたばこ:

• 検定統計量

0.1 ,3.2 11 sx7.2 ,2.5 22 sx

5.3

391

111

239117.2380.110

2.53.2)48(

22

t

帰無仮説が正しいとき,自由度 48 の t 分布に従う.有意水準5%,両側検定での棄却限界値(左側)は t = -2.0したがって,有意である.

Page 38: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

対応のあるデータ • 測定値間に対応をとることができるデータ.

(独立な2群は対応なし)– 例1:各参加者が2つの実験条件に参加– 例2:同一対象の時間的変化– 例3:類似の個体を選んで対を構成し,一方を条件1,もう一方を条件2にランダムに割り当てる.

• 参考:これらの例は,「乱塊法」( randomized block design )と呼ばれる実験方法.テキスト第 11 章「分散分析」の発展的事項.

Page 39: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

対応のある t 検定• i 番目のペア xi , yi の差を zi とする.• zi は,平均 μz ,分散 σz

2 の正規分布から,無作為に抽出されたと考える.

• ペア数が n のとき,変数 z を n 回測定したと考えれば,1標本での平均値の検定に帰着できる.

• 帰無仮説:

) ,(2

nNz z

z

0z

Page 40: ホーエル 『 初等統計学 』 第8章 4 節~6節 仮説の検定(2)

例題(章末問題 36 )• データを入力したエクセルファイル

( prob8_36.xlsx )をダウンロードし,「問題」シートで検定を実行.

• 解答は「解答」シートにある.