第 4 章統計的検定

第 4 章統計的検定

統計学　 2013 年度

Ⅰ 　仮説検定の考え方a) 　仮説の設定

1) 　検定仮説、対立仮説2) 　片側検定、両側検定

b) 　 2 種類の誤りc) 　仮説検定の手順

Ⅱ 　 1 つの標本にもとづく検定a) 　母平均の検定

1) 　母分散が既知の場合2) 　母分散が未知の場合

b) 　母比率の検定

Ⅲ 　 2 つの標本にもとづく検定a) 　母平均の差の検定

1) 　母分散がともに分かっている場合2) 　母分散は分からないが、等しいとみなしてよい場合

※ 　等分散の検定3) 　母分散について全く分からない場合

b) 　母比率の差の検定

Ⅰ 　仮説検定の考え方次のような問題を考える。• 2012 年のセンター試験、英語の平均点は 124 点であった。• T 高校では 3 年生全員がセンター試験を受験したが、受験生の中か

ら 25 人を選んで調査したところ、その平均点は 135 点であった。• T 高校の生徒の英語の試験の成績は、全受験者平均より良いといえ

るだろうか。　⇒　この疑問に対し、統計的に答える方法が統計的検定

×

××

×

×

××

×

××

母集団（ T 高校 3 年生全員）

標本（ n=25 ）

検定 (124点より良いかどうか )

母平均 μ 標本平均 x=135

a) 　仮説の設定1) 　検定仮説、対立仮説

• この問題において、「 T 高校の生徒の英語の成績は全受験者平均と変わらない」のか、「 T 高校の生徒の英語の成績は全受験者平均より高い」のかが知りたいことである。

• T 高校の受験生全体の英語の平均点を μ とあらわすと、H0: 　 μ=124H1: 　 μ>124

　　という二者択一の仮説を考え、標本の情報によっていずれか一方の仮説を採択する。

• 検定仮説（ H0 ）　検定したい状況を表したもの。否定されることを目的とした仮説の設定をおこなうことがあるので、帰無仮説といわれることもある。（この場合、T 高校としては「全受験者平均より良い」という結論を出したいので、この仮説は否定してほしい）

• 対立仮説（ H1 ）　検定仮説と反対の状況をあらわしたもの。

　検定仮説と対立仮説は、同時に成り立つことはなく、その 2 つですべての状況をあらわしている。

2) 　片側検定、両側検定• この例では、 T 高校の受験生の平均点は「変わらな

い」か「高い」の場合のみを考えた。（ T 高校の受験生の平均点が全受験者平均より「低い」場合は考えなかった）

　　⇒　このように、対立仮説のとりうる範囲が検定仮説の片側にくる検定を片側検定という。

※ 　この例の場合、検定仮説を H0: μ 124≦ として、「 T 高校の生徒の英語の成績は全受験者平均より高くない」のか「 T 高校の生徒の英語の成績は全受験者平均より高い」のかを検定することも可能である。しかしこの場合も検定仮説は対立仮説に近い値である H0: μ=124 を用いる。理由は後述する。

H0: μ=124 H1: μ>124

• 一方、ネジを作る工場において作られたネジが規格どおりかどうかを判断する場合には、「規格どおり」か「大きいか、小さいか」という判断が必要となる。

　　⇒　この場合、対立仮説は検定仮説の両側の範囲をとる。このような検定を両側検定という。

　たとえば、ネジの直径が 5mm かどうかを検定するには、H0: μ = 5

H1: μ ≠ 5

　という両側検定をおこなうことになる。

H0: μ=5 H1: μ>5H1: μ<5

あわせて H1: μ≠5

b) 　 2 種類の誤り• 仮説検定には 2 種類の誤りがある。

• 理想的な仮説検定は第 1 種の誤りと第 2 種の誤りがともに小さくなるような検定であるが、これらを同時に成り立たせることは難しい。

• 通常は第 1 種の誤りを 0.05 などの一定の小さな値（有意水準という）以下におさえた検定をおこなう。これは H0

を否定 ( 棄却 ) する強い証拠がない限り、 H0 を採択するということである。

H0 を採択( 逮捕 )

H1 を採択( 不逮捕 )

H0 が真（真犯人）

H1 が真（無実）

正取り逃がし（第 1 種の誤

り）誤逮捕

（第 2 種の誤り）

正

c) 　仮説検定の手順

　　仮説検定は次のような手順をとる。

仮説の設定

仮説検定に適当な統計量を選ぶ

検定仮説の採択域と棄却域を設定する

H0 を採択 H1 を採択

統計量が採択域

統計量が棄却域

＜ステップ１＞

＜ステップ２＞

＜ステップ３＞

＜ステップ４＞

＜ステップ 2 ＞仮説検定に適当な統計量

• T 高校の例では、 25 人の標本平均の分布は中心極限定理により、平均 μ 、分散の正規分布にしたがう。

• これを標準化した

　は標準正規分布にしたがうので、これが仮説検定に適当な統計量である。

　（母分散が未知の場合はが自由度 n-1 の t 分布にしたがうことを使う）

0

0.01

0.02

0.03

0.04

0.05

0.06

90 100 110 120 130 140 150

＜ステップ 3 ＞採択域と棄却域の設定

• 仮説検定では、まず検定仮説が正しいと思ってみる。 T高校の例で、 σ=40 であったなら、は平均、

　　標準偏差の正規分布にしたがう。

　となる。これは標本分布の 95% の範囲内（両側検定の場合）である。⇒検定仮説を採択

00.050.10.150.20.250.30.350.40.45

-3

-2.5 -2

-1.5 -1

-0.5 0

0.5 1

1.5 2

2.5 3

3.5 4

4.5 5

標準化　→

の分布 z の分布

• もし、 z=2.5 という結果が出たなら、どのように考えれば良いのであろうか。 ( のとき、 z=2.5となる。 )

• この例の場合対立仮説を採択し、他の母集団 ( たとえば μ ＝ 145)から得られた標本と考える。

• 片側検定の場合は、 z が 0 よりだいぶ大きい場合、検定仮説を棄却して対立仮説を採択することになるが、このようなｚの値は、 μ<124 を仮定した分布 ( たとえば μ=120) のすべてにおいて、検定仮説が棄却される。

zがここだったら検定仮説を棄却し、対立仮説を採択する。

00.050.10.150.20.250.30.350.40.45

-3

-2.5 -2

-1.5 -1

-0.5 0

0.5 1

1.5 2

2.5 3

3.5 4

4.5 5

00.050.10.150.20.250.30.350.40.45

-3

-2.5 -2

-1.5 -1

-0.5 0

0.5 1

1.5 2

2.5 3

3.5 4

4.5 5

zがここだったら検定仮説を棄却し、対立仮説を採択する。

• 採択域と棄却域は次のように設定される。

• 判定の境界値はそれぞれの統計量の分布による。（統計量の分布が標準正規分布で両側検定の場合は、 -1.96と 1.96 の間に入れば採択域、それ以外が棄却域となる）

• 片側検定において有意水準 5% の検定をおこなう場合、標準正規分布にしたがう変数であれば、

　　のとき検定仮説を採択し、のとき対立仮説を採択する。• t 分布にしたがう変数であれば、 α=.05 の列から求める

自由度のものを探す。 ( ここでは、 t0.90 と表記する。 )

両側検定

片側検定

採択域棄却域棄却域

採択域棄却域

Ⅱ 　 1 つの標本にもとづく検定

a) 　母平均の検定1) 　母分散が既知の場合

次のような問題を考える。（例）　ある工場では直径 5mm のねじを標準偏差

0.04mm におさまるような管理体制で製造している。製造機械の劣化によって、品質に変化が生じたかどうかを検討するために、 9 本を標本として選んだところ、その平均が 4.97mm であった。これは品質管理上異常なしと考えて良いだろうか。

１．仮説の設定　　この例の場合、「品質管理上異常がない」か、「品質管理上異常

がある」かを検定する。　　検定仮説としては「品質管理上異常がない」という仮説を用いる。

このとき対立仮説は「品質管理上異常がある」という仮説となり、H0: μ=5 vs. H1: μ≠5

　　と表すことができる。この場合、対立仮説は検定仮説の両側をとる（「異常がある」には、「大きすぎる」と「小さすぎる」の両方が含まれ、「異常がない」という検定仮説の両側の範囲をとる）。

　　※１　検定仮説と対立仮説を逆にし、 H0: μ≠5 vs. H1: μ =5 とすることも考えられる。しかし、採択域と棄却域を構成する場合、検定仮説が正しいとみなして構成するため、検定仮説はある範囲 (複合仮説 ) より、 1 つの数値 (単純仮説 ) であることの方が望ましい。

　　※ 2 　「ねじがねじ穴に入るかどうか」を検定するなら、「ねじ穴に入る」という検定仮説と、「ねじ穴に入らない」という対立仮説が考えられる。すなわち、 H0: μ 5 vs. H≦ 1: μ > 5 とすることである。

２．検定統計量　　この例では母分散が分かっているので、標本平均を用いて、

を考えると、これは標準正規分布にしたがう。

３．採択域と棄却域　　検定仮説が正しいと仮定する。このとき、標本平均をもとに計算

した z が 0 から大きく離れていたならばこの仮定は誤りだったと考える。

00.050.10.150.20.250.30.350.40.45

-3

-2.5 -2

-1.5 -1

-0.5 0

0.5 1

1.5 2

2.5 3

3.5 4

4.5 5

zがここだったら検定仮説が正しいが

zがここだったら検定仮説は誤りで、このような分布が正

しいと考える。

𝑧=𝑥−𝜇𝜎 /√𝑛

　　この場合、 z は標準正規分布にしたがうので、有意水準 5%† の仮説検定をおこなうなら、

　　　のとき検定仮説を採択し、　　　　またはのとき対立仮説を採択する。

†　検定仮説が正しいなら、 z>1.96 または z<-1.96 となるようなが選ばれる確率は 5% である。これは第 1 種の誤りの確率すなわち有意水準が 5% であることを意味している。

４．統計量の計算　　検定仮説が正しいとみなして (μ に 5 を入れて ) 統計量を計算する

と

　　となる。よってなので棄却域に入り、検定仮説を棄却し、対立仮説を採択する。

採択域棄却域棄却域-1.96 1.96

𝑧=𝑥−𝜇𝜎 / √𝑛

=4.97−50.04 /√9

=−0.030.04/3

=−0.090.04

=−94=−2.25

2) 　母分散が未知の場合

　　母分散が未知の場合は、 z の代わりにを考え、これ

が自由度 n-1 の t 分布にしたがうことを用いて仮説検定

をおこなう。

次のような問題を考える。（例）　ある科目の試験を、平均点 70 点となるように作

成したい。そこで、 26 人をサンプルとして選び、問題をといてもらったところ、 26 人の平均点は 60 点、分散が 625 であった。試験の問題作りは成功したといえるだろうか。

（解）１．仮説の設定「平均点が 70 点である」という仮説を、「平均点

が 70 点でない」という仮説に対して検定するので、 H0: μ=70 vs. H1: μ≠70 という仮説を設定する。

２．検定統計量標本平均を用いて、

を考えると、これは自由度 n-1 の t 分布にしたがう。３．採択域と棄却域　検定仮説が正しいと仮定する。このとき、標本

平均をもとに計算した t が 0 から大きく離れていたならばこの仮定は誤りだったと考える。 t は自由度 26-1=25 の t 分布にしたがうので、 t0.95=2.060 でる。有意水準 5% の仮説検定をおこなうなら、のとき検定仮説を採択し、またはのとき対立仮説を採択する。

４．統計量の計算

　　となる。なので検定仮説を採択する。よって問題作りは成功したといえる。

𝑡=𝑥−𝜇

𝑠 /√𝑛−1

𝑡=𝑥−𝜇

𝑠 /√𝑛−1=

60−70

√625/√26−1=−1025 /5

=−105

=−2

b) 　母比率の検定

• 母比率の検定では、が標準正規分布にしたがうことを利用する。

（例）　 2013 年 6月 4日 (火 ) に放送された「 2014FIFAワールドカップ™アジア地区最終予選日本 ×オーストラリア」では、視聴率が 38.6%(関東地区 600世帯を対象 ) であった。この結果から、 35% を超えたといえるであろうか。

（解）１．仮説の設定 H0: p=0.35 vs. H1: p ＞ 0.35 という仮説を設定する。

「 35% を超えない」という検定仮説に対し、「 35% を超えた」という対立仮説を検定するので、 H0: p 0.35 vs. H≦ 1: p ＞ 0.35 であるが、検定仮説は対立仮説に最も近い 1 点を考えれば良い。(0.35 で成り立てば、それより小さな値では必ず成り立つ )

２．検定統計量標本比率を用いて、

を考えると、これは標準正規分布にしたがう。３．採択域と棄却域 z は標準正規分布にしたがうので、有意水準 5%

の仮説検定を片側検定でおこなうなら、のとき検定仮説を採択し、のとき対立仮説を採択する。

４．統計量の計算

　　となる。なので検定仮説を棄却し、対立仮説を採択する。よってこの番組の視聴率は 35% を超えたといえる。

𝑧=�̂�−𝑝

√𝑝𝑞 /𝑛

𝑧=�̂�−𝑝

√𝑝𝑞 /𝑛=

0.386−0.35

√(0.35×0.65)/600=0.0360.0195

=1.846

Ⅲ 　 2 つの標本にもとづく検定

×

××

×

××

×

×

×

×

母集団 1 （個体数N1 ）

標本 1 （個体数n1 ）

×

××

×

×××

×

×

×

母集団 2 （個体数N2 ）

標本 2 （個体数n2 ）

この差をもとに

ここに差があるかどうかを検定

a) 　母平均の差の検定

• 2 つの母平均の差の検定は、 2社のメーカーが作った電球の寿命の差があるかどうかとか、試験の成績について男女間で差があるかどうかなどを検定するときに用いられる。

• 母平均の差の検定は、母分散についての情報がどの程度あるかによって、次のように分類できる。1) 母分散がともに分かっている場合2) 母分散は分からないが、等しいとみなしてよい場合3) 母分散について全く分からない場合

１）　母分散がともに分かっている場合

　平均値の差の検定において、 2 つの標本平均の分布は、　平均 μ1－ μ2 、分散の正規分布にしたがうことが理論的に導かれ

る。　したがって、

　が、標準正規分布にしたがう。　 2 つの母集団の分散がともに分かっている場合にはこの統計量を用

いて、検定をおこなえばよい。　　⇒　ただし、このような仮定はあまり現実的ではない。

𝑧=(𝑥1−𝑥2 )− (𝜇1−𝜇2 )

√ 𝜎12

𝑛1+𝜎22

𝑛2

２）　母分散は分からないが、等しいとみなしてよい場合

　この場合の検定は、現実味と対処しやすさの両方を持っている。　母分散を等しいとみなしてよいかどうかは、後述する等分散の検定

をおこなうことが可能である。　したがって、　　等分散の検定をおこなって等分散であると判定　　 → 母分散は分からないが等しいとみなしてよい場合の検定の適

用　という手順を用いればよい。

• 母分散は分からないが、等しいとみなしてよい場合には、 2 つの標本から求められた分散を , とあらわすと、母分散の不偏推定量は

　　となり、これを用いて

　　　　を考えると、これは自由度 n1+ n2-2 の t 分布にしたがう。

𝑡=(𝑥1−𝑥2 )− (𝜇1−𝜇2 )

�̂� √ 1𝑛1+ 1𝑛2

�̂� 2=𝑛1𝑠1

2+𝑛2𝑠22

𝑛1+𝑛2−2

（例）　 A, B 2銘柄のタバコのニコチン含有量を調べたところ、銘柄 A のタバコ 10 本は平均 27.0mg 、標準偏差 1.7mg 、銘柄 B のタバコ 7 本は平均 29.3mg 、標準偏差 1.9mg であった。この 2 つの銘柄の間にニコチン含有量の差はあるであろうか。

（解）１．仮説の設定　銘柄 A のニコチン含有量を μ1 、銘柄 B のニコチン含有量を μ2 とし、 M=μ1 ｰ μ2 とすると、

H0: M=0 vs. H1: M≠0

となる。２．検定統計量標本平均を用いて、

を考えると、これは自由度 n1+n2-2 の t 分布にしたがう。

𝑡=(𝑥1−𝑥2 )− (𝜇1−𝜇2 )

�̂� √ 1𝑛1+ 1𝑛2

３．採択域と棄却域　検定仮説が正しいと仮定する。このとき、標本平均をもとに計算した t が 0 から大きく離れていたならばこの仮定は誤りだったと考える。 t は自由度 10+7-2=15 の t 分布にしたがうので、 t0.95=2.131 である。有意水準 5% の仮説検定をおこなうなら、のとき検定仮説を採択し、またはのとき対立仮説を採択する。

４．統計量の計算　 σ2 について不偏推定量

　　を用いると、

　　よってなので棄却域に入り、検定仮説を棄却し、対立仮説を採択する。

　　 2銘柄のニコチン含有量には差があるといえる。

�̂� 2=𝑛1𝑠1

2+𝑛2𝑠22

𝑛1+𝑛2−2=10× (1.7 )2+7× (1.9 )2

10+7−2=54.1715

=3.611

𝑡=(𝑥1−𝑥2 )− (𝜇1−𝜇2 )

�̂� √ 1𝑛1+ 1𝑛2=

(27.0−29.3 )−0

√3.611×( 110 + 17 )

= −2.30.936

=−2.457

※ 　等分散の検定

• 2 つの母集団の分散が等しいかどうかについても検定をおこなうことができる。この検定では、「 2 つの母集団の分散は等しい」という検定仮説に対し、「 2 つの母集団の分散は等しくない」という対立仮説を想定して検定をおこなう。すなわち、

H0：　 σ1 = σ2 　 vs. 　 H1: 　 σ1≠σ2

　　という仮説検定である。　　この場合、

　　が自由度 (n1-1, n2-1) の F 分布に従う

• F 分布は次のような形状をしている。

0

0.02

0.04

0.06

0.08

0.1

0.12

0.140

0.4

0.8

1.2

1.6 2

2.4

2.8

3.2

3.6 4

4.4

4.8

5.2

5.6 6

確率密

度

F

F分布の例

(1,1)(5,5)(2,10)(10,2)(3,28)

＜例＞　タバコの 2銘柄の間で、ニコチン含有量の母分散に差があるかどうかを検定してみる。

• 銘柄 A は 10 本で標準偏差 1.7mg 、銘柄 B は 7 本で標準偏差 1.9mg であった。

H0：　 σ1 = σ2 　 vs. 　 H1: 　 σ1≠σ2

　　という仮説検定をおこなうとき、検定統計量は

　　となり、これが自由度 (n1-1, n2-1) の F 分布に従う。　　自由度 (9,6) の F 分布の 95% 点は（ 0.231, 5.523 ）となるので、　　　　 0.231 F 5.523≦ ≦ のとき、検定仮説を採択し、　　　　 F ＜ 0.231 または F ＞ 5.523 のとき、検定仮説を棄却し、対

立仮説を採択する。

00.010.020.030.040.050.060.070.080.090.1

0

0.4

0.8

1.2

1.6 2

2.4

2.8

3.2

3.6 4

4.4

4.8

5.2

5.6 6

確率密

度

F

自由度(9,6)のF分布

𝐹=

𝑛1𝑛1−1

𝑠12

𝑛2𝑛2−1

𝑠22

　　検定統計量を計算すると

　　となるので、 0.231 F 5.523≦ ≦ より検定仮説を採択する。　　よって、 2 つの母集団の分散は等しいといえる。（より正確には

2 つの母集団の分散が異なるとはいえない）

　　この検定をおこなえば、母分散の等しい場合の検定を用いることができることがわかる。

　　†　平均値の差の検定の予備的分析としてこの検定を用いる場合、有意水準を少し大きめにとる ( たとえば 0.25 など ) 。有意水準が0.05 であると、母集団の分散が等しいという検定仮説が棄却されにくく、母分散が異なる場合にも、母分散が等しいと仮定して平均値の差の検定をおこなってしまうからである。

３）　母分散について全く分からない場合　　この場合には、

　が自由度 n1+ n2-2 の t 分布には従わないことがわかっている。　しかし、自由度を修正することによって、ｔ検定を利用することが

できる。　自由度を

　によって求めると、自由度のｔ分布に従う。（ Welch の方法）

b) 　母比率の差の検定

• 2 つの母比率 p1 および p2 に差があるかどうかを検定する場合は、

　　が標準正規分布にしたがうことを利用する。

（例）　 6月 23日 (日 ) に放送されたアニメ「サザエさん」の視聴率は 17.0%(関東地区 600世帯を対象 ) であった。この結果は、同じ 6月 23日 (日 ) に放送された「真相報道バンキシャ！」の視聴率 13.1% を上回ったといえるかどうか。

（解）１．仮説の設定「サザエさん」の視聴率を p1 、「真相報道バンキシャ！」の視聴率を p2 とし、 M= p1-p2 とすると、 H0: M=0 vs. H1: M>0 となる。

２．検定統計量標本比率 , を用いて、

を考えると、これは標準正規分布にしたがう。３．採択域と棄却域　 z は標準正規分布にしたがうので、有意水準 5%

の仮説検定をおこなうなら、のとき検定仮説を採択し、のとき対立仮説を採択する。

４．統計量の計算　 p の値が不明なので、プールした推定値　をもちいる。

　　より、なので検定仮説を棄却する。「サザエさん」の視聴率は「真相報道バンキシャ！」の視聴率を上回ったといえる。

𝑧=(�̂�1− �̂�2)− (𝑝1−𝑝2)

√𝑝𝑞( 1𝑛1+1𝑛2 )

𝑧=(�̂�1− �̂�2)− (𝑝1−𝑝2)

√𝑝𝑞( 1𝑛1+1𝑛2 )

=(0.170−0.131 )−0

√0.1505×0.8495×( 1600 + 1600 )

= 0.0390.0206

=1.893

第 4 章 統計的検定

Documents

第 4 章統計的検定