統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法...

26
多重比較法 大学 医学

Upload: others

Post on 01-Sep-2019

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

  

統計的検定資料①  

多重比較法

弘前大学 医学部 保健学科  

理学療法学専攻

対馬 栄輝

Page 2: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1

目 次

第 1章 多重比較法 1

1.1 はじめに : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1

1.2 多重比較法の前に : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1

1.2.1 t検定の繰り返しによる検定多重性の問題 : : : : : : : : : : : : : : : : : : : : : : : 1

1.2.2 帰無仮説の特徴 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 2

1.2.3 仮説採択の解釈 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 3

1.2.4 スチューデント化された範囲 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 3

1.3 パラメトリック法(等分散性が仮定できるとき) : : : : : : : : : : : : : : : : : : : : : : : 4

1.3.1 Fisher's PLSD(Protected Least Signi¯cant Di®erence) : : : : : : : : : : : : : : : 4

1.3.2 Tukeyの方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 4

1.3.3 Sche®¶eの方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5

1.3.4 Dunnettの方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 6

1.3.5 Bonferroniの方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 7

1.3.6 Newman-Keulsの方法  : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 8

1.3.7 Duncanの方法  : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 8

1.3.8 Waller-Duncanの方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 8

1.3.9 その他の方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 9

1.4 パラメトリック法(等分散性が仮定できないとき) : : : : : : : : : : : : : : : : : : : : : : 10

1.4.1 Games-Howellの方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 10

1.4.2 Dunnettの Cの方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 10

1.4.3 Tamhaneの T2の方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 10

1.5 ノンパラメトリック法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 11

1.5.1 Steel-Dwassの方法  : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 11

1.5.2 Steelの方法  : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 11

1.5.3 Dunnの方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 11

1.5.4 その他の方法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 11

1.6 多重比較法適用の留意点 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 12

1.6.1 多群の比較について : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 12

1.6.2 多重比較法として不適切な手法 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 12

1.6.3 標本の大きさ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 13

1.6.4 等分散性 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 14

1.6.5 分散分析との整合性 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 14

1.7 多重比較法の手法選択 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 15

Page 3: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.7.1 適用条件の確認 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 16

1.7.2 多重比較法の選択 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 17

1.8 データ解析の実際 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 18

1.8.1 データ例 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 18

1.8.2 解析手順 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 18

1.8.3 解析結果 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 20

1.8.4 まとめ : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 20

Page 4: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1

第1章 多重比較法

1.1 はじめに

2標本(以降便宜的に“群”と呼ぶこともある)の平均値を比較するには t検定を用いる.3標本以上の

平均値の比較には分散分析を利用するa .分散分析では対象とする全群に対して一度に検定を行うため,興

味のある対の比較に関しては情報が得られない.そのためには,多重比較法(multiple comparison)を行

う必要がある.多重比較法の定義は,吉村 [1]によると“いくつかの水準・群がある.その相互に平均値的

な値(パラメータとして数値で表現出来ればそれでよい)において,差異があるかどうかを検定という推測

形式で確認したい.水準・群の各対で検定を行うと多重性のために公称の有意水準に比べて,第 1種の過

誤の確率が大きくなる.この現象を防ぐために多重性を考慮した公称の有意水準,つまり棄却限界値ある

いは棄却域の調整を行って検定する.このやり方を多重比較法という.”と述べられている.

 以降では一元配置モデルに基づく多重比較法を述べる.二元配置以上のモデルに関しては自由度の概念

が異なる程度で,基本的には一元配置モデルと異なることはない.従って,一元配置モデルの理論,計算法

を把握できれば十分である.

1.2 多重比較法の前に

1.2.1 t検定の繰り返しによる検定多重性の問題

3群以上の検定のために,なぜ t検定を用いてはならないのかを説明する.仮に A,B,Cの 3群があっ

たとする.それぞれ平均値 ¹A=¹B=¹C,かつ分散値 ¾2A=¾2

B=¾2C と仮定しよう.

  Aと Bの差の検定で帰無仮説が採択される事象を AB,同様に Bと Cでは BC,Aと Cでは ACとす

る.ABc,BCc,ACc は背反の事象,すなわち対立仮説が採択される事象である.ここで A,B,Cに対す

る t検定のそれぞれ有意水準の確率 ®(type Ⅰ error)を 5%とおくと,

P[AB]= P[BC]= P[AC]= 0:95,P[ABc]= P[BCc]= P[ACc]= 0:05 (2.1)

である.正しい判定は,全ての場合において“帰無仮説が採択されたとき”である.誤りの判定 Erは,少

なくとも一つの検定で“帰無仮説が棄却されたとき”であるから,

P[Er]= P[Ω]- P[AB∩ BC∩ AC]= 1-(0:95)3= 0:142625 (2.2)

となる.従って,約 3倍の type Ⅰ errorが生じてしまう.これは検定数によって増加し,一般に

1-(1-α)k(α=検定の有意水準,k=検定数) (2.3)

で表せる.このことから,3群以上の比較には t検定が利用できないことがわかる.a この考え方は慣習的なものであり,正しい手順かどうかはについては後述する.

Page 5: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

2 第 1章 多重比較法

1.2.2 帰無仮説の特徴

3群の平均値の比較を例に挙げて述べる.3群を A,B,Cと仮定する.分散分析での帰無仮説は,

H0:¹A=¹B=¹C (2.4)

であり,これを包括的帰無仮説(overall null hypothesis)と呼ぶ.その他の平均値の比較における帰無仮説

の全組み合わせは,

H0{AB}:¹A=¹B (2.5)

H0{AC}:¹A=¹C (2.6)

H0{BC}:¹B=¹C (2.7)

である.これらは部分帰無仮説(subset null hypothesis)と呼ばれ,これらの集合を帰無仮説族(family of

subset null hypothesis)またはファミリーという.ファミリーは興味のある比較によって異なり,全ての対

比較なら,

F1={H0{AB},H0{AC},H0{BC}} (2.8)

であったり,Aと他の群の比較に限るなら,

F2={H0{AB},H0{AC}} (2.9)

であったりする.多重比較法を適用するためには,このファミリーを事前に定義する必要がある.そして,

各ファミリーごとの有意水準 ®を,特に typeⅠ familywise error rate(以下,typeⅠ FWE)という.type

Ⅰ FWEは正しい帰無仮説のうち,少なくとも 1つが誤って棄却されてしまう確率である.多重比較のある

手法において,typeⅠ FWEが有意水準 ®よりも小さくなるときには“保守的(conservative)な手法”と

いわれる.typeⅠ FWEが有意水準 ®よりも大きくなるときには多重比較法として適切ではない.

※多重比較法における過誤の種類  

  typeⅠ FWEに併せて,多重比較で留意すべき過誤の種類を述べる.

1. 第Ⅰ種の過誤(type Ⅰ error):実際には差がないのに,有意差ありと判定する誤り.

2. 第Ⅱ種の過誤(type Ⅱ error):実際には差があるのに,有意差無しと判定する誤り.

3. 第Ⅲ種の過誤(type Ⅲ error):実際には正の差(負の差)があるのに,有意な負の差(正の差)があ

ると判定する誤り.

 これらの過誤について実例を挙げて考えてみよう.Aと Bと Cがあって,それぞれの平均値を ¹A=¹B

=¹C と仮定する.¹A 6= ¹B または ¹B 6= ¹C の様な結果を得たなら,これは第Ⅰ種の過誤である.逆に

¹A 6= ¹B 6= ¹C であるときに ¹A=¹B または ¹B=¹C の様な結果を得たなら,第Ⅱ種の過誤である.¹A<

¹B<¹C であるときに ¹A>¹B,¹B>¹C という結果を得たなら第Ⅲ種の過誤である.場合によっては ¹A

>¹B または ¹B>¹C の場合に ¹C>¹Aとなることもあり,解釈困難となってしまう.多重比較法では,第

Ⅲ種の過誤も考慮して解釈する必要がある.

Page 6: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.2. 多重比較法の前に 3

1.2.3 仮説採択の解釈

多重比較法における対立仮説の採択については,慎重に扱わねばならない.多重比較法では通常の検定法

に比べて typeⅠ FWEを有意水準以下に抑えるといったコントロールが重視され,帰無仮説が採択される

可能性が高まっているからである.この意味で,多重比較法では typeⅡ errorの考え方が理論的に難しい.

同様に,“帰無仮説を採択する”という考え方ではなくて“帰無仮説を保留する”という方がふさわしい.

1.2.4 スチューデント化された範囲

t検定では,求めた統計値に対して t分布を利用して判定する.多重比較法では,検定数を考慮した別の

統計量,すなわちステューデント化された範囲(Studentized range)qを用いる手法が多い.qは統計量の

一つであり,以下の式によって求められる.

 互いに独立で正規分布からの標本,x1,…,xj(j = 1,…,p)を仮定し,x1,…,xj の繰り返し数を nと

する.¹xj=ni=1 xij=n(j = 1,…,p)を求めて,¹x1,…,¹xj のうちの最大値を ¹xmax,最小値を¹xmin とし

て,

q=¹xmax-¹xmin

s=p

n(2.10)

を求める.ここで s2= pj=1

ni=1(xij-¹xj)2=(pn- p)である.

 判定には q表を利用するが,q表に無い値を求める場合は補間の方法がある.q(a,ÁE;®)で aは群数,ÁE

は誤差自由度,®は有意水準である.誤差自由度は ÁE= N - a= n1 +…+ na- aで求められる.ÁE前

後のÁ1(ÁE>Á1),Á2(ÁE<Á2)が与えられているとき,q(a,Á1;®)及び q(a,Á2;®)の値を用いて,以下の

ように補間する.

q(a,ÁE;®)=1=ÁE- 1=Á2

1=Á1- 1=Á2q(a,Á1;®)+

1=Á1- 1=ÁE

1=Á1- 1=Á2q(a,Á2;®) (2.11)

Page 7: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

4 第 1章 多重比較法

1.3 パラメトリック法(等分散性が仮定できるとき)

一概に多重比較法といっても多種多様の手順がある.しかも,まだ確立した手法とは言い難いために最適

な手法を選択する基準は無い.ここでは,最も利用される機会の多い手法を紹介して,代表的なものは簡単

な計算法も述べることにする.

1.3.1 Fisher's PLSD(Protected Least Signi¯cant Di®erence)

Fisher's PLSD(制約付最小有意差検定)は,単に LSD法(LSD検定)と呼ばれることもあるb .分散

分析の後に行う,post-hoc比較c の手法としては最も古い.LSD法は多重比較法としてふさわしくないこと

が理論的に確認されているため,計算手順を省略する.無制約 LSD(unprotected LSD)は,事前に分散分

析を行わない手順である.

1.3.2 Tukeyの方法

Tukeyの方法には,HSD検定(Tukey's honestly signi¯cant di®erence test)とWSD検定(Tukey's wholly

signi¯cant di®erence test)がある.HSD検定は Tukeyの a法とか Tukeyの q検定とも呼ばれ,WSD検定

は Tukeyの b法とも呼ばれる.一般に Tukeyの方法というときには HSD検定の方を指し,ここでは HSD

検定を Tukeyの方法とする.

  Tukeyの方法は群間で全ての対比較を同時に検定するための多重比較法である.Tukeyの方法では以下

の前提条件が満たされていなければならない.

1. 母集団分布は正規分布とする.

2. 比較対象となる全ての群の母分散は等しい.

この条件が満たされているならば,以下の手順d で計算する.データの群数は 1,…,a個とし,それぞれ

標本の大きさを n1,…,na とする.

  iと j(i = 1,…,a;j = 1,…,a;i≠ j)の比較に対しての帰無仮説H0{ij}は,

H0{ij}:¹i=¹j (3.12)

である.

1.ファミリーの決定 比較の対象となるファミリーを決定する.a群で全ての対比較をしたいなら,F ={H0{12},H0{13},…,H0{ij}}(i = 1,…,a;j = 1,…,a;i< j)となる.

2.平均値分散値を求める a群の平均値 ¹x1,…,¹xi と,分散値 s1,…,si(i= 1,…,a)を求める.

¹xi=

ni

k=1

xik

ni,   si=

ni

k=1

(xik-¹xi)2

ni- 1 (i= 1,…,a) (3.13)

b F-protected Fisher's Least Signi¯cant Di®erence とも呼ばれる.c post-hoc 比較(事後検定)とは,個々の平均値の差について特に仮説を持たない場合の比較である.a posteriori な比較(ア・

ポステリオリ比較)ともいう.d 本来の Tukeyの方法とは,全ての群の標本の大きさが等しい場合に適用するものである.ここで述べる計算式は,各群の標本の

大きさが等しくない場合にも拡張できる手法で,正確には Tukey-Kramer の方法と呼ばれる.

Page 8: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.3. パラメトリック法(等分散性が仮定できるとき) 5

3.誤差自由度 ÁE と誤差分散 Se を求める

ÁE= N - a= n1 +…+ na- a (N =a

i=1

ni) (3.14)

Se=

a

i=1

(ni- 1)si

ÁE(3.15)

4.検定統計量 tij を求める

tij=¹xi-¹xj

Se1

ni+

1

nj

  (i= 1,…,a;j = 1,…,a;i< j) (3.16)

5.判定 判定は,

   jtij j ¸ q(a,ÁE;®)=p

2なら,H0{ij}を棄却

   jtij j< q(a,ÁE;®)=p

2なら,H0{ij}を保留

とする.なお,q(a,ÁE;®)=p

2は,ステューデント化された範囲の上側 100®%点である.

1.3.3 Sche®¶eの方法

Sche®¶eの方法の特徴は,対比e (contrast)による全ての仮説を同時に検定するための多重比較法とい

うことである.対比とは,a

i=1

ci¹i,ここで,a

i=1

ci= 0 (i= 1,…,a) (3.17)

のとき,(3.17)式において対比係数 ci を適当に定めて帰無仮説H0 を,

H0:a

i=1

ci¹i= 0  (3.18)

とすることである.

 例えば,¹i(i= 1,2,3,4)のうち,¹1と¹2の比較を行いたいときは c1= 1,c2=- 1,c3= 0,c4= 0とお

けばよい.これを応用して,c1= 0:5,c2= 0:5,c3=- 0:5,c4=- 0:5とおくと,¹1と¹2の平均値と ¹3と¹4

の平均値を比較することになる.このように(3.18)式の条件下であらゆる c1,c2,c3,c4 の値を定めて対

比を行うことができる手法である.判定には F統計量を用いるので,ANOVAの結果と一致する.しかし

検出力が低くなる欠点も有しており,単純な群間の比較には使用しない方が良い.

  Sche®¶eの方法も Tukeyの方法と同様,

1. 母集団分布は正規分布とする.

2. 比較対象となる全ての群の母分散は等しい.

が満たされていなければならない.この下で計算手順を述べる.

1.ファミリーの決定 比較の対象となるファミリーを決定する.(3.18)式と同じである.e 線形対比または線形比較ともいう.

Page 9: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

6 第 1章 多重比較法

2.平均値分散値を求める a群の平均値 ¹x1,…,¹xi と,分散値 s1,…,si(i= 1,…,a)を求める.

¹xi=

ni

k=1

xik

ni,   si=

ni

k=1

(xik-¹xi)2

ni- 1 (i= 1,…,a) (3.19)

3.誤差自由度 ÁE と誤差分散 Se を求める

ÁE= N - a= n1 +…+ na- a (N =a

i=1

ni) (3.20)

Se=

a

i=1

(ni- 1)si

ÁE(3.21)

4.検定統計量 tij を求める

F =

a

i=1

ci¹xi

2

=ÁA

Se

a

i=1

c2i =ni

, ÁA= a- 1  (i= 1,…,a) (3.22)

5.判定 判定は,

   F ¸ F(ÁA,ÁE;®)なら,H0 を棄却

   F < F(ÁA,ÁE;®)なら,H0 を保留

とする.

1.3.4 Dunnettの方法

Dunnettの方法は,1つの対照群と 2つ以上の処理群があり,母平均について対照群と処理群の対比較の

みを同時に検定するものである.他に検定手続きが異なるステップダウン法f の Dunnettの逐次棄却型検

定法がある.

 検定に先立ち,

1. 母集団分布は正規分布とする.

2. 比較対象となる全ての群の母分散は等しい.

が満たされていなければならない.

 第 1群を対照群,第 i群(i= 2,3,…,a)を処理群として対照群と処理群の母平均の対比較を考える.

1.ファミリーの決定 比較の対象となるファミリーを決定する.ここではF={H0{12},H0{13},…,H0{1a}

}となる.

f 一つの部分帰無仮説を検定して,その結果を見た後で次のステップに進む方法をステップワイズ法と呼ぶ.ステップワイズ法はさらに,ステップアップ法とステップダウン法に分けられる.例えばステップダウン法とは最初に全ての平均値を一度に検定して帰無仮説が棄却されれば,その後に各水準の組み合わせで検定していく方法である.対して,Tukey の方法や Sche®¶e の方法などはシングルステップ法と呼ばれる.

Page 10: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.3. パラメトリック法(等分散性が仮定できるとき) 7

2.対立仮説の決定 F ={H1{12},H1{13},…,H1{1a}}に対する対立仮説 H1{1i}を明示する.

H1{1i}:¹1 6= ¹i (3.23)

H1{1i}:¹1>¹i (3.24)

H1{1i}:¹1<¹i (3.25)

3.平均値分散値を求める a群の平均値 ¹x1,…,¹xi と,分散値 s1,…,si(i= 1,…,a)を求める.

¹xi=

ni

k=1

xik

ni,   si=

ni

k=1

(xik-¹xi)2

ni- 1 (i= 1,…,a) (3.26)

4.誤差自由度 ÁE と誤差分散 Se を求める

ÁE= N - a= n1 +…+ na- a (N =a

i=1

ni) (3.27)

Se=

a

i=1

(ni- 1)si

ÁE(3.28)

5.検定統計量 tij を求める

t1i=¹x1-¹xi

Se1

n1+

1

ni

  (i= 1,…,a) (3.29)

5.½を求めるn2

n2 + n1(n2= n3=…= naを仮定) (3.30)

5.判定 対立仮説によって,判定方法は異なる.

(3.23)の場合:Dunnettの d表より,d(a,ÁE,½;®)を求め,jt1ij ¸ d(a,ÁE,½;®)となるなら,H0{1i}を

棄却し,¹1と¹iには差があると判定する.jt1ij< d(a,ÁE,½;®)なら,H0{1i}を保留する.

(3.24)の場合:Dunnettの d0表より,d0(a,ÁE,½;®)を求め,t1i ¸ d0(a,ÁE,½;®)となるなら,H0{1i}を

棄却し,¹1と¹iには差があると判定する.t1i< d0(a,ÁE,½;®)なら,H0{1i}を保留する.

(3.25)の場合:Dunnettの d0表より,d0(a,ÁE,½;®)を求め,t1i ∙- d0(a,ÁE,½;®)となるなら,H0{1i}

を棄却し,¹1と¹i間には差があると判定する.t1i>- d0(a,ÁE,½;®)なら,H0{1i}を保留する.

1.3.5 Bonferroniの方法

Bonferroniの不等式に基づくステップワイズの多重比較法である.Bonferroniの不等式とは k個の事象Ei

(i= 1,2,…,k)に対して,

P rk

i=1

Ei ∙k

i=1

P r(Ei) (3.31)

Page 11: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

8 第 1章 多重比較法

が成り立つ,といったものである.k = 3ならば,Pr[E1 [E2 [E3] ∙ P r[E1] + P r[E2] + P r[E3]となるこ

とは自明であろう.

  ¹1=¹2=¹3の下で F ={H0{12},H0{13},H0{23}}とした検定を行うとして(3.31)式に当てはめる.

H0{12}が誤って棄却される事象を®1,以下順に®2,®3 までとすると,

P r[®1 [ ®2 [ ®3] ∙ P r[®1] + P r[®2] + P r[®3]

となる.最大 typeⅠ FWEが有意水準 ®以下となるためには,

P r

3

i=1

®i ∙ ®

であることから,

P r[®i] ∙ ®=3(i= 1,2,3)

となるから,一つの検定ごとに ®=3として行うとよい.

  Bonferroniの方法はファミリーをどのようにも設定でき,検定統計量もどのようなものでも良いという

利点がある.例えば,Â2 検定に応用することもできる.また,標本どうしが独立でない場合にも利用でき

る.しかし,(3.31)式でいうところの kが大きいときには保守的になってしまう欠点がある.

 Bonferroniの方法を改良(特に kが大きい場合)したものとしてHolmの方法 [2]や,Sha®erの方法 [3]g も

あり,理論的には同様である.その他,Simesの不等式に基づく方法(Hochbergの方法 [4],Hommelの方

法 [5],Romの方法 [6]など)があるが,これらは数理的に確立していないため積極的に用いることは出来

ない.

1.3.6 Newman-Keulsの方法 

Newman-Keulsの方法は,Student-Newman-Keulsの方法(S-N-K法)とも呼ばれる.この方法は,最

大 typeⅠ FWEを有意水準以下に抑えることができないため,多重比較としては適切でないことが知られ

ている.

1.3.7 Duncanの方法 

Duncanの方法は,Newman-Keulsの方法 [→ 1.3.6節]が基礎となっている.typeⅠ FWEは t検定とほ

ぼ同じ大きさになることが知られており,多重比較法としてはふさわしくない手法である.にもかかわら

ず,生物学や農学の分野では頻繁に用いられているようである [8].

1.3.8 Waller-Duncanの方法

Duncanの方法 [→ 1.3.7節]よりも新しい手法である.しかし,これも多重比較法としては適切でない.

g Sha®er の方法で Bonferroni の不等式の代わりに∙Sid¶ak の不等式(検出力は Bonferroni の方法より高く,Tukey の方法より劣る)を用いた Holland-Copenhaver の方法もある

Page 12: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.3. パラメトリック法(等分散性が仮定できるとき) 9

1.3.9 その他の方法

Williamsの方法は Dunnettの方法と類似しているが,事前に各群の順位を想定できる場合に適用させる

方法である.その他に,Tukey-Welschの方法 [7],Peritzの方法h ,Hochberg's GT2の方法,Gabrielの方

法,ステップダウン法の Ryan-Einot-Gabriel-Welschの方法(R-E-G-Wの方法ともいう)などがある.多

重比較法の手法が多く存在するのは理論的に確立していないことの現れであり,明らかに誤った方法と明示

したもの以外はどの方法を用いても誤りとはいえない現状である.

h Newman-Keuls の方法と Tukey-Welsch の方法を組み合わせたステップダウン法で,多重比較法として妥当な手順である.

Page 13: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

10 第 1章 多重比較法

1.4 パラメトリック法(等分散性が仮定できないとき)

ここでは正規分布に従いかつ,等分散性が仮定できない標本の比較を行う際の手法について述べること

にする.

1.4.1 Games-Howellの方法

Games-Howellの方法 [9]はTukey型対比の方法で,Welchの統計量を基礎とした多重比較法である.従っ

て(3.16)式に基づき,a水準の比較の場合,分母を変形した以下の式,

tij=¹xi-¹xj

s2i

ni+

s2j

nj

  (i= 1,…,a;j = 1,…,a;i< j) (4.32)

s2i=

ni

k=1

(xik-¹xi)2=ºi,ºi= ni- 1;s2j=

nj

k=1

(xjk-¹xj)2=ºj,ºj= nj- 1

によって計算する.

 限界値は,q(a,ºij,®)によって求められる.ただし,

ºij=(s2

i =ni + s2j=nj)2

s4i =n2

i(ni- 1)+ s4j =n2

j(nj- 1)(4.33)

である.

 適用は,Tukeyの方法 [→ 1.3.2節]と同様である.これは,標本の大きさが異なる群どうしの比較には

向かない.

1.4.2 DunnettのCの方法

Dunnettの Cの方法は Games-Howellの方法と同じ検定統計量を(4.33)式から求めるが,限界値の求

め方は異なる.標本の大きさが小さいときi は,Dunnettの T3の方法が適する.いずれも,標本の大きさ

が異なる群どうしの比較には向かない.

1.4.3 TamhaneのT2の方法

上記の手法と同様にWelthの統計量を基礎とした多重比較法である.

i 例数が少ないとき,Games-Howell の方法は有意水準を保てなくなり,Dunnett の C の方法は保守的になる.これらの欠点を補うべく,2 方法の限界値の平均を限界値とする Games-Howell-C の方法がある.しかし,例数が少ないときに必ずしも有効な手段とは限らない.

Page 14: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.5. ノンパラメトリック法 11

1.5 ノンパラメトリック法

以降ではノンパラメトリック法(分布に依らない方法)を説明する.ノンパラメトリック法に基づく多重

比較法を適用させるにあたり,注意しなければならない点を以下に挙げる.

1. 比較対照とする標本の母集団分布はどのような分布でも良いが,各標本の母集団分布は同一でなけれ

ばならない.

2. 各標本の不等分散性が存在する場合でも,母集団分布が不明とは限らない.母集団が正規分布に従っ

て,各標本が等分散とならないことはあり得るj .

3. 標本の大きさが小さいとき(特に,大きさ n< 10のとき),ノンパラメトリック法の適用が困難となる

(大標本近似のため).また,各標本の大きさが著しく異なるときにも誤った判定をすることがあるk .

4. 同順位が多いとき,同順位補正が必要.

ノンパラメトリック法が適するのは,外れ値(outlier)が存在するときや,変数の測定尺度が順序尺度のと

きである.以下に代表的な手順を述べる.

1.5.1 Steel-Dwassの方法 

Steel-Dwassの方法は Tukeyの方法のノンパラメトリック版である.従って,全ての対比較を同時に検定

するための多重比較法となる.

1.5.2 Steelの方法 

Steelの方法の適用は,パラメトリック法のDunnettの方法と同様である.対照群と他の 2つ以上の処

理群を対比較するときに用いる方法である.

1.5.3 Dunnの方法

平均値の代わりに平均順位を用いて検定する方法.Dunnettの方法と同様に 1つの対照群と 2つ以上の処

理群の対比較のみを同時に検定する手順もある.米国National Institutes of Healthの National Toxicology

Program毒性癌原性試験の報告書で常用されている方法である.

1.5.4 その他の方法

Williamsの方法([→ 1.3.9節参照])のノンパラメトリック版として Shirley-Williamsの方法がある.

その他,多種にわたる方法が用意されている.なお,Bonferroniの方法は検定統計量に制限が無いことか

ら,ノンパラメトリックな手法としても考えることができる.

j このとき,等分散性を検定してからパラメトリック法とノンパラメトリック法を使い分ける手順があるが,これは明らかな誤りである.

k パラメトリック法にもいえることである.

Page 15: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

12 第 1章 多重比較法

1.6 多重比較法適用の留意点

この節では,多重比較法の適用上の基本的な留意点を述べる.

1.6.1 多群の比較について

多群を比較するときには,必ずしも多重比較法を用いなければならないわけではない.各検定の帰無仮説

の扱いによっては,多重比較法を用いることができなくなる.以下のベン図は,左が多重比較の場合で右が

t検定の繰り返しの場合を表している.  

図 1.1 多重比較法と t検定の帰無仮説を表すベン図

  

この図では,多重比較の場合は複数の検定について“少なくとも 1つの帰無仮説が採択される”という事

象(図 1.1の左図斜線部分)であるのに対して,t検定の繰り返しでは“Aと B・Aと Cの帰無仮説を同時

に採択する”という事象(図 1.1の右図斜線部分)になっている.

 例えば,Aという新薬と Bと Cという従来からの薬があったとする.Aと Bと Cのうち,どの薬が優

れているかを比較する場合は多重比較法が適用される(図 1.1左図).つまり,Aと Bと Cの間のどれか

(Aまたは [or;∪]Bまたは C)には差があるといったことを結論づけたい場合である.しかし,Bよりも

Aが優れて(劣って)いて“かつ(and;∩)”Cよりも Aが優れて(劣って)いるという結論を得たいと

きや,Bと Aに効果の差があって,“かつ”Cと Aに効果の差があるといった結論を得たい場合は,Aと

B,Aと Cの t検定の繰り返しでよいことになるl (図 1.1右図).

 また,回帰分析や階層構造分散分析(hierarchial ANOVA[他章を参照])を用いた方が適当となることも

ある.この点に関しては,山村 [10]が参考となる.

1.6.2 多重比較法として不適切な手法

当然ながら t検定を繰り返す手順が挙げられる.また,LSD法はステューテンド化された範囲を考慮し

ていないため,多重比較法としては推奨されないm .その他,Duncanの方法,Newman-Keulsの方法

l このとき,B と C の比較には興味がない.m 多重比較法と別記している場合もある.

Ω

AB

AC

BC

AB∩AC(≦α)

Ω

AB∪AC∪BC(≦α)

AB

AC

BC

※この図では,i と j (i=A,B; j=B,C)の平均値の比較における帰無仮説H 0{ij}を単に i j と表している.

多重比較 t検定

Page 16: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.6. 多重比較法適用の留意点 13

n は誤った手法であるため,用いてはならない.このことは既に理論的な面からも証明されていることであ

る.

※ LSD法が多重比較法として認められない理由

 正確にいうと LSD法は 4群以上の差の比較の場合に適用できない.以降,この理由について述べる.

  post-hoc比較の LSD法は事前に分散分析を行い,主効果が有意であった場合にのみ行うものである.こ

のことから,実際に検定を行うときは以下の 2つの場合が想定できる.

1. 分散分析で帰無仮説が棄却されなかったとき

2. 分散分析で帰無仮説が棄却され,LSD法でも帰無仮説が棄却されたとき

これらのうちどの場合が正しいかは実際の群間平均値の差によって決まる.なお,LSD法は 2群の比較に

おいて有意水準の設定が t検定に近い値となっているo .

 まず,3群の平均値の比較について述べてみる.A,B,Cの 3群を仮定する.検定の有意水準は 5%とす

る.分散分析での帰無仮説を H0,対立仮説を H1 とし,LSD法の帰無仮説を(検定数は Aと B,Bと C,

Aと Cの 3種類であるから)それぞれH0{AB},H0{BC},H0{AC},対立仮説をH1{AB},H1{BC},H1{AC}

とする.実際に ¹A=¹B=¹C だとすると誤ってH1が採択される確率(typeⅠ error)は,たかだか 5%で

ある(上記 1.に相当).¹A=¹B≠¹C であるとき,分散分析ではH0が棄却される.次に LSD法により A

と B,Bと C,Aと Cの比較が行われるが,H1{BC},H1{AC}は採択されるから,生じる typeⅠ errorは

Aと Bの比較だけ(5%)である.従って,3群の平均値の比較には,LSD法は何ら問題なく適用できる.

 問題となるのは 4群以上の比較の場合である.A,B,C,Dの群を想定する.H0:¹A=¹B=¹C=¹D と

仮定すると,分散分析を行った場合に H0 が棄却される確率は 5%である.¹A=¹B=¹C≠¹D のときは,

分散分析でH0 が棄却され,LSD法へと進む.LSD法では Aと B,Aと C,Aと D,Bと C,Bと D,C

と Dの 6つの比較を行うことになる.これらの比較で帰無仮説が棄却されるのは Aと D,Bと D,Cと D

の 3つである.残りの 3つ(Aと B,Aと C,Bと C)の検定はそれぞれ,ほぼ有意水準 5%で検定が行

われる.従って 2標本 t検定を適用させたときと同様に typeⅠ errorは 5%以上になってしまい,不適切

な手法となる.

1.6.3 標本の大きさ

標本の大きさ(sample size)の問題には,標本間の大きさの違いと標本そのものの大きさの 2つがある.

 標本間の大きさの違いについては補正する手法が考案されており,市販のほとんどのパソコン用統計ソ

フトでプログラムされているものが多い.しかし,標本どうしの大きさの違いにも上限がある.Tukeyの

方法を例にとると,標本間の比率m:nが異なるほど,また群の数 a(標本数)が大きいほど typeⅠ FWE

が小さく保守的になることが知られている.m:n= 1:2程度までならば,a ∙ 12のとき理論値から大き

くかけ離れることはない.m:n= 1:3以上の違いになると,a ¸ 4のときでも理論値から大きくかけ離れ

てしまい,正しい検定ができなくなる [11].

 差を検出するための標本の大きさを決定する方法は現在のところ確定できない.t検定では標本の大きさ

によって検出力を調整できる性質を持つ.この点に関して,多重比較法では検出力の定義が一致していない

から確定した傾向が得られていないようである.

n これらは正確には多重範囲検定(multiple range test)といわれる.o LSD 法の ® は t 検定とほぼ同じ性質を持つ.この時点で,多重比較法として不適切であることがわかる.

Page 17: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

14 第 1章 多重比較法

1.6.4 等分散性

パラメトリックな多重比較法(等分散性が仮定できるとき)においては,等分散性が保証されていなけれ

ば適用できないことを前述した.実際,多重比較法はこの点に関して分散分析よりも鋭敏である.

 等分散性を検定するために Bartlett検定や Levene検定[他章を参照]などを利用することは多いが,正

しい手順で行わないと誤った結果を導いてしまう.多重比較法の予備検定として行う等分散性の検定では,

typeⅡ errorが重視されなければならない.つまり,各群が等分散していないにも関わらず,誤って“分散

が異なるとはいえない”と判定する確率を少なくしなければならない.特に例数が少ないときは,対策とし

て有意水準 ®の引き上げが必要となる.例えば,®の二標本問題の t検定では,等分散性の F検定は 4®に

定めると良い [12]といわれる.多重比較法においては,等分散性の検定を ®= 0:2程度で行わなければ意

味をなさないことが確認 [13]されている.さらには,®= 0:5まで引き上げても,なお理論値に従わない意

見もある.しかし,この状態では等分散性の検定自体の目的が失われてしまうため,単純に有意水準を引き

上げれば良いというわけでもない.

 このように,多重比較法の前に等分散の検定を行う手順については意見の分かれるところであるが,必

ずしも正しい,または誤った手順は確定できない.基本統計量の観察,データの図示を行って判断の参考

とするのも一つの対策案である.なお,不等分散標本の比較に対してはWelchの補正を基礎とした手法 [→

1.4節参照]を用いる必要がある.

1.6.5 分散分析との整合性

分散分析で帰無仮説が棄却された後に多重比較法を行う場合p (事後検定ともいわれる)があるが,これ

は理論的に誤りであることが明確となっている.Tukeyの方法を代表とした多くの多重比較法では分散分

析との整合性は低く,分散分析と多重比較法の検定結果が一致しない事態が生じる.従って対比較を行う前

に分散分析を行うと,誤った判定を下してしまう.なお,分散分析との整合性が高いのは Sche®¶eの方法で

ある.このことから,事前に分散分析を行う必要があるのは比較の対象が明確にされていないときで,かつ

事後検定として探索的な線形対比を Sche®¶eの方法で行う場合である.また,3群比較における事後検定と

してのみ LSD検定を用いる場合は,理論的に問題の無い手順といえよう.

p 正確には,非計画的(事後的)非直交対比の手順である.

Page 18: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.7. 多重比較法の手法選択 15

1.7 多重比較法の手法選択

いままで述べてきた基準をもとに多重比較法の選択フローチャートを図 1.2のように表した.

  

図 1.2 多重比較法の選択フローチャート

この図をもとに,実際の多重比較法の選択方法を説明する.

 

 

No

対比較 対比(対比の種類がわかっている)

対比(対比の種類がわからない)

各群の比較の形式は?各群の比較の形式は?

NoYes

分散分析後,Scheffé法による線形対比

分散分析後,Scheffé法による線形対比1つの対照群といくつ

かの処理群の比較

1つの対照群といくつ

かの処理群の比較

全ての群の同時対比較

全ての群の同時対比較

Tukeyの方法,Bonferroniの方法,

Šidákの方法,Games-Howellの方法※

※等分散性を仮定出来ない

Tukeyの方法,Bonferroniの方法,

Šidákの方法,Games-Howellの方法※

※等分散性を仮定出来ない

Steel-Dwassの方法

Steel-Dwassの方法

各群は正規分布に従う

各群は正規分布に従う

Scheffé法による線形対比,Bonferroniの

方法

Scheffé法による線形対比,Bonferroniの

方法

各群の順序性はわかっている

各群の順序性はわかっている

NoYes

Williamsの方法

Williamsの方法

各群は正規分布に従う

各群は正規分布に従う

Shirley-Williamsの方法

Shirley-Williamsの方法

NoYes

各群は正規分布に従う

各群は正規分布に従う

Dunnettの方法

Dunnettの方法

Steelの方法,Dunnの

方法

Steelの方法,D u n nの

方法

NoYes

NoYes この図以外にも様々な方法が考案されており,

その手法を用いることも可能である.ただし,ここ

でで示した以外の方法が理論的に確立した手

法であるかどうかについては明確にできない.

Bonferroniの方法,

Šidákの方法

Bonferroniの方法,

Šidákの方法

Yes

Page 19: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

16 第 1章 多重比較法

1.7.1 適用条件の確認

図 1.2のフローチャートに進む前に,まず“分析しようとしているデータに対して多重比較法が適用でき

るか”をチェックする.

1.多重比較法を行う必要があるか [→ 1.6.1節を参照]  

 多重比較法は多群の平均値(または中央値)の比較を同時に行う時に適用されるべきである.下記に,多

重比較法を行うまでもない例を挙げる.

例 1-脳卒中患者に対する新しい治療法- A法-が従来からの B法かつ,C法よりも効果的か否かを知り

たい.但し,B法と C法のどちらが効果的かは知る必要がない.この場合は,Aと Bの t検定,Aと Cの

t検定を繰り返すだけでよい.その 2つの t検定の結果が一致した場合のみ,結論づけができる.なお,A

法が,少なくとも B法か C法のどちらか一方よりも優れていることを知りたいときは,Dunnettの方法が

適用となる.A・B・C法のうち,どの方法が最も優れているか知りたい場合は多重比較法の適用となる.

例 2-年齢と握力との関連を見たい.対象者を年齢別に 30歳以下,40歳代,50歳代,60歳以上とカテゴ

リー分けして,握力値の差をみる.このようなときは,年齢をカテゴリー分けせずに 2変数の回帰分析,ま

たは重回帰分析を行うのが正しい.検討したい要因が連続変数で与えられてる場合,特別な事情がない限

り,恣意的なカテゴリー区分を行って多重比較法を適用するというやり方は誤りである.

 あらゆる統計的検定を行う際にいえることであるが,何を比較したいのか,ということを実験前に決め

ておく必要がある.

2.標本の大きさは十分か [→ 1.6.3節を参照]  

 一般には標本の大きさは大きい程良い.大きさの最小値はどれくらいと断言できないが,理論的には n=

2で問題ない.これは,あくまで理論的な面からのことであるからデータの性格によっては,より大きい必

要がある.注意すべきことは,標本の大きさが小さいときに標本の正規性の仮定が困難となるゆえに,ノン

パラメトリック検定を適用させる誤りである.ノンパラメトリック法またはパラメトリック法が問題なく適

用できる大きさは,およそ n ¸ 10のときであると考えるとよい.

 標本どうしの大きさが異なるならば,可能な限り同じ大きさにする.各群で最も小さい標本の大きさに

対して最も大きい標本の大きさが 2倍以下であれば,ほぼ問題なく適用できる.

3.母集団分布は正規分布か,その他の分布か  

 おおかたの標本は母集団が未知であって当然なのでこの判断は困難である.通常は解析者の経験に基づ

く判断に委ねられる場合が多いであろう.解析者の主観的な判断によって解析を進めたならば,その判断の

基準と根拠を明記するとよい.標本の大きさが十分に大きいならば,正規性の検定を利用するのも対策の

一つである.

4.等分散性は保証できるか  

 等分散性と正規性は全く異なる概念である.これについても明確な意見を述べられない.この点に関し

ては 1.6.4節が参考となるが,確定した意見ではない.等分散性が保証できないと厳密には変数変換などの

手続が必要となる.

Page 20: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.7. 多重比較法の手法選択 17

1.7.2 多重比較法の選択

前節の条件を考慮したならば,図 1.2に沿って手法を選択する.

1.各群の比較の形式は?  

 比較の形式は対比較と線形対比に分かれる.

対比較… 例えば A群の平均値と B群の平均値,A群の平均値と C群の平均値,B群の平均値と C群の平

均値といった通常の群比較.

対比… 例えば A群と B群を合わせた平均値と,C群と D群を合わせた平均値の比較といった場合.また,

A群の平均値× 0.2と B群× 0.8を合わせた平均値と,C群× 0.6と D群× 0.4を合わせた平均値ど

うしの比較を行う場合 [→詳細は 1.3.3節を参照].

 線形対比で対比の種類がわかっているというのは,上記のように具体的な比較を明確に表せるときであ

る.対比の種類がわからないというのは,何れかの群の組み合わせに差があると仮定するがそれ以上のこ

とは不明のときである.その際には,対象とする全ての群どうしに差があるかを事前に分散分析で確認す

る必要がある.

2.1つの対照群といくつかの処理群の比較  

 “対照群”とは比較の基準となる群である.健常群と脳卒中患者 A群,脳卒中患者 B群を対象として,

健常群よりも歩行速度が劣るのはどの群かといったことを検定するときは,健常群が対照群で脳卒中患者

A・B群が処理群となる.但し,Aと B群の比較には興味がない.

 ここで注意しなければならないのは,Williamsの方法と Dunnettの方法との使い分けである.例として,

対照Ⅰ群と治療薬 Aを 10mg投与したⅡ群,治療薬 Aを 20mg投与したⅢ群,同じく 40mg投与したⅣ群

の比較を考える.対照群に対して治療薬 Aの効果を知るために,Dunnettの方法を適用させたとする.検

定の結果,Ⅰ群とⅡ群,Ⅰ群とⅣ群に有意差が認められたとする.このとき,Ⅰ群とⅢ群の有意差は認めら

れないため,“治療薬 Aは 20mg投与では効果が無く,10mgかまたは 40mgを投与すべき”と結論できる

であろうか.一般に効果の順序性を考慮しなければならないときは,Williamsまたは Shirley-Williamsの

方法を適用させないと,このような矛盾が生じてしまう.この矛盾が生じたときでも,判定結果を受け入れ

られるか否かを考慮して使い分けるようにするとよい.

3.各群の順序性はわかっている  

 順序性とは,例えば A群,B群,C群,D群があるとき,経験的に ¹A>¹B>¹C>¹D(または,¹A<¹B

<¹C<¹D)と仮定できるときである.

4.全ての群の対比較  

 対比較には全ての群の組み合わせを比較する場合と,特定の群に限定して比較する場合の 2つがある.通

常は全ての群の対比較を行うことが多いが,例えば,Aと Bの比較,Cと Dの比較,Aと Cの比較に限っ

て検定したいという場合は,Bonferroniの方法が適するq .

 以上の手順を参考に,図 1.2を利用して適切な多重比較法を選択することが可能である.

q 標本数によっては,Tukey の方法と比較して棄却域が高いことがあるため,その場合は Tukey の方法を用いる方がよい.

Page 21: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

18 第 1章 多重比較法

1.8 データ解析の実際

この節では実際のデータ例を挙げて,解析の手順を説明する.

1.8.1 データ例

A,B,C,Dという 4つの地域から 8人つづの被検者(全被検者は同年齢で男性のみ)を抽出し,握力

を測定した.その結果,取得したデータは下表のようになった.

群 A B C D

被検者 1 51:8 41:4 28:1 38:1

2 60:7 31:5 25:6 19:5

3 43:9 35:8 24:3 51:5

4 58:3 45:8 36:7 42:6

5 47:4 40:1 49:0 39:0

6 38:9 42:1 36:2 37:8

7 47:8 34:9 54:0 51:5

8 49:8 45:2 46:7 50:8

平均値 49:8 39:6 37:6 41:4

標準偏差 7:2 5:1 11:3 10:7

1.8.2 解析手順

興味のある比較は“ 4つの地域のうちどの地域どうしに差があるか”である.図 1.2より,まず対比較が

選択される.地域の順序性,つまり特定の地域が高い値を示すという事前の知識は無い.更に,特定の地域

どうしの比較ではなく 4地域全ての比較である.現段階ではデータの母集団分布と分散の等質性に関する情

報は得られていないから,Tukeyの方法,Games-Howellの方法かまたは Steel-Dwassの方法が選択される.

 参考として,間違った手法である“最初に分散分析を行う手順”を試してみる.このデータに対しては一

元配置分散分析が適用となる.結果は下表の通りであった.

変動要因 偏差平方和 df 分散 分散比

群間変動 695:7 3 231:9 2:90

郡内変動 2238:8 28 79:96

総変動 2934:5 23

棄却限界域は F (3,28;0:05)= 2:95であるから,主効果は有意でない.従って,握力の地域差はあるとは

いえず,分析はここで終了である.

 さて,正しい手法を適用させよう.解析の前にデータの特性を確認する必要がある.まず,データを図示

して視覚的に傾向を知る必要がある.

Page 22: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.8. データ解析の実際 19

  

図 1.3 データの図示

 

 図 1.3は A~D群別にデータを様々な方法で表現したものである.図 1.3の a.では D群が正規分布から

逸脱している印象を受ける.c.の Q-Qプロットを観察しても,Dではラインから大きく離れたデータが存

在する.A~D群全体の平均値¹= 42:09,標準偏差 S.D.= 9.73であり,これから± 3S.D.の下限値は 12.9

と算出できる.同様に D群の± 3S.D.の下限値は 9.22である.これらから D群の最小値 19.5は外れ値で

あると考え難い.各群の標本の大きさも 8例と少ないこと,握力値は一般に正規分布に従うという経験的

な知識から,母集団正規分布を仮定する.

 等分散性については,図 1.3-d.をみると C群の S.D.は B群の 2倍以上の大きさだから標本間で等分散

しているとは判断し難い印象を受ける.グラフ全体を観察しても,C・D群のばらつきが大きいようにみ

える.参考までに Levene検定(等分散性の検定)を行ってみたところ,p= 0:195となった.有意水準を

®= 0:05とするならば Tukey検定を適用する.しかし,①図 1.3をみても水準間の等分散性を仮定できる

か疑問が残る,②例数が少ない,③ 1.6.4節の考え方を取り入れるならば,Levene検定の結果が p= 0:195

程度であっても等分散とはいえない,といった考えから等分散を仮定しない方法-Games-Howellの方法-

が適すると判断した.この判断は絶対的に正しいとはいえないが,妥当であろう.不安が残る場合は Tukey

の方法も同時に行っておくと良い.

2030

4050

60

A

x[,

i]

-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

4045

5055

60

B

x[,

i]

-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

3540

4550

C

x[,

i]

-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

2530

3540

4550

55

D

x[,

i]

-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

2025

3035

4045

50

A B C Da.箱図

10 20 30 40 50 60

0.0

0.0

20.0

40.0

6

A

10 20 30 40 50 60

0.0

0.0

20.0

40.0

6

B

10 20 30 40 50 60

0.0

0.0

10.0

20.0

3

C

10 20 30 40 50 60

0.0

0.0

10.0

20.0

3

D

A B

C Db.ヒストグラムと正規曲線

A B C D  

Min 38.90 31.50 24.30 19.50 1st Qu 46.52  35.57 27.48 38.03 Median 48.80 40.75 36.45 40.80 Mean 49.82 39.60 37.57 41.35 3rd Qu 53.42 42.88 47.28 50.97 Max 60.70 45.80 54.00 51.50 S.D. 7.16 5.09 11.31 10.71 

d.特性値

A B

C Dc.Q-Qプロット

Page 23: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

20 第 1章 多重比較法

1.8.3 解析結果

 実際に検定を適用させた結果,以下の表のようになった.

比較 平均値の差 有意確率 95% CI 下限 95% CI 上限

Games¡Howellの方法  Avs:B 10:23 0:027 1:08 19:38

C 12:25 0:096 ¡1:83 26:33

D 8:48 0:293 ¡5:01 21:96

Bvs:C 2:03 0:966 ¡11:46 15:51

D ¡1:75 0:974 ¡14:58 11:08

Cvs:D ¡3:78 0:901 ¡19:79 12:24

参考:Tukeyの方法  Avs:B 10:23 0:125 ¡1:98 22:43

C 12:25 0:049 0:04 24:46

D 8:48 0:253 ¡3:73 20:68

Bvs:C 2:03 0:969 ¡10:18 14:23

D ¡1:75 0:979 ¡13:96 10:46

Cvs:D ¡3:78 0:833 ¡15:98 8:43

 有意水準を p= 0:05とすると,Games-Howellの方法では Aと B,Tukeyの方法では Aと Cの差が有意

となる.各群の平均値をみると(図 1.3-d.)Aと Cの差が最も大きいから Tukeyの方法の結果が理に叶っ

ていると思う.仮に Tukeyの方法を支持するとしても,Aと C群の差の S.D.値は大きいので平均値の変動

範囲は広い.また,95%信頼区間の下限値が 0.04程度であり,実質的な差とならない.

 ここでは Games-Howellの方法を優先的に採用したので,Aと Bの有意差を最終結論とする.Cと Dの

分散値が大きくなった原因が明確であれば,Tukeyの方法の結果を考慮する必要もある.

1.8.4 まとめ

具体的なデータを挙げて解析手順の参考例を述べたが,実際に解析してみると手法選択の判断に迷う部

分もあり,やや主観的に進めた感もある.データ解析の基本はデータを図示して,特性を考察した上で検定

手法を選択することである.迷うときには,複数の手法を平行して適用させることも必要となってくる.あ

る一つの手法を適用させ,その結果が全て正しいというわけではない.統計的データ解析は検定を適用させ

て有意差を発見するのではなく,試行錯誤を繰り返してデータの特徴を読みとり,その法則と検定結果の信

頼度を判断することである.加えて,データを取得した環境についても情報を得ておかなければならない.

 

 

Page 24: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

1.8. データ解析の実際 21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

※なお,この資料では付表を省略してあるので,他書を参考にして頂きたい.付表が手に入らない場合

や,この資料に関する質問・意見がある場合は,下記まで連絡下さい.

 

  弘前大学医学部 保健学科 理学療法学専攻 対馬栄輝(つしま えいき)

  〒 036-8564 青森県弘前市本町 66-1

  電話& FAX  0172- 39- 5981

  e- mail:[email protected]

  URL:http://itan.cc.hirosaki-u.ac.jp/ptstu®/pteiki/eiki.html

Page 25: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝
Page 26: 統計的検定資料① - personal.hs.hirosaki-u.ac.jp · 統計的検定資料① 多重比較法 弘前大学医学部保健学科 理学療法学専攻 対馬 栄輝

23

関連図書

[1] 吉村 功:多重比較法の問題点.統計数理研究所共同研究リポート 18:58-71,1989.

[2] Holm S:A simple sequentially rejective multiple test procedure.Scandinavian.Jornal of Statistics

6:65-70,1979.

[3] Sha®er JP:Modi¯ed sequentally rejective multiple test procedure.Jornal of the American Statistical

Association 81:826-831,1986.

[4] Hochberg Y:A sharper Bonferroni procedure for multiple tests of signi¯cance.Biometrika 75:800-802,

1988.

[5] Hommel G:A stagewise rejective multiple test procedure based on a modi¯ed Bonferroni test.

Biometrika 75:383-386,1988.

[6] Rom DM:A sequentially rejective test procedure based on a modi¯ed Bonferroni inequality.

Biometrika 77:663-665,1990.

[7] Welsch RE:A modi¯cation of the Newman-Keuls procedure for multiple comparisons.Working Paper

612-672,Sloan School of Management,M.I.T.,Boston,MA,1972.

[8] 永井 信:農学実験の分散分析における多重比較の考え方と使い方 [1]検定方法編(Ⅰ).農業および園

芸 65:567-572,1990.

[9] Games PA,Howell JF:Pairwise multiple comparisons procedures with unequal N's and/or variances:

A Monte Carlo study.J.Educ.Statist. 1:113-125,1976.

[10] 山村光司:多重比較法とその選び方(1)多重比較否定論.植物防疫 47:28-33,1993.

[11] 吉田道弘:不等標本サイズの場合の Tukey の多重比較法-精密計算に基づく Tukey-Kramer法の評

価-.計算機統計学 1:17-24,1989.

[12] Gans DJ:Use of a preliminary test in comparing two sample means.Commun. Statist. B10:163-174,

1981.

[13] 阿部研自:多重比較法における不等分散の影響評価.応用統計学 28:55-78,1999.