階層的線形モデルにおける経験ベイズ推定量の実測検repo.komazawa-u.ac.jp/opac/repository/all/29842/rsr011...階層的線形モデルがデータ解析ツールとして普...

7
問題と目的 心理学をはじめとする人間科学の諸分野の研究 において収集されるデータは,しばしば階層的な 構造をもっている。データが階層的な構造をもっ ているとは,分析の対象となる観測値が何らかの 上位の抽出単位に包含されている状態を指す。例 えば,学級単位で生徒が抽出された場合や,複数 の個人に対して縦断的測定を行った場合にこのよ うなデータが得られることになる。本稿では,こ うした階層的な構造をもつデータのことを階層的 データと呼ぶことにする。階層的データは,一般 に母集団からの完全無作為抽出を行うことが難し いというデータ収集上の現実的な制約から得られ ることもあれば,現象の階層的構造自体に興味が あって収集される場合もある。例えば,算数の新 しい教授法の効果を調べたい場合,学校教育にお ける教授というものは一般的に学級単位でなされ るものであるから,個人単位での介入は非現実的 であり,生態学的妥当性に欠けると考えられる。 また,個人単位で介入を行った場合,学級担任の 能力や学級の風土,平均的な学力のレベルやばら つきなど学級の特性を考慮に入れて分析を行うこ とが難しくなる。このような場合は,むしろ学級 という集団単位での介入を行う方が望ましいと考 えられる。 階層的データの特徴は,観測値の独立性が満た されていないことである。観測値の独立性は多く の統計分析において重要な前提条件となってお り,これを逸脱することは記述的にも,また推計 学的にも様々な問題を引き起こすことが知られて いる。例えば,奥村(2008a)は,集団単位での実 験的介入の効果の検定や区間推定を行った場合, 集団内の凝集性を表す級内相関係数によって検定 力や信頼区間幅が理論上の値と大きくずれてくる こと,またそのずれの程度は検定力の場合母集団 効果量に依存することを数学的に示し,これを確 かめるための簡単なプログラムを提供している。 階層的データを適切かつ効率的に分析するため の統計解析法として近年心理・教育の分野で注目 を浴びているのが,階層的線形モデル(Hierarchi- cal Linear M odels; HLM )である。階層的線形 モデルは当初ベイズ統計学の文脈で考え出され (Novick, Thayer, Cole, & Jackson, 1972),そ の後生物統計や医療統計の分野で理論的な研究が おこなわれていたものであるが,母数の事後分布 を解析的に導出することが困難であることから当 初はデータ解析に用いられることはほとんどな かった。しかし,EMアルゴリズムをはじめとする 数値計算法が開発 さ れ(Dempster, Laird, & Rubin, 1977),また時を同じくして計算機の性能 が高まってくると,新たに経験ベイズ推定という 1 駒澤大学心理学論集,2009,第11 号,1-7 2009, 11, 1-7 ul 階層的線形モデルにおける経験ベイズ推定量の実測検 定力 奥村 太一 The actual statistical power of empirical Bayes estimator in the hierarchical linear models Taichi OKUM URA ( Department of Educational Psychology, The University of Tokyo / Japan Society for the Promotion of Science ) ABSTRACT In this article, bias of the actual power of empirical Bayes estimator in an experimental design of the hierarchical linear models (HLM ) is investigated by the M onte Carlo simulation method by controlling sample size. Simulation res ec ts saythat applying the REM L method causes smaller and simpler pattern of biases compared to the case of applying the FML method,although the both of the cases show significant biases of power under the situations of small sample size. The biases esp Ba ially depend on the number of groups, compared to the size of the groups. KEY WORDS: hierarchical linear models, empirical st yes estimator, actual stati po ical er w

Upload: others

Post on 07-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 階層的線形モデルにおける経験ベイズ推定量の実測検repo.komazawa-u.ac.jp/opac/repository/all/29842/rsr011...階層的線形モデルがデータ解析ツールとして普

問題と目的

心理学をはじめとする人間科学の諸分野の研究

において収集されるデータは,しばしば階層的な

構造をもっている。データが階層的な構造をもっ

ているとは,分析の対象となる観測値が何らかの

上位の抽出単位に包含されている状態を指す。例

えば,学級単位で生徒が抽出された場合や,複数

の個人に対して縦断的測定を行った場合にこのよ

うなデータが得られることになる。本稿では,こ

うした階層的な構造をもつデータのことを階層的

データと呼ぶことにする。階層的データは,一般

に母集団からの完全無作為抽出を行うことが難し

いというデータ収集上の現実的な制約から得られ

ることもあれば,現象の階層的構造自体に興味が

あって収集される場合もある。例えば,算数の新

しい教授法の効果を調べたい場合,学校教育にお

ける教授というものは一般的に学級単位でなされ

るものであるから,個人単位での介入は非現実的

であり,生態学的妥当性に欠けると考えられる。

また,個人単位で介入を行った場合,学級担任の

能力や学級の風土,平均的な学力のレベルやばら

つきなど学級の特性を考慮に入れて分析を行うこ

とが難しくなる。このような場合は,むしろ学級

という集団単位での介入を行う方が望ましいと考

えられる。

階層的データの特徴は,観測値の独立性が満た

されていないことである。観測値の独立性は多く

の統計分析において重要な前提条件となってお

り,これを逸脱することは記述的にも,また推計

学的にも様々な問題を引き起こすことが知られて

いる。例えば,奥村(2008a)は,集団単位での実

験的介入の効果の検定や区間推定を行った場合,

集団内の凝集性を表す級内相関係数によって検定

力や信頼区間幅が理論上の値と大きくずれてくる

こと,またそのずれの程度は検定力の場合母集団

効果量に依存することを数学的に示し,これを確

かめるための簡単なプログラムを提供している。

階層的データを適切かつ効率的に分析するため

の統計解析法として近年心理・教育の分野で注目

を浴びているのが,階層的線形モデル(Hierarchi-

cal Linear Models;HLM)である。階層的線形

モデルは当初ベイズ統計学の文脈で考え出され

(Novick, Thayer, Cole, & Jackson, 1972),そ

の後生物統計や医療統計の分野で理論的な研究が

おこなわれていたものであるが,母数の事後分布

を解析的に導出することが困難であることから当

初はデータ解析に用いられることはほとんどな

かった。しかし,EM アルゴリズムをはじめとする

数値計算法が開発され(Dempster, Laird, &

Rubin, 1977),また時を同じくして計算機の性能

が高まってくると,新たに経験ベイズ推定という

1

駒澤大学心理学論集,2009,第11号,1-7

2009, 11, 1-7

ul

階層的線形モデルにおける経験ベイズ推定量の実測検定力

奥村 太一

The actual statistical power of empirical Bayes estimator in the hierarchical linear models

Taichi OKUMURA (Department of Educational Psychology, The University of Tokyo / Japan Society for the

Promotion of Science)

ABSTRACT In this article,bias of the actual power of empirical Bayes estimator in an experimental design of the hierarchical linear models (HLM)is investigated by the Monte Carlo simulation method by controlling sample size. Simulation res

ec

ts say that applying the REML method causes smaller and simpler pattern of biases compared to the case of applying the FML method,although the both of the cases show significant biases of power under the situations of small sample size. The biases esp

Ba

ially depend on the number of groups,compared to the size of the groups.

KEY WORDS:hierarchical linear models,empirical st yes estimator,actual stati po ical er w

原 著

Page 2: 階層的線形モデルにおける経験ベイズ推定量の実測検repo.komazawa-u.ac.jp/opac/repository/all/29842/rsr011...階層的線形モデルがデータ解析ツールとして普

簡便な母数推定法が考え出され(Dempster,

Rubin,& Tsutakawa, 1981),これを実装したソ

フトウェアが提供されるようになってきたことか

ら(Raudenbush, Bryk, Cheong, & Congdon,

2000;Singer, 1998),階層的線形モデルはデータ

解析のツールとして近年心理学や行動医学をはじ

めとする研究分野で爆発的に利用されるように

なってきている(Schwartz & Stone, 1998;

Yamaguchi, Lin, Morio, & Okumura, 2008な

ど)。

階層的線形モデルがデータ解析ツールとして普

及するようになった大きな理由の一つは経験ベイ

ズ推定法という新しい簡便な母数推定法が考案さ

れたことであるが,経験ベイズ推定法には大きな

問題点がある。経験ベイズ推定法とは,モデルに

含まれるすべての母数を一度に推定するのではな

く,分散共分散行列のみを先に推定しておき,そ

の推定値を回帰係数の推定などに再利用するとい

うものである。このようにして推定された回帰係

数の推定量のことを経験ベイズ推定量(empirical

Bayes estimator)と呼ぶ。経験ベイズ推定量には

既に推定された分散共分散行列の推定値が母数値

とみなされて代入されているため,特にサンプル

サイズが小さい場合,その標準誤差が過少に推定

されることが知られている(Raudenbush &

Bryk, 2002)。従って,経験ベイズ推定量に関する

有意性検定を行っても,理論上よりも甘い基準で

検定が行われている可能性がある。奥村(2008b)

は,階層的線形モデルのうち階層的実験デザイン

による介入効果を検討するための下位モデルにお

いて経験ベイズ推定量の実測有意水準について検

討している。その結果,特にサンプルサイズが小

さい場合,経験ベイズ推定量の有意水準は理論値

よりも大きく乖離することが示された。検定力に

関してこうした理論値と実測値のずれに関してよ

り系統的に検討した研究はないが,階層的線形モ

デルが今後心理学の研究におけるデータ解析の手

法として普及して行った場合,検定力がどのよう

な状況の下でバイアスを示す可能性があるのか検

討しておくことは重要な問題であろう。

そこで,本研究では階層的線形モデルにおける

経験ベイズ推定量に関して有意性検定を行った場

合の検定力について,実測値が理論値に比べてど

のように乖離してくるのか,モンテカルロ・シミュ

レーションによって考察する。

方 法

本研究で検討の対象とするのは,奥村(2008b)

で取り上げたのと同じ,階層型実験デザイン

(Cluster-randomized trials;CRT)と呼ばれる階

層的線形モデルの下位モデルである。このモデル

は,具体的には例えば新しい統計学の教授法や心

理教育の効果を講義やゼミといった集団単位の介

入で実施するといったような教育心理学や臨床心

理学の研究でよく行われている実験デザインに相

当する。完全つり合い型デザインの場合,このデ

ザインは分散分析における階層的デザインの変量

模型に相当することが知られている(Kirk,

1995)。

このデザインのモデル式を示す。 を 番目

の集団の 番目の観測値であるとする( =1,...,

; =1,..., )。 について,レベル1のモデル

として以下の式を考える。

β,σ ⑴

母数βは,以下のレベル2のモデル式において説

明され,またランダムに変動するものとする。

β γ+γ ,τ ⑵

ただし, は 番目の集団が実験群であれば 0.5

を,統制群であれば-0.5を取る変数であるとす

る。⑴式および⑵式を統合することにより,デー

タ発生モデルは以下の一つの式によって表わすこ

とができる。

γ+γ ,σ+τ ⑶

このモデルにおいて実験の介入効果は母数γに

相当する。

完全つり合い型デザインであれば,γの経験ベ

イズ推定量 γの分散 は,

=4 τ+σ

で推定される(Raudenbush, 1997)。また,Fotiu

(1989)によりγに関する区間推定を行う場合の

1001-α%信頼区間は,

1001-α% =γ± ⑸

で計算される。この信頼区間がゼロを含んでいな

いことと検定が 1001-α%水準で有意であるこ

ととは明らかに同値である。

シミュレーションでは,実験的介入の効果を表

す母数γが母集団においてゼロではない(実験の

効果がある)という条件のもとで⑶式のモデルに

もとづいて疑似データを発生させて統計的検定を

2

Page 3: 階層的線形モデルにおける経験ベイズ推定量の実測検repo.komazawa-u.ac.jp/opac/repository/all/29842/rsr011...階層的線形モデルがデータ解析ツールとして普

行い,実際に棄却された割合をもってその検定の

実測検定力とする。シミュレーションを行うにあ

たって実際に設定した母数の値は,Table1に示

した通りである。このシミュレーションでは完全

つり合い型デザインによる実験が行われたことを

想定した(すなわち,すべての について = )。

経験ベイズ推定量に関する有意性検定の検定力の

バイアスを生み出す条件はいくつか考えられる

が,このシミュレーションでは奥村(2008a)に

倣ってサンプルサイズのみを操作することにし

た。本研究では,集団の大きさ を 4,6,10,20,

50,100と変化させた上で,集団の数 も同様に 4,

6,10,20,50,100と変化させ,合計36条件を設

定した。この場合の検定力の理論値は奥村(2008

a)で提案したRの関数を用いて計算することに

した。分散共分散行列の推定法としては大きく分

けて完全最尤法(full maximum likelihood

method;FML)と制約付き最尤法(restricted

maximum likelihood method;REML)の2つが

これまでに考案されていることから,この2つの

推定法間での比較も行うことにした。各条件

10,000個のデータセットを発生させ,有意水準を

5%と設定して検定を行い,実際に帰無仮説

( :γ=0)が棄却された割合を実測検定力して

計算した。モデルのデータへのフィットにはRの

lme関数を用いた。

結果と考察

Figure1からFigure6は,分散共分散行列の推

定法としてFMLおよびREMLを用いた場合,

集団の数 を変化させたときに母数γに関する

有意性検定の実測検定力がどのように変化するの

か,集団の大きさ ごとに分けて理論上の値から

の差を示したものである。本節では,このシミュ

レーション結果をもとにFMLを用いた場合と

REMLを用いた場合の母数γの実測検定力につ

いて考察していく。

まず,単純にFMLとREMLの結果を比較す

ると,どちらも集団の数 が小さい場合に実測検

定力が理論値より外れ, が大きくなるに従って

理論値に近づいていくが,REMLの方がFMLに

比べて全体的にはるかに理論値に近い値を取って

いることがわかる。FMLを用いた場合,最低でも

集団の数 は20から50程度必要であるが,

REMLの場合は6から10程度で理論値に非常に

近いところに落ち着いている。また, が小さい

とき,FMLでは集団の大きさ を大きくしても

実測検定力は理論値より大きく乖離したままであ

るのに対し,REMLを用いた場合は集団の大きさ

が20から50程度あれば十分理論値に近い値を

示している。

次に,各方法それぞれについて細かく見ていく。

上でも述べたように,FMLでは実測検定力がど

れくらい理論値に近いかは集団 の数に大きく依

存している。 が小さい場合の実測検定力と理論

値とのずれの大きさは,集団の大きさ にも依存

して変化している。特に が4と極端に小さく,

が4から10程度の場合,実測危険率はむしろ

REMLよりも理論値に極めて近いがやや低めの

値を取っているのに対し, が6になると実測検

定力は突然理論値よりかなり高めになって甘い検

定を行うようになり,その後 をさらに増加させ

ていくと理論値に近づいていく。REMLでも実測

検定力と理論値とのずれの大きさは集団の数 に

依存しているが,実測検定力は理論値よりも一貫

して小さいままで,FMLほどそのパターンは複

雑ではない。集団の数 が小さい場合,特に =4

と極端な場合はFMLよりもむしろ理論値とのず

れが大きいが, が6になると,実測検定力が理

論値よりも小さいという傾向はそのままであるも

のの,乖離の程度はFMLの場合に比べてずっと

小さく,また の増大に伴って理論値に近づいて

いくスピードも速い。実測検定力と理論値とのず

れは特に集団の大きさ が20程度までの場合に

顕著であるが(それでもFMLよりは小さい),

がそれよりも大きくなると乖離は集団の数 とほ

とんど関係なく,またその程度も無視できるほど

小さくなっている。

まとめ

本研究では,階層的線形モデルにおける基本的

な実験デザインの一つであるCRTを取り上げ,

処遇の効果を表す母数γに関する有意性検定の

実測検定力をシミュレーションによって検討し

た。その結果,分散共分散行列の推定法として

Table 1:Parameter values for the simulation

γ γ σ τ

20.0 2.0 10.0 10.0

3

Page 4: 階層的線形モデルにおける経験ベイズ推定量の実測検repo.komazawa-u.ac.jp/opac/repository/all/29842/rsr011...階層的線形モデルがデータ解析ツールとして普

Figure 1:The deviance of power from theoretical values ( )

Figure 2:The deviance of power from theoretical values ( )

4

Page 5: 階層的線形モデルにおける経験ベイズ推定量の実測検repo.komazawa-u.ac.jp/opac/repository/all/29842/rsr011...階層的線形モデルがデータ解析ツールとして普

Figure 3:The deviance of power from theoretical values ( )

Figure 4:The deviance of power from theoretical values ( )

5

Page 6: 階層的線形モデルにおける経験ベイズ推定量の実測検repo.komazawa-u.ac.jp/opac/repository/all/29842/rsr011...階層的線形モデルがデータ解析ツールとして普

FMLを用いた場合もREMLを用いた場合も,実

測検定力は集団の大きさ と集団の数 に依存し

て理論値と乖離するが,FMLを用いた場合は

REMLを用いた場合に比べてその乖離のパター

ンが と の組み合わせにおいてより複雑であ

り,またサンプルサイズ(特に集団の大きさ )

を大きくした場合に理論値に近づく程度も

REMLに比べて遅いことが分かった。また,

REMLを用いた場合の実測検定力は一貫して理

論値より低くなるものの,集団の数 が大きい場

合やあるいはが小さくても集団の大きさ が大き

い場合はほとんど無視できるレベルであることも

わかった。

奥村(2008b)では,本研究で取り上げたのと同

じモデルにおいて母数γに関する有意性検定を

行った場合の実測危険率の理論値とのずれについ

て本研究と同様のシミュレーションで検討してい

る。その結果,分散共分散行列の推定にFMLを用

いた場合の方がREMLを用いた場合よりも複雑

なパターンを示し,またサンプルサイズの増大に

伴って理論値に近づいていくスピードが遅いこと

がわかったが,同様の傾向が検定力についても確

認された。ただし,FMLとREMLのいずれを用

いた場合も推定値を母数γおよびその標準誤差

Figure 5:The deviance of power from theoretical values ( )

Figure 6:The deviance of power from theoretical values ( )

6

Page 7: 階層的線形モデルにおける経験ベイズ推定量の実測検repo.komazawa-u.ac.jp/opac/repository/all/29842/rsr011...階層的線形モデルがデータ解析ツールとして普

の推定量に母数値とみなして代入することは経験

ベイズ推定量の性質として違いはなく,母数の推

定に関する不確実性を無視していることは共通し

ていることから,FMLではほとんどの場合理論

値よりも高い検定力が,REMLでは理論値よりも

一貫して低い検定力が観察されたことは当初の予

想を裏切るものであった。推定法の違いによって

なぜこうした傾向の違いが生じたのかは,今後理

論的に検証をしていく必要があるだろう。

また,今回は実測検定力と理論値とのずれを検

討する上での条件としてサンプルサイズのみを操

作したが,これだけでは現実に起こりうる母集団

及びデータ収集の状況をすべてカバーできたわけ

ではない。今後は級内相関係数(⑶式で示された

分散成分全体のうち,τの占める割合で定義さ

れ,集団の心理的凝集性を表す指標)や母集団に

おける実験の効果の大きさγなども系統的に操

作し,さらに広範囲にわたって条件を操作し検討

する必要があるだろう。

参考文献

Dempster,A.P.,Laird,N.M.,& Rubin,D.B.(1977).

Maximum likelihood from incomplete data via

EM algorithm. Journal of the Royal Statistical

Society(Series B),39,1-8.

Dempster,A.P.,Rubin,N.M.,& Tsutakawa,R.K.

(1981). Estimation in covariance components

models.Journal of the American Statistical Asso-

ciation,76,341-353.

Fotiu, R. P. (1989). A comparison of the EM and

data augmentation algorithms on simulated small

sample hierarchical data from research on educa-

tion. Unpublished Ph. D. dissertation, Michigan

State University.

Kirk, R. E. (1995). Experimental design (3 ed.).

Belmont,CA:Brooks/Cole.

Novick,M.R.,Thayer,D.T.,Cole,N.S.,& Jack-

son,P.H.(1972).Estimating multiple regressions

in m groups:Cross-validation study.British Jour-

nal of Mathematical and Statistical Psychology,

25,33-50.

奥村太一 (2008a).階層的実験デザインにおける処

遇の効果の検定力および信頼区間幅について.駒

澤大学心理学論集,10,33-39.

奥村太一 (2008b).階層的線形モデルにおける経験

ベイズ推定量の有意性検定における実測危険率.

駒澤大学心理学論集,10,41-47.

Raudenbush,S.W. (1997). Statistical analysis and

optimal design for cluster randomized trials.

Psychological Methods,2,173-185.

Raudenbush,S.W.,Bryk,A.S.,Cheong,Y.F.,&

Congdon, R. (2000).HLM5: Hierarchical linear

and nonlinear modeling. Scientific Software

International.

Schwartz,J.E.,& Stone,A.A.(1998).Strategies for

analyzing ecological momentary assessment

data.Health Psychology,17,6-16.

Singer,J.D.(1998).Using SAS PROC MIXED to fit

multilevel models,hierarchical models,and indi-

vidual growth models. Journal of Educational

and Behavioral Statistics,24,323-355.

Yamaguchi,S.,Lin,C.,Morio,H.,& Okumura,T.

(2008). Motivated expression of self-esteem

across cultures. In R. M. Sorrentino & S.

Yamaguchi (Eds.),Handbook of motivation and

cognition across cultures.(pp.369-392).San Diego,

CA:Elsevier.

7