マルチレベルモデル講習会 実践編
DESCRIPTION
東洋大学で行われたマルチレベル講習会の実践編です。SPSSとHADの使い方を解説しています。TRANSCRIPT
1
マルチレベルモデル講習会実践編
清水裕士 広島大学大学院総合科学研究科
http://norimune.net
自己紹介
• 清水裕士– 所属:広島大学 大学院総合科学研究科
• 助教– 専門:社会心理学 グループダイナミクス
• 親密な対人関係におけるソーシャル・サポート• 社会規範・道徳の進化
• 連絡先– E-mail: simizu706(at)hiroshima-u.ac.jp– Webサイト: http://norimune.net– Twitter: @simizu706
3
実践編
4
SPSSによる分析の流れ
5
HLMの分析の流れ
• グループ内類似性の評価–級内相関係数の算出
• レベル1・レベル2の変数の用意–レベル1の変数→集団平均で中心化を行う• →各集団の平均を得点から引くこと
–レベル2の変数→全体平均で中心化を行う
• HLMを行うソフトに変数をセット–モデリングをして推定値を算出• 適合度などを参考に、モデルを修正
6
級内相関係数の算出
「分析」→「混合モデル」
7
級内相関係数の算出
8
「変量をクリック」
「被験者のグループ化」のところにグループ変数を指定
共分散タイプ:無構造
「定数項を含める」をチェック
9
推定方法を最尤法にしておく
• 「推定」をクリック–今回は最尤法を使う–どちらでも大きな違いはない
–他はいじらなくていい
10
級内相関係数の算出
• 共分散パラメータを見る–残差・・・集団内変動–切片・・・集団間変動–級内相関 = 0.349 / (0.637 + 0.349) = 0.354
11
説明変数の準備
• 個人レベルの変数–集団平均値を算出• 「グループ集計」で,グループごとの平均値を算出
–集団平均で中心化• 上で計算した集団平均値をデータから引く
• 集団レベルの変数–全体平均で中心化• 平均値を計算して,データから引く
12
集団平均値の計算
13
集団平均で中心化
14
全体平均中心化
15
出来上がったデータセット
ではさっそく HLMを実行
• 満足度を目的変数にした HLM–レベル 1に発話量 _wc–レベル 2に発話量 _m_gmと集団成績 _gm
16
発話量 _wc
集団成績 _gm
満足度
満足度 レベル2
レベル1
発話量 _m_gm
平均化
17
共変量に説明変数を入れて「固定」を押す
18
主効果として各説明変数を入れる
19
「変量」を押して変量効果を指定
20
出力のオプション
• 「統計量」をクリック–パラメータ推定値–共分散パラメータの検定• は最低限でも出力する
• ここまで出来たら,「 OK」–分析結果が出力される
21
出力 1:情報量基準
• モデルの適合度– AIC・・・複雑なモデルを好む– BIC・・・倹約的なモデルを好む– AICC・・・中間ぐらい
22
固定効果
• 推定値–いわゆる,回帰係数– dfは自由度• 小数があるのは, Satterthwaiteの補正をしているため
23
変量効果の分散成分
• 変量効果の分散と共分散– UN(1,1)は切片の分散– UN(2,2)は回帰係数の分散– UN(2,1)は切片と回帰係数の共分散• ゾロ目は分散,それ以外は共分散
24
レベル間交互作用
25
レベル間交互作用
26
単純効果分析
• 交互作用効果が出たら単純効果が知りたい–分散分析や回帰分析と同じ–説明変数が連続変量の場合は, ±1SDの効果を見ることが多い• あくまで,多い,というだけで,そうすべきというわけではない
• SPSSでは単純効果の検定ができない– PreacherのWebサイトにパラメータを入力– http://www.quantpsy.org/interact/index.html
27
PreacherのWebサイト
28
グラフも出力してくれる
29
HADによる分析
30
HADとは
• 清水が作った Excelの VBAで動くプログラム– Excelのバージョンは 2007以降に対応– Macにも対応( Excel for Mac2011以降)
• WinとMacを同じファイルで使いまわせる
• 主に心理統計分析ができる–大抵の心理統計分析は可能
• データハンドリング,統計的検定,多変量解析など–マルチレベル分析もできる
• 階層線形モデルや,マルチレベル SEMなど
31
HADとは
• 無償のソフトウェアです– 利用は無償です– 清水のブログからからダウンロードできます
• http://norimune.net/had• 何度でもダウンロードできます
• 自由なソフトウェアです– ソースコードを自由に閲覧・変更することができます
• 第三者への配布も自由です– ライセンス
• GNU General Public License ( GPL )に則ってます• ライセンスについては「 HADとは」(
http://norimune.net/had )のページを参照してください。
32
HLMにおける HADの特徴• フリーソフトウェアである
– SPSS (とお金)がなくても, Excelがあれば使える
• 単純効果分析ができる– 簡単に単純効果とグラフの出力ができる
• 頑健標準誤差を出力できる– SPSSは出力してくれない
• 最尤法しか対応していない– 制限付き最尤法は現状,利用できない– 今後搭載の可能性も 0ではない
33
HADを起動する• 起動時に、マクロを有効にするか聞かれる– Excelのマクロセキュリティを「中」にする• Excel上部に下のような警告が出たら、有効化を押す
• 下の通知が出てきたら「有効にする」を押す
34
HAD12以降の注意点
• HAD12からは Excelのソルバーを使っている– ソルバー: Excelに入っているアドイン
• 最初に起動したときにエラーがでる場合– コンパイルエラーというのが出ることがある– その場合は, HADを一度閉じて,もう一度起動する。すると,ソルバーが入っていれば普通に使うことができる
• ソルバーがない場合– ソルバーオフバージョンを使う必要がある
35
HADを起動
• B 列にグループを識別する変数を入れる
36
モデリングシートに読み込む
• データの読み込み–セットできたら「データ読み込み」ボタン–データをチェックして、以下の場合に警告• データセットに空白がある場合• 欠損値記号以外の文字列がある場合
– 数式エラーの場合は、それらを欠損値に変換できる
• データが保存されているわけではない–変数名の読み込みと設定を読み込むだけ–データセットを変えると分析結果も変わる
37
モデリングシートの機能基本的な統計分析
新しい変数の作成多変量解析
変数情報の設定 データセット選択
使用変数の指定
38
• モデリングシートの 9行目に変数名を指定
• 3 通りの指定方法がある– 自分でセルに入力する → コピペでもよい– 「選択セルを使用」ボタンを押す– GUIを使う
分析に使用する変数を指定
ここに入力
ID変数は B 列に入力する
39
GUIを使用する
• 「使用変数」ボタンを押すと GUIが立ち上がる
• 追加と削除で指定– Shiftや Ctrlを使えば複数の変数を選択できる
• 変数の登録– よく使う変数のセットは登録しておくと便利
– すぐにセットを呼び出せる
40
HADで基礎統計分析
• 使用変数を指定して,「分析」ボタンを押す
ヒストグラム
41
級内相関係数の算出
• 使用変数を指定して,「分析」ボタンを押す–級内相関係数を チェック
• OK ボタンを押す
42
級内相関係数の算出
• 推定値と信頼区間,検定統計量, p値を出力
43
回帰分析の方法
モデリングスペース
44
回帰分析の方法
• 「回帰分析」のラジオボタンをクリック–回帰分析用のモデリングスペースが表示される–その中の「回帰分析」を選択
• 先に目的変数,あとで説明変数を指定–変数を選択して,「目的変数を投入」を押す
• ここでは満足度–「主効果を全投入」を押すと,自動的に説明変数がモデルに投入される
45
回帰分析の方法
• 「分析実行」を押す–「 Reg」というシートで結果が出力される
46
交互作用も簡単にできる
• 交互作用項は自動的に中心化して作成
47
ステップごとの結果
48
単純効果分析も出力する
49
HLMの方法
• モデリングシートで「階層線形モデル」を選択– HLM用のモデリングスペースに切り替わる
今回は SPSSと結果を一致させるため頑健標準誤差はオフにしておく
50
実行を押せば HLMができる
• 切片の集団間変動だけを仮定したモデル–「 HLM」というシートに出力される
HADの HLMは,デフォルトで説明変数は全体平均で中心化される
51
説明変数の中心化
• 「変数の作成」ボタンから行う–「変数の作成」を押して,「尺度変換」タブの「集団平均で中心化する」をチェック
• 分析上で中心化を行う–「レベル 1変数を集団平均で中心化」をチェックすると,自動的に中心化される
–説明変数は自動的に全体平均で中心化される• この設定をオフにすることもできる
52
説明変数の中心化
53
集団平均値の計算
• 「変数の作成」の「尺度変換」タブ–集団平均値にチェック → 列を選択して右クリック
54
回帰係数の集団間変動
• 「変量効果→」にレベル 1変数を指定する
55
出力 1
• モデル適合度–情報量基準を参照する–回帰係数の集団間変動を仮定すると, R2 乗などの計算はできなくなる
56
出力 2
• 固定効果–集団平均で中心化した変数・・・ wcがつく–全体平均で中心化した変数・・・ gmがつく
57
出力 3
• 変量効果の分散成分–検定方法は SPSSと異なる( HLM7と同じ)
58
交互作用項の投入
• 交互作用項を「 *」を挟んで投入する
59
交互作用項の投入
• 「交互作用を全投入」ボタン–説明変数すべての交互作用項が投入される
• Shift キー+「交互作用を全投入」ボタン–交互作用項を作りたい説明変数を選択した状
態で, Shift キーを押しながらボタンを押すと,その変数だけの交互作用項が投入される
–今回は,「発話量」と「集団成績」の交互作用項だけを投入
60
交互作用項の投入
• 分析結果–交互作用項が有意–情報量基準も小さくなった AIC: 777→764
61
単純効果分析• 「スライス→」に群分け変数を指定–ここでは集団成績をスライスに指定
62
• 集団成績 ±1SDの単純効果を推定
単純効果分析
63
単純効果分析発話量 発話量- 1SD +1SD
_- 1SD集団成績 3.230 3.097_+1SD集団成績 3.350 4.057 **
2.5
3
3.5
4
4.5
-1SD +1SD
満足度
発話量
集団成績_-1SD
集団成績_+1SD
64
マルチレベルモデルあれこれ
65
HLMをするならどのソフトウェア?
• HLM7→ HLM だけならベスト• HAD → REMLができない 単純効果分析可• Mplus → REMLができない• SPSS→ ロバスト SEが出ない、 DF 設定が不自由
• R → ロバスト SEが出ない
• HLMをするならとりあえず HLM 7がオススメ–フリーソフトなら HADで十分
66
結果を報告するとき
• 固定効果は回帰分析とまったく同じ– 推定値,効果量, 信頼区間,検定統計量, p値– βとか γなど,数式や記号は必須ではない
• 変量効果は分散か標準偏差を報告– 分散か標準偏差かは,ソフトウェアの出力による
• 適合度– 逸脱度( -2*対数尤度)
• これも必須ではない– モデル比較をするなら,情報量基準
67
階層「線形」モデル?
• 実は線形だけではない– HLM7はロジットやポワソンなどのリンクを
選べる– SPSSも一般化線形混合モデルで可能• ただし,推定精度はよくない• 擬最尤法を使っているため
• HADでは,簡便的な推定法で可能–一般化線形モデルを使って,クラスタ標準誤差で推定精度を補正する方法
68
HLMの限界
• 従属変数が一つ–重回帰分析の発展版であることの限界–モデリングが限られる
• 集団レベルの独立変数の問題–個人レベルの変数を平均化する必要がある–説明変数の集団平均値の信頼性が低い場合,推定にバイアスが生じる
69
マルチレベル構造方程式モデル
• Multilevel Structure Equation Modeling–以下、ML-SEM– SEMの階層的データ分析版
• 多変量を扱ったモデリングが可能–適合度指標を参照できる–今のところ、Mplus、 EQS、ML-winなどが対応
• 今回は簡単な紹介にとどめる
70
HLMとML-SEMのイメージ
個人レベル説明変数 個人レベル
目的変数
個人レベル
HLM
集団レベル
分解
集団平均で中心化
集団レベル独立変数
集団平均値
集団平均値には個人レベルの情報が含まれる
71
HLMとML-SEMのイメージ
説明変数
集団レベル
個人レベル
目的変数
個人レベル
分解
ML-SEM
集団レベル
分解
集団レベルの推定は,ML-SEMのほうが正確
72
HLMの結果
• 発言量の集団平均のパスが有意–しかも高度に有意
発話量 _wc
集団成績
満足度
満足度 レベル2
レベル1
発話量 _m
平均化
0.154**
0.344**
0.220**
0.211**
0.604
72
73
ML-SEMの結果
• 集団レベルの発話量の効果が変化– HLMの結果は個人レベルの情報を含んでいる
発話量
集団成績
満足度
満足度 レベル2
レベル1
0.150**
0.435*
0.220**
0.205**
0.604
73
発話量
74
HADによるML-SEM
W_満足度W_発話量
B_満足度B_発話量
B_集団成績
0.220**
0.435**
0.150**
75
HLMとML-SEMの違い• 同じ点– 階層的なデータを分析できる– ML-SEMは HLMの上位モデル
• 回帰分析と構造方程式モデルの関係と同じ
• ML-SEMの利点– モデリングが自由( HLMは従属変数が一つ)– 個人のデータから、集団レベルの独立変数を推定できる( HLMは平均値を算出する必要がある)
• HLMの利点– 多くのソフトウェアが対応している– 制限付き最尤法を利用できる
• 不偏分散を推定できる
76
階層線形モデルについての資料
• Raudenbush, S. W. & Bryk, A. S. (2002). – Hierarchical linear models – Applications and data analysis
methods(2nd ED.).– HLMについてのほぼすべてが書いてある
• PreacherのWebサイト– http://www.quantpsy.org/interact/index.html– HLMの単純効果分析を実行できる
• 奥村太一 (2006). – 階層的線形モデルによるデータの分析例– http://www.p.u-tokyo.ac.jp/~okumurin/gd_okumura.pdf
77
階層線形モデルについての資料
• 尾崎幸謙先生のWeb 資料– http://www.jartest.jp/pdf/3-5ozaki.pdf– 独立変数の中心化についてまとめてある
• 水本篤先生のWebサイトの資料– http://mizumot.com/lablog/archives/179– 今日の話とは少し違った視点での説明がある
• 村山航先生のWebサイトの資料– http://www4.ocn.ne.jp/~murakou/statistics.htm– HLMについてのマニアックな話題がいくつかある
ありがとうございました
• 清水裕士– 所属:広島大学 大学院総合科学研究科
• 助教– 専門:社会心理学 グループダイナミクス
• 親密な対人関係におけるソーシャル・サポート• 社会規範・道徳の進化
• 連絡先– E-mail: simizu706(at)hiroshima-u.ac.jp– Webサイト: http://norimune.net– Twitter: @simizu706