マルチレベルモデル講習会実践編

1

マルチレベルモデル講習会実践編

清水裕士　広島大学大学院総合科学研究科

http://norimune.net

自己紹介

• 清水裕士– 所属：広島大学　大学院総合科学研究科

• 助教– 専門：社会心理学　グループダイナミクス

• 親密な対人関係におけるソーシャル・サポート• 社会規範・道徳の進化

• 連絡先– E-mail： simizu706(at)hiroshima-u.ac.jp– Webサイト： http://norimune.net– Twitter: @simizu706

http://norimune.net/


3

実践編

4

SPSSによる分析の流れ

5

HLMの分析の流れ

• グループ内類似性の評価–級内相関係数の算出

• レベル１・レベル２の変数の用意–レベル１の変数→集団平均で中心化を行う• →各集団の平均を得点から引くこと

–レベル２の変数→全体平均で中心化を行う

• HLMを行うソフトに変数をセット–モデリングをして推定値を算出• 適合度などを参考に、モデルを修正

6

級内相関係数の算出

「分析」→「混合モデル」

7


8

「変量をクリック」

「被験者のグループ化」のところにグループ変数を指定

共分散タイプ：無構造

「定数項を含める」をチェック

9

推定方法を最尤法にしておく

• 「推定」をクリック–今回は最尤法を使う–どちらでも大きな違いはない

–他はいじらなくていい

10


• 共分散パラメータを見る–残差・・・集団内変動–切片・・・集団間変動–級内相関　＝　 0.349 / (0.637 + 0.349) = 0.354

11

説明変数の準備

• 個人レベルの変数–集団平均値を算出• 「グループ集計」で，グループごとの平均値を算出

–集団平均で中心化• 上で計算した集団平均値をデータから引く

• 集団レベルの変数–全体平均で中心化• 平均値を計算して，データから引く

12

集団平均値の計算

13

集団平均で中心化

14

全体平均中心化

15

出来上がったデータセット

ではさっそく HLMを実行

• 満足度を目的変数にした HLM–レベル 1に発話量 _wc–レベル 2に発話量 _m_gmと集団成績 _gm

16

発話量 _wc

集団成績 _gm

満足度

満足度レベル2

レベル1

発話量 _m_gm

平均化

17

共変量に説明変数を入れて「固定」を押す

18

主効果として各説明変数を入れる

19

「変量」を押して変量効果を指定

20

出力のオプション

• 「統計量」をクリック–パラメータ推定値–共分散パラメータの検定• は最低限でも出力する

• ここまで出来たら，「 OK」–分析結果が出力される

21

出力 1：情報量基準

• モデルの適合度– AIC・・・複雑なモデルを好む– BIC・・・倹約的なモデルを好む– AICC・・・中間ぐらい

22

固定効果

• 推定値–いわゆる，回帰係数– dfは自由度• 小数があるのは， Satterthwaiteの補正をしているため

23

変量効果の分散成分

• 変量効果の分散と共分散– UN(1,1)は切片の分散– UN(2,2)は回帰係数の分散– UN(2,1)は切片と回帰係数の共分散• ゾロ目は分散，それ以外は共分散

24

レベル間交互作用

25

レベル間交互作用

26

単純効果分析

• 交互作用効果が出たら単純効果が知りたい–分散分析や回帰分析と同じ–説明変数が連続変量の場合は， ±1SDの効果を見ることが多い• あくまで，多い，というだけで，そうすべきというわけではない

• SPSSでは単純効果の検定ができない– PreacherのWebサイトにパラメータを入力– http://www.quantpsy.org/interact/index.html

27

PreacherのWebサイト

28

グラフも出力してくれる

29

HADによる分析

30

HADとは

• 清水が作った Excelの VBAで動くプログラム– Excelのバージョンは 2007以降に対応– Macにも対応（ Excel for Mac2011以降）

• WinとMacを同じファイルで使いまわせる

• 主に心理統計分析ができる–大抵の心理統計分析は可能

• データハンドリング，統計的検定，多変量解析など–マルチレベル分析もできる

• 階層線形モデルや，マルチレベル SEMなど

31

HADとは

• 無償のソフトウェアです– 利用は無償です– 清水のブログからからダウンロードできます

• http://norimune.net/had• 何度でもダウンロードできます

• 自由なソフトウェアです– ソースコードを自由に閲覧・変更することができます

• 第三者への配布も自由です– ライセンス

• GNU General Public License （ GPL ）に則ってます• ライセンスについては「 HADとは」（

http://norimune.net/had ）のページを参照してください。

http://norimune.net/had

http://norimune.net/had

32

HLMにおける HADの特徴• フリーソフトウェアである

– SPSS （とお金）がなくても， Excelがあれば使える

• 単純効果分析ができる– 簡単に単純効果とグラフの出力ができる

• 頑健標準誤差を出力できる– SPSSは出力してくれない

• 最尤法しか対応していない– 制限付き最尤法は現状，利用できない– 今後搭載の可能性も 0ではない

33

HADを起動する• 起動時に、マクロを有効にするか聞かれる– Excelのマクロセキュリティを「中」にする• Excel上部に下のような警告が出たら、有効化を押す

• 下の通知が出てきたら「有効にする」を押す

34

HAD12以降の注意点

• HAD12からは Excelのソルバーを使っている– ソルバー： Excelに入っているアドイン

• 最初に起動したときにエラーがでる場合– コンパイルエラーというのが出ることがある– その場合は， HADを一度閉じて，もう一度起動する。すると，ソルバーが入っていれば普通に使うことができる

• ソルバーがない場合– ソルバーオフバージョンを使う必要がある

35

HADを起動

• B 列にグループを識別する変数を入れる

36

モデリングシートに読み込む

• データの読み込み–セットできたら「データ読み込み」ボタン–データをチェックして、以下の場合に警告• データセットに空白がある場合• 欠損値記号以外の文字列がある場合

– 数式エラーの場合は、それらを欠損値に変換できる

• データが保存されているわけではない–変数名の読み込みと設定を読み込むだけ–データセットを変えると分析結果も変わる

37

モデリングシートの機能基本的な統計分析

新しい変数の作成多変量解析

変数情報の設定データセット選択

使用変数の指定

38

• モデリングシートの 9行目に変数名を指定

• 3 通りの指定方法がある– 自分でセルに入力する　→　コピペでもよい– 「選択セルを使用」ボタンを押す– GUIを使う

分析に使用する変数を指定

ここに入力

ID変数は B 列に入力する

39

GUIを使用する

• 「使用変数」ボタンを押すと GUIが立ち上がる

• 追加と削除で指定– Shiftや Ctrlを使えば複数の変数を選択できる

• 変数の登録– よく使う変数のセットは登録しておくと便利

– すぐにセットを呼び出せる

40

HADで基礎統計分析

• 使用変数を指定して，「分析」ボタンを押す

ヒストグラム

41


• 使用変数を指定して，「分析」ボタンを押す–級内相関係数を　チェック

• OK ボタンを押す

42


• 推定値と信頼区間，検定統計量， p値を出力

43

回帰分析の方法

モデリングスペース

44


• 「回帰分析」のラジオボタンをクリック–回帰分析用のモデリングスペースが表示される–その中の「回帰分析」を選択

• 先に目的変数，あとで説明変数を指定–変数を選択して，「目的変数を投入」を押す

• ここでは満足度–「主効果を全投入」を押すと，自動的に説明変数がモデルに投入される

45


• 「分析実行」を押す–「 Reg」というシートで結果が出力される

46

交互作用も簡単にできる

• 交互作用項は自動的に中心化して作成

47

ステップごとの結果

48

単純効果分析も出力する

49

HLMの方法

• モデリングシートで「階層線形モデル」を選択– HLM用のモデリングスペースに切り替わる

今回は SPSSと結果を一致させるため頑健標準誤差はオフにしておく

50

実行を押せば HLMができる

• 切片の集団間変動だけを仮定したモデル–「 HLM」というシートに出力される

HADの HLMは，デフォルトで説明変数は全体平均で中心化される

51

説明変数の中心化

• 「変数の作成」ボタンから行う–「変数の作成」を押して，「尺度変換」タブの「集団平均で中心化する」をチェック

• 分析上で中心化を行う–「レベル 1変数を集団平均で中心化」をチェックすると，自動的に中心化される

–説明変数は自動的に全体平均で中心化される• この設定をオフにすることもできる

52

説明変数の中心化

53

集団平均値の計算

• 「変数の作成」の「尺度変換」タブ–集団平均値にチェック　→　列を選択して右クリック

54

回帰係数の集団間変動

• 「変量効果→」にレベル 1変数を指定する

55

出力 1

• モデル適合度–情報量基準を参照する–回帰係数の集団間変動を仮定すると， R2 乗などの計算はできなくなる

56

出力 2

• 固定効果–集団平均で中心化した変数・・・ wcがつく–全体平均で中心化した変数・・・ gmがつく

57

出力 3

• 変量効果の分散成分–検定方法は SPSSと異なる（ HLM7と同じ）

58

交互作用項の投入

• 交互作用項を「 *」を挟んで投入する

59


• 「交互作用を全投入」ボタン–説明変数すべての交互作用項が投入される

• Shift キー＋「交互作用を全投入」ボタン–交互作用項を作りたい説明変数を選択した状

態で， Shift キーを押しながらボタンを押すと，その変数だけの交互作用項が投入される

–今回は，「発話量」と「集団成績」の交互作用項だけを投入

60


• 分析結果–交互作用項が有意–情報量基準も小さくなった　 AIC： 777→764

61

単純効果分析• 「スライス→」に群分け変数を指定–ここでは集団成績をスライスに指定

62

• 集団成績 ±1SDの単純効果を推定

単純効果分析

63

単純効果分析発話量発話量- 1SD +1SD

_- 1SD集団成績 3.230 3.097_+1SD集団成績 3.350 4.057 **

2.5

3

3.5

4

4.5

-1SD +1SD

満足度

発話量

集団成績_-1SD

集団成績_+1SD

64

マルチレベルモデルあれこれ

65

HLMをするならどのソフトウェア？

• HLM7→　 HLM だけならベスト• HAD　→　 REMLができない　単純効果分析可• Mplus　→　 REMLができない• SPSS→　ロバスト SEが出ない、 DF 設定が不自由

• R　→　ロバスト SEが出ない

• HLMをするならとりあえず HLM ７がオススメ–フリーソフトなら HADで十分

66

結果を報告するとき

• 固定効果は回帰分析とまったく同じ– 推定値，効果量，信頼区間，検定統計量， p値– βとか γなど，数式や記号は必須ではない

• 変量効果は分散か標準偏差を報告– 分散か標準偏差かは，ソフトウェアの出力による

• 適合度– 逸脱度（ -2*対数尤度）

• これも必須ではない– モデル比較をするなら，情報量基準

67

階層「線形」モデル？

• 実は線形だけではない– HLM7はロジットやポワソンなどのリンクを

選べる– SPSSも一般化線形混合モデルで可能• ただし，推定精度はよくない• 擬最尤法を使っているため

• HADでは，簡便的な推定法で可能–一般化線形モデルを使って，クラスタ標準誤差で推定精度を補正する方法

68

HLMの限界

• 従属変数が一つ–重回帰分析の発展版であることの限界–モデリングが限られる

• 集団レベルの独立変数の問題–個人レベルの変数を平均化する必要がある–説明変数の集団平均値の信頼性が低い場合，推定にバイアスが生じる

69

マルチレベル構造方程式モデル

• Multilevel Structure Equation Modeling–以下、ML-SEM– SEMの階層的データ分析版

• 多変量を扱ったモデリングが可能–適合度指標を参照できる–今のところ、Mplus、 EQS、ML-winなどが対応

• 今回は簡単な紹介にとどめる

70

HLMとML-SEMのイメージ

個人レベル説明変数個人レベル

目的変数

個人レベル

HLM

集団レベル

分解

集団平均で中心化

集団レベル独立変数

集団平均値

集団平均値には個人レベルの情報が含まれる

71

HLMとML-SEMのイメージ

説明変数

集団レベル

個人レベル

目的変数

個人レベル

分解

ML-SEM

集団レベル

分解

集団レベルの推定は，ML-SEMのほうが正確

72

HLMの結果

• 発言量の集団平均のパスが有意–しかも高度に有意

発話量 _wc

集団成績

満足度

満足度レベル2

レベル1

発話量 _m

平均化

0.154**

0.344**

0.220**

0.211**

0.604

72

73

ML-SEMの結果

• 集団レベルの発話量の効果が変化– HLMの結果は個人レベルの情報を含んでいる

発話量

集団成績

満足度

満足度レベル2

レベル1

0.150**

0.435*

0.220**

0.205**

0.604

73

発話量

74

HADによるML-SEM

W_満足度W_発話量

B_満足度B_発話量

B_集団成績

0.220**

0.435**

0.150**

75

HLMとML-SEMの違い• 同じ点– 階層的なデータを分析できる– ML-SEMは HLMの上位モデル

• 回帰分析と構造方程式モデルの関係と同じ

• ML-SEMの利点– モデリングが自由（ HLMは従属変数が一つ）– 個人のデータから、集団レベルの独立変数を推定できる（ HLMは平均値を算出する必要がある）

• HLMの利点– 多くのソフトウェアが対応している– 制限付き最尤法を利用できる

• 不偏分散を推定できる

76

階層線形モデルについての資料

• Raudenbush, S. W. & Bryk, A. S. (2002). – Hierarchical linear models – Applications and data analysis

methods(2nd ED.).– HLMについてのほぼすべてが書いてある

• PreacherのWebサイト– http://www.quantpsy.org/interact/index.html– HLMの単純効果分析を実行できる

• 奥村太一 (2006). – 階層的線形モデルによるデータの分析例– http://www.p.u-tokyo.ac.jp/~okumurin/gd_okumura.pdf

http://www.quantpsy.org/interact/index.html

http://www.quantpsy.org/interact/index.html

http://www.p.u-tokyo.ac.jp/~okumurin/gd_okumura.pdf

http://www.p.u-tokyo.ac.jp/~okumurin/gd_okumura.pdf

77

階層線形モデルについての資料

• 尾崎幸謙先生のWeb 資料– http://www.jartest.jp/pdf/3-5ozaki.pdf– 独立変数の中心化についてまとめてある

• 水本篤先生のWebサイトの資料– http://mizumot.com/lablog/archives/179– 今日の話とは少し違った視点での説明がある

• 村山航先生のWebサイトの資料– http://www4.ocn.ne.jp/~murakou/statistics.htm– HLMについてのマニアックな話題がいくつかある

http://www.jartest.jp/pdf/3-5ozaki.pdf

http://mizumot.com/lablog/archives/179

http://www4.ocn.ne.jp/~murakou/statistics.htm

ありがとうございました

• 清水裕士– 所属：広島大学　大学院総合科学研究科

• 助教– 専門：社会心理学　グループダイナミクス

• 親密な対人関係におけるソーシャル・サポート• 社会規範・道徳の進化

• 連絡先– E-mail： simizu706(at)hiroshima-u.ac.jp– Webサイト： http://norimune.net– Twitter: @simizu706



マルチレベルモデル講習会 実践編

Data & Analytics

マルチレベルモデル講習会実践編