マルチレベルモデル講習会 実践編

78
ママママママママママママ マママ ママママ ママママママママママママママ http://norimune.net 1

Upload: hiroshi-shimizu

Post on 25-May-2015

4.536 views

Category:

Data & Analytics


3 download

DESCRIPTION

東洋大学で行われたマルチレベル講習会の実践編です。SPSSとHADの使い方を解説しています。

TRANSCRIPT

Page 1: マルチレベルモデル講習会 実践編

1

マルチレベルモデル講習会実践編

清水裕士 広島大学大学院総合科学研究科

http://norimune.net

Page 2: マルチレベルモデル講習会 実践編

自己紹介

• 清水裕士– 所属:広島大学 大学院総合科学研究科

• 助教– 専門:社会心理学 グループダイナミクス

• 親密な対人関係におけるソーシャル・サポート• 社会規範・道徳の進化

• 連絡先– E-mail: simizu706(at)hiroshima-u.ac.jp– Webサイト: http://norimune.net– Twitter: @simizu706

Page 3: マルチレベルモデル講習会 実践編

3

実践編

Page 4: マルチレベルモデル講習会 実践編

4

SPSSによる分析の流れ

Page 5: マルチレベルモデル講習会 実践編

5

HLMの分析の流れ

• グループ内類似性の評価–級内相関係数の算出

• レベル1・レベル2の変数の用意–レベル1の変数→集団平均で中心化を行う• →各集団の平均を得点から引くこと

–レベル2の変数→全体平均で中心化を行う

• HLMを行うソフトに変数をセット–モデリングをして推定値を算出• 適合度などを参考に、モデルを修正

Page 6: マルチレベルモデル講習会 実践編

6

級内相関係数の算出

「分析」→「混合モデル」

Page 7: マルチレベルモデル講習会 実践編

7

級内相関係数の算出

Page 8: マルチレベルモデル講習会 実践編

8

「変量をクリック」

「被験者のグループ化」のところにグループ変数を指定

共分散タイプ:無構造

「定数項を含める」をチェック

Page 9: マルチレベルモデル講習会 実践編

9

推定方法を最尤法にしておく

• 「推定」をクリック–今回は最尤法を使う–どちらでも大きな違いはない

–他はいじらなくていい

Page 10: マルチレベルモデル講習会 実践編

10

級内相関係数の算出

• 共分散パラメータを見る–残差・・・集団内変動–切片・・・集団間変動–級内相関 =  0.349 / (0.637 + 0.349) = 0.354

Page 11: マルチレベルモデル講習会 実践編

11

説明変数の準備

• 個人レベルの変数–集団平均値を算出• 「グループ集計」で,グループごとの平均値を算出

–集団平均で中心化• 上で計算した集団平均値をデータから引く

• 集団レベルの変数–全体平均で中心化• 平均値を計算して,データから引く

Page 12: マルチレベルモデル講習会 実践編

12

集団平均値の計算

Page 13: マルチレベルモデル講習会 実践編

13

集団平均で中心化

Page 14: マルチレベルモデル講習会 実践編

14

全体平均中心化

Page 15: マルチレベルモデル講習会 実践編

15

出来上がったデータセット

Page 16: マルチレベルモデル講習会 実践編

ではさっそく HLMを実行

• 満足度を目的変数にした HLM–レベル 1に発話量 _wc–レベル 2に発話量 _m_gmと集団成績 _gm

16

発話量 _wc

集団成績 _gm

満足度

満足度 レベル2

レベル1

発話量 _m_gm

平均化

Page 17: マルチレベルモデル講習会 実践編

17

共変量に説明変数を入れて「固定」を押す

Page 18: マルチレベルモデル講習会 実践編

18

主効果として各説明変数を入れる

Page 19: マルチレベルモデル講習会 実践編

19

「変量」を押して変量効果を指定

Page 20: マルチレベルモデル講習会 実践編

20

出力のオプション

• 「統計量」をクリック–パラメータ推定値–共分散パラメータの検定• は最低限でも出力する

• ここまで出来たら,「 OK」–分析結果が出力される

Page 21: マルチレベルモデル講習会 実践編

21

出力 1:情報量基準

• モデルの適合度– AIC・・・複雑なモデルを好む– BIC・・・倹約的なモデルを好む– AICC・・・中間ぐらい

Page 22: マルチレベルモデル講習会 実践編

22

固定効果

• 推定値–いわゆる,回帰係数– dfは自由度• 小数があるのは, Satterthwaiteの補正をしているため

Page 23: マルチレベルモデル講習会 実践編

23

変量効果の分散成分

• 変量効果の分散と共分散– UN(1,1)は切片の分散– UN(2,2)は回帰係数の分散– UN(2,1)は切片と回帰係数の共分散• ゾロ目は分散,それ以外は共分散

Page 24: マルチレベルモデル講習会 実践編

24

レベル間交互作用

Page 25: マルチレベルモデル講習会 実践編

25

レベル間交互作用

Page 26: マルチレベルモデル講習会 実践編

26

単純効果分析

• 交互作用効果が出たら単純効果が知りたい–分散分析や回帰分析と同じ–説明変数が連続変量の場合は, ±1SDの効果を見ることが多い• あくまで,多い,というだけで,そうすべきというわけではない

• SPSSでは単純効果の検定ができない– PreacherのWebサイトにパラメータを入力– http://www.quantpsy.org/interact/index.html

Page 27: マルチレベルモデル講習会 実践編

27

PreacherのWebサイト

Page 28: マルチレベルモデル講習会 実践編

28

グラフも出力してくれる

Page 29: マルチレベルモデル講習会 実践編

29

HADによる分析

Page 30: マルチレベルモデル講習会 実践編

30

HADとは

• 清水が作った Excelの VBAで動くプログラム– Excelのバージョンは 2007以降に対応– Macにも対応( Excel for Mac2011以降)

• WinとMacを同じファイルで使いまわせる

• 主に心理統計分析ができる–大抵の心理統計分析は可能

• データハンドリング,統計的検定,多変量解析など–マルチレベル分析もできる

• 階層線形モデルや,マルチレベル SEMなど

Page 31: マルチレベルモデル講習会 実践編

31

HADとは

• 無償のソフトウェアです– 利用は無償です– 清水のブログからからダウンロードできます

• http://norimune.net/had• 何度でもダウンロードできます

• 自由なソフトウェアです– ソースコードを自由に閲覧・変更することができます

• 第三者への配布も自由です– ライセンス

• GNU General Public License ( GPL )に則ってます• ライセンスについては「 HADとは」(

http://norimune.net/had )のページを参照してください。

Page 32: マルチレベルモデル講習会 実践編

32

HLMにおける HADの特徴• フリーソフトウェアである

– SPSS (とお金)がなくても, Excelがあれば使える

• 単純効果分析ができる– 簡単に単純効果とグラフの出力ができる

• 頑健標準誤差を出力できる– SPSSは出力してくれない

• 最尤法しか対応していない– 制限付き最尤法は現状,利用できない– 今後搭載の可能性も 0ではない

Page 33: マルチレベルモデル講習会 実践編

33

HADを起動する• 起動時に、マクロを有効にするか聞かれる– Excelのマクロセキュリティを「中」にする• Excel上部に下のような警告が出たら、有効化を押す

• 下の通知が出てきたら「有効にする」を押す

Page 34: マルチレベルモデル講習会 実践編

34

HAD12以降の注意点

• HAD12からは Excelのソルバーを使っている– ソルバー: Excelに入っているアドイン

• 最初に起動したときにエラーがでる場合– コンパイルエラーというのが出ることがある– その場合は, HADを一度閉じて,もう一度起動する。すると,ソルバーが入っていれば普通に使うことができる

• ソルバーがない場合– ソルバーオフバージョンを使う必要がある

Page 35: マルチレベルモデル講習会 実践編

35

HADを起動

• B 列にグループを識別する変数を入れる

Page 36: マルチレベルモデル講習会 実践編

36

モデリングシートに読み込む

• データの読み込み–セットできたら「データ読み込み」ボタン–データをチェックして、以下の場合に警告• データセットに空白がある場合• 欠損値記号以外の文字列がある場合

– 数式エラーの場合は、それらを欠損値に変換できる

• データが保存されているわけではない–変数名の読み込みと設定を読み込むだけ–データセットを変えると分析結果も変わる

Page 37: マルチレベルモデル講習会 実践編

37

モデリングシートの機能基本的な統計分析

新しい変数の作成多変量解析

変数情報の設定 データセット選択

使用変数の指定

Page 38: マルチレベルモデル講習会 実践編

38

• モデリングシートの 9行目に変数名を指定

• 3 通りの指定方法がある– 自分でセルに入力する → コピペでもよい– 「選択セルを使用」ボタンを押す– GUIを使う

分析に使用する変数を指定

ここに入力

ID変数は B 列に入力する

Page 39: マルチレベルモデル講習会 実践編

39

GUIを使用する

• 「使用変数」ボタンを押すと GUIが立ち上がる

• 追加と削除で指定– Shiftや Ctrlを使えば複数の変数を選択できる

• 変数の登録– よく使う変数のセットは登録しておくと便利

– すぐにセットを呼び出せる

Page 40: マルチレベルモデル講習会 実践編

40

HADで基礎統計分析

• 使用変数を指定して,「分析」ボタンを押す

ヒストグラム

Page 41: マルチレベルモデル講習会 実践編

41

級内相関係数の算出

• 使用変数を指定して,「分析」ボタンを押す–級内相関係数を チェック

• OK ボタンを押す

Page 42: マルチレベルモデル講習会 実践編

42

級内相関係数の算出

• 推定値と信頼区間,検定統計量, p値を出力

Page 43: マルチレベルモデル講習会 実践編

43

回帰分析の方法

モデリングスペース

Page 44: マルチレベルモデル講習会 実践編

44

回帰分析の方法

• 「回帰分析」のラジオボタンをクリック–回帰分析用のモデリングスペースが表示される–その中の「回帰分析」を選択

• 先に目的変数,あとで説明変数を指定–変数を選択して,「目的変数を投入」を押す

• ここでは満足度–「主効果を全投入」を押すと,自動的に説明変数がモデルに投入される

Page 45: マルチレベルモデル講習会 実践編

45

回帰分析の方法

• 「分析実行」を押す–「 Reg」というシートで結果が出力される

Page 46: マルチレベルモデル講習会 実践編

46

交互作用も簡単にできる

• 交互作用項は自動的に中心化して作成

Page 47: マルチレベルモデル講習会 実践編

47

ステップごとの結果

Page 48: マルチレベルモデル講習会 実践編

48

単純効果分析も出力する

Page 49: マルチレベルモデル講習会 実践編

49

HLMの方法

• モデリングシートで「階層線形モデル」を選択– HLM用のモデリングスペースに切り替わる

今回は SPSSと結果を一致させるため頑健標準誤差はオフにしておく

Page 50: マルチレベルモデル講習会 実践編

50

実行を押せば HLMができる

• 切片の集団間変動だけを仮定したモデル–「 HLM」というシートに出力される

HADの HLMは,デフォルトで説明変数は全体平均で中心化される

Page 51: マルチレベルモデル講習会 実践編

51

説明変数の中心化

• 「変数の作成」ボタンから行う–「変数の作成」を押して,「尺度変換」タブの「集団平均で中心化する」をチェック

• 分析上で中心化を行う–「レベル 1変数を集団平均で中心化」をチェックすると,自動的に中心化される

–説明変数は自動的に全体平均で中心化される• この設定をオフにすることもできる

Page 52: マルチレベルモデル講習会 実践編

52

説明変数の中心化

Page 53: マルチレベルモデル講習会 実践編

53

集団平均値の計算

• 「変数の作成」の「尺度変換」タブ–集団平均値にチェック → 列を選択して右クリック

Page 54: マルチレベルモデル講習会 実践編

54

回帰係数の集団間変動

• 「変量効果→」にレベル 1変数を指定する

Page 55: マルチレベルモデル講習会 実践編

55

出力 1

• モデル適合度–情報量基準を参照する–回帰係数の集団間変動を仮定すると, R2 乗などの計算はできなくなる

Page 56: マルチレベルモデル講習会 実践編

56

出力 2

• 固定効果–集団平均で中心化した変数・・・ wcがつく–全体平均で中心化した変数・・・ gmがつく

Page 57: マルチレベルモデル講習会 実践編

57

出力 3

• 変量効果の分散成分–検定方法は SPSSと異なる( HLM7と同じ)

Page 58: マルチレベルモデル講習会 実践編

58

交互作用項の投入

• 交互作用項を「 *」を挟んで投入する

Page 59: マルチレベルモデル講習会 実践編

59

交互作用項の投入

• 「交互作用を全投入」ボタン–説明変数すべての交互作用項が投入される

• Shift キー+「交互作用を全投入」ボタン–交互作用項を作りたい説明変数を選択した状

態で, Shift キーを押しながらボタンを押すと,その変数だけの交互作用項が投入される

–今回は,「発話量」と「集団成績」の交互作用項だけを投入

Page 60: マルチレベルモデル講習会 実践編

60

交互作用項の投入

• 分析結果–交互作用項が有意–情報量基準も小さくなった  AIC: 777→764

Page 61: マルチレベルモデル講習会 実践編

61

単純効果分析• 「スライス→」に群分け変数を指定–ここでは集団成績をスライスに指定

Page 62: マルチレベルモデル講習会 実践編

62

• 集団成績 ±1SDの単純効果を推定

単純効果分析

Page 63: マルチレベルモデル講習会 実践編

63

単純効果分析発話量 発話量- 1SD +1SD

_- 1SD集団成績 3.230 3.097_+1SD集団成績 3.350 4.057 **

2.5

3

3.5

4

4.5

-1SD +1SD

満足度

発話量

集団成績_-1SD

集団成績_+1SD

Page 64: マルチレベルモデル講習会 実践編

64

マルチレベルモデルあれこれ

Page 65: マルチレベルモデル講習会 実践編

65

HLMをするならどのソフトウェア?

• HLM7→  HLM だけならベスト• HAD →  REMLができない 単純効果分析可• Mplus →  REMLができない• SPSS→ ロバスト SEが出ない、 DF 設定が不自由

• R → ロバスト SEが出ない

• HLMをするならとりあえず HLM 7がオススメ–フリーソフトなら HADで十分

Page 66: マルチレベルモデル講習会 実践編

66

結果を報告するとき

• 固定効果は回帰分析とまったく同じ– 推定値,効果量, 信頼区間,検定統計量, p値– βとか γなど,数式や記号は必須ではない

• 変量効果は分散か標準偏差を報告– 分散か標準偏差かは,ソフトウェアの出力による

• 適合度– 逸脱度( -2*対数尤度)

• これも必須ではない– モデル比較をするなら,情報量基準

Page 67: マルチレベルモデル講習会 実践編

67

階層「線形」モデル?

• 実は線形だけではない– HLM7はロジットやポワソンなどのリンクを

選べる– SPSSも一般化線形混合モデルで可能• ただし,推定精度はよくない• 擬最尤法を使っているため

• HADでは,簡便的な推定法で可能–一般化線形モデルを使って,クラスタ標準誤差で推定精度を補正する方法

Page 68: マルチレベルモデル講習会 実践編

68

HLMの限界

• 従属変数が一つ–重回帰分析の発展版であることの限界–モデリングが限られる

• 集団レベルの独立変数の問題–個人レベルの変数を平均化する必要がある–説明変数の集団平均値の信頼性が低い場合,推定にバイアスが生じる

Page 69: マルチレベルモデル講習会 実践編

69

マルチレベル構造方程式モデル

• Multilevel Structure Equation Modeling–以下、ML-SEM– SEMの階層的データ分析版

• 多変量を扱ったモデリングが可能–適合度指標を参照できる–今のところ、Mplus、 EQS、ML-winなどが対応

• 今回は簡単な紹介にとどめる

Page 70: マルチレベルモデル講習会 実践編

70

HLMとML-SEMのイメージ

個人レベル説明変数 個人レベル

目的変数

個人レベル

HLM

集団レベル

分解

集団平均で中心化

集団レベル独立変数

集団平均値

集団平均値には個人レベルの情報が含まれる

Page 71: マルチレベルモデル講習会 実践編

71

HLMとML-SEMのイメージ

説明変数

集団レベル

個人レベル

目的変数

個人レベル

分解

ML-SEM

集団レベル

分解

集団レベルの推定は,ML-SEMのほうが正確

Page 72: マルチレベルモデル講習会 実践編

72

HLMの結果

• 発言量の集団平均のパスが有意–しかも高度に有意

発話量 _wc

集団成績

満足度

満足度 レベル2

レベル1

発話量 _m

平均化

0.154**

0.344**

0.220**

0.211**

0.604

72

Page 73: マルチレベルモデル講習会 実践編

73

ML-SEMの結果

• 集団レベルの発話量の効果が変化– HLMの結果は個人レベルの情報を含んでいる

発話量

集団成績

満足度

満足度 レベル2

レベル1

0.150**

0.435*

0.220**

0.205**

0.604

73

発話量

Page 74: マルチレベルモデル講習会 実践編

74

HADによるML-SEM

W_満足度W_発話量

B_満足度B_発話量

B_集団成績

0.220**

0.435**

0.150**

Page 75: マルチレベルモデル講習会 実践編

75

HLMとML-SEMの違い• 同じ点– 階層的なデータを分析できる– ML-SEMは HLMの上位モデル

• 回帰分析と構造方程式モデルの関係と同じ

• ML-SEMの利点– モデリングが自由( HLMは従属変数が一つ)– 個人のデータから、集団レベルの独立変数を推定できる( HLMは平均値を算出する必要がある)

• HLMの利点– 多くのソフトウェアが対応している– 制限付き最尤法を利用できる

• 不偏分散を推定できる

Page 76: マルチレベルモデル講習会 実践編

76

階層線形モデルについての資料

• Raudenbush, S. W. & Bryk, A. S. (2002). – Hierarchical linear models – Applications and data analysis

methods(2nd ED.).– HLMについてのほぼすべてが書いてある

• PreacherのWebサイト– http://www.quantpsy.org/interact/index.html– HLMの単純効果分析を実行できる

• 奥村太一 (2006). – 階層的線形モデルによるデータの分析例– http://www.p.u-tokyo.ac.jp/~okumurin/gd_okumura.pdf

Page 77: マルチレベルモデル講習会 実践編

77

階層線形モデルについての資料

• 尾崎幸謙先生のWeb 資料– http://www.jartest.jp/pdf/3-5ozaki.pdf– 独立変数の中心化についてまとめてある

• 水本篤先生のWebサイトの資料– http://mizumot.com/lablog/archives/179– 今日の話とは少し違った視点での説明がある

• 村山航先生のWebサイトの資料– http://www4.ocn.ne.jp/~murakou/statistics.htm– HLMについてのマニアックな話題がいくつかある

Page 78: マルチレベルモデル講習会 実践編

ありがとうございました

• 清水裕士– 所属:広島大学 大学院総合科学研究科

• 助教– 専門:社会心理学 グループダイナミクス

• 親密な対人関係におけるソーシャル・サポート• 社会規範・道徳の進化

• 連絡先– E-mail: simizu706(at)hiroshima-u.ac.jp– Webサイト: http://norimune.net– Twitter: @simizu706