第4回darm勉強会 (多母集団同時分析)

40
DARM勉強会#4 2013.06.22. 1 多母集団同時分析 (Multiple Group Structural E quation Modeling) 広島大学教育学研究科 博士課程後期2年 德岡

Upload: masaru-tokuoka

Post on 06-May-2015

4.601 views

Category:

Education


4 download

DESCRIPTION

第4回DARM勉強会発表資料

TRANSCRIPT

Page 1: 第4回DARM勉強会 (多母集団同時分析)

DARM勉強会#4 2013.06.22.

1

多母集団同時分析 (Multiple Group Structural Equation

Modeling)

広島大学教育学研究科 博士課程後期2年

德岡 大

Page 2: 第4回DARM勉強会 (多母集団同時分析)

Reporting Guideline

Lomax, R. G. (2010). Structural equation modeling: Multiple covariance and mean structures. G. R. Hancock, & R. O. Mueller (Eds.), The Reviewer’s Guide to Quantitative Methods in the Social Sciences. New York: Routledge, pp. 385-396.

2

Page 3: 第4回DARM勉強会 (多母集団同時分析)

2つの集団の比較をSEMでするには

• 相関や回帰のような関連の問題であれば,パス解析を用いてSEMでも実行可能

• t 検定のように群間の平均値差をSEMで検討するには? a. ダミー変数をモデルに加えて,ダミー変数から因子へのパ

ス係数で平均値差を検討する – 回帰式にダミー変数が加わっている状態とよく似た形 – 集団間の共分散行列が共通であるという厳しい暗黙の仮定

3

f

v1 v2 v3

e1 e2 e3

male_dummy (0-1)

e4

Page 4: 第4回DARM勉強会 (多母集団同時分析)

2つの集団の比較をSEMでするには

• t 検定のように群間の平均値差をSEMで検討するには? b. 平均構造をSEMに導入して集団間の平均値差を検討 – いわゆる多母集団同時解析 – 集団間で異なる因子を測定していないか検討可能(測定不変モデル)

– 制約を柔軟に変えられ,適合度によるモデル選択が可能

4

f

v1 v2 v3

e1 e2 e3

male f

v1 v2 v3

e1 e2 e3

female

Page 5: 第4回DARM勉強会 (多母集団同時分析)

なぜ多母集団同時分析が必要なのか

• 内発的動機づけの小学生と中学生の差を検討したい • 質問紙調査により内発的動機づけを測定 • 測定項目の評定を合成して内発的動機づけ変数を作成 • t検定で小学生と中学生の比較 • 内発的動機づけの測定項目への因子負荷量は本当に同じであ

るといえるか? • 構成概念から測定される変数への影響が集団間で異なる場合,

合成された平均値は,同一の構成概念なのだろうか? • t検定やダミー変数による回帰では,影響が同一であるという前

提を検討せずに,集団間の差を検討することになる。 • これらの問題に対応できるのが多母集団同時解析

5

プレゼンター
プレゼンテーションのノート
アンケートのような調査を主体とする研究の場合,構成概念は複数の変数により測定されることが多い
Page 6: 第4回DARM勉強会 (多母集団同時分析)

MS-SEMとは

MS-SEM (Maltiple Sample SEM) • 集団によって変数間の関連が異なるか検討(i.e., 共分散構造の

同質性)

6

f

v1 v2 v3

e1 e2 e3

male f

v1 v2 v3

e1 e2 e3

female

Page 7: 第4回DARM勉強会 (多母集団同時分析)

SM-SEMとは

SM-SEM (Structured Means SEM) • 集団によって同一の潜在変数の平均値が異なるか検討(i.e., 切

片の値) • 最低限,因子負荷量が等価である制約を満たす必要あり

7

f

v1 v2 v3

e1 e2 e3

male f

v1 v2 v3

e1 e2 e3

female

Page 8: 第4回DARM勉強会 (多母集団同時分析)

MS-SEMとSM-SEMで考慮すべき14のこと

1. 検討する潜在変数を含んだ理論的なモデルのための理由が実質的な領域における利用可能な理論や研究に基づくこと(I)

2. パス図が検討する理論的なモデルを提示するために見せること(I)

3. サンプルサイズや抽出方法を含めて,集団やサンプルが記述されること(M)

4. 潜在変数を示すために使われる観測変数が完全に記述されること(e.g., 尺度,信頼性,妥当性)(M)

5. 利用したソフトウェアのバージョンと名前を報告すること。加えて,パラメタの推定方法が議論されること(M, R)

6. 欠損データの処置方法や外れ値が議論されること(M, R) 7. 各サンプルに対する相関,平均および標準偏差が提示され,で

きる限り,ローデータへの接近が手助けされること(M, R) 8. 識別,収束,正ではない限定的な行列,不十分な(許容できな

い)解に伴う問題が報告され,解消されること(R)

8

Page 9: 第4回DARM勉強会 (多母集団同時分析)

MS-SEMとSM-SEMで考慮すべき14のこと

9. パラメタ推定や統計的有意性(それぞれに対する正や負の関係についての正や負の方向性のように,期待される方向性を含む)が表,パス図,文中などで報告されること(R)

10. それぞれのモデルに対する多様な全体的な適合度指標が報告され,適用できるならば,χ2差異検定がネストされたモデルを比較するために報告されること(R)

11. 理論的,統計的理由を含めてモデル修正が報告されること(R) 12. 複数のモデルが多母集団モデリング(MS-SEM)におけるパラメ

タ推定の不変性をチェックするためにテストされること(R) 13. 平均構造のパラメタ推定が,関連する効果量測定を含め,構

造平均モデリングで報告されること(R) 14. 結果は,理論的なモデルの不変性を検査する文脈で考察され

ること(D) 9

Page 10: 第4回DARM勉強会 (多母集団同時分析)

MS-SEMとSM-SEMで考慮すべきこと

• 基本的にはSEMなので,SEMのルールを包含している • SEMにおけるルールはSEMの発表資料参照 • ここでは,複数の集団による関連の仕方の違い(MS-SEM)や平

均構造を導入して,推定平均の違い(SM-SEM)を検討する上で特に気を付ける必要のあることについて報告していく

10

Page 11: 第4回DARM勉強会 (多母集団同時分析)

1.理論モデルの正当性について

MS-SEM, SM-SEM共通 • 理論的モデルにおけるグループ差についての仮説 • e.g., 特定の構造での青年期発達における男女差

MS-SEMとSM-SEMで検討できること MS-SEM • 特定のパラメタ(パス係数や共分散)が集団間で異なるのか等

しいのかについてテストできる SM-SEM • 集団間の潜在的な平均値差があるかどうかテストできる • 観測変数へのパス係数については同質性が保証されなければ

検討してはいけない 11

Page 12: 第4回DARM勉強会 (多母集団同時分析)

1.理論モデルの正当性について:事例

• 理論的モデルにおけるグループ差についての仮説 In this study, we investigate whether the findings with school-age children extend to adolescent students. Because teachers see adolescents on an almost daily basis and have a professional responsibility to their students, teachers can have a significant impact on the number of adults adolescents identify as caring role models. We expected that those students who reported that they had adults who cared about them felt more safe and secure at school than students who were bereft of caring adults.

12

Shumow, L., & Lomax, R. G. (2001). Predicting perceptions of school safety. The School Community Journal, 11, 93-112.

Page 13: 第4回DARM勉強会 (多母集団同時分析)

2.パス図の提示

• パス図には検定した理論的なモデルを含むべき • パス図の種類:目的によって少なくとも2種類ある

• 目的1:文献レビューの理論的モデルを提示する

– パス図の提示だけでなく,どのように変数間の関係が理論化されるのかを説明する

• 目的2:分析の結果を提示する – 重要なパラメタ推定値をパス図の中に書く

• 複数のサンプルのある状況では,サンプルごとに推定結果は示

されるべき

13

Page 14: 第4回DARM勉強会 (多母集団同時分析)

2.パス図の提示:事例

• 目的2:分析の結果を提示する

14 Shumow, L., & Lomax, R. G. (2002).Parental efficacy: Predictor of parenting behavior and adolescent outcomes. Parenting: Science and Practice, 2, 127-150.

Page 15: 第4回DARM勉強会 (多母集団同時分析)

3.サンプリングの問題

• 結果やサンプリング妥当性の判断を考慮できる 1. 集団の定義についての情報を含まなければならない(e.g., 公

立の学校に通うアメリカの13~17歳の男女) 2. 利用したサンプリング手続きのタイプは記述される必要がある

(e.g., 無作為,クラスター,階層,利便性)。母集団からどのようにサンプルが選択されたのか記述すべき

3. それぞれのサンプルから実際にどのようにデータを収集したのかについて詳細に提示する必要あり

15

Page 16: 第4回DARM勉強会 (多母集団同時分析)

3.サンプリングの問題:事例

• サンプリングの手続きについて Recruitment. Analyses were conducted on baseline data from a randomized trial of Parents Who Care, a universal substance abuse prevention program. Families with eighth-grade students were recruited from Seattle school. • 実際のデータ収集について Data collection. Data were collected in the families’ homes. Parents and adolescents completed separate audio-computer-administered surveys. Prior to each family interaction task, a trained research assistant set up the video equipment, provided oral and written standardized instructions to each family, then left the room while the family completed the task.

16

Skinner, M. L., MacKenzie, E. P., Haggerty, K. P., Hill, K. G., & Roberson, K. C. (2011). Observed parenting behavior with teens: Measurement invariance and predictive validity across race. Cultural Diversity and Ethnic Minority Psychology, 17, 252-260.

Page 17: 第4回DARM勉強会 (多母集団同時分析)

3.サンプリングの問題:事例

17

• 集団の定義について Demographic variables. Race was measured as African American (race = 1) or European American (race = 0). Assignment was based on school records of parent report of the student’s race when enrolled in school. The study included students from only these two racial/ethnic groups and recruitment and blocking were based on this variable.

Skinner, M. L., MacKenzie, E. P., Haggerty, K. P., Hill, K. G., & Roberson, K. C. (2011). Observed parenting behavior with teens: Measurement invariance and predictive validity across race. Cultural Diversity and Ethnic Minority Psychology, 17, 252-260.

Page 18: 第4回DARM勉強会 (多母集団同時分析)

4.潜在変数と観測変数

• SEMの発表資料参照

18

Page 19: 第4回DARM勉強会 (多母集団同時分析)

5.ソフトウェアと推定方法

SEMの復習 • SEMを用いた研究では,ほとんどの推定方法が観測変数の分

布に関する仮定をつくる • 最尤法による推定は,SEMで用いられる一般的な推定方法であ

り,多変量正規性を仮定する • データの分布,推定方法,観測変数の測定尺度を記述する必

要がある MS-SEM • それぞれのサンプルについて分布,推定方法,測定尺度につい

て記述する必要あり。

19

Page 20: 第4回DARM勉強会 (多母集団同時分析)

5.ソフトウェアと推定方法:事例

• 推定方法の妥当性について Structural equation modeling (LISREL 8, Joreskog & Sorbom, 1993) was used to assess the relations among the variables used in the theoretical model depicted in Figure 1. The theoretical model was evaluated separately for the overall sample, and for the African American, Hispanic and White samples. Results are shown in Table 2. As the data were reasonably normally distributed (e.g., no variables had skewness or kurtosis values exceeding |1.5|), maximum-likelihood was selected as the method of estimation.

20 Shumow, L., & Lomax, R. G. (2001). Predicting perceptions of school safety. The School Community Journal, 11, 93-112.

Page 21: 第4回DARM勉強会 (多母集団同時分析)

5.ソフトウェアと推定方法:事例

• 多変量正規性の確認,対処,使用したソフトウエア Analysis. Prior to conducting the confirmatory factory analysis (CFA), items with extremely non-normal distribution (i.e., skew |3.0| or kurtosis 10.00) (Kline, 1998) in either racial sample were eliminated. In one case (Caregiver nagged the teen) the variable was collapsed into only two levels: (1) not at all, and (2) sometimes or more. All analyses were conducted in Mplus v. 3.11.

21

Skinner, M. L., MacKenzie, E. P., Haggerty, K. P., Hill, K. G., & Roberson, K. C. (2011). Observed parenting behavior with teens: Measurement invariance and predictive validity across race. Cultural Diversity and Ethnic Minority Psychology, 17, 252-260.

Page 22: 第4回DARM勉強会 (多母集団同時分析)

5.ソフトウェアと推定方法:事例

22

• それぞれのサンプルについて分布について

Skinner, M. L., MacKenzie, E. P., Haggerty, K. P., Hill, K. G., & Roberson, K. C. (2011). Observed parenting behavior with teens: Measurement invariance and predictive validity across race. Cultural Diversity and Ethnic Minority Psychology, 17, 252-260.

Page 23: 第4回DARM勉強会 (多母集団同時分析)

6.欠損データと外れ値の対処

• 欠損データの扱い方の記述,その方法を適用する正当な理由および最初のサンプルサイズと最終的なサンプルサイズが含まれるべき

• 基本的には,SEMと同様なのでSEMの発表資料参照

23

Page 24: 第4回DARM勉強会 (多母集団同時分析)

7.各サンプルに対するデータテーブル

SM-SEM • 観測変数の相関,平均,標準偏差(もしくは分散)を行列の形で

表で提示されることが多い • 複数のサンプルでは,(a)サンプルごとに提示(b)サンプルのペ

アの場合,対角線上の上に1つ目のグループ,下に2つ目のグループ

• 完全な行列は観測変数が多すぎない限り,各サンプルごとに表して提示すべき

• 読者が結果を再現することのできるようにする十分な情報を提示すべき

24

Page 25: 第4回DARM勉強会 (多母集団同時分析)

7.各サンプルに対するデータテーブル:事例

• 観測変数の相関,平均,標準偏差の提示方法について

• 提示した例では,上段 にサンプル全体の相関, 下段にヨーロッパ系アメ リカ人のサンプルの相関, を,M, SDには1列目にサ ンプル全体,2列目にヨ ーロッパ系アメリカ人の 基礎統計量を示している

25 Shumow, L., & Lomax, R. G. (2002).Parental efficacy: Predictor of parenting behavior and adolescent outcomes. Parenting: Science and Practice, 2, 127-150.

Page 26: 第4回DARM勉強会 (多母集団同時分析)

8.適切な最終解を得る中での問題

• SEMの発表資料参照 • 複数のサンプルの場合であっても,エラーが減ったり,なくなる

ことはない。 • エラーは,解決方法と同様に報告する必要がある。

26

Page 27: 第4回DARM勉強会 (多母集団同時分析)

9.パラメタ推定と統計的有意性 MS-SEM • 各集団について,自由推定したすべての推定値,標準誤差,統

計的有意性を報告する必要がある • サンプルごとに列にして報告も可 SM-SEM • 推定された平均値差が報告される必要がある • 重要な結果はパス図に,尺度や構造モデルから得られる結果

の完全な報告は,表を1つ以上用いる • 表に結果をまとめるとき,ギリシャ文字(e.g., ζ, ξ)ではなく観測変

数と潜在変数の名前を用いて,パラメタのタイプ(e.g., 因子負荷量,測定誤差,パス係数)を明確に分類して提示することを推奨

これらは,MS-SEMやSM-SEMの中で不変性を検定するための推定値なのでわかるように結果が報告されることを推奨

27

Page 28: 第4回DARM勉強会 (多母集団同時分析)

9.パラメタ推定と統計的有意性:事例

• 各集団について,自由推定したすべての推定値,統計的有意性の報告例(一部抜粋)

28 Shumow, L., & Lomax, R. G. (2002).Parental efficacy: Predictor of parenting behavior and adolescent outcomes. Parenting: Science and Practice, 2, 127-150.

Page 29: 第4回DARM勉強会 (多母集団同時分析)

9.パラメタ推定と統計的有意性:事例

• パラメタのタイプを分けて報告

29 Shumow, L., & Lomax, R. G. (2002).Parental efficacy: Predictor of parenting behavior and adolescent outcomes. Parenting: Science and Practice, 2, 127-150.

Page 30: 第4回DARM勉強会 (多母集団同時分析)

10.全体的なモデル適合度とモデル比較

• MS-SEMやSM-SEMを用いる時,χ2値の差異検定(i.e., 尤度比検定)がネストモデル(nested model)を検討するために推奨される

• ネストモデル:変数は同じ,1つ以上のパラメタに制約が加わる時,1つのモデルが別のモデルの中にネストされる。

比較の仕方 • 制約の厳しいモデル(χ2値,自由度)ー制約のゆるいモデル(χ2値,自由度)

30

f

v1 v2 v3

e1 e2 e3

e4

Model 1 f

v1 v2 v3

e1 e2 e3

e4

Model 2

パス係数を固定

Page 31: 第4回DARM勉強会 (多母集団同時分析)

10.モデル比較:事例

• モデル比較の手順説明 We used multiple-group CFA (MGCFA) to assess measurement equivalence across African American and European American families. Specifically, we compared the fit between models where loadings in the two samples were constrained to be equal to models where they were allowed to differ (unconstrained) using the likelihood ratio test (a 2 difference test) and by examining the change in the comparative fit index (CFI). Chi-square difference tests yielding nonsignificant p values (p .05) were interpreted as support of measurement invariance (Bontempo, Hofer, & Lawrence, 2006). Since 2 is more likely to yield erroneous support or invariance in small samples, differences in the CFI, which is not influenced by sample size, were also used. Differences less than or equal to .01 were interpreted as evidence of invariance (Cheung & Rensvold, 2002).

31

Skinner, M. L., MacKenzie, E. P., Haggerty, K. P., Hill, K. G., & Roberson, K. C. (2011). Observed parenting behavior with teens: Measurement invariance and predictive validity across race. Cultural Diversity and Ethnic Minority Psychology, 17, 252-260.

Page 32: 第4回DARM勉強会 (多母集団同時分析)

10.モデル比較:事例

• 結果の提示方法 Noninvariance was indicated for prosocial rewards and problem solving (see Table 3). In the case of prosocial rewards, the loading for ‘Failed to respond to prosocial behavior or attitude’ was negative and significant in both groups, but stronger for African American families.

32

Skinner, M. L., MacKenzie, E. P., Haggerty, K. P., Hill, K. G., & Roberson, K. C. (2011). Observed parenting behavior with teens: Measurement invariance and predictive validity across race. Cultural Diversity and Ethnic Minority Psychology, 17, 252-260.

Page 33: 第4回DARM勉強会 (多母集団同時分析)

11.モデル修正

• SEMの発表資料参照

33

Page 34: 第4回DARM勉強会 (多母集団同時分析)

12.多母集団モデリング

• 性別や年齢の異なるサンプルにおいてパス係数や因子負荷量などの推定値が異なるのか,パラメタに制約をつけモデルを比較することで,理論の一般性についてテスト可能

たぼる手順(パラメタ制約のかけ方) 1. モデル1(配置不変):サンプルごとに何も制約をつけない(全て

自由推定) 2. モデル2(弱測定不変):サンプルごとに因子負荷量が等価であ

るという制約をつける 3. モデル3(強測定不変):測定誤差分散が等価であるという制約

をつける 4. モデル4(測定不変):分散,共分散が等価であるという制約を

つける 5. モデル5:パス係数が等価であるという制約 6. モデル6:予測の誤差分散が等価であるという制約

34

Page 35: 第4回DARM勉強会 (多母集団同時分析)

12.多母集団モデリング:配置不変性

• 集団間で同じモデル構造を仮定するが,因子負荷量や誤差分散などすべての推定値が異なる

35

f2 f1

v1

v2

v3

v4

v5

e

e

e

e

e

Male

f2 f1

v1

v2

v3

v4

v5

e

e

e

e

e

Female e

e

Page 36: 第4回DARM勉強会 (多母集団同時分析)

12.多母集団モデリング:弱測定不変性

• 因子負荷量だけに等値制約をかける

36

f2 f1

v1

v2

v3

v4

v5

e

e

e

f2 f1

v1

v2

v3

v4

v5

e

e

e

e

e

Female e

e

Male e

e

Page 37: 第4回DARM勉強会 (多母集団同時分析)

12.多母集団モデリング:強測定不変性

• 因子負荷量と観測変数の誤差分散に等値制約をかける

37

f2 f1

v1

v2

v3

v4

v5

e

e

e

f2 f1

v1

v2

v3

v4

v5

e

e

e

e

e

Female e

e

Male e

e

Page 38: 第4回DARM勉強会 (多母集団同時分析)

12.多母集団モデリング:測定不変性

• 因子負荷量と潜在変数の分散,共分散に等値制約をかける

38

f2 f1

v1

v2

v3

v4

v5

e

e

e

f2 f1

v1

v2

v3

v4

v5

e

e

e

e

e

Female e

e

Male e

e

Page 39: 第4回DARM勉強会 (多母集団同時分析)

13.平均構造モデリング

• 集団間で潜在変数の平均値に差があるか検討できる(弱測定不変以上の制約をかけたモデルが採用できるとき)

• 一方の集団の潜在変数の平均を0に固定する 因子平均の解釈 • (推定値÷標準誤差)標準偏差分,0に固定したグループと異なる 因子平均を効果量dで解釈するには(Kline,1988) • グループAの分散+グループBの分散÷2の平方根を算出・・・① • 推定された平均値÷① = 効果量d

• 効果量dの解釈は,DARM第3回資料を参照

39

Kline, R. B. (1998). Principles and practice of structural equation modeling. New York: Guilford Press. http://psychology.concordia.ca/fac/kline/Supplemental/means_b.html#Table B.3

Page 40: 第4回DARM勉強会 (多母集団同時分析)

14.理論的なモデルの文脈における結果の解釈

• 多母集団の研究は,特定のモデルが異なる集団にも適合するか,異なる文脈でも適合するかに関してモデルの妥当性を検討できる

• 考察においても異なる集団や文脈におけるモデルの妥当性について記述

• MS-SEMは,モデルが妥当であるということを示す唯一の方法であることを記述すべき

• 別の検討方法(詳細はShumacker & Lomax, 2004) • (a)1つのサンプルを2つに分けて検討する伝統的交差妥当性

(b)サンプルを半分にせずに済む予期された交差妥当性(c)シュミレーション法(d)ブートストラップ法(e)ジャックナイフ法

40