4.cronbachのα係数ngtskk.xii.jp/b02_cronbach.pdf1 4.cronbachのα係数...
TRANSCRIPT
4
信頼性,妥当性とは
1)信頼性 時や場所を変えても同様な結果を得られるか
再現性の問題
2)妥当性 測りたいものをそれとして測っているか
(病気を病気と,健康を健康として表しているか)
(測定の)有効性の問題
♥
6
ここでは信頼性(reliability)を扱う
心理学・教育学分野で
「妥当性(validity)」とともに
テストの性能を検討するための概念
一般の質問票にも使われている
【注】 「妥当性(validity)」の議論には「因子分析」の知識が必要
7
ここで例として用いる質問票
Q1. 私の人生は年をとるにつれてだんだんと良くなっている。
(はい いいえ わからない)
Q2. 私は知り合いと比べて人生の挫折が多い。
Q3. 今が私の人生で最もわびしい時期だ。
Q4. 私はもっと若い頃と同じくらい幸福だ。
Q5. 私の人生は今よりもっと幸福になっていたかもしれない。
Q6. 今が私の人生で一番良いときだ。
Q7. 自分がやっているほとんどのことが面倒くさいとか退屈だと思う。
Q8. - - - - -
- - - - -
8
例として用いる質問票の形式
すべての質問が同じ分野のことを尋ねている
構成概念が単一である
(ここでは「人生・生活の満足感・幸福感」)
ある質問群で身体的なことを,
別の質問群で社会関係について尋ねている
というようなものでない
9
あらためて,信頼性とは
理論的には
同じ人に同じ条件で質問して同じ回答が出る
繰り返し測定しても安定した結果が出る
再現性・安定性をもつ
実際の確認は
同じ人に同じような条件で質問して同じ回答が出る
11
1/4 再テスト法(test-retest)
同じ被験者に期間をおいて2回同じ質問をする
2回の結果の相関が高ければ信頼性は高い
欠点
「記憶」の要因が入る(前の回答を覚えている)
期間が長いと被験者の条件が変化する
テストを2回実施するには手間がかかる
12
2/4 平行テスト法(parallel test)
同じ被験者に2つの同等なテストを同時点で行う
2つの結果の相関が高ければ信頼性は高い
欠点
2つのテストが同等であるという保証が難しい
質問が増えるため,回答に負担がかかる
13
3/4 折半法(split-half method)
実施後,1つのテストを2つに分ける
2つの半群の相関が高ければ信頼性は高い
ただし,このままでは,半群の質問票の信頼性になってしまうので,
相関係数を r としたとき,2 r/ (1+r) を指標とする〔Spearman-Brownの修正公式〕
欠点
2つが等質に分けられているという保証が難しい
折半する方法によって(質問群が変わるので)相関が変化し,定まらない
14
4/4 内部一貫法
折半法を拡張して考える
2群の分け方はさまざまだが,そのすべての分け方を行い,すべての相関の平均を出す
例えば,20問を10問-10問で分けると,その分け方は 20C10÷2=92378通りある
2つだけでなく,3つ,4つ,…に分けると考えることもできる
この考え方で作られた指標がクロンバックのα係数(Cronbach’s α,単に α係数 ともよぶ)
15
Cronbachのα係数の計算元データ
被験者n=10名,質問数k=5の例
被験者 Q1 Q2 Q3 Q4 Q51 4 3 4 3 22 4 2 2 2 33 5 4 3 3 54 4 3 4 3 45 3 2 3 3 46 3 2 3 3 27 5 5 5 4 48 4 4 4 4 39 4 4 3 4 3
10 3 3 5 4 3
16
Cronbachのα係数の定義式
被験者n人,質問数k個,i番目の人の合計得点をXi ,s2 は分散とする
2
1
2
11 Xi
k
jj
s
s
k
k
合計点の分散
各質問の分散の合計-
質問数-
質問数1
1
17
Lee J. Cronbach
アメリカの心理学者・教育学者
1916年~2001年
Stanford University School of Education
Cronbach, L. J. 1951
Coefficient alpha and the
internal structure of tests.
Psychometrika, 16,
297-334.
18
Cronbachのα係数の意義
1)折半法による信頼性係数推定の拡張である
2)各質問間の回答の一貫性の程度を表し,
「内的整合性」あるいは「内部一貫性」
による方法とされる
3)求めたい本来の信頼性係数の下限をなす,
したがって,ひかえめな値となる
〔理論的説明は略〕
19
信頼性の元の意味とずれる?
当初の
質問が繰り返されても同じ回答が出る
という意味が
一回しか測定しない場合の
内的整合性
に置き換わっている??
⇒1回測定でも,「折半」することによって,繰り返し測定が行われたとみなされる
21
α係数はいくつならよいか
無条件では決められない
研究の影響度にもよる
一般に,0.7から0.8以上とされていることが多い
1に近ければ良いというものでもない
すべて同じ質問ならα=1
質問間に全く相関がなければα=0
0≦α≦1
24
計算前の注意(1)
1)回答実質の方向性と回答値の方向性は
全質問でそろえておく
(どの問でも満足度が大きいほど数値大,など)
2)一般のQOL質問票などでは,
身体・家族・社会参加など,
構成概念が同じ下位尺度ごとに計算する
(ここで最初にあげた質問票例は全体で一分野の質問群なので全質問で計算)
25
計算前の注意(2)
さまざまな(できるだけ広範囲の)「自覚症状」を尋ねる質問票を作る場合がある
こうした場合は,もともと等質性を想定しない(むしろその逆である)ので,α係数が小さいのが当然である
26
SPSSによる計算
SPSS,SASなどは専用のプログラムをもち,オプションもついている
以下は,下位尺度「心理状態」のもとに4つの質問が設けられている例である
ここではSPSSのオプションで「項目を削除したときの尺度」も出力させている
メニュー : 分析 ⇒ 尺度 ⇒ 信頼性分析
30
SPSSの出力例解説
右端の数値がこの全体のα係数と比べて大きくなるようならば,その質問を除くと残り全体の同質性は高まる
すなわち,その質問は仲間はずれということになり,質問票を作り直す時に削除する目安となる
上の例では最初の「心理状態問題有」は,これを除いて計算した右端のα係数(.886)が全体のα係数(.814)より大きく,他の3つの項目と比べてやや異質な質問であることがわかる
31
Excelでも計算できる
被験者10名,質問数5の例 被験者 Q1 Q2 Q3 Q4 Q5 計
1 4 3 4 3 2 162 4 2 2 2 3 133 5 4 3 3 5 204 4 3 4 3 4 185 3 2 3 3 4 156 3 2 3 3 2 137 5 5 5 4 4 238 4 4 4 4 3 199 4 4 3 4 3 18
10 3 3 5 4 3 18
分散 0.544444 1.066667 0.933333 0.455556 0.9 9.788889 計の分散分散合計= 3.9
Alpha= 0.751986∥
5/(5-1)*(1-D13/G12)
合計点の分散
各質問の分散の合計-
質問数-
質問数1
1
R(EZR)で: 統計解析→検査の正確度の評価
→質問項目の信頼性の評価(Cronbachのα信頼性係数)
> #####質問項目の信頼性の評価(Cronbachのα信頼性係数)#####
> reliability(cov(Dataset[,c("記憶","思考力","集中力","心理")], use="complete.obs"))
Alpha reliability = 0.8144
Standardized alpha = 0.8159
Reliability deleting each item in turn:
Alpha Std.Alpha r(item, total)
記憶 0.7062 0.7088 0.7594
思考力 0.7505 0.7521 0.6705
集中力 0.6914 0.6938 0.7834
心理 0.8864 0.8861 0.3659 32
デフォルトで「項目を削除したときのα係数」を計算している
35
(ここで例示した質問票の注釈)
出典:Life Satisfaction Index (LSI) 【藤田 試訳】
Neugarten, B. L. , Harvighurst, J. and Tobin, S. S.:
The Measurement of Life satisfaction.
J.Geroxtology, 16; 134-143, 1961
【注】
1)上記にはいくつかの改訂版があります
2)全般的な幸福感(well-being)を尋ねるものですが
3)本来,年配者を対象に,いわゆる「successful aging」を検討するために行うものです
36
α係数:医学ジャーナルでの文献
引用に使えます
Bland JM, Altman DG.
Statistical notes: Cronbach’s alpha.
BMJ 1997; 314: 572
37
【参考】分散分析からも計算できる
質問と被験者を要因とした
繰り返しの無い
二元配置分散分析
のFR値を用いて
α=1-1/FR
と表せる
1/FR
=残差分散/被験者間分散
=(1/(p-1))×(ST-SR-SC)/SR
被験者 Q1 Q2 Q3 Q4 Q5
1 4 3 4 3 22 4 2 2 2 33 5 4 3 3 54 4 3 4 3 45 3 2 3 3 46 3 2 3 3 27 5 5 5 4 48 4 4 4 4 39 4 4 3 4 3
10 3 3 5 4 3
38
一般に「信頼性係数」とは
Cronbach以前から「信頼性係数」の概念は存在し.次のように定義されている(Guilford,1959)
データ(実得点)xの分散をσ2x
対象の真値の分散をσ2s
誤差の分散をσ2e
として
信頼性係数(coefficient of reliability;ρ)
2
2
x
s
= = =
22
2
es
s
22
2
1
es
e
40
相関と信頼性は同じ?
こんなふうになれば相関大―信頼性高い
症例 1 2 3 4 5 6 …
1回目 2 3 1 2 4 2 …
2回目 2 3 1 2 4 2 …
これは相関大だが,信頼性は?
症例 1 2 3 4 5 6 …
1回目 2 3 1 2 4 2 …
2回目 3 4 2 3 5 3 …
41
単純な相関係数では無理
相関係数=1でも下記のような場合もある
このような場合は「信頼性」は高くない
1回目
2回目 信頼性大の場合は1回目と2回目の値が等しい: 点が直線y=x上にある
これは相関係数=1 だが…
43
級内相関係数
Intraclass correlation coefficient
略して,ICC
Fisher先生の命名
測定の繰り返しが3回以上の場合は,
(1回目,2回目),( 1回目,3回目),( 2回目,3回目)などすべての組み合わせで点をつくる
級内相関係数を計算するモデル
(1)二元配置混合:人的効果が変量で項目効果が固定
(2)二元配置変量:人的効果と項目効果の両方が変量
(3)一元配置変量:人的効果が変量(項目間の違いに意味がない場合:同種の測定機器などを1つにまとめて信頼性をみたい場合など)
【注】変量はランダムに取り出されたもの〔20歳代の人a,b,c,…等〕,固定は固有名詞扱いと考えることができる
45
級内相関係数のタイプ選択
研究仮説によって選択する
(1)一致性:項目が同じ傾向を示し,測定値が平行関係にあれば級内相関は高いとみなす
(2)絶対一致:項目が同じ傾向を示し,測定値そのものも一致していれば級内相関は高いとみなす
46