稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w,...
TRANSCRIPT
![Page 1: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/1.jpg)
2値データのIntraclass Correlation
Coefficientの推定マクロプログラム○稲葉 洋介1、田中 紀子1
1国立国際医療研究センター データサイエンス部生物統計研究室
Macro program for calculating
Intraclass Correlation
Coefficient for binary dataYosuke Inaba, Noriko Tanaka
Biostatistics Section, Department of Data
Science
National Center for Global Health and Medicine
![Page 2: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/2.jpg)
要旨:
アウトカムが2値の場合のIntraclass Coefficient
Correlation(級内相関係数:ICC)について,幾つかの異なる推定量をSASで実装し,マクロプログラムを
作成した.また条件を変化させて性能を比較し,推定量の選択の基準等を議論する。
キーワード: Intraclass Coefficient
Correlation, ,ICC, Binary, Survival Cluster
Randomized trial
2
![Page 3: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/3.jpg)
ICCとは
3
![Page 4: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/4.jpg)
ICCとは
• Intraclass Correlation Coefficient(級内相関係数:ICC)
–同一クラスター(定義された群、あるいは繰り返し測定された個体)内のデータの相似性を示す定量的な指標
4
![Page 5: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/5.jpg)
5
応用
–評価者間信頼性の指標
• 精神医学的測定
• 病理、画像診断
– クラスターランダム化試験
• 検出力に影響する要因(murray 2004)
• 生存時間をエンドポイントとする試験では、イベント有無の2値データで計算したICCを用いる場合が多い
![Page 6: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/6.jpg)
Correlated binary data
6
Cluster y
1 1 1 0 1 1 1 1 0 1 1
2 1 0 1 1 1 0 1 1 1 1
3 0 0 0 1 1 0 0 1 1 0
4 1 0 0 1 0 1 1 1 0 1
5 1 1 1 0 0 1 1 1 1 0
6 0 1 1 0 0 0 0 1 1 1
7 0 0 1 0 0 1 1 1 1 1
8 1 1 0 1 0 0 0 0 1 1
9 0 1 0 0 0 1 0 0 0 0
10 1 0 1 0 1 0 1 1 1 1
Cluster y
1 1 1 1 1 1 1 1 1 1 1
2 0 0 0 0 0 0 0 0 0 0
3 1 1 1 1 1 1 1 1 1 1
4 1 0 0 0 0 0 0 0 0 0
5 1 1 1 1 1 1 0 1 1 1
6 0 0 1 0 0 0 0 0 0 0
7 0 0 0 0 0 0 0 0 0 0
8 0 0 0 0 0 0 0 0 0 0
9 0 0 0 0 0 0 0 0 0 0
10 1 1 1 1 1 1 1 1 1 1
ICC=0.1 ICC=0.9
![Page 7: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/7.jpg)
定義
7
![Page 8: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/8.jpg)
8
𝑘 : クラスター数
𝑛𝑖 : 𝑖番目のクラスターの要素数
𝑋𝑖𝑗~𝐵𝑒𝑟𝑛𝑢𝑙𝑙𝑖 𝜋 𝑖 = 1, … , 𝑘 𝑗 = 1,… , 𝑛𝑖: 応答
(1:成功 or 0:失敗)
𝑌𝑖 = 𝑋𝑖𝑗 : i番目のクラスターの成功の総数
ICCの定義
![Page 9: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/9.jpg)
9
ICCの定義
• 全てのオブザベーションにおいて成功確率は共通(𝑃𝑟 𝑋𝑖𝑗 = 1 := 𝜋 for ∀𝑖, 𝑗)とし,異なる
クラスター間のオブザベーションは全て独立と仮定する.
• 同一クラスター内では,任意のオブザベーションの組(𝑋𝑖𝑗 , 𝑋𝑖𝑙)の相関は共通とし,
(common-correlation model)
Corr 𝑋𝑖𝑗 , 𝑋𝑖𝑙 ≔ 𝜌をICCと定義する
![Page 10: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/10.jpg)
10
ICCの定義
• この時、𝐸 𝑋𝑖𝑗 = 𝜋, 𝑉𝑎𝑟 𝑋𝑖𝑗 = 𝜋(1 − 𝜋)より
𝑉𝑎𝑟 𝑌𝑖 = 𝑛𝑖𝜋 1 − 𝜋 1 + 𝑛𝑖 − 1 𝜌
• 𝑌𝑖は二項分布に従うが𝜌 > 0の時に過大分散、𝜌 < 0の時に過少分散となる。
![Page 11: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/11.jpg)
11
ICCの定義(一般化線形モデル)
𝛽𝑖~𝑁 0, 𝜎𝛽2 : クラスターの変量効果、
𝑒𝑖𝑗 ~𝑁 0, 𝜎2 : 誤差
𝑋𝑖𝑗 = 𝜇 + 𝛽𝑖 + 𝑒𝑖𝑗
𝑉𝑎𝑟 𝑋𝑖𝑗 = 𝑉𝑎𝑟 𝑋𝑖𝑗 = 𝜎𝛽2 + 𝜎2
ゆえにCorr 𝑋𝑖𝑗 , 𝑋𝑖𝑙 =𝜎𝛽2
𝜎𝛽2+𝜎2
= ICC
![Page 12: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/12.jpg)
ICCマクロについて
12
![Page 13: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/13.jpg)
13
ICCの計算方法
• マクロ化の動機
• 2値データのICCは出版されているものだけで10種類以上(Ridout 1996)
• SAS/STATで直接計算できるプロシージャは無い
![Page 14: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/14.jpg)
14
記載例:
%Binary_ICC(
Input=library.raw2,Cluster=region,Response
=y, Output=result,Method=aov aovs
peq,CI=Y,iter=100)
仕様の詳細は資料集参照
ICCマクロ詳細
![Page 15: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/15.jpg)
15
Output
![Page 16: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/16.jpg)
16
Method glmm
• nlmixedプロシージャを使用
• データによっては収束しない事があるので注意
![Page 17: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/17.jpg)
17
• 以下の状況で、Methodによっては計算できないため欠損値が返る
–全ての応答が0 or 全ての応答が1
–全てのクラスターサイズが1
• Moment estimator(keq,keqs etc)は推定値が1を超える場合がある。
–本マクロでは計算値をそのまま出力している
注意事項
![Page 18: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/18.jpg)
シミュレーション
18
![Page 19: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/19.jpg)
19
• 各推定量の挙動を確認するため、シミュレーションを実施した。
• 以下の条件でシミュレーションデータを生成した。(Rの関数rcbinをIMLで呼び出して使用)
– 𝜋 : 0.1, 0.5, 0.9
– Num of Cluster : 10, 30, 50
– Cluster Size(平均、20%で変動) : 10, 30, 50
– 𝜌 :0.1, 0.5, 0.9
–各設定の反復回数は100回
シミュレーションデータ詳細
![Page 20: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/20.jpg)
20
–以下の混合2項分布よりシミュレーションデータを生成した。(Rのrcbin関数をSAS/IMLにより呼び出して使用)
• 𝑍𝑖 , 𝜈𝑖𝑗~ 𝑏𝑒𝑟𝑛𝑢𝑙𝑙𝑖 𝜋 , 𝜇𝑖𝑗~𝑏𝑒𝑟𝑛𝑢𝑙𝑙𝑖 𝜌
𝑦𝑖𝑗 = 1 − 𝜇𝑖𝑗 𝜈𝑖𝑗 + 𝜇𝑖𝑗𝑍𝑖
ただし、以下の場合は除外• 𝑌𝑖 = 1 for ∀𝑘
• 𝑌𝑖 = 𝑛𝑖 for ∀𝑘
• 𝑛𝑖 = 1 for ∀𝑘
データ生成方法
![Page 21: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/21.jpg)
21
シミュレーションエラー𝜋の設定値と生成されたシミュレーションデータの 𝜋の差の分布
![Page 22: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/22.jpg)
22
シミュレーション結果
• 41サンプルについて、glmmは推定が収束せず推定値が得られなかった。
– 41/8100なので、結果に大きな影響なし
• 結果の詳細は配布資料参照
![Page 23: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/23.jpg)
23
シミュレーション考察
• aov, aovs, fc, mak, peq, pgp, ppr, stab, ub
の推定値は、設定に関わらず精度が良い。
• keq, keqs, kpr, kprs, w, wsは、𝜌の値が大き
くクラスターサイズが小さいと推定が不安定になっている。
• glmmはクラスターサイズが小さい時にややバイアスが入るが概ね安定的
![Page 24: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/24.jpg)
まとめ
• ICCを計算するマクロを実装した。
• 各推定量の挙動をシミュレーションにより確認した。
• 今後は機能拡充を目指す
–推定量の追加(Extended quasi-likelihood
estimator等)
–他の方法による信頼区間
– Glmmでの詳細な指定24
![Page 25: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/25.jpg)
25
参照文献
• FISHER, R. A. Statistical methods for
research workers. Edinburgh: Oliver and
Boyd, 1925.
• DONNER, Allan. A review of inference
procedures for the intraclass correlation
coefficient in the one-way random effects
model. International Statistical
Review/Revue Internationale de
Statistique, 1986, 67-82.
![Page 26: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/26.jpg)
26
• DONOVAN, A. M.; RIDOUT, M. S.;
JAMES, D. J. Assessment of somaclonal
variation in apple. II. Rooting ability and
shoot proliferation in vitro. Journal of
horticultural science, 1994, 69.1: 115-122.
参照文献
![Page 27: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/27.jpg)
27
• GIBSON, G. J.; AUSTIN, E. J. Fitting and
testing spatio‐temporal stochastic
models with application in plant
epidemiology. Plant Pathology, 1996, 45.2:
172-184.
• RIDOUT, Martin S.; DEMETRIO, Clarice
GB; FIRTH, David. Estimating intraclass
correlation for binary data. Biometrics,
1999, 55.1: 137-148.
参照文献
![Page 28: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/28.jpg)
Back up
• 𝑍𝑖 , 𝜈𝑖𝑗~ 𝑏𝑒𝑟𝑛 𝜋 , 𝜇𝑖𝑗~𝑏𝑒𝑟𝑛 𝜌
𝑦𝑖𝑗 = 1 − 𝜇𝑖𝑗 𝜈𝑖𝑗 + 𝜇𝑖𝑗𝑍𝑖
𝑦𝑖𝑗~𝑏𝑒𝑟𝑛𝑢𝑙𝑙𝑖 𝜋 , 𝐼𝐶𝐶 = 𝜌の証明:
Pr 𝑦𝑖𝑗 = 0
= Pr 𝜇𝑖𝑗 = 0, 𝜈𝑖𝑗 = 0 + Pr 𝜇𝑖𝑗 = 1, 𝑍𝑖 = 0
= 1 − 𝜌 1 − 𝜋 + 𝜌 1 − 𝜋 = 1 − 𝜋
Pr 𝑦𝑖𝑗 = 1
= Pr 𝜇𝑖𝑗 = 0, 𝜈𝑖𝑗 = 1 + Pr 𝜇𝑖𝑗 = 1, 𝑍𝑖 = 1
= 1 − 𝜌 𝜋 + 𝜌𝜋 = 𝜋28
![Page 29: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/29.jpg)
Back up
• 𝐸 𝑦𝑖𝑗 = 0 ∗ 1 − 𝜋 + 1 ∗ 𝜋 = 𝜋
• 𝑉𝑎𝑟 𝑦𝑖𝑗 = 1 − 𝜋 0 − 𝜋 2 + 𝜋 1 − 𝜋 2 =
𝜋 1 − 𝜋
29
![Page 30: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/30.jpg)
Back up
• 𝐼𝐶𝐶 = 𝐶𝑜𝑟𝑟 𝑦𝑖𝑗 , 𝑦𝑖𝑙 =𝐶𝑜𝑣 𝑦𝑖𝑗,𝑦𝑖𝑙
𝑉𝑎𝑟 𝑦𝑖𝑗 𝑉𝑎𝑟 𝑦𝑖𝑙
• 𝐶𝑜𝑣 𝑦𝑖𝑗 , 𝑦𝑖𝑙
• = 𝐶𝑜𝑣 1 − 𝜇𝑖𝑗 𝜈𝑖𝑗 + 𝜇𝑖𝑗𝑍𝑖 , 1 − 𝜇𝑖𝑙 𝜈𝑖𝑙 +
30
![Page 31: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定](https://reader031.vdocuments.pub/reader031/viewer/2022011813/5e380c9def0e4f079a276e15/html5/thumbnails/31.jpg)
Back up
• 従って、 𝐶𝑜𝑟𝑟 𝑦𝑖𝑗 , 𝑦𝑖𝑙 =𝜋 1−𝜋 𝜌
𝜋 1−𝜋= 𝜌
31