稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w,...

31
2値データのIntraclass Correlation Coefficientの推定マクロプログラム ○稲葉 洋介 1 、田中 紀子 1 1 国立国際医療研究センター データサイエンス部 生物統計研究室 Macro program for calculating Intraclass Correlation Coefficient for binary data Yosuke Inaba, Noriko Tanaka Biostatistics Section, Department of Data Science National Center for Global Health and Medicine

Upload: others

Post on 17-Jan-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

2値データのIntraclass Correlation

Coefficientの推定マクロプログラム○稲葉 洋介1、田中 紀子1

1国立国際医療研究センター データサイエンス部生物統計研究室

Macro program for calculating

Intraclass Correlation

Coefficient for binary dataYosuke Inaba, Noriko Tanaka

Biostatistics Section, Department of Data

Science

National Center for Global Health and Medicine

Page 2: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

要旨:

アウトカムが2値の場合のIntraclass Coefficient

Correlation(級内相関係数:ICC)について,幾つかの異なる推定量をSASで実装し,マクロプログラムを

作成した.また条件を変化させて性能を比較し,推定量の選択の基準等を議論する。

キーワード: Intraclass Coefficient

Correlation, ,ICC, Binary, Survival Cluster

Randomized trial

2

Page 3: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

ICCとは

3

Page 4: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

ICCとは

• Intraclass Correlation Coefficient(級内相関係数:ICC)

–同一クラスター(定義された群、あるいは繰り返し測定された個体)内のデータの相似性を示す定量的な指標

4

Page 5: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

5

応用

–評価者間信頼性の指標

• 精神医学的測定

• 病理、画像診断

– クラスターランダム化試験

• 検出力に影響する要因(murray 2004)

• 生存時間をエンドポイントとする試験では、イベント有無の2値データで計算したICCを用いる場合が多い

Page 6: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

Correlated binary data

6

Cluster y

1 1 1 0 1 1 1 1 0 1 1

2 1 0 1 1 1 0 1 1 1 1

3 0 0 0 1 1 0 0 1 1 0

4 1 0 0 1 0 1 1 1 0 1

5 1 1 1 0 0 1 1 1 1 0

6 0 1 1 0 0 0 0 1 1 1

7 0 0 1 0 0 1 1 1 1 1

8 1 1 0 1 0 0 0 0 1 1

9 0 1 0 0 0 1 0 0 0 0

10 1 0 1 0 1 0 1 1 1 1

Cluster y

1 1 1 1 1 1 1 1 1 1 1

2 0 0 0 0 0 0 0 0 0 0

3 1 1 1 1 1 1 1 1 1 1

4 1 0 0 0 0 0 0 0 0 0

5 1 1 1 1 1 1 0 1 1 1

6 0 0 1 0 0 0 0 0 0 0

7 0 0 0 0 0 0 0 0 0 0

8 0 0 0 0 0 0 0 0 0 0

9 0 0 0 0 0 0 0 0 0 0

10 1 1 1 1 1 1 1 1 1 1

ICC=0.1 ICC=0.9

Page 7: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

定義

7

Page 8: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

8

𝑘 : クラスター数

𝑛𝑖 : 𝑖番目のクラスターの要素数

𝑋𝑖𝑗~𝐵𝑒𝑟𝑛𝑢𝑙𝑙𝑖 𝜋 𝑖 = 1, … , 𝑘 𝑗 = 1,… , 𝑛𝑖: 応答

(1:成功 or 0:失敗)

𝑌𝑖 = 𝑋𝑖𝑗 : i番目のクラスターの成功の総数

ICCの定義

Page 9: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

9

ICCの定義

• 全てのオブザベーションにおいて成功確率は共通(𝑃𝑟 𝑋𝑖𝑗 = 1 := 𝜋 for ∀𝑖, 𝑗)とし,異なる

クラスター間のオブザベーションは全て独立と仮定する.

• 同一クラスター内では,任意のオブザベーションの組(𝑋𝑖𝑗 , 𝑋𝑖𝑙)の相関は共通とし,

(common-correlation model)

Corr 𝑋𝑖𝑗 , 𝑋𝑖𝑙 ≔ 𝜌をICCと定義する

Page 10: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

10

ICCの定義

• この時、𝐸 𝑋𝑖𝑗 = 𝜋, 𝑉𝑎𝑟 𝑋𝑖𝑗 = 𝜋(1 − 𝜋)より

𝑉𝑎𝑟 𝑌𝑖 = 𝑛𝑖𝜋 1 − 𝜋 1 + 𝑛𝑖 − 1 𝜌

• 𝑌𝑖は二項分布に従うが𝜌 > 0の時に過大分散、𝜌 < 0の時に過少分散となる。

Page 11: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

11

ICCの定義(一般化線形モデル)

𝛽𝑖~𝑁 0, 𝜎𝛽2 : クラスターの変量効果、

𝑒𝑖𝑗 ~𝑁 0, 𝜎2 : 誤差

𝑋𝑖𝑗 = 𝜇 + 𝛽𝑖 + 𝑒𝑖𝑗

𝑉𝑎𝑟 𝑋𝑖𝑗 = 𝑉𝑎𝑟 𝑋𝑖𝑗 = 𝜎𝛽2 + 𝜎2

ゆえにCorr 𝑋𝑖𝑗 , 𝑋𝑖𝑙 =𝜎𝛽2

𝜎𝛽2+𝜎2

= ICC

Page 12: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

ICCマクロについて

12

Page 13: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

13

ICCの計算方法

• マクロ化の動機

• 2値データのICCは出版されているものだけで10種類以上(Ridout 1996)

• SAS/STATで直接計算できるプロシージャは無い

Page 14: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

14

記載例:

%Binary_ICC(

Input=library.raw2,Cluster=region,Response

=y, Output=result,Method=aov aovs

peq,CI=Y,iter=100)

仕様の詳細は資料集参照

ICCマクロ詳細

Page 15: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

15

Output

Page 16: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

16

Method glmm

• nlmixedプロシージャを使用

• データによっては収束しない事があるので注意

Page 17: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

17

• 以下の状況で、Methodによっては計算できないため欠損値が返る

–全ての応答が0 or 全ての応答が1

–全てのクラスターサイズが1

• Moment estimator(keq,keqs etc)は推定値が1を超える場合がある。

–本マクロでは計算値をそのまま出力している

注意事項

Page 18: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

シミュレーション

18

Page 19: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

19

• 各推定量の挙動を確認するため、シミュレーションを実施した。

• 以下の条件でシミュレーションデータを生成した。(Rの関数rcbinをIMLで呼び出して使用)

– 𝜋 : 0.1, 0.5, 0.9

– Num of Cluster : 10, 30, 50

– Cluster Size(平均、20%で変動) : 10, 30, 50

– 𝜌 :0.1, 0.5, 0.9

–各設定の反復回数は100回

シミュレーションデータ詳細

Page 20: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

20

–以下の混合2項分布よりシミュレーションデータを生成した。(Rのrcbin関数をSAS/IMLにより呼び出して使用)

• 𝑍𝑖 , 𝜈𝑖𝑗~ 𝑏𝑒𝑟𝑛𝑢𝑙𝑙𝑖 𝜋 , 𝜇𝑖𝑗~𝑏𝑒𝑟𝑛𝑢𝑙𝑙𝑖 𝜌

𝑦𝑖𝑗 = 1 − 𝜇𝑖𝑗 𝜈𝑖𝑗 + 𝜇𝑖𝑗𝑍𝑖

ただし、以下の場合は除外• 𝑌𝑖 = 1 for ∀𝑘

• 𝑌𝑖 = 𝑛𝑖 for ∀𝑘

• 𝑛𝑖 = 1 for ∀𝑘

データ生成方法

Page 21: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

21

シミュレーションエラー𝜋の設定値と生成されたシミュレーションデータの 𝜋の差の分布

Page 22: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

22

シミュレーション結果

• 41サンプルについて、glmmは推定が収束せず推定値が得られなかった。

– 41/8100なので、結果に大きな影響なし

• 結果の詳細は配布資料参照

Page 23: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

23

シミュレーション考察

• aov, aovs, fc, mak, peq, pgp, ppr, stab, ub

の推定値は、設定に関わらず精度が良い。

• keq, keqs, kpr, kprs, w, wsは、𝜌の値が大き

くクラスターサイズが小さいと推定が不安定になっている。

• glmmはクラスターサイズが小さい時にややバイアスが入るが概ね安定的

Page 24: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

まとめ

• ICCを計算するマクロを実装した。

• 各推定量の挙動をシミュレーションにより確認した。

• 今後は機能拡充を目指す

–推定量の追加(Extended quasi-likelihood

estimator等)

–他の方法による信頼区間

– Glmmでの詳細な指定24

Page 25: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

25

参照文献

• FISHER, R. A. Statistical methods for

research workers. Edinburgh: Oliver and

Boyd, 1925.

• DONNER, Allan. A review of inference

procedures for the intraclass correlation

coefficient in the one-way random effects

model. International Statistical

Review/Revue Internationale de

Statistique, 1986, 67-82.

Page 26: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

26

• DONOVAN, A. M.; RIDOUT, M. S.;

JAMES, D. J. Assessment of somaclonal

variation in apple. II. Rooting ability and

shoot proliferation in vitro. Journal of

horticultural science, 1994, 69.1: 115-122.

参照文献

Page 27: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

27

• GIBSON, G. J.; AUSTIN, E. J. Fitting and

testing spatio‐temporal stochastic

models with application in plant

epidemiology. Plant Pathology, 1996, 45.2:

172-184.

• RIDOUT, Martin S.; DEMETRIO, Clarice

GB; FIRTH, David. Estimating intraclass

correlation for binary data. Biometrics,

1999, 55.1: 137-148.

参照文献

Page 28: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

Back up

• 𝑍𝑖 , 𝜈𝑖𝑗~ 𝑏𝑒𝑟𝑛 𝜋 , 𝜇𝑖𝑗~𝑏𝑒𝑟𝑛 𝜌

𝑦𝑖𝑗 = 1 − 𝜇𝑖𝑗 𝜈𝑖𝑗 + 𝜇𝑖𝑗𝑍𝑖

𝑦𝑖𝑗~𝑏𝑒𝑟𝑛𝑢𝑙𝑙𝑖 𝜋 , 𝐼𝐶𝐶 = 𝜌の証明:

Pr 𝑦𝑖𝑗 = 0

= Pr 𝜇𝑖𝑗 = 0, 𝜈𝑖𝑗 = 0 + Pr 𝜇𝑖𝑗 = 1, 𝑍𝑖 = 0

= 1 − 𝜌 1 − 𝜋 + 𝜌 1 − 𝜋 = 1 − 𝜋

Pr 𝑦𝑖𝑗 = 1

= Pr 𝜇𝑖𝑗 = 0, 𝜈𝑖𝑗 = 1 + Pr 𝜇𝑖𝑗 = 1, 𝑍𝑖 = 1

= 1 − 𝜌 𝜋 + 𝜌𝜋 = 𝜋28

Page 29: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

Back up

• 𝐸 𝑦𝑖𝑗 = 0 ∗ 1 − 𝜋 + 1 ∗ 𝜋 = 𝜋

• 𝑉𝑎𝑟 𝑦𝑖𝑗 = 1 − 𝜋 0 − 𝜋 2 + 𝜋 1 − 𝜋 2 =

𝜋 1 − 𝜋

29

Page 30: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

Back up

• 𝐼𝐶𝐶 = 𝐶𝑜𝑟𝑟 𝑦𝑖𝑗 , 𝑦𝑖𝑙 =𝐶𝑜𝑣 𝑦𝑖𝑗,𝑦𝑖𝑙

𝑉𝑎𝑟 𝑦𝑖𝑗 𝑉𝑎𝑟 𝑦𝑖𝑙

• 𝐶𝑜𝑣 𝑦𝑖𝑗 , 𝑦𝑖𝑙

• = 𝐶𝑜𝑣 1 − 𝜇𝑖𝑗 𝜈𝑖𝑗 + 𝜇𝑖𝑗𝑍𝑖 , 1 − 𝜇𝑖𝑙 𝜈𝑖𝑙 +

30

Page 31: 稲葉洋介 、田中紀子 国立国際医療研究センター …...• keq, keqs, kpr, kprs, w, wsは、 の値が大き くクラスターサイズが小さいと推定が不安定

Back up

• 従って、 𝐶𝑜𝑟𝑟 𝑦𝑖𝑗 , 𝑦𝑖𝑙 =𝜋 1−𝜋 𝜌

𝜋 1−𝜋= 𝜌

31