comparison of confidence bands for survival function€¦ · 小標本下( < 200...

17
生存関数における信頼バンド構成法の比較 Comparison of confidence bands for survival function Masashi Sato, Chikuma Hamada Graduate school of Engineering, Tokyo University of Science 要旨: LIFETEST 2

Upload: others

Post on 05-Apr-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

生存関数における信頼バンド構成法の比較佐藤 聖士,浜田 知久馬東京理科大学 工学研究科Comparison of confidence bands for survival function

Masashi Sato, Chikuma HamadaGraduate school of Engineering, Tokyo University

of Science

要旨:生存関数の信頼バンド構成法の定量的,包括的な比較はなされておらず,いずれの手法を用いるべきか明確ではない.本発表では,信頼バンドの定量的な比較により,推奨される信頼バンドの手法について報告する.キーワード:生存関数,信頼バンド,LIFETEST プロシジャ

2

Page 2: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

3

生存時間解析[1]

• ある基準の時刻からある目的の反応がおきるまでの時間の解析

• 打切りを考慮

A ・・・ 通常のデータB ・・・ 脱落データC ・・・ 観察打切り

生存時間 :死亡= イベント:生存A

B

C

患者観察終了時点 時間

0

4

生存関数・ハザード関数[1]

• 生存関数:時点 t までイベントが起きない確率• ハザード関数:時点 tの瞬間でのイベントの発生率)(th

)(tS

時間(時間(時間(時間(t))))ハザード関数ハザード関数ハザード関数ハザード関数(指数分布)(指数分布)(指数分布)(指数分布)

0

h(t)生存関数生存関数生存関数生存関数 (指数分布)(指数分布)(指数分布)(指数分布)時間(時間(時間(時間(t))))0

S(t)

)exp()( ttS λ−= λ=)( th

a=λ

b=λa

b

1

Page 3: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

5

カプラン・マイヤー推定量[1]

• 生存関数の推定量

• 生存関数: ( ) ( ) ( ) ( )∏ <−=×−×−=

tt iii

ndndndtS 111ˆ2211 L の大きさにおける全リスク集合時点におけるイベント総数時点 inid ii :,:

( )tS

0

1 時間( )111 nd−

( ) ( )2211 11 ndnd −⋅−

( ) ( ) ( )332211 111 ndndnd −⋅−⋅−

t

:打切り:イベント(以下,KM推定量)

6

Page 4: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

KM推定量の信頼区間

• Greenwoodの公式

• 信頼区間:

( )[ ] ( ) ( )∏ <−×≈

tt iiiii

dnndtStS2ˆˆVar

)](ˆ[Var)(ˆ2/ tSztS α±

7

KM推定量の信頼バンド(同時信頼区間)

• KM推定量の信頼区間

– 各々の時点における生存割合の区間推定– 95%信頼区間:ある時点において, 95%の確率で生存割合の真値が含まれるような区間

• KM推定量の信頼バンド

– 時点全体における生存関数の同時区間推定– 95%信頼バンド:すべての時点において, 95%の確率で生存割合の真値が含まれるような区間

8

Page 5: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

信頼バンドの種類

• EP型信頼バンド

• HW型信頼バンド

( )( ) ( )[ ]

( ) ( ) ( )( ) ( )[ ]

( )tSn

tnaahtStStS

n

tnaahtS SULSUL ˆ1,ˆˆ1,ˆ

2/1

2

2/1

2 σσ αα ++≤≤

+−

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )tStaaetStStStaaetS SULSULˆ,ˆˆ,ˆ σσ αα +≤≤−

( ) ( ) 生存割合の分散生存割合の推定量 ::ˆ 2ttS Sσ

W. J. Hall and Jon A (1980)

Nair,V. N. (1984)

9

10

Page 6: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

11

変換による区間の算出

• 得られた生存割合 を関数 で変換(以下, を変換関数と呼ぶ)• 変換後に区間を計算し,逆変換

( ) ( ) ( )( )tSgtSxg ˆˆ →

( )( ) ( )( )[ ]tSgtSg ˆVar96.1ˆ ±

( )( ) ( )( )[ ]

±−

tSgtSgg ˆVar96.1ˆ1g-1(x)

( )tS ( )xg ( )xg

12

LIFETEST procedure で計算可能な5種類の変換[2][3]

名称名称名称名称 変換関数変換関数変換関数変換関数

変換無し(以下,LINEAR)対数変換(以下,LOG)

二重対数変換(以下,LOGLOG)逆正弦変換(以下,ASINSQ)ロジット変換(以下,LOGIT) ( ) ( )xxg

1sin−=

( ) ( )( )xxg loglog −=

( ) xxg =

( ) ( )xxg log=

( ) ( )( )xxxg −= 1log

Page 7: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

LIFETEST プロシジャのプログラム例

PROC LIFETEST DATA=DATA CONFBAND=ALL STDERRCONFTYPE=LOG;

TIME T*CENSOR(1);RUN; 信頼バンドの型を指定(EP or HW)

ALLで両方を出力使用する変換関数を指定(ASINSQRT or LOGLOG or LINEAR or

LOG or LOGIT)13

SAS9.3LIFETESTプロシジャで計算可能な信頼バンド

• EP型,HW型信頼バンド

• それぞれの型で5種類の変換が可能

• デフォルトでは,HW型+LOGLOGが適用される

あわせて10タイプタイプタイプタイプの

信頼バンドが計算可能

14

Page 8: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

小標本下( < 200)で仕様が推奨されている信頼バンド・変換関数

• EP型信頼バンド + ASINSQ

• EP型信頼バンド + LOGLOG

• EP型信頼バンド + LOGIT

• HW型信頼バンド + 変換無し

Nair (1984)

Kalbfleisch, Prentice (1980)

Meeker , Escobar(1998)

Borgan , Liestøl (1990)上記の組み合わせでは,サンプルサイズが20以上までは妥当な結果が得られる15

背景・問題点のまとめ

• SAS9.3 ではKM推定量に対する複数の信頼バンドが構成可能

• 小標本下における包括的な比較は未だに報告されていない

研究目的

• 小標本下における,信頼バンド構成方法の比較・推奨される信頼バンドの検討

16

Page 9: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

方法

• SAS9.3 で計算可能な10タイプの信頼バンドに対し,シミュレー

ション実験により以下の3を評価指標とした比較を行う

1. 被覆確率2. バンド幅3. 真値がバンドから外れる時点

• 発生させる生存時間のパラメータや,サンプルサイズ,打切り割合などのシミュレーション条件を変化させ,各信頼バンドの

性能を評価する

17

シミュレーション設定1

� 生存時間分布: 打切り,タイデータなし� ワイブル分布 ( λ = 0.9, α = 2)� ガンマ分布 ( λ = 0.2 , α = 3.8 )� 対数正規分布( μ = -0.4, σ = 0.6 )

� N:20, 40, 80, 160

� 信頼水準:95%

� シミュレーション回数:100000回

18

Page 10: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

ワイブル分布対数正規分布

ガンマ分布19

0.85

0.87

0.89

0.91

0.93

0.95

0.97

0.99

EP型型型型 HW型型型型 EP型型型型 HW型型型型 EP型型型型 HW型型型型ワイブル分布ワイブル分布ワイブル分布ワイブル分布 ガンマ分布ガンマ分布ガンマ分布ガンマ分布 対数正規分布対数正規分布対数正規分布対数正規分布被被被被覆覆覆覆確確確確率率率率

異なる生存時間分布での比較異なる生存時間分布での比較異なる生存時間分布での比較異なる生存時間分布での比較((((n = 40))))LINEAR

LOG

LOGLOG

LOGIT

ASINSQ

n = 40

20

Page 11: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

0.85

0.87

0.89

0.91

0.93

0.95

0.97

0.99

EP型型型型 HW型型型型 EP型型型型 HW型型型型n = 20 n = 40

被被被被覆覆覆覆確確確確率率率率ワイブル分布での被覆確率(ワイブル分布での被覆確率(ワイブル分布での被覆確率(ワイブル分布での被覆確率(n =20, 40))))

LINEAR

LOG

LOGLOG

LOGIT

ASINSQ

21

0.85

0.87

0.89

0.91

0.93

0.95

0.97

0.99

EP型型型型 HW型型型型 EP型型型型 HW型型型型n = 80 n = 160

被被被被覆覆覆覆確確確確率率率率ワイブル分布での被覆確率(ワイブル分布での被覆確率(ワイブル分布での被覆確率(ワイブル分布での被覆確率(n =80, 160))))

LINEAR

LOG

LOGLOG

LOGIT

ASINSQ

22

Page 12: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

シミュレーション設定2

� 生存時間分布: タイデータなし� ワイブル分布 ( λ = 0.9, α = 2)

� N:160

� 打切り割合:50%, 75%, 87.5%

� 信頼水準:95%

� シミュレーション回数:100000回

23

0.85

0.87

0.89

0.91

0.93

0.95

0.97

0.99

EP型型型型 HW型型型型 EP型型型型 HW型型型型 EP型型型型 HW型型型型 EP型型型型 HW型型型型87.50% 75% 50% 0%

被被被被覆覆覆覆確確確確率率率率打切り割合を変化させての比較打切り割合を変化させての比較打切り割合を変化させての比較打切り割合を変化させての比較((((0% ~~~~ 87.5%))))

LINEAR

LOG

LOGLOG

LOGIT

ASINSQ

24

Page 13: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

シミュレーション設定3

� 生存時間分布: 打切り,タイデータなし� ワイブル分布( λ = 0.9, α = 0.5), ( λ = 0.9, α = 1), ( λ = 0.9, α = 2)( λ = 0.9, α = 5), ( λ = 0.9, α = 10)

� N:20, 40, 80, 160

� 信頼水準:95%

� シミュレーション回数:100000回

25

26

Page 14: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

0.85

0.87

0.89

0.91

0.93

0.95

0.97

0.99

EP型型型型 HW型型型型 EP型型型型 HW型型型型 EP型型型型 HW型型型型 EP型型型型 HW型型型型 EP型型型型 HW型型型型α = 0.5 α = 1 α = 2 α = 5 α = 10

被被被被覆覆覆覆確確確確率率率率異なる形状の生存時間分布での比較異なる形状の生存時間分布での比較異なる形状の生存時間分布での比較異なる形状の生存時間分布での比較((((n = 40))))

LINEAR

LOG

LOGLOG

LOGIT

ASINSQ

27

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

区間幅区間幅区間幅区間幅t

LINEAR LOG LOGLOG LOGIT ASINSQRT

区間幅(区間幅(区間幅(区間幅(HW型,指数分布,型,指数分布,型,指数分布,型,指数分布,n = 20))))

28

Page 15: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

区間幅区間幅区間幅区間幅t

区間幅(指数分布,変換なし)区間幅(指数分布,変換なし)区間幅(指数分布,変換なし)区間幅(指数分布,変換なし) EP (n=50) HW (n=50)

EP (n=550) HW (n=550)

29

結果

� 分布の種類・形状に依らず,被覆確率は同様な傾向を示すことが確認された� EP型の信頼バンドについて

� LINEAR, LOGLOG, LOGITは信頼水準を保持できていない� LOG は信頼水準を保持するが,小標本下では区間幅が大きく(LINEARに比べ30%程度)増加する� ASINSQ は信頼水準を2~3%程度上回り,保守性が見られる

EP型の信頼バンドは生存関数が0, 1 付近では定義されず,その近傍での性能が不安定になる30

Page 16: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

結果

� HW型の信頼バンドについて� いずれの変換を用いても信頼水準を満たし,特にLINEAR, LOGIT は信頼水準を1%~3%程度上回る保守的な傾向が見られる� LOGLOG を用いたものは被覆確率が信頼水準に最も近づく傾向が見られる

� 信頼バンドの幅について� HW,EPの型による違いはサンプルサイズの変化による違いよりも小さいことが確認された� LOG を用いたものは区間幅が増加することが確認された

31

まとめ

� 小標本下ではLOGLOG変換を用いたHW型の信頼バンドが

推奨されることが示唆された

� 保守性が重要な場合には変換を用いないHW型の信頼バ

ンドが推奨される

今後の課題

� より詳細なサンプルサイズでの検討

� 尤度比型等の他の信頼バンドとの比較

32

Page 17: Comparison of confidence bands for survival function€¦ · 小標本下( < 200 )で仕様が推奨されている信 頼バンド・変換関数 • EP 型信頼バンド +

参考文献

[1] 浜田知久馬 (1999),”学会・論文発表のための統計学”, 東京大学出版[2] W. J. Hall , J. A. Wellner (1980),“Confidence Bands for a Survival Curve from

Censored Data”, Biometrika.

[3] V. N. Nair (1984), “Confidence Bands for Survival Functions with Censored Data: A Comparative Study”, Technometrics, Vol. 26, pp. 265-275.

[4] Ø. Borgan , K. Liestøl (1990), “A Note on Confidence Intervals and Bands for the Survival Function Based on Transformations”, Scandinavian Journal of Statistics, Vol. 17, No. 1, pp. 35-41

[5] M. Hollander, I. W. McKeague , J. Yang (1997),“Likelihood Ratio Based Confidence Bands For Survival Functions”, Journal of the American Statistical Association.

33

参考文献

[6] W. Q. Meeker , L. Escobar (1998), “Statistical Methods for Reliability Data”, New York: John Wiley & Sons.

[7] J. D. Kalbfleisch , R. L. Prentice (2002),” The Statistical Analysis of Failure Time Data”, New York: John Wiley & Sons.

[8] S. Bari, H. Patel (2011), “Survival Analysis: K-M Plot with Confidence Band”, The NorthEast SAS Users Group;Coders' Corner.

34