death noteの統計学」 - sas institute...sasによる生存時間分布の予測 「death...

86
SASによる生存時間分布の予測 Death Noteの統計学 」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival Distribution using SAS Statistics for “Death Note” Chikuma Hamada Tokyo University of Science Death Note

Upload: others

Post on 30-Mar-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

SASによる生存時間分布の予測「Death Noteの統計学」

東京理科大学

浜田知久馬,魚住龍史

Prediction of Survival Distribution using SAS

Statistics for “Death Note”

Chikuma Hamada

Tokyo University of Science

Death Note

Page 2: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

要旨

分位点回帰を行うプロシジャQUANTREGプロシジャを打ち切りがある場合に拡張したQUANTLIFEプロシジャがバージョン9.4から新たに追加された.このプロシ

ジャを利用するとメディアン等の分位点と共変量の関係をモデル化することが出来る.本発表では,チュートリアルとしてLIFETESTプロシジャ,PHREGプロシジャ,LIFEREGプロシジャ,QUANTLIFEプロシジャを用いた生存関数の予測について解説する.

キーワード:生存時間分布,比例ハザードモデル,加速モデル,分位点回帰

2

QUANTREG(分位点回帰)+LIFETEST(ノンパラ)

=QUANTLIFE(分位点回帰の生存時間への拡張)

Page 3: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

内容

3

生存時間の予測ノンパラメトリックな予測

KM(LIFETEST)セミパラメトリックな予測

Cox(PHREG)

パラメトリックな予測加速(LIFEREG)

分位点の予測QUANTLIFE

Death Note

Page 4: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

生存時間解析のSASの教科書

4

生存時間解析応用編

Page 5: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

第1 章はじめに

1.1 生存時間解析とSAS

1.1.1 LIFETEST プロシジャ(第2 章)

1.1.2 PHREG プロシジャ(第3 章)

1.1.3 POWER プロシジャ(第4 章)

1.1.4 LIFEREG プロシジャ

1.1.5 SURVEYPHREG プロシジャ

1.1.6 QUANTLIFE プロシジャ

1.1.7 ICLIFETEST プロシジャ

1.1.8 ICPHREG プロシジャ5

Page 6: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

第2 章生存関数のノンパラメトリックな推定と検定(LIFETEST プロシジャ)

2.1 ノンパラメトリックな生存関数と

ハザード関数の推定

2.1.1 カプラン・マイヤー推定量

2.1.2 カプラン・マイヤープロット

2.1.3 生存関数の信頼区間

2.1.4 生存関数の信頼バンド

2.1.5 ハザードの推定と可視化

2.2.1 2 群間の比較

2.2.2 多重比較法による解析 6

Page 7: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

第3 章コックス回帰によるハザード比の推定とその拡張(PHREGプロシジャ)

3.1 PHREG プロシジャによる様々な線型仮説に対する検討

3.2 共変量及び多重性の調整

3.3 最大対比法の適用

3.4 モデルの評価

3.4.1 残差統計量

3.4.2 累積ショーンフェルド残差プロットによる

比例ハザード性の評価

3.4.3 累積マルチンゲール残差プロットによる線型モデル

の仮定の評価

3.5 フレイルティモデルと周辺コックスモデルによる

クラスター生存時間データの解析7

Page 8: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

第4 章生存時間解析における例数設計(POWER プロシジャ)

4.1 生存時間解析における例数設計の概要:

4.2 フリードマンの方法とショーンフェルドの方法4.3 POWER プロシジャによる生存時間解析の

例数設計

4.3.1 ラカトスの方法

4.3.2 POWER プロシジャによる実行例

4.3.3 フリードマンの方法とショーンフェルドの

方法による例数との比較

4.3.4 区分直線モデルによる例数設計 8

Page 9: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

応用編に関連したチュートリアル浜田知久馬・藤井陽介(2003). 生存時間解析の症例数設計.

浜田知久馬・安藤英一(2005). POWERプロシジャによる症例数設計.

浜田知久馬(2011). 生存時間解析再入門

生存時間解析のミステリーをひも解く.

浜田知久馬(2013). SAS 生存時間解析プロシジャの最新の機能拡張.

9

Page 10: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

10

共変量 (covariate)予後因子(prognostic factor)背景因子(baseline factor)

• 生存時間に対する影響を調べたい変数

1)治療法の違いを表す共変量

2)患者固有の性質を表す共変量:年齢,検査値

3)外性的な共変量(環境要因):施設,時代

• 時間非依存性共変量:性,人種

• 時間依存性共変量:検査値,治療法

( time dependent covariate )

Page 11: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

11

生存時間に影響を与える因子

性別:男性 80.5歳(8位) 女性 86.8歳(1位) (2014)

疾患:糖尿病,高血圧

食生活:赤ワイン,果物

地域:沖縄県は長寿だった

生活習慣:喫煙,運動

職業:医師,タクシードライバー,関取

遺伝子(ゲノム疫学)

Page 12: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

12

生存時間解析の方針• ノンパラメトリック(LIFETEST)

– 特定の分布を仮定しない推定

– Kaplan-Meier法,

ログランク検定,一般化ウイルコクソン検定

• セミパラメトリック(PHREG)– 特定の分布を仮定しないハザード比の推定

– Coxの比例ハザードモデル

• パラメトリック(LIFEREG)– 特定の分布を仮定した生存時間解析

– 加速モデル

Page 13: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

•13

Kaplan-Meier法死亡時点で階段が低下

t1 t2 t3 t4

1/71/7

2

11

4

11

6

11

7

11

4

11

6

11

7

11

6

11

7

11

7

11

↑ ↑ ↑

Page 14: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

Kaplan-Meier法瞬間の単位で生き残る確率を積算

時点tまで生き残る:ti<tの全てを生き残る.

死亡が起きてない時点: 生き残る確率= 1

死亡が起きた時点:生き残る確率=

ni:時点iのリスク集合の大きさ

di:時点iの死亡数

死亡がおきてない時点は水平で,死亡が起きた時点で生存関数S(t)は階段状に低下

(di=1で打ち切りがなければ,1/nづつ低下)

i

i

n

d1

Page 15: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

•15

生存割合の推移

時点t1まで:1 (死亡がおきてない)

t1~t2 :

t2~t3 :

t3~t4 :

t4 ~ : 27.02

11

4

11

6

11

7

11

54.04

11

6

11

7

11

714.07

5

6

5

7

6

6

11

7

11

857.07

6

7

11

Page 16: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

死亡:階段低下 打ち切り:ヒゲ

t1 t2 t3 t4

1.0

0.8

0.6

0.4

0.2

0.0

↑ ↑ ↑

Page 17: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

17

加速(時間に対するモデル化)比例ハザード(時間の逆数のモデル化)

β>0:z↑→T ↑ (リスクは減少)

β<0:z↑→T ↓ (リスクは増大)

比例

β>0:z↑→T ↓ (リスクは増大)

β<0:z↑→T ↑ (リスクは減少)

2つのモデル間でβの符号は反対

)exp(0 izβTTT

)exp()()( 0 izβTthth

加速

Page 18: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

18

加速モデルと比例ハザードモデル

・加速モデル

・比例ハザードモデル

))(loglog())(loglog(

)()(

)exp()()(

0

)exp(

0

0

tStS

tStS

thth

T

T

T

0

0

0

loglog

)exp()(

)exp(

TT

tStS

TT

T

T

T

Page 19: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

19

加速モデル:横軸が定数倍,S(t)=S0(t/2)

:T0 :T exp(β Tz)=2

5.02

1)1( 00 SSS

任意の%点が定数倍

Page 20: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

20

比例ハザードモデル:縦軸がべき乗

S(t)=S0(t)2 exp(β Tz)=2のとき

0.8

0.82 0.6

0.62

0.3

0.32

Page 21: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

21

二重対数プロット加速モデル

log(-log(S))

log(time)

水平方向に

平行移動

βa

z=0,1

0loglog TzT

Page 22: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

22

二重対数プロット比例ハザードモデル

log(-log(S))

log(time)

垂直方向に

平行移動

βph

z=0,1

))(loglog())(loglog( 0 tSztS

Page 23: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

23

ワイブル確率プロット(二重対数プロット)

ワイブル分布の生存関数

logtを横軸,log(-logS(t))を縦軸に

プロットすると傾きγ の直線になる.

ttS

ttS

ttS

loglog))(loglog(

)(log

)exp()(

tlog

))(loglog( tS

log切片:

傾き:

Page 24: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

24

二重対数プロットワイブル分布

log(-log(S))

log(time)

βa

βph

傾き:γ

βph=―γβa

log切片:

ttS loglog))(loglog(

Page 25: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

25

二重対数プロット1)横軸:log(time) 縦軸:log(-log(S))

2)比例ハザードモデルのとき,

上下に平行移動

3)加速モデルのとき,左右に平行移動

4)ワイブル分布のときは直線

(上下,左右に同時に平行移動)

比例ハザードかつ加速モデル

-β (加速)×γ =β (比例)

Page 26: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

例題データ:加速モデルdata test;

do drug=0,1;

do i=1 to 20;time=i*(drug+1);output;end;end;run;

proc print;run;

proc sgplot;

scatter x=time y=drug ;run;

26

Page 27: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

例題データ:人工的な加速モデル

27生存時間

薬剤群

対照群

生存時間が2倍

2 4 6 8 10 ・・・ 20・・・ 40

12345 ・・・ 10・・・ 20

01 2 TT

401T

200T

Page 28: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

LIFETESTによる解析(ノンパラ)proc lifetest data= test plots=(s,lls);

time time;

strata drug;

run;

28

Page 29: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

生存関数の予測(ノンパラ)Kaplan-Meier プロット

29

Page 30: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

二重対数プロット(ノンパラ)

30

log(2)=0.693

対数生存時間比

01

01

log2loglog

2

TT

TT

log(time)

Page 31: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

PHREGによる解析(セミパラ)data dummy; do drug=0 to 1;_group_=1;output; end;

proc phreg data=test plots(overlay=group)=(s);

model time= drug;

baseline out=out covariates=dummy

survival=s loglogs=lls/nomean;run;

data out;set out;logw=log(time);

label s='survival' lls='lls';

proc gplot data=out;

plot s*time=drug lls*logw=drug;;run;

31

Page 32: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

生存関数の予測(セミパラ)

32

Page 33: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

33

尤推定値の分析

パラメータ パラメータ推定値

ハザード比

drug -1.36910 0.254 対数ハザード比-1.369=log(0.254)

二重対数プロット(セミパラ)log(-log(S))

共変量の効果を誤特定

Page 34: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

LIFEREGによる解析(パラ)ワイブル分布

proc lifereg data=test;

model time=drug/dist=weibull;

output out=out cdf=cdf;

data out;set out;s=1-cdf;

lls=log(-log(s));logw=log(time);

proc gplot;

plot s*time=drug lls*logw=drug;

symbol1 i=spline c=red w=3 l=;

symbol2 i=spline c=green w=3 l=;run; 34

Page 35: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

生存関数の予測(パラ)

35

01 2 TT

Page 36: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

二重対数プロット(パラ)

36

Analysis of Maximum Likelihood Parameter Estimates

Parameter Estimate

Intercept 2.4643

drug 0.6931

Scale 0.5489

Weibull Shape 1.8220

0.6931×1.822=1.262

log2=0.6931

log(-log(S))

生存時間分布を誤特定

Page 37: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

比例ハザードモデルと加速モデル

1)ノンパラ 共変量をモデル化できない.

既存のモデルは仮定が厳しすぎる.

2)比例ハザードモデル

ハザードが時点によらず定数倍

二重対数プロットが縦軸方向に平行移動

3)加速モデル(ワイブル分布)

時間の%点が定数倍

二重対数プロットが横軸方向に平行移動

特定の生存時間分布を仮定する必要がある. 37

Page 38: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

QUANTLIFEによる解析

proc quantlife data= test method=na log plot=quantplot;

model time=drug /quantile=0.00 to 0.95 by 0.05;

baseline out=qlout covariates=dummy survival=qlsurv quantile=qly;run;

proc gplot data=qlout;plot qlsurv*qly=drug;

symbol1 i=steplj w=3 l=1 c=red;

symbol2 i=steplj w=3 l=2 c=blue;run; 38

加速(対数線形)モデル

zT )(1)(0)(log τ分位点に対する回帰分析

Page 39: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

39

Parameter Estimates

Quantile Parameter DF Estimate StandardError

95% Confidence Limits t Value Pr > |t|

0.1000 Intercept 1 0.7815 0.5170 -0.2317 1.7948 1.51 0.1389

drug 1 0.6704 0.7164 -0.7338 2.0745 0.94 0.3553

0.2000 Intercept 1 1.4111 0.4257 0.5768 2.2454 3.31 0.0020

drug 1 0.7116 0.5987 -0.4618 1.8850 1.19 0.2420

0.3000 Intercept 1 1.8239 0.3375 1.1624 2.4855 5.40 <.0001

drug 1 0.6869 0.4654 -0.2253 1.5990 1.48 0.1482

0.4000 Intercept 1 2.0954 0.2651 1.5758 2.6150 7.90 <.0001

drug 1 0.6772 0.3789 -0.0653 1.4198 1.79 0.0818

0.5000 Intercept 1 2.3283 0.2240 1.8893 2.7674 10.39 <.0001

drug 1 0.6706 0.3150 0.0531 1.2880 2.13 0.0398

0.6000 Intercept 1 2.5161 0.1736 2.1758 2.8563 14.49 <.0001

drug 1 0.6931 0.2537 0.1960 1.1903 2.73 0.0095

0.7000 Intercept 1 2.6647 0.1385 2.3933 2.9360 19.25 <.0001

drug 1 0.6931 0.1963 0.3083 1.0780 3.53 0.0011

0.8000 Intercept 1 2.7900 0.1085 2.5773 3.0026 25.72 <.0001

drug 1 0.6931 0.1573 0.3848 1.0015 4.41 <.0001

0.9000 Intercept 1 2.9232 0.0772 2.7718 3.0745 37.85 <.0001

drug 1 0.6931 0.1134 0.4708 0.9155 6.11 <.0001

zT )(1)(0)(log 加速モデル

Page 40: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

パラメータ推定値× Quantile

40

log(2)=0.693

log(i)i=1 to 20

zT )(1)(0)(log

)(1)( tStF

)2log()(1

plot=quantplotオプション

%点によらず係数は一定加速モデルが成立

)20log()(0

Page 41: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

生存関数の予測

41

Page 42: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

N=19で対数変換なし(加法モデル)data test;

do drug=0,1;

do i=1 to 19;time=i*(drug+1);output;end;end;run;

proc quantlife data= test method=na plot=quantplot;

model time=drug / quantile=0.00 to 0.95 by 0.05;

baseline out=qlout covariates=dummy survival=qlsurv quantile=qly;

run;

proc gplot data=qlout;plot qlsurv*qly=drug;

symbol1 i=steplj w=3 l=1 c=red;

symbol2 i=steplj w=3 l=2 c=blue;run; 42

zT )(1)(0

Page 43: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

生存関数の予測

43

Page 44: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

44

Parameter Estimates

Quantile Parameter

DF Estimate StandardError

95% Confidence Limits

t Value Pr > |t|

0.1000 Intercept 1 2.0000 1.3175 -0.5822 4.5822 1.52 0.1377

drug 1 2.0000 2.9569 -3.7954 7.7954 0.68 0.5031

0.2000 Intercept 1 4.0000 1.7206 0.6277 7.3723 2.32 0.0258

drug 1 4.0000 3.8306 -3.5078 11.5078 1.04 0.3033

0.3000 Intercept 1 6.0000 1.9308 2.2157 9.7843 3.11 0.0037

drug 1 6.0000 4.4071 -2.6378 14.6378 1.36 0.1818

0.4000 Intercept 1 8.0000 2.0055 4.0694 11.9306 3.99 0.0003

drug 1 8.0000 4.4343 -0.6911 16.6911 1.80 0.0796

0.5000 Intercept 1 10.0000 2.0368 6.0080 13.9920 4.91 <.0001

drug 1 10.0000 4.7272 0.7349 19.2651 2.12 0.0414

0.6000 Intercept 1 12.0000 2.1370 7.8116 16.1884 5.62 <.0001

drug 1 12.0000 4.5073 3.1658 20.8342 2.66 0.0115

0.7000 Intercept 1 14.0000 2.1706 9.7457 18.2543 6.45 <.0001

drug 1 14.0000 4.3911 5.3937 22.6063 3.19 0.0030

0.8000 Intercept 1 16.0000 1.8313 12.4107 19.5893 8.74 <.0001

drug 1 16.0000 3.9257 8.3057 23.6943 4.08 0.0002

0.9000 Intercept 1 18.0000 1.2936 15.4646 20.5354 13.91 <.0001

drug 1 18.0000 2.7325 12.6443 23.3557 6.59 <.0001

zT )(1)(0 加法モデル

Page 45: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

パラメータ推定値× Quantile

45

zT )(1)(0

20)(0 20)(1

)(1)( tStF )(1)( tStF

Page 46: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

QUANTLIFEの文法PROC QUANTLIFE < options > ;

BASELINE < options > ;*予測する共変量の指定;

CLASS variables ;

EFFECT name = effect-type ( variables < / options > ) ;

MODEL response < censor(list) > = < effects >

< / QUANTILE= > ;

OUTPUT <OUT=SAS-data-set > < keyword=name . . . keyword=name > ;

TEST effects < / options > ;

Page 47: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

生存時間解析のプロシジャの比較

47*QUANTLIFE:生存時間分布に特定の分布を仮定しないが,共変量で%点が変化

プロシジャ 焦点 モデルアプローチ

共変量 打ち切り

LIFETEST生存関数

ノンパラ 層別 右側

PHREGハザード関数

比例ハザードモデル

セミパラモデル調整

右側

LIFEREG生存時間

加速モデル パラモデル調整

右側,

左側,区間

QUANTLIFE 生存時間の分位点

加速モデルセミパラ*

モデル調整

右側加法モデル

Page 48: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

最小2乗法と絶対値の和の最小

48

5:

min

8.4

0)(2

)9()6()5()3()1(

min)(

96531

22222

2

medianA

AyS

yAnAy

AydA

dS

AAAAA

AyS

,,,,:y

i

i

i

i

i

Page 49: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

算術平均:4.8 中央値:5.02乗和を最小 絶対値の和を最小

49

1

3

5

6

9

A

Page 50: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

最小2乗の確認S=Σ(Yi-4.8)2

=(1-4.8)2 + (3-4.8)2 + (5-4.8)2 + (6-4.8)2 + (9-4.8)2

=(-3.8)2 + (-1.8)2 + (0.2)2 + (1.2)2 + (4.2)2

=36.8

S’=Σ(Yi-5.0)2

=(1-5.0)2 + (3-5.0)2 + (5-5.0)2 + (6-5.0)2 + (9-5.0)2

=(-4.0)2 + (-2.0)2 + (0)2 + (1)2 + (4)2

=37.050

Page 51: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

最小絶対値の確認

S=Σ|Yi-4.8|

=|1-4.8 | + |3-4.8| + |5-4.8| + |6-4.8| + |9-4.8|

=3.8 +1.8 + 0.2 +1.2 + 4.2

=11.2

S’=Σ|Yi-5.0|

=|1-5 | + |3-5| + |5-5| + |6-5| + |9-5|

=4.0 +2 + 0 +1 + 4

=11.051

Page 52: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

絶対値の和の変化

52

1

3

5

6

9

A

Page 53: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

最小2乗法の模式図単回帰分析

53

X0

××

XX

×

no x y

1 1 3

2 2 2

3 3 5

4 4 4

5 5 14

Page 54: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

最小2乗推定

直線による予測式:

残差:

残差平方和:

b0 b1の関数

偏微分して0⇒正規方程式54

ii xbby 10

iii yye

min)(

)(

2

10

22

ii

iiie

xbby

yyeS

Page 55: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

最小2乗推定量

55xx

xy

ii

ii

iiii

iiii

iiie

iiiie

ii

iiie

S

S

xxxx

yyxxb

xxxxbyyxx

exexx

xxbyyxxdb

dS

xxbyyxbbyS

xbybxbby

xbbny

exbbydb

dS

))((

))((

))(())((

02)(2

))()((2

))(()(

0

0

02)(2

1

1

1

1

2

1

2

10

1010

10

10

0

Page 56: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

単回帰分析の結果

i

ii

x

xbby

4.26.1

10

Page 57: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

%点(分位点)回帰の指標

57

n

yi

T

i

n

yi

T

i

n

yi

T

i

n

yi

T

i

n

i

T

i

n

i

T

i

Ti

Ti

Ti

Ti

yyS

yyS

yS

yS

βx

i

βx

i

βx

i

βx

i

i

i

ii

ii

βxβx

βxβx

βx

βx

::

::

1

2

1

05.095.0

:%95

)1(

:%

5.0:

:

点回帰

 

点回帰

メディアン回帰

回帰分析

Page 58: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

proc quantreg;model y=x /quantile=.05 .50 .95;

xy

xy 2

xy 75.225.0

50%点

95%点

5%点

Page 59: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

QUANTREGプロシジャの結果

xy 75.225.0

xy 2

xy

切片 傾き

分位点 分位点

Page 60: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

QUANTREGプロシジャの結果 50%点

xy 2

n

i

T

iyS1

5.0: βxiメディアン回帰

Page 61: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

5%点:負の残差が出ないようにする

xy

n

yi

T

i

n

yi

T

iT

iT

i

yySβx

i

βx

i

ii

βxβx::

95.005.0

Page 62: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

95%点:正の残差が出ないようにする

xy 75.225.0

n

yi

T

i

n

yi

T

iT

iT

i

yySβx

i

βx

i

ii

βxβx::

05.095.0

Page 63: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

分位点回帰の特徴ノンパラメトリック回帰

1)外れ値に対して頑健

(平均値に対する中央値の頑健性.)

2)等分散性が成り立たない場合でも対応可

(期待値が大きくなると分散が大きくなる.)

3) %点についてモデル化

%点ごとに異なった回帰係数をあてはめることができる.

63

Page 64: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

64

2013年プロ野球打者のデータ

年俸(万円)

通算安打

回帰分析90%予測区間

阿部

Page 65: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

65

分位点回帰95%点

50%点

5%点

分位点回帰1)不等分散性に対応可2)外れ値に対して頑健

通算安打

年俸万円

2013年プロ野球打者のデータ

Page 66: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

%点回帰(quantlifeの記載)

n

yi

T

i

n

yi

T

i

n

i

T

i

T

i

n

i

T

i

Ti

Ti

yy

yIy

yr

uIuu

βx

i

βx

i

ii

i

ii

βxβx

βxβx

βxβ

::

1

1

)1(

)0)((

)(

))0(()(

Page 67: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

分位点回帰の打ち切りデータに対する拡張方針打ち切りを起こした個体:打ち切り時点から∞の

どこかで死亡が起きる.

1)打ち切り時点で死亡

2)∞(最終観察時点)の時点で死亡

に重みを付けて分割

後の時点の累積死亡率を推定するときは,1)の重みを大きくする.重みは逐次的に更新

67

Page 68: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

Kaplan-Meier-Type Estimatorイベント,打ち切りの寄与

i

ii

i

T

i

T

ii

T

i

w

y

ory

yw

yw

y

1

)(

:

:

))(1(

)(

*

*

最終観察時点

打ち切り時点生存時間

打ち切り:

イベント:

βx

βx

βx

i

i

i

:推定したい分位点

の累積分布個体

打ち切り時点の

i

:

i

Page 69: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

打ち切りデータの重み

69の死亡の重み時点

の重み:打ち切り時点の死亡

:推定したい分位点

の累積分布打ち切り時点の個体

:

1

1

1

1)(1

1

)(

i:

ii

iii

i

ii

i

w

w

Page 70: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

Kaplan-Meier-Type Estimator 打ち切りデータの重み

00.14.01

4.00.1

1

:0.1,4.0

83.04.01

4.09.0

1

:9.0,4.0

17.04.01

4.05.0

1

:5.0,4.0

016.04.01

4.03.0

1

:3.0,4.0

i

ii

i

ii

i

ii

i

ii

で死亡iy

り最終観察時点で打ち切:*y

累積分布が0.3の時点では生存

累積分布が1.0の時点では死亡

Page 71: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

重みの模式図

71時間

累積死亡分布関数

i t ∞

i

1

i1

i

1

時点tでの死亡の重み

時点∞での死亡の重み

最終観察時点

Page 72: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

重みの持つ意味KM推定量:1 2 3 4 5 6 7 8 9 10

* * *

72

1,76,0,52.0,4.0,3.0,2.0,1.0:)(

0,24.0,48.0,6.0,7.0,8.0,9.0:)(

10964321:

1

0

2

1

5

4

7

6

8

7

9

8

10

9

1

11

2

11

5

11

7

11

8

11

9

11

10

11

tF

tS

t

Page 73: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

LIFETESTのプログラム

data data;

input t c @@;

cards;

1 0 2 0 3 0 4 0 5 1

6 0 7 1 8 1 9 0 10 0

;

proc lifetest plots=s(atrisk=0 to 10 by 1);

time t*c(1);run;73

Page 74: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

74

0.1

0.1

0.1

0.1

0.12

0.24

2.114.01

4.052.01

4.01

4.0

Page 75: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

1 2 3 4 5 6 7 8 9 10* * *

75

76.010

52.01

52.021

4.01

4.01111

9

52.010

14.01

4.01111

6

の累積分布関数τ時点

の累積分布関数τ時点 の重みで死亡2.04.01

4.052.0

この式をτ について解くとKM推定量

Page 76: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

EXAMPLE: PRIMARY BILIARY CIRRHOSIS STUDY

原発性胆汁性肝硬変(PBC)N=418 死亡:161,打ち切り:257

Time:生存時間(年)

Status:打ち切り変数(1 :死亡,0:打ち切り)

Age:試験登録時の年齢

Albumin:アルブミン濃度(g/dL)

Bilirubin:ビリルビン(mg/dL)

Edema:浮腫の有無

Protime:プロトロンビン時間(秒)

Page 77: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

PHREGによる解析proc phreg data=pbcmodel Time*Status(0)=logBilirubin logProtime logAlbumin Age Edema;

77

最尤推定値の分析

パラメータ 自由度

パラメータ推定値

標準誤差

カイ 2 乗値

Pr > ChiSq

ハザード比

logBilirubin 1 0.87072 0.08263 111.0484 <.0001 2.389

logProtime 1 2.37789 0.76674 9.6181 0.0019 10.782

logAlbumin 1 -2.53264 0.64819 15.2664 <.0001 0.079

Age 1 0.03940 0.00765 26.5306 <.0001 1.040

Edema 1 0.85934 0.27114 10.0447 0.0015 2.362

Page 78: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

78

プロットする参照共変量 (平均値)

logBilirubin logProtime logAlbumin Age Edema

0.571493 2.369201 1.244156 50.741460 0.100478

PHREGによる生存時間分布の予測

Page 79: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

LIFEREGによる解析(ワイブル)proc lifereg data=pbc; model Time*Status(0)=logBilirubin logProtime logAlbumin Age Edema;

Analysis of Maximum Likelihood Parameter Estimates

Parameter DF Estimate Standard Error

Chi-Square

Pr > ChiSq

Intercept 1 12.2155 1.4539 70.59 <.0001

logBilirubin 1 -0.5770 0.0556 107.55 <.0001

logProtime 1 -1.7565 0.5248 11.20 0.0008

logAlbumin 1 1.6694 0.4276 15.24 <.0001

Age 1 -0.0265 0.0053 25.35 <.0001

Edema 1 -0.6303 0.1805 12.19 0.0005

Scale 1 0.6807 0.0430

Weibull Shape 1 1.4691 0.0928

Page 80: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

QUANTLIFEのプログラム

ods graphics on;

proc quantlife data=pbc log method=naplot=(quantplot survival) seed=1268;

model Time*Status(0)=logBilirubinlogProtime logAlbumin Age Edema

/quantile=(.1 .2 .3 .4 .5 .6 .75);

run;

Page 81: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

分位点に対するパラメータ推定値

Page 82: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

82

12.2

-0.58

-1.761.67

QUANTLIFEのパラメータ推定値

生存時間

を有意に低下

有意差なし

LIFEREGの推定値

Page 83: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

QUANTLIFEのパラメータ推定値

83

-0.0265 -0.63

分位点によらず,回帰係数はほぼ一定加速モデルの妥当性が示唆

Page 84: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

プロットする参照共変量 (平均値)

logBilirubin logProtime logAlbumin Age Edema

0.571493 2.369201 1.244156 50.741460 0.100478

plot=(survival)オプション

QUANTLIFEによる生存時間分布の予測

Page 85: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

QUANTLIFEの利点

任意の%点に対して,特定の生存時間分布を

仮定しないで共変量の影響を評価,生存時間分布を予測

任意の%点に対する係数の一様性を評価することで加速モデルの妥当性を評価

(加速モデルでは任意の%点に対して

係数が一定)

85

Page 86: Death Noteの統計学」 - Sas Institute...SASによる生存時間分布の予測 「Death Noteの統計学」 東京理科大学 浜田知久馬,魚住龍史 Prediction of Survival

参考文献Koenker, R. and Bassett, G. W. (1978), “Regression Quantiles,” Econometrica, 46, 33–50.12SAS Global Forum 2013 Statistics and Data Analysis

Koenker, R. and Geling, O. (2001), “Reappraising Medfly Longevity: A Quantile Regression Survival Analysis,”Journal of the American Statistical Association, 96, 458–468.

Peng, L. and Huang, Y. (2008), “Survival Analysis with QuantileRegression Models,” Journal of the American Statistical Association, 103, 637–649.

Portnoy, S. (2003), “Censored Regression Quantiles,” Journal of the American Statistical Association, 98, 1001–1012.

Lin, G. and Rodriguez,N.R. (2013), “Using the QUANTLIFE Procedure for Survival Analysis” SAS Global Forum 2013,Paper 421 86