jinheum kim ([email protected]) department of applied statistics university of suwon
DESCRIPTION
Adjusted Kaplan-Meier Estimator for Period Analysis with Long-term Survival Data. Jinheum Kim ([email protected]) Department of Applied Statistics University of Suwon. 동 기. - PowerPoint PPT PresentationTRANSCRIPT
Jinheum KimJinheum Kim
([email protected])([email protected])
Department of Applied StatisticsDepartment of Applied Statistics
University of SuwonUniversity of Suwon
Jinheum KimJinheum Kim
([email protected])([email protected])
Department of Applied StatisticsDepartment of Applied Statistics
University of SuwonUniversity of Suwon
2
동 기
Brenner 교수 팀은 1996 년 Cancer 학술지에 “ An alternative approach to monitoring cancer patient survival” 라는 논문을 발표한 이래로 생존율 추정과 관련된 다수의 논문을 발표
주요 관심은 생명표 작성 : 그룹 자료 중심
왜 각광 ( 脚光 ) 받고 있나 ?
Complete data 를 바탕으로 하면 장기간 생존자료에서는 study 에 일찍 들어 온 환자의 생존정보에 영향을 많이 받음 . 그러나 Brenner 교수 팀의
‘ Period analysis approach’ 는 최근의 생존정보에 민감함 .
실제 생존율에 가까운 추정이 가능 `
생명표보다 유연한 생존율 추정을 위해서
3
무엇이 새로운가 ?
Actuarial 추정량 보다 조밀 (fine) 하게 추정 가능
( 관찰된 생존시간 각각을 개별 그룹으로 형성 !)
최근에 변화된 생존정보를 더 잘 반영
Period analysis approach + Kaplan-Meier estimate
4
LTRC 자료와 어떻게 다른가 ?
관심기간 내에서 관찰된 환자만 분석에 포함 .
마치 LTRC (left-truncated & right-censored) 자료처럼 보임 .
▣ 이전에 진단되어 의 시작시점까지 이벤트가 발생하지 않은 환자의 경우에 이전까지의 생존경험을 분석에 포함 .`
생존시간 : 의 시작시점과 이벤트 발생시점 간의 차이 진단시점과 이벤트 발생시점 간의 차이
P
P PP
P (NO!)(Yes!)
5
위험집합과 사망집합의 재정의
: 관찰된 서로 다른 생존시간
, 만일 번째 환자가 동안 에서 위험에 노출
되어 있으면 ; 0, o.w
, 만일 번째 환자가 동안 로 이벤트가
발생하면 ; 0, o.w
▣ : 에서 위험집합에 속하는 환자수
: 에서 사망집합에 속하는 환자수
▣ 형태적으로는 KM 과 동일 !
1 2, ,t t
tjr jt
tjd jt
1tjir
1tjid
( )ri tji
i
P
P
jt
jt
( )di tji
i
6
Illustration
7
환자 8
환자 5
환자 2
Illustration
10환자 9
6
14
21
0 4 6 8 14 (t1) (t2) (t3) (t4)
관찰된 생존시간
8
Illustration
11123457합계
000001119
001000118
100011105
000010002
( 사망 집합 ) ( 위험 집합 )
( 환자번호 )
-
0000000014
0000000013
0000000112
0001000111
0100011110
000100017
000011116
--------4
--------3
-------1
tjir
1t 2t 3t 4t 1t 2t 3t 4ti tjid
9
생존함수 추정과 표준오차
: 진단시점부터 시간 이후 생존율
재정의한 를 Greenwood 공식에 대입
ˆ 1j
tjt
t t tj
dS
r
,tj tjr d
t
2ˆ ˆˆ( )( )j
t
t t
dtjV S St r r dtj tj tj
10
응 용 예
1993-1997 동안에 등록되어 2001 년 말까지 추적 조사된 79,707 명의 서울시 암 등록 자료
(Ahn et al., 2002)
성별과 연령 (<20, 20-40, 40-60, >60) 의 조합에 따라 8 개 층으로 층화
=[1997, 2001]
Complete data 와 period analysis approach 에 따른 KM 추정량의 비교
P
11
표본 통계량
3920152543373127
5979858250627373
3663726128395153
14,578
15,089
6,162
77220,519
17,969
3,258
1,004
60<40-6020-40<2060<40-6020-40<20
여 자남 자표본 통계량
n
(%)cf
(%)pf
(%)h
Left truncation 비율 : 남성 > 여성 ; 고령층으로 갈수록 커짐
Censoring 비율 : Complete dada < Period
analysis approach ( 성별 , 연령 무관 )
12
생존율 비교
연령층에 무관하게 남자의 생존율이 여자보다 낮음 . 20-60 대 층에서 큰 차이를 보임 .
성별에 관계없이 고령층으로 갈수록 생존율이 낮음 . 인접 연령 층 간 차이는 고령층으로 옮아갈수록 커짐 .
Complete data 를 바탕으로 추정한 경우보다 period analysis approach 에 의한 추정값이 큼 .
그러나 예상했던 것처럼 후자의 표준오차가 전자보다 큼 .
Period analysis approach 에 기초한 KM 추정량의 95% 신뢰구간 내에 complete data 에 기초한 KM 추정량이 포함되지 않음 .
두 방법은 유의수준 5% 에서 통계적으로 유의함 .
13
Actuarial 추정량의 생존율 비교
14
마치면서
장기간 생존자료의 생존율 추정에서 최근 생존정보를 잘 반영할 수 있는 추정량을 제안
서울시 암등록 자료에 적용 : 매년 새로운 암 치료법이 개발되고 있기 때문에 암 환자들의 생존율은 증가 추세에 있으며 , 제안한 추정량이 이를 잘 반영하고 있는 것으로 나타남 .
유효 표본수가 줄어들고 , 이로 인해 표준오차가 커지는 단점이 있지만 대용량 자료에서는 크게 문제되지 않음 .
15
THANK YOU!