sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf ·...

12
www.kasl.org 33 Sample size calculation and statistical analysis plan 신 임 희 대구가톨릭대학교 의과대학 의학통계학교실 □ 임상시험 : Sample Size Calculation(Determination) 1) 표본수 결정에 들어가기전에.... - sample size의 개념 모집단(population) 표본(sample) 두 집단의 차이가 크면 ? / 표준편차가 크면 ? 모집단(population) 표본(sample) 추정(Estimation) 가설검정(Hypothesis testing) 귀무가설( H 0 )/ 대립가설( H 1 ) p-value

Upload: others

Post on 07-Aug-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

www.kasl.org 33

Sample size calculation and statistical analysis plan

신 임 희

대구가톨릭대학교 의과대학 의학통계학교실

□ 임상시험 : Sample Size Calculation(Determination)

1) 표본수 결정에 들어가기전에....

- sample size의 개념

모집단(population) 표본(sample)

두 집단의 차이가 크면 ? / 표준편차가 크면 ?

모집단(population) 표본(sample)

추정(Estimation)

가설검정(Hypothesis testing)

→ 귀무가설( H 0)/ 대립가설( H 1

)

→ p-value

Page 2: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

제3회 임상연구방법론 워크숍

34 대한간학회

검정결과 : H 0 accept H 1

accept

H 0 (true) 옳은 결정 제1종오류 α

H 1 (true) 제2종오류 β 옳은 결정(1-β)

note) . p-value < 인 경우에 귀무가설 기각,

즉, 대립가설을 받아들임

. 이런 오류가 왜 생기는 것인가?

. 유의수준( )의 설정 : = 0.1, 0.05, 0.01

. 검정력(power)의 설정 : =0.80, 0.90

. 가설검정의 형태 : 양측검정 / 단측검정

. 제1종오류와 제 2종오류의 설정 및 percentile

제1종 오류(α) 단측( Zα) 양측( Zα/2)

0.01

0.05

0.10

1.282

1.645

1.282

1.645

1.960

1.645

제2종 오류(β) 검정력 (power) Zβ

0.05

0.10

0.20

0.95

0.90

0.80

1.645

1.282

0.842

2) 적합한 표본수 결정의 중요성

- 윤리적이고 과학적인 면(Ethical and Scientific view)

Page 3: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

신임희 | Sample size calculation and statistical analysis plan

www.kasl.org 35

- 연구비와 직접적인 관련

- 주요관점(main focus) : 가장 적합한 sample size로 가장 효과적인 연구결과의 기대

note) - 표본의 수가 적으면 좋은가? : 윤리적인면?/과학적인면?

- 표본의 수가 많으면 좋은가? : 윤리적인면?/과학적인면?

note) ICH-E9

3) 적합한 표본수를 결정하기 위해 무엇을 먼저 고려해야 하는가?

- 그룹의 수?

- 연구에 관여하는 센터수?

- 1차 유효성 평가변수 : primary endpoint(variable)?

- 1차 유효성 평가변수의 형태?

- drop rate?

- compliance rate?

- control/treatment의 sample size의 비

- 유의수준, power의 설정

- 기존의 예비연구/참고문헌을 통한 review

- clinical difference의 설정이 가능한가??? (비열등성, 동등성)

note) 변수의 형태 : 양적 (평균, 표준편차 ) /질적(발병률, 반응율)

연구기간을 고려한 유효성 평가변수의 설정

연구대상수는 군간에 항상 같아야 하는가? power problem

4) 표본수를 조금이라도 줄이고 싶다면...

- 1차 유효성 평가변수 : 연속형변수의 이용함

- 측정을 정밀하게 하여 표준편차를 최대한 줄임

- 보다 빈번히 발생하는 변수를 1차 유효성 평가변수로 설정하는 방법

note) 표본의 수가 생각보다 크면, 임상시험을 할 수 없을까?

5) 흔히 발견되는 오류...

- 표본수 계산공식없이 임의로 연구대상수의 결정? 예) 대조군 시험군 각 30명

- 표본수 산출 공식이 있으나 적용이 잘못된 경우?

Page 4: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

제3회 임상연구방법론 워크숍

36 대한간학회

- 표본수를 계산하는데 필요한 요인(유의수준, power, clinical difference..)??

- 표본수를 계산하는데 필요한 요인이 있으나, 그 근거의제시가 없는 경우

- 계산을 잘못하여 오류?

- 관찰연구, 서술적 연구..임의로 sample size계산은 필요없다고 언급하는 경우??

......

6) 임상시험에서의 표본수 결정 :

A. 한그룹 : 양적인 경우(mean, S.D) / 질적인 경우(proportion, rate)

B. 두그룹 : 양적인 경우(mean, S.D) / 질적인 경우(proportion, rate)

C. 동등성 /비열등성, 우위성인 경우

D. 생존분석과 관련된 경우

note) 세집단(이상), 상관계수, ....

두그룹의 경우)

양적자료인 경우 질적자료인 경우

1) 가설의 형태 귀무가설 /대립가설 귀무가설 /대립가설

2) sample size계산을

위하여 필요한 요인

유의수준

power

평균차이/ 표준편차(표본)

유의수준

power

비율차이

3) sample size 계산식

4) 예제

A약을 먹은 환자들의 통증 평균 VAS

와 B약을 먹은 환자들의 통증평균

VAS가 15mm 차이가 나는지 보이고

싶다. 기존문헌에서 알려진 바로는 표

준편차의 값이 13.5mm로 추정가능하

다. drop rate는 15%로 설정한다.

기존의 항암제는 40% 정도의 response

rate가 있으며, 새로운 항암제 re-

sponse rate는 50%정도로 기대하며

임상연구를 실시하고자 한다 drop rate는

15%로 설정한다.

6)-1. 양적인 경우:

A약을 먹은 환자들의 통증 평균 VAS와 B약을 먹은 환자들의 통증 평균 VAS 15mm 차이가 나는 지 보

이고 싶다. 기존 문헌에서 알려진 바로는 표준편차의 값이 13.5mm로 추정 가능하다. drop rate는 15%로 설

정한다.

Page 5: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

신임희 | Sample size calculation and statistical analysis plan

www.kasl.org 37

1) 가설

2) - 유의수준 / power

- 평균차이 / 표준편차

- drop rate

3) 계산식 :

4) EXCEL 에 값을 그대로 입력해보면..... ( ) 명

5) 전체 표본수 :

6)-2. 질적인 경우:

기존의 항암제는 40%정도의 response rate가 있으며, 새로운 항암제의 response rate는 50%정도로 기대하

며 임상연구를 실시하고자 한다 drop rate는 15%로 설정한다.

1) 가설

2) - 유의수준 / power

- 비율차이

- drop rate

3) 계산식 : n=

(Zα 2 p q + Zβ p cq c+p tq t )2

δA

2

Page 6: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

제3회 임상연구방법론 워크숍

38 대한간학회

4) EXCEL 에 값을 그대로 입력해보면..... ( ) 명

5) 전체 표본수 :

□ 임상시험 : Statistical Analysis Plan

1) 임상시험 통계분석시 고려해야 할 부분

- ITT(Intention-to-treat) analysis / PP(Per Protocol) analysis

- 피험자의 일반적인 특성 및 집단간의 동질성검정

- 평가변수에 대한 분석 : 양적자료 / 질적 자료

기술통계(Descriptive analysis) : simple statistics, graphical analysis

추측통계(Inferential analysis) :

- 모수적/ 비모수적 접근법(parametric and nonparametirc approach)

- two sample t-test, -test, one way ANOVA,

repeated measures one factor(two facotr) analysis,

survival analysis, meta analysis

adverse effects/ side effects, efficacy

note) simple & clear analysis + conclusion

- 결측치(Missing Values) 및 이상치(Outliers) ?

자료변환(Data Transformation) ?

세부집단(Subgroups)에 대한 고려 ?

교호작용(Interactions)과 공변량(Covariates) ?

other effects? .......

Page 7: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

신임희 | Sample size calculation and statistical analysis plan

www.kasl.org 39

2) 통계적 분석방법(SAP)의 구체적인 명시

note) 임상연구(시험)에서 통계분석을 해야 하는 부분

- 일목요연한 전개의 필요성

- ITT(Intention to treat ) analysis / PP(Per Protocol)분석

0) 이용되는 통계패키지및 유의수준

1) 기본적인 특성(Baseline characteristics)

1)-1. 전체자료에 대해서

- 인구통계학적 특성 / 임상적인 특성(vital sign, 기본 Lab....)

1)-2. 각 집단간의 동질성 검정

- 인구통계학적 특성 / 임상적인 특성(vital sign, 기본 Lab....)

2) 유효성 평가 변수

2)-1. 1차 유효성 평가변수(primary variable)

- 그룹간의차이, 시점간의 차이, 그룹과시점간의 interaction

2)-2. 2차 유효성 평가변수

- 그룹간의차이, 시점간의 차이, 그룹과시점간의 interaction

2)-3. 그 이외의 변수들

- 그룹간의차이, 시점간의 차이, 그룹과시점간의 interaction

3) 총괄적 유효성 평가

4) 이상반응에 대한 분석

- 총괄적 이상반응에 대한 분석

5) 그 이외....

3) 임상시험 : 통계분석방법

FOCUS : 자료의 속성파악/ 가정의 확인절차 !!!!!!!!

- 연구목적 및 data의 속성에 맞는 방법의 선택

ex) 양적자료 - mean, S.D. 독립 t-test, one way ANOVA,

pearson's correlation coefficient,

multiple linear regression

질적자료 - n(%), Chi-square test, logistic regression

- 분석방법의 이해

▶ 가정의 점검 - 정규성, 등분산성, 독립성...등등

Page 8: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

제3회 임상연구방법론 워크숍

40 대한간학회

⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂⚂ 두(세) 집단의 비교 / 한 집단의 전 후비교

??????

initial finished

experimental

control

통계 분석 방법 data속성

두집단

모수적

two sample t-test

paired t-test

비모수적

Wilcoxon 순위합검정

Wilcoxon 부호순위 검정 양적

세집단이상one way ANOVA

two-way ANOVAKruskal-Wallis 검정

sample

size 40 ? Chi-square test

질적 sample

size 40 ? Fisher's exact test

note) 만약 baseline characteristics 에서 분석하고자 하는 평가변수에 영향을 줄 수 있는 특성의 차

이가 두 집단간에 통계적으로 유의 하였다면???

→ 공분산분석 ( ANCOVA : Analysis of Covariance)

⚂ 두(세) 집단의 시점에 따른 반복측정

??????

initial 시점1 시점k (finished)

experimental

control

Page 9: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

신임희 | Sample size calculation and statistical analysis plan

www.kasl.org 41

→ 분석의 관점 : 그룹간의 차이 / 시점간의 차이/ 룹과 시점의 interaction

그래프의 형태: 분석의 관점과 함께 고려

time time

→ 반복측정요인 분석 (repeated measure one factor(two factor) analysis)

양적자료

- 반복측정일요인분석(repeated measure one factor analysis)

- 반복측정이요인분석(repeated measure two factor analysis)

note) 혼합모형의 이해..

일반적으로 반복측정 요인분석에서는....

반복측정의 더 복잡한 상황은 어떤 경우인가 ??....

ITT/PP

질적자료 ??

: Freedman test(지료의 속성 : 순위척도)

⚂ Correlation analysis

Pearson / Spearman / Partial/ Multiple / Canonical

⚂ Regression analysis

regression model

y=β0+β1x 1+⋯+βkx k+ε

- linear : simple / multiple

- logistic : simple - binary / mutinomial multiple - binary /multinomial

- nonlinear

Page 10: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

제3회 임상연구방법론 워크숍

42 대한간학회

- 종속변수(반응변수)/ 독립변수(설명변수), covariate

- 종속변수 자료의 속성 - 양적, 질적

- optimal variable의 선택 : 상관관계(양적), Chi-square test(질적)

- 가정의 확인 : 자료의 속성 - 양적, 질적

- 최대값과 최소값의 비율?

- 이상점? /오차의 독립성?

- 독립변수간의 관계(다중공선성)

note) optimal variable 선택을 위해서....

>> univariate analysis의 필요함

/ 특히, logistic regression에서...

예를 들어....

어떤 질환유, 무에 영향을 미치는 요인의 파악을 위해서...

>> univariate analysis 실시

>> optimal vairable 선택 : optimal covariate

>> (binary) logistic regression

질환 유 질환 무 p-value

인구통계학적특성

age

sex

....

임상적특성

BMI

TG

LDL

...

- 모델의 유의성 /설명력

변수의 유의성 - 변수선택? : stepwise, forward, backward

- regressison model 제시

- logistic : odds ratio와 더불어 95% confidence interval 제시

Page 11: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

신임희 | Sample size calculation and statistical analysis plan

www.kasl.org 43

⚂ Survival analysis

- Survival function : empirical / Kaplan-Meier / NA. SV...

survival analysis에서의 main focus

- 특정시점에서의 생존률

- 환자의 50%가 생존하는 시간(median survival time)

- 평균 생존 시간(mean survival time)

- 두(세)군의 생존시간 비교

- 예후인자(prognostic factor)

note) censoring의 개념

(loss to follow up / drop out / end study)

survival curve의 형태

time (months, years..)

survival curve의 비교

항상 log-rank test만 이용할 것인가?

→ 두(세)개의 survival curve가 적어도 꼬이지 않았을때

두(세)개의 survival curve가 꼬였을때 ???

survival curve에 영향을 주는 예측인자의 파악

→ Cox's proportional hazard model

exp′

where ⋯

- 예측인자의 설정 : univariate analysis에서 선택함...

Page 12: Sample size calculation and statistical analysis plankasl.org/upload/lecture/201403_b3.pdf · 2015-10-21 · 신임희 | Sample size calculation and statistical analysis plan 35 -

제3회 임상연구방법론 워크숍

44 대한간학회

- 가정의 확인 : proportional? / nonproportional ?

log(-logs(t))의 확인?

- odds ratio? / hazard ratio?

⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂

∴ Plan & Result : Clinically significant + Statistically significant