usmle step 1:頻出統計問題 医学統計 medical …. igakutokei.pdfusmle step...

15
2020-医学統計 Medical Statistics 折笠秀樹 1 医学統計 Medical Statistics 第1回(4/7USMLE Step 1 :頻出統計問題 1. Mean, Median, Standard deviation 2. 2 x 2 Table, FP, FN, TP, TNSensitivity, Specificity & Screening TestsNegative & Positive Predictive Value 3. Incidence, Prevalence and Case-Fatality Rate 4. Bias & ValidityConfounding, Randomization & Blinding 5. Types of Study Design 6. Odds Ratio and Relative RiskNumber Needed to Treat & Absolute Risk Reduction 7. P-Value, Statistical Significance and Types of ErrorConfidence Interval Interpretation 目次 1. 記述統計 2. 検査 3. 罹患率と有病率 4. バイアスと妥当性 5. 研究デザイン 6. 効果の指標 7. 推測統計 8. 検定手法 9. 相関と回帰 10. 統計解析事例 11. 多変量解析 12. 生存時間解析 13. 臨床論文読解 14. 例数設計 15. プロトコール開発 16. JMP統計ソフトの利用 17. 期末試験(英文出題が主で、30分) 4/7 4/14 4/21 4/28 1.記述統計 Descriptive statistics -Mean, Median, Standard Deviation- 名義 順序 連続 離散 数値 文字 中心位置 ばらつき 正規分布 (ガウス分布) 1 2 3 4 5 6

Upload: others

Post on 11-Apr-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

2020-医学統計 Medical Statistics 折笠秀樹

1

医学統計Medical Statistics

第1回(4/7)

USMLE Step 1:頻出統計問題

1. Mean, Median, Standard deviation

2. 2 x 2 Table, FP, FN, TP, TNーSensitivity, Specificity & Screening TestsーNegative & Positive Predictive Value

3. Incidence, Prevalence and Case-Fatality Rate

4. Bias & ValidityーConfounding, Randomization & Blinding

5. Types of Study Design

6. Odds Ratio and Relative RiskーNumber Needed to Treat & Absolute Risk Reduction

7. P-Value, Statistical Significance and Types of ErrorーConfidence Interval Interpretation

目次1. 記述統計2. 検査3. 罹患率と有病率4. バイアスと妥当性

5. 研究デザイン6. 効果の指標7. 推測統計

8. 検定手法9. 相関と回帰10. 統計解析事例11. 多変量解析12. 生存時間解析13. 臨床論文読解

14. 例数設計15. プロトコール開発16. JMP統計ソフトの利用17. 期末試験(英文出題が主で、30分)

4/7

4/14

4/21

4/28

1.記述統計

Descriptive statistics

-Mean, Median, Standard Deviation-

データの尺度

名義

順序

連続 離散

数値

文字

中心位置

ばらつき

正規分布(ガウス分布)

1 2

3 4

5 6

2020-医学統計 Medical Statistics 折笠秀樹

2

7.1 Central tendency

• Distribution 分布

• Central tendency 中心位置

– Mean 平均値

– Median 中央値

– Mode 最頻値

頻度

Survival rate 生存率Median Survival Time 生存時間中央値

[対称な分布]

7.2 Dispersion

• Dispersion 散布度(ばらつき、変動)– Spread 散布度(広がり)

• 指標– Range 範囲 (最大値ー最小値)

– Interquartile Range (IQR) 四分位範囲(75%点ー25%点)

– Standard deviation 標準偏差 s

– Variance 分散(= 標準偏差2 ) s 2

25%点

75%点

最大値

最小値Range範囲

Interquartile range(IQR)四分位範囲

箱ひげ図

箱ひげ図

100.0% 最大値 100

75.0% 四分位点 80

50.0% 中央値 60

25.0% 四分位点 30

0.0% 最小値 0

平均 55.942029

標準偏差 31.451122平均の標準誤差 3.7862701

N 69

統計ソフトーJMP Exhibit

平均(標準偏差)

人数(割合)

数値

文字

集団の特徴は

記述統計

標準偏差

SDとSEの違い

• SD(標準偏差)– 記述統計(→データ変動)のひとつ– 平均±2SDに95%データが入る

→ SD ~ (Max-Min) ÷ 5 で予想できる– SDは標本サイズで変わらない

• SE(標準誤差)– 推測統計(→標本変動)のひとつ

– データの様相を記述するのではなく、母集団の姿を推測するときに用いる

– SEは標本サイズで変わる。サイズが大きいとSE(推定誤差)は小さくなる。

→ 一般化 (標本調査のみ!)

→ 実態報告 (全数調査/標本調査)

~1

𝑛

DescriptiveStatistics(by John Grauntin1663)

InferentialStatisticsby R.A.Fisher

Ronald A. Fisher (1925)Statistical Methods for Research Workers.

集団特徴

仮説結論

7 8

9 10

11 12

2020-医学統計 Medical Statistics 折笠秀樹

3

Standard error of the mean (SEM)

• Standard error of the mean (SEM) 標準誤差

– 平均値など推定値の精度を表す

– 一般には、SE と書く

– SDは、データの散布度を表す

• SEM = 𝒔

𝒏, s=SD, n=sample size

• 平均値±1.96 x SEM =95%信頼区間(漸近)

7.3 Normal Distribution

• Normal Distribution 正規分布–ベル型

–平均値に対称

– 2つのパラメータ(平均値μ、標準偏差σ)

– N(μ, σ2)と書く

• Standard Normal Distribution 標準正規分布–平均値0, 標準偏差1の正規分布

– N(0, 1), または N(0, 12)と書く

標準正規分布 N(0, 1)

99.7%

平均± 3×SD

平均± 2×SD

平均± 1×SD (2/3)

正規分布の特徴

• Bell-shaped

• Symmetry around the mean

• Mean=Median=Mode

• Dispersion (Spread) represented by the SD

• Characterized by two parameters (μ, σ)

→ Q.53 to 56

99.7%

13 14

15 16

17 18

2020-医学統計 Medical Statistics 折笠秀樹

4

7.4 Skewed (Asymmetric) Distribution

• Skewed Distribution 歪んだ分布

• Asymmetric Distribution 非対称分布

二峰性

正方向へ歪んだ

負方向へ歪んだ

分布の形状と歪度(skewness coefficient; γ)

左側に歪んだ 対称 右側に歪んだ(γ=-0.7) (γ=0) (γ=0.7)

→ Q.57

2.検査の精度Performance of the Tests

Diagnostic tests 診断検査

Screening tests 検診

Section 3.1

2x2 Table 2x2表

Screening tests 検診

Diagnostic tests 診断検査

B-False Positive 偽陽性

CーFalse Negative 偽陰性

検査 D+ D-

T+ A B

T- C D

疾病

A True PositiveD True NegativeB False PositiveC False Negative

19 20

21 22

23 24

2020-医学統計 Medical Statistics 折笠秀樹

5

Section 3.3~3.8

• Validity 妥当性

• Accuracy 正確度

A Sensitivity [SE] 感度(鋭敏度)

B Specificity [SP] 特異度

C False-positive rate [FP] 偽陽性

D False-negative rate [FN] 偽陰性

E Accuracy 正確度(一致率)

ほぼ同じ

Valid Invalid (Biased) Valid Invalid (Biased)Imprecise Precise Precise Imprecise

~Validity

つづき

偽陰性率=1-感度

偽陽性率=1-特異度

D+ D-

T+ A B A+B

T- C D C+D

A+C B+D

SE = A/A+C(=1-FN)SP = D/B+D(=1-FP)FN = C/A+CFP = B/B+D

2つのカット点D-

D+

検査値

A B

T+

T-T+

T-

FP

FNSE=0.95SP=0.70

SE=0.60SP=0.95

Fig 3.2

Section 3.9~3.10

• ROC Curve ROC曲線

X Cut-off point カット点

1

10

0 False-Positive(=1 – SP)

True-Positive(=SE)

B

A

検査が数値の場合カット点によってSE,SPが変わる

つづき1

10

0

F

V

Perfect

By Chance

Area Under Carve(AUC)曲線下面積

False-Positive(=1 – SP)

True-Positive(=SE)

25 26

27 28

29 30

2020-医学統計 Medical Statistics 折笠秀樹

6

つづき

D+ D-

→ T+ A B

→ T- C D

Predictive Value 的中率

T→D 的中率D→T 検査精度(SE/SP/FN/FP)

PPV=A/(A+B)

NPV=D/(C+D)

Section 3.11~3.13

• 疾病から検査(検査精度) SE,SP,FN,FP

– Pr (T | D)

• 検査から疾病(疾病予測) PPV, NPV

– Pr (D | T)

A. Positive Predictive Value (PPV) 陽性的中率 Pr (D+ | T+)

B. Negative Predictive Value (NPV) 陰性的中率 Pr (D- | T-)

SE = Pr (T+|D+)SP = Pr (T-|D-)

Section 3.2

Reliability 信頼性~再現性 Reproducibility

Precision 精(確)度

Random variability 偶然変動 Reliability

~Random error 偶然誤差 信頼性

Systematic error 系統誤差 妥当性Validity

正確性Accuracy

つづき

精(確)度 低い 高い 高い

Precision

正確度Accuracy

高い 高い 低い

× ××

再現性

• 1回目と2回目が一致すること

• Agreement 一致性

• 連続データ

– Intra-class correlation (ICC) 級内相関(係数)

• 文字(カテゴリー)データ

– Cohen’s kappa coefficient カッパ係数

Y=X

r=0.73

ICC=0.77

r 相関係数(関連性)

ICC 級内相関係数(一致性)

31 32

33 34

35 36

2020-医学統計 Medical Statistics 折笠秀樹

7

Section 3.14

• PPV, NPVはPrevalence有病率に依存する

–検査の精度を見る指標としては好ましくない

• Prevalenceが高い(病院など)→ PPVNPV

• Prevalenceが低い(検診など)→ PPVNPV

Q12

The extent to which a test measures what it was originally designed to measure is described as

(A)Sensitivity(B)Specificity(C)Validity(D)Reliability(E)True-positive value

Page 17.

(A) Validity(B) Systematic error (not systemic!!)(C) Reliability(D) Random error(E) Precision

→ Q13 to Q18

まとめ

• Validity 正当性(正確度、妥当性) 的を得ていること~Accuracy 正確度

• Systematic error 系統誤差 的から外れている ~Low Validity

• Precision 精度 偶然誤差が小さいこと 的の周りに固まっているかばらばらか

• Random error 偶然誤差 ~Low Precision

• Reliability 信頼性 何度測っても同様の値になること~Reproducibility 再現性、Dependability 従属性、Agreement 一致性、Consistency 一貫性

Page 17.

(A) Validity(B) Systematic error (not systemic!!)(C) Reliability(D) Random error(E) Precision

→ Q13 to Q18

E

C

A

C

D

B

Example – Q23 to Q36

A or BQ23. Cutoff point set too lowQ24. --- too highQ25. --- greater sensitivityQ26. --- lesser sensitivityQ27. --- greater specificityQ28. --- lesser specificityQ29. --- greater false positive rateQ30. --- greater false negative rate

Use C,D,E,F,G,H

Q31. True positives for cutoff point XQ32. True positives and false positives for cutoff XQ33. True negatives for cutoff XQ34. True negatives and false negatives for cutoff X

Q35. False positives for cutoff point AQ36. False negatives for cutoff point B

37 38

39 40

41 42

2020-医学統計 Medical Statistics 折笠秀樹

8

Likelihood ratio 尤度比

• 陽性尤度比(+LR)=𝑃(𝑇+|𝐷+)

𝑃(𝑇+|𝐷−)=

𝑆𝐸

1−𝑆𝑃

• 陰性尤度比(-LR)=𝑃(𝑇−|𝐷+)

𝑃(𝑇−|𝐷−)= 1−𝑆𝐸

𝑆𝑃

事前オッズ×陽性尤度比=事後オッズ(確定診断)

事前オッズ×陰性尤度比=事後オッズ(除外診断)

例:インフルエンザの迅速検査

• 検査精度– SE=62%, SP=98% (次頁) →+LR=.62/.02=31, -LR=.38/.98=0.39

• 目の前の方の症状等からIFZの可能性=10%→事前オッズ= 1:9 =1/9

• 確定診断(検査結果=陽性)– 事後オッズ=1/9 x 31 = 31/9)→31/40=80%

• 除外診断(検査結果=陰性)– 事後オッズ=1/9 x 0.39 = 1/27→1/28=3%

+LRは、確定診断に影響(大きいほど良い)-LRは、除外診断に影響(小さいほど良い)

医師国家試験・過去問から(F問題)

43 44

45 46

47 48

2020-医学統計 Medical Statistics 折笠秀樹

9

これらはすべて確定診断

陽性尤度比LR+ = SE/(1-SP)

除外診断

検査結果が陰性になっていること

陰性尤度比LR- = (1-SE)/SP

3.罹患率と有病率

Incidence, Prevalence, Case fatality rate罹患率(発生率)、有病率(罹病率) 、致死率

Morbidity and Mortality罹病率 死亡率

Section 5.1 Incidence Rate

• Incidence Rate 罹患率(発生率、発症率、発現率)– Incidence Rate = # new case / Total # at risk(Proportion割合)– =#new case / Total person-years at risk (Rate率)

• 感染症では1wk単位(週当たり)、慢性疾患では1year単位(年あたり/年率)で提示する– 癌の発生率 1% /年

• 6月中に2,400人が入院し、12人がUTI発現– 12/2400 x 1,000 = 5 per 1,000 patients– もっとLow incidenceでは、 per 100,000で表す

Section 5.2 Prevalence

• Prevalence有病率 あるいは 罹病率

• Incidenceのほうは率Rateであるが、こちらは割合Proportionである

• 6,400人中32人が有病– 32 / 6,400 x 1,000 = 5 per 1,000人

• Low prevalenceのときは、per 100,000人で示す

Summary

• Incidence(罹患率、発生率)

– これはRate(率)であり、時間概念を伴う

–薬疹の罹患率は、年間10万人に3人発生する

• Prevalence(有病率、罹病率)

– これはProportion(割合)である

– 50歳以上の成人における糖尿病の有病率はおよそ20%、5人に1人と言われている

49 50

51 52

53 54

2020-医学統計 Medical Statistics 折笠秀樹

10

割合 122/4907(Proportion) (2.49%)

率 122/1354.0(Rate) (9.01% per year)

5.3 PrevalenceとIncidenceの関係

• Prevalence (P) = Incidence (I) x Duration (D)

• 感染症のようにDurationが短いと、いくらIncidenceが高くても、年間を通じて感染者数は少ない

• 慢性疾患のようにDurationが長いと、いくらIncidenceが低くても、どんどん増えていくため有病者数は多い

55 56

57 58

59 60

2020-医学統計 Medical Statistics 折笠秀樹

11

5.4 Person-years

• Person-years 人年

–人数と観察年数を加味した情報単位

• 1人を0.5年観察 →0.5人年

– 100人を0.5年観察 →50人年

• 別の100人を1年観察 →100人年

–合計して、150人年の観察データが存在

→ Q43.

がん死亡率の計算

0.6 人年

0.8 人年

0.7 人年

0.6 人年

0.6 人年

死亡

がん発症

がん発症

がん発症 が

ん発症がん発症

6/301/1 12/311年死亡率=1/5

20%?

1

2

3

4

5

一年内に死亡するかも

総人年=3.3人年1年死亡率=1/3.3

30%?

Example(p.33)

• Cook州の人口は250万人、年間6,000人死亡(1,200白血病, 1,750脳卒中, 250肺炎, 250ホジキン病, 2,500急性心筋梗塞)

• Proportionate mortality rate for leukemia ?

• Annual incidence rate for histiocytosis 発現率• Crude mortality rate for histiocytosis 粗死亡率• Age-specific mortality rate (31-60 yrs) 年齢別死亡率*

• Case fatality rate by age group 致死率

Age Group Cases Deaths Population

1-30 10 5 2,000

31-60 50 30 5,000

61+ 30 20 1,000

Total 90 55 8,000

per 100,000人

(30/5000)x1000=6 per 1000人

Table 5.2

50%, 60%, 66%

生存率

• 生存率(Survival rate)

= 生存者数/集団総数 x 100 %

= (総数ー死亡者数)/総数 x 100 %

• 相対生存率(Relative survival rate)

– 生存率/疾病でない人での生存率

– がん患者の生存率=50%, がんではない人での生存率=80%とすると、がん相対生存率=50/80 x 100=60%→がん患者だとふつうの人の60%しか生きられない

相対生存率>生存率

4年生存率

生存時間中央値

61 62

63 64

65 66

2020-医学統計 Medical Statistics 折笠秀樹

12

死亡率比較のための標準化

年齢層地区ーA 地区ーB 基準地区

人口 死亡率 死者数 人口 死亡率 死者数 人口構成

若年 10,000 1/1,000 10 5,000 1/1,000 5 100,000

中年 10,000 1/500 20 5,000 1/500 10 150,000

高齢 10,000 1/100 100 20,000 1/100 200 200,000

単純死亡率 130/30,000=0.43% 215/30,000=0.72%

30,000人 130人 30,000人 215人 450,000

標準化→基準地区の人口構成を仮定する。

100,000x(1/1,000)+150,000x(1/500)+200,000x(1/100)=100 + 300 + 2,000 = 2,400 死亡期待数

100,000x(1/1,000)+150,000x(1/500)+200,000x(1/100)=100 + 300 + 2,000 = 2,400 死亡期待数

?和 和

年齢調整死亡率

積/100,000 積/100,000

直接比較

比較する2群の年齢別死亡率データが必要

白人炭鉱労働者は一般集団より2.41倍、結核死亡率が高い。

間接比較

不要

基準集団の年齢別死亡率だけでよい。関心集団の年齢別死亡率データは不要だが、年齢別人口分布は必要

標準化死亡率比

間接法

観察集団 基準集団

期待死亡数

年齢 人口 (割合) 死亡数 死亡率(%) 人口 (割合) 死亡率(%)

0~9 1,143 (10.7%) 0.073 0.83

10~19 1,364 (12.8%) 0.038 0.52

20~29 1,355 (12.7%) 0.073 0.99

30~39 1,314 (12.3%) 0.097 1.27

40~49 1,629 (15.3%) 0.244 3.97

50~59 1,399 (13.1%) 0.633 8.86

60~69 1,372 (12.9%) 1.625 22.30

70~79 764 ( 7.2%) 4.063 31.04

80~ 321 ( 3.0%) 12.764 40.97

合計 10,661 (100%) 96 0.90(=96/10661) 0.823 110.76

観察集団の人口 ×基準集団の死亡率/100

観察死亡数=96, 期待死亡数=110.76

→ SMR(標準化死亡率比)=96

110.76x100 = 86.7

年齢調整死亡率は直接計算されない!

既知既知

既知

4.バイアスと妥当性

Bias and Validity

Bias and confounding

• Bias

• 偏りといって、データ収集や解釈の過程で入り込むゴミ(誤った結論に導く)– Selection bias 選択バイアス(Attrition, Health-worker, Response biasなど)

– Information bias 情報バイアス(Lead-time, Recall, Misclassification, Reporting biasなど)

• Confounding bias 交絡バイアス– これだけはデータ収集のさいのバイアスではなく、得られたデータを解釈するときに生じるバイアスである

– 因果に絡む真実の原因があるが、それが虚の原因と強く関連するために生じる

– 薬をたくさん飲む人は早死にするというのは虚の関係であり、薬をたくさん飲む人は高齢者が多いためであり、高齢者が単に早死にするというのが真の関係である

72

67 68

69 70

71 72

2020-医学統計 Medical Statistics 折笠秀樹

13

6.10 Bias(Systematic error)

• Bias バイアス(偏り)– Systematic error 系統誤差 ⇔ 偶然誤差

• Validity 妥当性– Accuracy 正確性

• 3種類– Selection (Sampling) Bias 選択バイアス– Information (Misclassification) Bias 情報バイアス– Confounding Bias 交絡バイアス

Systemic 全身性

BIAS BIAS

選択バイアス

選択バイアス

冬に分娩異常が多かった→ 冬に出産すると危険?

Selection Bias

季節 病院分娩 平均分娩所要時間 分娩異常発生率

夏(4ヶ月) 180 8.0時間 7.8% (14/180)

冬(8ヶ月) 240 10.5時間* 11.7% (28/240)**

アラスカ地方での分娩異常

* P<0.05 **P=0.04

選択バイアス

• Admission rate bias 入院率バイアス– Berkson’s bias– ケースのほうが入院者多く選択される

– ケースとコントロールで入院率が異なり、リスク因子分布も異なる

• Nonresponse bias 非回答バイアス– 非回答データを除外したら選択バイアス

• Lead time bias 先行期間バイアス– 早期診断例が多く入ることにより、生存率が高くなったり、合併症発生率が低くなる

情報バイアス

73 74

75 76

77 78

2020-医学統計 Medical Statistics 折笠秀樹

14

情報バイアス

健康に留意している人100人普通に生活している人100人

健康に留意していると血圧値が低かった→ 信じていいか?

健康に留意している人は 寝る前に 血圧測定普通に生活している人は 起床時に 血圧測定

健康に留意していたから血圧値が低かったわけでなく、単に健康に留意していた人は寝る前に測っていたから低かった。

Information biasMeasurement bias

情報バイアス

• Recall bias 想起バイアス

–過去のことを想起するときに誤る

• Interviewer bias 面接者バイアス

–面接者によって回答を変える

• Unacceptability bias 非受理バイアス

–受け入れられやすい回答をしがちである

解釈バイアス

高地に住む 虚血性心疾患

メキシコ系の人種

交絡バイアス(Confounding)

薬剤 死亡

高齢/病弱

これが死亡の真の原因(交絡因子)

図11.Confounding by indicationの模式図薬剤の適応となるのは高齢者や病弱者であり、それが真の死亡原因なのだが、薬剤があたかも死亡原因のように見られる現象のことである。これは通称、交絡バイアス(Confounding bias)と呼ばれ、選択バイアス(Selection bias)、測定バイアス(Measurement bias)と同様に気をつけたい事項である。

適応(による)バイアス

Sections 6.7~6.9

• Independent variables 独立変数

– 原因、介入、X変数

• Dependent variables 従属変数

– 結果、効果、Y変数

• Confounding variables 交絡変数

– 因果関係を曲げる変数

X Y

Z

咽頭癌

飲酒

喫煙

交絡因子

X→Y因果推論

79 80

81 82

83 84

2020-医学統計 Medical Statistics 折笠秀樹

15

In comparing the deaths of one hospital with those of another,

any statistics are justly considered absolutely valueless

which do not give the ages, the sexes and the diseases of all the cases.

The quote appears on page 59 of her 1859 book "Notes on Nursing: What It Is and What It Is Not".

Florence Nightingale (1820 - 1910)ーBritish nursing pioneer and statistician.

交絡(Confounding)に関する記述

リードタイム(Lead time)

検診で早期に癌が診断された時間の分(リードタイム)だけ、検診発見がん患者の生存時間は見かけ上長いことになる。

スクリーニング(検診)で疾病(癌)が見つかる

症状発現によって疾病(癌)が見つかる

死亡リードタイム(先行期間)

Hill’s criteria of causality

1. Strength 関連の強さ

2. Consistency (Reproducibility) 一貫性(再現性)

3. Specificity 特異性(種なくして実なし)

4. Temporality 前後関係

5. Biological gradient (Dose-response relationship) 用量反応

6. Plausibility (Mechanism) 作用機序

7. Coherence (Epidemiological and laboratory findings) 整合性(疫学データと実験室データの間)

8. Experiment 実験的証拠

9. Analogy 類推(同様の因子で同一結果)

Austin Bradford HillThe Environment and Disease: Association or Causation?,”Proceedings of the Royal Society of Medicine, 58 (1965): 295-300.

因果推論の基準

Randomization

• R.A.Fisherが1926年に提唱

• ランダム化(ランダム割付)と訳す

• 確率を用いて割り当てる方式

• 利点

–比較可能性

–予測不能性

–確率の導入により、P値が計算できる

Blinding

• 盲検化と訳す

• Masking遮蔽化とも言う

• 被験者・医療関係者・アウトカム判定者・データ解析者へ盲検化する

• 情報バイアスが防げる

盲検性

• 非盲検(Unblind, Open-label)

• 単盲検(Single-blind)

–被験者に対して

• 二重盲検(Double-blind)

–被験者、研究者に対して

• 三重盲検(Triple-blind)

–被験者、研究者、効果判定者(あるいはデータ分析者)に対して

85 86

87 88

89 90