哈佛大学医学院: 陈常中 2012 年 11 月 mark.chen@empowerstats...

13
哈哈哈哈哈哈哈 哈哈哈 2012 哈 11 哈 [email protected] [email protected] 哈哈哈哈哈哈哈哈哈哈 I 数数 数数数 数数 哈哈哈哈 哈哈哈哈哈哈

Upload: chipo

Post on 14-Jan-2016

223 views

Category:

Documents


1 download

DESCRIPTION

医 学论文 写 作系列 讲座 I 数据统 计分析 思 路 第二部分: 回归分 析基础. 哈佛大学医学院: 陈常中 2012 年 11 月 [email protected] [email protected]. 回归方程 与 t 检验 / 方差分析 / 卡方检验 等. 原来你也能做我的工作,不会抢我的饭碗吧?哈哈!. Y i = β 0 + β 1 * X i + e i. β 0. e i. X = 0. β 1. X = 1. e i. ? β 1 = 0. β 0 + β 1. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

哈佛大学医学院: 陈常中2012 年 11 月

[email protected][email protected]

医学论文写作系列讲座 I

数据统计分析思路

第二部分:回归分析基础

Page 2: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

回归方程 与t 检验 / 方差分析 / 卡方检验

原来你也能做我的工作,不会抢我的饭碗吧?哈哈!

Page 3: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

Yi = β0 + β1 * Xi + ei

X = 0

X = 1

β0

β0 + β1

β1

ei

ei

? β1= 0

Page 4: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

X = 0 , 1

X=1,

Y = β0 + β1 * X

X=0 , Y = β0

Y = β0 + β1

Page 5: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

X = 0 , 1 , 2

X=2 , Y = β0 + β2

I : Y = β0 + β1 * X X=0 , Y = β0

X=1 , Y = β0 + β1

X=2 , Y = β0 + β1*2

II : Y = β0 + β1 * (X=1) + β2 * (X=2)

X=0 , Y = β0

X=1 , Y = β0 + β1

Page 6: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

X6 统计量 β ( 95% CI ) p 值 0 (A) 140 (35%) 0

1 (B) 140 (35%) 2.50 ( 0.07, 4.92) 0.044

2 (C) 120 (30%) 5.26 ( 2.74, 7.79) <0.001

X6 0.95 + 0.81 2.63 ( 1.37, 3.89) <0.001

Y5 = β0 + β1*(X6=1) + β2*(X6=2)

Y5 = β0 + β1*X6

Page 7: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

文献中的回归分析应用

Page 8: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

广义线性回归方程f(Y) = β0 + β1*X1+ β2*X2+ β3*X3+ β4*X4+ ……

Y :收缩压值? f(y)=YY: 是否高血压? f(y)=logit(y)

Page 9: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

三组( X=0 、 1 、 2 )率的比较

X=0 , n00 n01 N0

Y=0 Y=1 合计

X=1 , n10 n11 N1

X=2 , n20 n21 N2

率 (p) 比值

n01/N0 n01/n00

n11/N1 n11/n10

n21/N2 n21/n20

Page 10: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

率与比值率: p = N(y=1) / N(total) 0 - 1

比值: odd = N(y=1) / N(y=0) 0 - ∞

odd = p / (1-p)

logit(Y) = log( p / (1-p) )

两组比值比 : Odds ratio (OR) =( P1/(1-P1) ) / ( P0/(1-P0 ) )

Page 11: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

三组( X=0 、 1 、 2 )率的比较

X=0 , log(P0/(1-P0)) = β0

X=1 , log(P1/(1-P1)) = β0 + β1

X=2 , log(P2/(1-P2)) = β0 + β2

log(P/(1-P)) = β0 + β1*(X=1) + β2*(X=2)

OR(X=1 vs. x=0) = e β1

log( P1/(1-P1) ) - log( P0/(1-P0) ) = β1

log( ( P1/(1-P1) ) / ( P0/(1-P0) ) ) = β1

OR(X=2 vs. x=0) = e β2

Page 12: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

文献中的回归分析应用

Page 13: 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats Changzhong_chen@dfci.harvard

练习读入 regdd.xls

1. 用单因素分析模块分析 X6 与 Y5 关系2. 将 X6 转换成连续性变量 X6.CONT 分析其

余 Y5 的关系3. 将 Y5 转换成 2 分类变量 Y5.P80 ,取最高

的 20% 为 1 ,下面的 80% 为 0 。分析X6 、 X6.CONT 与 Y5.P80 的关系