实例分析

57
方方方方 1 实实实实 实实实实实实 实实实实实实实实实实 实 实实实实实 统一 60 实 2 实实实 实实实 实实实实实实实实实实实实实实实实实实实实实 实 ,。 9-1 实实实 4 实实实实实实实实实实实实实实实实实实实实实实实实实 实实实实

Upload: sopoline-morrow

Post on 01-Jan-2016

30 views

Category:

Documents


1 download

DESCRIPTION

实例分析. 某医生为研究一种四类降糖新药的疗效,以统一的标准选择 60 名 2 型糖尿病患者,按完全随机设计方案将患者分为三组进行试验。表 9-1 是治疗 4 周后的血糖下降 值。 检验三组受试对象血糖下降值差别有无统计学意义?. 表 9-2 从已知正态总体 N (10,5 2 ) 随机抽取 10 个样本( n i =20 )的结果. 表 9-3 45 次比较中 5 次有统计学意义的结果. 方差分析 An alysis o f va riance(ANOVA). 一个或多个处理因素,多个水平样本均数的比较. 主要内容. 方差分析基本思想 - PowerPoint PPT Presentation

TRANSCRIPT

方差分析 1

实例分析

某医生为研究一种四类降糖新药的疗效,以统一的标准选择 60 名 2 型糖尿病患者,按完全随机设计方案将患者分为三组进行试验。表 9-1 是治疗 4 周后的血糖下降值。

检验三组受试对象血糖下降值差别有无统计学意义?

方差分析 2

表 9-1 治疗 4周的血糖下降值

高剂量组

(i=1)

低剂量组

(i=2)

对照组

(i=3) 合计

5.6 16.3 -0.6 5.6 12.4 7.8

9.5 11.8 5.7 7.0 0.9 6.9

6.0 14.6 12.8 7.9 7.0 1.5

Xij 8.7 4.9 4.1 4.3 3.9 9.4

9.2 8.1 -1.8 6.4 1.6 3.8

5.0 3.8 -0.1 7.0 6.4 7.5

3.5 6.1 6.3 5.4 3.0 8.4

5.8 13.2 12.7 3.1 3.9 12.2

8.0 16.5 9.8 2.2 6.0

15.5 9.2 12.6 1.1

11.8 2.0 2.7

ni 21 19 20 60

iX 9.1952 5.8000 5.4300 6.8650

Si2 17.3605 18.1867 12.3843 18.4176

∑ X 193.0992 110.2000 108.6000 411.9000

方差分析 3

表 9-2 从已知正态总体 N(10,52) 随机抽取 10 个样本( ni=20 )的结果

样本编号 1 2 3 4 5 6 7 8 9 10

12.61 10.85 9.23 9.11 10.90 9.24 9.55 10.28 9.12 8.75

S 4.29 5.44 3.93 6.55 4.83 4.86 3.88 3.89 5.38 4.08

X

方差分析 4

表 9-3 45 次比较中 5 次有统计学意义的结果

比较组 1 与 3 1 与 6 1 与7

1 与9

1 与 10

t 2.601 2.329 2.372 2.272 2.918

P 0.013 0.025 0.023 0.029 0.006

方差分析 5

方差分析Analysis of variance(ANOVA)

一个或多个处理因素,多个水平样本均数的比较

方差分析 6

主要内容

方差分析基本思想 完全随机设计资料的方差分析 随机区组设计资料的方差分析 析因设计资料的方差分析 多个样本均数间的两两比较

方差分析 7

有关方差分析的几个符号

离均差 离均差平方和 SS

方差( 2 S2 );均方( MS ) 自由度: 关系: MS= SS/

方差分析 8

一、方差分析的基本思想

就是把全部观察值间的变异——总变异按设计和需要分解成两个或多个组成部分,再作分析。变异的大小用方差来衡量,只不过将方差的分子离均差平方和及分母自由度分开,分别考虑。

方差分析 9

该资料有三个不同的组别,称为 3 个处理组,目的是检验三组样本均数( )所代表的

总体均数( μ1 , μ2 , μ3 )之差异有无统计

学意义。

321 ,, XXX

分析:

方差分析 10

全部资料中存在哪些变异?用什么指标反映

资料的变异?

------- 离均差平方和之均数为方差。

------- 离均差平方和 SS 反映各类变异。

方差分析 11

三个处理组中,各个观察值之间及各观察值与总体均数之间不完全相同,存在变异,称为总变异。

ν 总 =N-1

(一)变异的分解

1. 总变异 (total variation)

N

XC

N

XXXXSS

2

222

)(

)()(总

方差分析 12

2. 组间变异 (variation between groups)

各处理组间的样本均数 ( )

各不相等,与总均数也不同,它们之间的离散程度称为组间变异。

kXXXX ,...,, 321

1)(

)()()(

1

2

2

1

22

1

kCn

X

N

X

n

XXXnSS

k

i i

ij

k

i

k

i i

ij

ii

组间

组间

   ,

方差分析 13

MS 组间 =SS 组间 / ν 组间

组间均方反映的是处理因素的作用,同时

也包括了随机误差。

方差分析 14

3. 组内变异 (variation within groups)

每一个处理组内各数据大小各不相同,此变异异称为组内变异。

2

1 1

)(

k

i

n

j

i

iij XXSS组内

ν 组内 = ( n1-1 ) + ( n2-1 ) + ( n3-1 ) +….+ ( n

k-1 )

=N-k

方差分析 15

MS 组内 =SS 组内 /ν 组内

组内变异反映了观察值的随机误差,包括个

体变异和随机测量误差。

方差分析 16

4. 三种变异的关系

SS 总 =SS 组间 +SS 组内

ν 总 =ν 组间 +ν 组内

方差分析 17

分析:若各样本所代表的未知总体相同,即处

理因素不起作用,那么组间变异和组内变异均

由抽样误差所致,则 MS 组间 /MS 组内≈ 1 。

方差分析 18

若处理因素起作用,则组间变异应较大,那么:

MS 组间 /MS 组内将明显大于 1 。

当 F= MS 组间 /MS 组内大于一定的界值时,可

以下结论认为处理因素起作用。

方差分析 19

此检验就是方差分析,也称 F 检验,检

验统计量为 F 值服从自由度 ν 组间 =k-1,ν

组内 =N-k 的 F 分布。

方差分析 20

ANOVA 由英国统计学家 R.A.Fisher 创立,为纪念 Fisher ,以 F

命名,故方差分析又称 F 检验 ( F tes

t )。用于推断多个总体均数有无差异 。

方差分析 21

(二)统计量 F 的计算及其意义

F=MS 组间 /MS 组内

自由度: 组间 = 组数 - 1

组内 = N - 组数

通过公式计算出统计量 F ,查表求出对应的P 值,与进行比较,以确定是否为小概率事件。

方差分析 22

根据检验水准 α ,查 F 界值表:

当 F≥F α(ν1, ν2) , P≤ α, 拒绝 H0 ,接受 H1 ,认为

总体均数间有差别。

F < F α(ν1, ν2 ) , P > α ,没有理由拒绝,还不

能认为各组总体均数的差别有统计学意义。

注意:方差分析是单侧检验。

方差分析 23

方差分析表

变异来源  SS ν   MS F P

组间   k-1 SS 组间 / ν 组间

组内  SS 总 -SS 组间  N-k    SS 组内 / ν 组内

总        N-1         

Cn

Xk

i i

1

2)(

CX 2

方差分析 24

方差分析的基本思想

将总变异分解成至少 2 部分

总自由度分解成与总变异相同数量的部分

比较不同变异的均方

F 分布,统计学检验

方差分析 25

方差分析的基本思想:

根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用加以解释,如各组均数间的变异 SS 组间可由处理因素的作用加以解释,通

过比较不同变异来源的均方,借助 F 分布做出统计推断,从而了解该因素对观测指标有无影响。

方差分析 26

(三)方差分析的应用条件

各观察值相互独立

各组观察值 X 均服从正态分布

各总体方差相等(齐性)

方差分析 27

只有 1 个研究因素,但该因素至少有 2 个以

上的水平。根据随机化原则将受试对象随

机分配到一个研究因素的多个水平中去,

然后观察效应,比较各水平组的效应是否

不同。

二、 完全随机设计资料的方差分析

方差分析 28

检验步骤:1.建立假设,确定检验水准H0 :三个总体均数全相等,即 μ1=μ2=μ3

H1 :三个总体均数不全相等。

α=0.05

2. 计算检验统计量∑X2

ij =3914.33 ,∑ Xij=411.9 , C= 2827.6935

4438.3004)(

1

2

k

i i

ij

n

X

方差分析 29

方差分析表变异来源 SS ν MS F

组间 176.7612 2 88.3806 5.537

组内 909.8723 57 15.9627

总 1086.6335 49

方差分析 30

3. 确定 P 值,做出推断结论。

F0.05(2,60) =3.15 , F> F0.05(2,60), P<0.05 。按 α 水准

拒绝 H0 ,接受 H1 ,差别有统计学意义。可认

为 2 型糖尿病患者治疗 4 周,其餐后 2 小时血糖

的总体平均水平不全相同。

方差分析 31

三、随机区组设计资料的方差分析

例 9-2 为探索丹参对肢体缺血再灌注损的影

响,将 30 只纯种新西兰实验用大白兔,按窝

别相同、体重相近划分为 10 个区组。每个区

组 3 只大白兔随机采用 A 、 B 、 C 三种处理方

案,结果如表 9-6 所示,问 A 、 B 两种方案分

别与 C 方案的处理效果是否不同。

方差分析 32

表 9-6 A、B、C三种方案处理后大白兔血中白蛋白减少量(g/L)

区组 A方案

丹参 2ml/kg

B方案

丹参 1ml/kg

C方案

生理盐水 nj jX ∑ X

1 2.21 2.91 4.25 3 3.1233 9.3699

2 2.32 2.64 4.56 3 3.1733 9.5199

3 3.15 3.67 4.33 3 3.7167 11.1501

4 1.86 3.29 3.89 3 3.0133 9.0399

5 2.56 2.45 3.78 3 2.9300 8.7900

6 1.98 2.74 4.62 3 3.1133 9.3399

7 2.37 3.15 4.71 3 3.4100 10.2300

8 2.88 3.44 3.56 3 3.2933 9.8799

9 3.05 2.61 3.77 3 3.1433 9.4299

10 3.42 2.86 4.23 3 3.5033 10.5099

ni 10 10 10 30

iX 2.5800 2.9760 4.1700 3.2420

∑ X 25.8000 29.7600 41.7000 32.4200

∑ X2 69.0328 89.9886 175.3334 334.3548

方差分析 33

(一)离均差平方和与自由度的分解

SS 总

SS 误差

误差

SS 区组

区组

SS 处理

处理

方差分析 34

)1/(

1

)(1

)(1

2

1

2

bSSMS

b

CXk

XXnSSn

j

k

iij

jjj

区组区组

区组

区组

方差分析 35

SS 总 = SS 处理 + SS 区组 + SS 误差

总 = 处理 + 区组 + 误差

变异之间的关系:

方差分析 36

(二)方差分析的基本步骤

1.建立检验假设,确定检验水准对于处理组:H0 :三个总体均数相等,H1 :三个总体均数不全相等。对于区组:H0 :十个总体均数相等,H1 :十个总体均数不全相等。α=0.05

方差分析 37

2. 计算检验统计量

表 9-7 方差分析表

变异来源 SS df MS F P

处理组 13.7018 2 6.8509 32.639 <0.01

区组 1.5577 9 0.1731 0.825 >0.05

误差 3.7790 18 0.2099

总 19.0385 29

方差分析 38

3. 确定 P 值,做出推断结论。对处理,按 α=0.05 水准,拒绝 H0 ,接受 H1 ,

有统计学意义。可以认为 A 、 B 、 C 三种方案的处理效果不全相同,即三个总体均数不全相同。对区组,按 α=0.05 水准,不拒绝 H0 ,无

统计学意义。还不能认为十个区组的总体均数不全相同。

方差分析 39

存在的问题

方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。

解决方案:多个样本均数间的两两比较。

方差分析 40

四、多个样本均数间的两两比较

若要说明多个总体均数中哪些总体均

数不等,需进一步作两两比较。

方差分析 41

(一) SNK法

属多重极差检验,其检验统计量为 q ,

故又称 q 检验。

例 9-5 对例 9-1 资料中治疗 4 周后,血糖下

降值的三组均数进行两两比较。

组别 高剂量组 低剂量组 对照组9.1952 5.8000 5.4300

组次 1 2 3

iX

方差分析 42

1.建立检验假设,确定检验水准

H0: μA=μB ,任两个对比组的总体均数相等

H1 : μA≠μB ,任两个对比组的总体均数不等

α=0.05

2. 计算检验统计量:首先将三个样本均数由大到

小排列,并编组次。

方差分析 43

误差

误差 )(

BA

BA

nn

MS

XXq

112

计算统计量 q 的公式

方差分析 44

表 9-18 例 9-1 的 SNK 检验表

A 与 B q 组间跨度a

q0.05 界值 P

1 与 3 4.266 3 3.40 <0.05

1 与 2 3.796 2 2.83 <0.05

2 与 3 0.409 2 2.83 >0.05

方差分析 45

3. 确定 P 值,做出推断结论:由表可以看出,按 α=0.05 水准, 1 与 3 及 1 与 2 对比

组拒绝 H0 ,接受 H1 ,有统计学意义。 2

与 3 对比组不拒绝 H0 ,无统计学意义。因

此,可以认为血糖下降值的总体平均水平在高剂量组与对照组、高剂量组与低剂量组不同。

方差分析 46

(二) Dunnett法

Dunnett法检验统计量为 t ,故称 Dunnett

-t 检验。适用于 k-1 个实验组与对照组均数的比较。

例 9-6 对例 9-2 资料,问 A 方案、 B 方案分别与 C 方案的总体均数是否不同?

方差分析 47

1.建立检验假设,确定检验水准

H0: μT=μC ,任一实验组与对照组的总体均数相等

H1 : μT≠μC ,任一实验组与对照组的总体均数不等

α=0.05

2. 计算检验统计量

误差

误差 )(

CT

CTD

nnMS

XXt

11

方差分析 48

表 9-19 例 9-2 的 Dunnett-t 检验表

T 与 C tD P

A 与 C -7.760 <0.05

B 与 C -5.827 <0.05

3. 确定 P 值,做出推断结论: ν 误差 =18 , a=2

( 实验组数), α=0.05 ,查 Dunnett-t 界值表, tD=2.40 。按 α 水准, A与 C、 B与 C 拒绝 H0 ,

接受 H1 ,有统计学意义。可以认为 A 方案与 C

方案、 B 方案与 C 方案血中白蛋白的减少量不同。

方差分析 49

(三) Bonfferoni法例 9-7 对例 9-1 资料中治疗 4 周后,血糖下降值的三组均数进行两两比较。1.建立检验假设,确定检验水准H0: μA=μB ,任两个对比组的总体均数相等H1 : μA≠μB ,任两个对比组的总体均数不等α′= α /m=2α/k(k-1)= 0.0167

2. 计算检验统计量

方差分析 50

误差

误差 )(

BA

BA

nnMS

XXt

11

计算统计量 t 的公式

方差分析 51

表 9-20 例 9-1 的 Bonfferoni t 检验表

A 与 B t P

1 与 3 3.016 0.002~0.005

1 与 2 2.684 0.005~0.01

2 与 3 0289 >0.50

方差分析 52

3. 确定 P 值,做出推断结论:由表可以看出,按 α′=0.0167 水准, 1 与 3 及 1 与 2 对

比组拒绝 H0 ,接受 H1 ,有统计学意义。

2 与 3 对比组不拒绝 H0 ,无统计学意义。

因此,可以认为血糖下降值的总体平均水平在高剂量组与对照组、高剂量组与低剂量组不同。

方差分析 53

五、析因设计资料的方差分析

将两个或多个实验因素的各水平进行组合,对各

种可能的组合都进行实验,从而探讨各实验因素

的主效应 (main effect) 以及各因素间的交互作用

( interaction) 。

方差分析 54

表 9-10 析因设计资料整理格式

B 因素A 因素

1 2

1 a1b1 a2b1

2 a1b2 a2b2

方差分析 55

SS 总 =SSA+SSB+SSAB+SS 误差

ν 总 =νA+νB+νAB+ν 误差

方差分析 56

六、重复测量资料的方差分析

同一受试对象的同一观察指标在不同时间点

上进行多次测量所得的资料,常用来分析该

观察指标在不同时间点上的变化特点。

方差分析 57

与随机区组设计资料的区别:

(1) 同一受试对象的数据高度相关;

(2) 处理因素在受试对象间随机分配,但受试

对象的时间点是固定的,不能随机分配。