第九章方差分析

第九章方差分析

讲授内容方差分析的基本思想及应用条件

完全随机设计资料的方差分析随机区组设计资料的方差分析

重复测量资料的方差分析多个样本均数间的多重比较

基本思想及应用条件

1 、基本思想：根据资料设计的类型及研究目的，可将总变异分解为两个或多个部分，每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差，即可了解该因素对测定结果有无影响。

2 、应用条件：1 ）各样本是相互独立的随机

样本2 ）各样本来自正态总体3 ）各处理组总体方差相等，

即方差齐

基本思想及应用条件

完全随机设计资料的方差分析

一、完全随机设计完全随机设计： (completely random d

esign) 是采用完全随机化的分组方法，将全部试验对象分配到 g 个处理组（水平组），各组分别接受不同的处理，试验结束后比较各组均数之间的差别有无统计学意义，推论处理因素的效应。


例 1 某医生为研究一种四类降糖新药的疗效，以统一的纳入标准和排除标准选择了 60 名 2 型糖尿病患者，按完全随机设计方案将患者分为三组进行双盲临床试验。其中，降糖新药高剂量组 21 人、低剂量组 19 人、对照组 20 人。对照组服用公认的降糖药物，治疗 4 周后测得其餐后 2 小时血糖的下降值 (mmol/L) ，结果如表 9-1 所示。问治疗 4 周后，餐后 2 小时血糖下降值的三组总体平均水平是否不同？


分组方法：先将 60 名糖尿病患者从 1 开始到 60 编号；从随机数字表（附表 15 ）中的任一行任一列开始，依次读取三位数作为一个随机数录于编号下；然后将全部随机数从小到大编序号 ( 数据相同的按先后顺序编序号 ) ，将每个随机数对应的序号记录；规定序号 1-21 为甲组，序号 22-40 为乙组，序号 41-60 为丙组。


二、变异分类与表达

表 4-1 g个处理组的试验结果

处理分组测量值统计量

1水平 X11 X12 … X1j … 1nX1

n1 1X S1

2水平 X21 X22 … X2j … 2nX2

n2 2X S2

…

…

…

…

…

…

…

…

…

…

g水平 Xg1 Xg2 … Xgj … ggnX ng gX Sg


完全随机设计资料在进行统计分析时，需根据数据的分布特征选择方法，对于正态分布且方差齐同的资料，常采用完全随机设计的单因素方差分析 (one-way ANOVA) 或成组资料的 t 检验（ g=2 ）；对于非正态分布或方差不齐的资料，可进行数据变换或采用 Wilcoxon秩和检验。



记总均数为，

各处理组均数为，

总例数为 N＝ nl+n2+…+ng ， g 为处理组数。

1 1

/ing

iji j

X X N

1

/in

i ij ij

X X n



1. 总变异 60 名 2 型糖尿病患者的餐后 2 小时血糖 Xij 大小各不相同，与它们的总均数(overall mean) 也不相同，这种变异称为总变异 (total variation) 。该变异既包含了随机误差 ( 即 2 型糖尿病患者的个体差异和测量误差 ) ，又包含了三组用药即处理的不同，其大小用所有数据 (N=60) 的方差即均方 MS(mean square) 来表示。



1．总变异全部测量值大小不同，这种变异称为总变异。

总变异的大小可以用离均差平方和 (sum of squares of deviations from mean ，SS) 表示，即各测量值 Xij与总均数差值的平方和，记为 SS 总。

总变异 SS 总反映了所有测量值之间总的变异程度



2 2

1 1 1 1

i in ng g

ij iji j i j

SS X X X C

总 2 2

1 1 1 1

i in ng g

ij iji j i j

SS X X X C

总

2

1 1

( ) /ing

iji j

C X N

2

1 1

( ) /ing

iji j

C X N

1N 总 1N 总



2．组内变异在同一处理组中，虽然每个受试对象接受的处理相同，但测量值仍各不相同，各组内 2 型糖尿病患者的餐后 2 小时血糖 Xij大小各不相同，与本组的样本均数也不相同，这种变异称为组内变异（误差）。组内变异可用组内各测量值 Xij与其所在组的均数的差值的平方和表示，记为 SS 组内 , 表示随机误差 (含个体差异和测量误差 ) 的影响。又称误差变异



2

1 1

( )ing

ij ii j

SS X X

组内2

1 1

( )ing

ij ii j

SS X X

组内

N g 组内N g 组内



3．组间变异各处理组由于接受处理的水平不同，各组的样本均数 (i＝ 1 ， 2 ，…， g)也大小不等，三组 2 型糖尿病患者餐后 2 小时血糖的样本均数各不相同，它与总均数也不相同，这种变异称为组间变异。

其大小可用各组均数与总均数的离均差平方和表示，记为 SS 组间，它反映了三组用药不同的影响 ( 如处理确实有作用 ) ，同时也包括了随机误差



2

12

1 1

( )

( )

in

ijj

g g

i ii i i

X

SS n X X Cn

组间

2

12

1 1

( )

( )

in

ijj

g g

i ii i i

X

SS n X X Cn

组间

1g 组间1g 组间



各组均数之间相差越悬殊，它们与总均数的差值越大， SS 组间就越大 ,反之 SS组间越小。 SS 组间反映了各间的变异程度。

存在组间变异的原因有：①随机误差 (包括个体变异和测量误差 )②处理的不同水平可能对试验结果的影响。



基本思想：

SS SS SS 总组间组内SS SS SS 总组间组内

总组间组内总组间组内



变异程度除与离均差平方和的大小有关外，还与其自由度有关，将各部分离均差平方和除以相应自由度，其比值称为均方差，简称均方 (mean square ，MS) 。

SSMS

组间

组间组间

SSMS

组间

组间组间

SSMS

组内

组内组内

SSMS

组内

组内组内



如果各组样本的总体均数相等（ H0 ：…），即各处理组的样本来自相同总体，无处理因素的作用（处理效应），则组间变异同组内变异一样，只反映随机误差作用的大小。组间均方与组内均方的比值称为 F统计量

MSF

MS 组间

组内

MSF

MS 组间

组内1 组间1 组间 2 组内2 组内



MSF

MS 组间

组内

MSF

MS 组间

组内误差误差处理

组内变异组间变异

误差误差处理

组内变异组间变异



F值（ Fisher ）接近于 l ，就没有理由拒绝H0 ；反之， F值越大，拒绝H0 的理由越充分。数理统计的理论证明，当H0

成立时， F统计量服从 F分布。 F分布有两个自由度，分子自由度为 1 ，分母自由度为 2 ，记为 F~ 。 1 2,F



由F界值表（附表3），可查出按水准（一般取=0.05）F分布的单尾界值1 2( , )F ，作

为判断统计量F大小的标准。若根据试验结果计算的F值偏大，如1 20.05( , )F F 时，则

0.05P ，拒绝H0，接受H1： i不全相等(i＝1，2 …，，g)，说明各样本来自不同总体，

即认为各样本的总体均数不等。反之，当 F<1 20.05( , )F 时，P>0.05，则不拒绝 H0，还不

能下各样本的总体均数不等的结论。

由F界值表（附表3），可查出按水准（一般取=0.05）F分布的单尾界值1 2( , )F ，作

为判断统计量F大小的标准。若根据试验结果计算的F值偏大，如1 20.05( , )F F 时，则

0.05P ，拒绝H0，接受H1： i不全相等(i＝1，2 …，，g)，说明各样本来自不同总体，

即认为各样本的总体均数不等。反之，当 F<1 20.05( , )F 时，P>0.05，则不拒绝 H0，还不

能下各样本的总体均数不等的结论。



通过上述变异的分解，可以看出，方差分析的基本思想就是根据试验设计的类型，将全部测量值总的离均差平方和及其自由度分解为两个或多个部分，除随机误差作用外，每个部分的变异可由某个因素的作用 ( 或某几个因素的交互作用 )加以解释，如组间变异 SS 组间可由处理因素的作用加以解释。通过比较不同变异来源的均方，借助 F分布做出统计推断，从而推论各种研究因素对试验结果有无影响。



应用条件：1 ）各样本是相互独立的随机

样本2 ）各样本来自正态总体3 ）各处理组总体方差相等，

即方差齐



分析步骤 (1)建立检验假设，确定检验水准 H0 ：三个总体均数全相等，即 μ1=μ2=μ3 H1 ：三个总体均数不全相等，亦即至少有两

个总体均数不等。即 μ1≠μ2≠μ3 或 μ1=μ2≠μ3 或 μ1=μ3≠μ2 或 μ2=μ3≠μ1

α=0.05


完全随机设计资料的方差分析完全随机设计资料的方差分析

(2) 计算检验统计量可根据下表的公式和前面表 9-1 下

半部分数据来计算。也可用统计软件包如 SAS 或 SPSS 等进行计算，直接获得表 9-4 的方差分析表。

(2) 计算检验统计量可根据下表的公式和前面表 9-1 下

半部分数据来计算。也可用统计软件包如 SAS 或 SPSS 等进行计算，直接获得表 9-4 的方差分析表。


本例的资料是按完全随机设计方法获得的试验结果 , 可将总变异分解成组间变异和组内变异 , 并列方差分析表 .

表完全随机设计资料的方差分析表变异来源自由度 SS MS F

总变异 N－1 2

1 1

ing

iji j

X C

组间 g－1 2

1

1

( )i

n

ijj

g

i i

X

Cn

SS

组间

组间

MS

MS组间

组内

组内 N－g SS SS总组间 SS

组内

组内

表完全随机设计资料的方差分析表变异来源自由度 SS MS F

总变异 N－1 2

1 1

ing

iji j

X C

组间 g－1 2

1

1

( )i

n

ijj

g

i i

X

Cn

SS

组间

组间

MS

MS组间

组内

组内 N－g SS SS总组间 SS

组内

组内


完全随机设计资料的方差分析按表中的公式计算各离均差平方和 SS 、自

由度、均方 MS 和 F 值。


表 9-4 例 9-1的方差分析表变异来源 df SS MS F P 总变异 59 1086.63 组间 2 176.76 88.38 5.537 <0.01

组内（误差） 57 909.87 15.96

表 9-4 例 9-1的方差分析表变异来源 df SS MS F P 总变异 59 1086.63 组间 2 176.76 88.38 5.537 <0.01

组内（误差） 57 909.87 15.96


(3)确定 P值，作出推断结论以求 F 值时分子的自由度 ν1=ν 组间、分母的自

由度 ν2=ν 组内查附表 3 的 F 界值表得 P 值。若F≥Fα(ν1, ν2) ，则 P≤α ，按 α 水准，拒绝 H0 ，接受 H1 ，有统计学意义。

本例： ν1=3−1=2 ， ν2=60−3=57 。因附表 3 中ν2 无 57 ，故取最接近者 ν2=60, 得 P<0.01 。按α=0.05 水准，拒绝 H0 ，接受 H1 ，有统计学意义。可以认为 2 型糖尿病患者经药物 ( 新药和标准药物 ) 治疗 4 周，其餐后 2 小时血糖的总体平均水平不全相同，即三个总体均数中至少有两个不同。



注意：方差分析的结果若拒绝H0 ，接受H1 ，不能说明各组总体均数两两间都有差别。如果要分析哪些两组间有差别，要进行多个均数间的多重比较（见本章第六节）。当 g=2 时，方差分析的结果与两样本均数比较的 t 检验等价，有。t F


随机区组设计资料的方差分析

随机区组设计随机区组设计 (randomized block desi

gn)又称为配伍组设计，是配对设计的扩展。具体做法是：先按影响试验结果的非处理因素（如性别、体重、年龄、职业、病情、病程等）将受试对象配成区组 (block) ，再分别将各区组内的受试对象随机分配到各处理或对照组。

随机区组设计资料的方差分析与完全随机设计相比，随机区组设计的特点是

随机分配的次数要重复多次，每次随机分配都对同一个区组内的受试对象进行，且各个处理组受试对象数量相同，区组内均衡。在进行统计分析时，将区组变异离均差平方和从完全随机设计的组内离均差平和中分离出来，从而减小组内平方和（误差平方和），提高了统计检验效率。若将区组作为另一处理因素的不同水平，随机区组设计等同于无重复观察的两因素设计。



例 9-2 为探索丹参对肢体缺血再灌注损伤的影响，将 30只纯种新西兰实验用大白兔，按窝别相同、体重相近划分为 10 个区组。每个区组 3只大白兔随机采用 A、 B、 C三种处理方案，即在松止血带前分别给予丹参 2ml/kg 、丹参 1ml/kg 、生理盐水 2ml/kg ，在松止血带前及松后 1 小时分别测定血中白蛋白含量 (g/L) ，算出白蛋白减少量如下表 9-6 所示，问A、 B两方案分别与 C方案的处理效果是否不同？


方法 : 先将小白鼠的体重从轻到重编号，体重相近的 3只小白鼠配成一个区组，共 10 个区组。在随机数字表（附表 15 ）中任选一行一列开始的 2 位数作为 1个随机数；在每个区组内将随机数按大小排序；各区组中内序号为 1 的接受 A方案、序号为 2 的接受 B 方案、序号为3 的接受 C 方案 .



符合随机区组设计的资料在进行数据统计分析时也需根据数据的分布特征选择方法，对于正态分布且方差齐同的资料，应采用两因素方差分析 (two-way ANOVA) 或配对 t检验（ g=2 ）。当不满足方差分析和 t检验条件时，可对数据进行变换或采用随机区组设计资料的 Friedman M检验。



变异分解为说明随机区组设计方差分析的变异

分解和计算分析过程，将按随机区组设计的试验结果用符号表示整理成表。将第 j (j ＝ 1 ， 2 ，…， n) 区组的受试对象随机分配接受处理因素第 i(i＝ 1 ， 2 ，…， g) 水平的处理，试验结果用 Xij表示，整理成表 4-7 形式。


随机区组设计资料的方差分析表随机区组设计的试验结果

处理因素(g个水平) 区组编号 1 2 3 … g

1 X11 X21 X31 … Xg1

2 X12 X22 X32 … Xg2

…

…

…

…

…

…

j X1j X2j X3j … Xgj

…

…

…

…

…

…

n 1nX 2nX 3nX … gnX

表随机区组设计的试验结果

处理因素(g个水平) 区组编号 1 2 3 … g

1 X11 X21 X31 … Xg1

2 X12 X22 X32 … Xg2

…

…

…

…

…

…

j X1j X2j X3j … Xgj

…

…

…

…

…

…

n 1nX 2nX 3nX … gnX

记总均数为 /ijX X N ，各处理组均数为

1

/n

i ijj

X X n

，各区组均数为

1

/g

j iji

X X g

，总例数为N＝n×g，n为区组数，g为处理组数。试验数据有四个不同的变

异：

记总均数为 /ijX X N ，各处理组均数为1

/n

i ijj

X X n

，各区组均数为

1

/g

j iji

X X g

，总例数为N＝n×g，n为区组数，g为处理组数。试验数据有四个不同的变

异：


随机区组设计资料的方差分析(1) 总变异 SS 总：反映所有观察值之间的变异，计算见

公式（ 4-1 ）。(2) 处理间变异：由处理因素的不同水平作用和随机误

差产生的变异，记为 SS 处理，计算见公式（ 4-2 ）。（ 3) 区组间变异：由不同区组作用和随机误差产生的

变异，记为 SS 区组，计算公式为2

2

1 1 1

1( ) ( )

gn n

j ijj j i

SS g X X X Cg

区组

22

1 1 1

1( ) ( )

gn n

j ijj j i

SS g X X X Cg

区组



(4) 误差变异：完全由随机误差产生的变异，记为 SS 误差。

SS SS SS SS 处理区组总误差SS SS SS SS 处理区组总误差

处理总区组误差处理总区组误差因此，SS 误差的计算公式为

SS SS SS SS 处理区组误差总SS SS SS SS 处理区组误差总



表 9-8 随机区组设计资料的方差分析表变异来源

自由度 SS MS F

总变异 N－1 2

1 1

g n

iji j

X C

处理间 g－1 2

1 1

1( )

g n

iji jn

X C

SS

处理

处理

MS

MS处理

误差

区组间 n－1 2

1 1

1( )

gn

ijj ig

X C

SS

区组

区组

MS

MS区组

误差

误差（n－1）（g－

1） SS 总－ SS 处理-－SS 区组

SS

误差

误差

表 9-8 随机区组设计资料的方差分析表变异来源

自由度 SS MS F

总变异 N－1 2

1 1

g n

iji j

X C

处理间 g－1 2

1 1

1( )

g n

iji jn

X C

SS

处理

处理

MS

MS处理

误差

区组间 n－1 2

1 1

1( )

gn

ijj ig

X C

SS

区组

区组

MS

MS区组

误差

误差（n－1）（g－

1） SS 总－ SS 处理-－SS 区组

SS

误差

误差


随机区组设计资料的方差分析分析步骤

(1)建立检验假设，确定检验水准对于处理组，H0 ：三个总体均数全相等，即 A、 B、 C三种方案的

效果相同H1 ：三个总体均数不全相等，即 A、 B、 C三种方案

的效果不全相同对于区组，H0 ：十个总体均数全相等H1 ：十个总体均数不全相等均取 α=0.05


随机区组设计资料的方差分析(2) 计算检验统计量


变异来源 SS df MS F P

处理组 13.7018 2 6.8509 32.639 <0.01

区组 1.5577 9 0.1731 0.825 >0.05

误差 3.7790 18 0.2099

总 19.0385 29


按水准， 1=2 、 2=18 查附表 3 的 F 界值表，得 F0.05(2 ， 18)=3.55 ， F0.01(9 ， 18)= 3.60 ， F ＝ 32.64＞ F0.01(2 ，

18) ， P＜ 0.01 。按 a 水准，拒绝H0 ，认为三种方案的处理效果不全相等，还不能认为十个区组的总体均数不全相同。

0.05



注意：方差分析的结果拒绝H0 ，接受 H1 ，不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别，可进行多个均数间的多重比较（见本章第六节）。当 g=2 时，随机区组设计方差分析与配对设计资料的 t 检验等价，有。


t F


随机区组设计确定区组因素应是对试验结果有影响的非处理因素。区组内各试验对象应均衡，区组之间试验对象具有较大的差异为好，这样利用区组控制非处理因素的影响，并在方差分析时将区组间的变异从组内变异中分解出来。因此，当区组间差别有统计学意义时，这种设计的误差比完全随机设计小，试验效率得以提高。


重复测量资料的方差分析例 9-4 为研究减肥新药盐酸西布曲明片和盐酸西布曲明胶囊的减肥效果是否不同，以及肥胖患者服药后不同时间的体重随时间的变化情况。采用双盲双模拟随机对照试验，将体重指数 BMI27的肥胖患者 40名随机等分成两组，一组给予盐酸西布曲明片 +模拟盐酸西布曲明胶囊，另一组给予盐酸西布曲明胶囊 +模拟盐酸西布曲明片。所有患者每天坚持服药，共服药 6 个月 (24 周 ) ，受试期间禁用任何影响体重的药物，而且受试对象行为、饮食及运动与服药前的平衡期均保持一致。分别于平衡期 (0 周 ) 、服药后的 8周、16 周、 24 周测定肥胖患者的体重 (kg) 得表 9-13 的资料。

受试对象 j

剂型k

服药后测定时间 i( 周 ) 受试对象 j

剂型k

服药后测定时间 i( 周 )0 8 16 24 0 8 16 24

1 1 84.4 82.2 82.2 83.0 21 2 64.4 61.4 61.8 62.0

2 1 105.0 100.8 97.4 96.6 22 2 91.0 88.4 87.4 89.6

3 1 63.8 62.0 61.6 60.4 23 2 76.0 76.2 72.8 71.6

4 1 86.2 85.5 83.0 81.8 24 2 71.0 72.0 69.8 68.4

5 1 75.6 73.4 74.0 73.0 25 2 69.4 66.6 62.8 60.8

6 1 61.2 60.4 60.8 60.2 26 2 89.9 87.4 92.6 95.5

7 1 67.8 66.0 63.4 63.6 27 2 66.8 63.6 62.6 61.6

8 1 77.2 73.6 72.6 72.0 28 2 63.4 61.2 62.6 62.0

9 1 73.2 72.2 72.2 74.6 29 2 70.0 67.6 69.8 69.4

10 1 65.4 63.6 62.6 60.8 30 2 86.6 84.0 81.4 78.0

11 1 80.0 77.0 72.4 69.4 31 2 90.4 84.4 77.4 71.0

12 1 74.4 77.0 75.2 77.4 32 2 74.8 73.6 72.8 76.6

13 1 82.6 80.4 81.2 79.6 33 2 67.4 64.4 61.0 58.2

14 1 68.6 65.0 63.2 63.4 34 2 84.4 82.2 80.2 75.4

15 1 79.0 77.0 73.8 72.5 35 2 79.0 76.0 76.5 78.5

16 1 69.4 66.8 64.4 60.8 36 2 87.4 83.2 81.2 77.2

17 1 72.6 71.0 68.2 70.2 37 2 68.7 65.8 63.0 66.4

18 1 72.4 72.6 72.8 72.6 38 2 83.0 81.8 78.4 78.4

19 1 75.6 73.4 73.4 72.2 39 2 66.5 64.4 63.4 65.4

20 1 80.0 78.0 76.4 74.8 40 2 64.6 62.6 64.2 62.0

重复测量资料和随机区组设计资料的区别：(1) 重复测量资料中同一受试对象 ( 看成区组 ) 的

数据高度相关，无论哪位受试对象服用盐酸西布曲明片剂或是胶囊，其服药后 8 周、 16 周和 24 周的体重均和前面时间点 ( 含服药前的 0周 ) 的体重相关。表 9-14 为分不同剂型后使用统计软件包计算得到的各时点简单相关系数 r ，从中可以看出，不同时点间相关系数介于 0.850 ~0.989 之间，其 P 值全为 0.000 ，均有统计学意义，说明不同时点数据其相关性较强。

重复测量资料的方差分析

(k=1 时 ) 服药后测

定时间 i

服药后测定时间 i( 周 ) (k=2 时 ) 服药后测定时

间 i

服药后测定时间 i( 周 )

8 16 24 8 16 24

0 0.989 0.971 0.939 0 0.989 0.944 0.850

8 0.986 0.966 8 0.961 0.880

16 0.985 16 0.958

(2) 重复测量资料中的处理因素在受试对象 ( 看成区组 ) 间为随机分配，但受试对象 ( 看成区组 )内的各时间点往往是固定的，不能随机分配；随机区组设计资料中每个区组内的受试对象彼此独立，处理只在区组内随机分配，同一区组内的受试对象接受的处理各不相同。

本节主要介绍两因素重复测量资料的单变量方差分析方法。


离均差平方和与自由度的分解

两因素重复测量资料的总变异包括两部分：横向分组的受试对象间 (between subjects) 的变异纵向分组的受试对象内 (within subjects) 的变异。其中横向分组受试对象间的变异又分为处理因素 K( 在此

为剂型 ) 的变异和个体间误差的变异两部分；而纵向分组受试对象内的变异则可分为时间因素 I的变异、处理 K和时间 I的交互作用 (KI) 以及个体内误差的变异三部分


( ) ( )

( ) ( )

SS SS SS

SS SS SS SS SS

总受试对象间受试对象内

处理时间个体间误差个体内误差处理与时间交互

总受试对象间受试对象内

处理时间个体间个体内处理与时间交互

重复测量资料方差分析的基本步骤重复测量资料的方差分析步骤仍为三步，本例

如下： (1)建立检验假设，确定检验水准对于处理因素 K H0 ：不同剂型 ( 片剂和胶囊 ) 的减肥效果相同 H1 ：不同剂型 ( 片剂和胶囊 ) 的减肥效果不同


对于时间因素 I H0 ：服用减肥药前后不同时间体重的总体均

数全相等 H1 ：服用减肥药前后不同时间体重的总体均

数不全相等对于交互作用 KI H0 ：药物剂型 K和时间 I无交互效应 H1 ：药物剂型 K和时间 I有交互效应均取 α=0.05


(2) 计算检验统计量使用统计软件包 SAS 或 SPSS 等进行计算。对本例可

得到表 9-15 的方差分析表 (3)确定 P值，作出推断结论以求 F 值时分子自由度 ν1 、分母自由度 ν2 查附表 3

的 F 界值表得相应 P 值，或直接由计算机所给 P 值作出推断结论。本例，按 α=0.05 水准，减肥药剂型 K( 片剂和胶囊 ) ，剂型 K与时间 I的交互效应KI均不拒绝 H0 ，无统计学意义，还不能认为盐酸西布曲明不同剂型的减肥效果不同，也还不能认为剂型 K与时间 I间有交互效应。而时间因素 I拒绝 H0 ，接受 H1 ，有统计学意义，可认为服用减肥药盐酸西布曲明前后不同时间 (8 周、 16 周和 24 周 ) 的平均体重不全同。


变异来源 SS df MS F P

( 受试对象间 ) (13163.9810) (39)

处理 K 5.9290 1 5.9290 0.017 0.897

个体间误差 13158.0520 38 346.2645

( 受试对象内 ) (904.6500) (120)

时间 I 384.5300 3 128.1767 28.213 0.000

交互作用 KI 2.1940 3 0.7313 0.161 0.922

个体内误差 517.9260 114 4.5432

总 14068.6310 159 88.4820

重复测量资料方差分析的前提条件进行重复测量资料的方差分析，除需满足一般方

差分析的条件外 (详后 ) ，还需特别满足协方差阵 (covariance matrix) 的球形性 (sphericity / circularity) 或复合对称性 (compound symmetry) 。 Box(1954)指出，若球形对称性质不能满足，则方差分析的 F 值是有偏的，因为它增大了第一类错误的概率。球对称性通常采用 Mauchly 检验 (Mauchly’s test) 来判断


多个样本均数间的多重比较

当方差分析的结果为拒绝H0 ，接受 H1时，只说明 g 个总体均数不全相等。若想进一步了解哪些两个总体均数不等，需进行多个样本均数间的两两比较或称多重比较（ multiple comparison ）。

若用上一章的两样本均数比较的 t检验进行多重比较，将会加大犯Ⅰ类错误（把本无差别的两个总体均数判为有差别）的概率。

第六节多个样本均数间的多重比较

例如，有 4 个样本均数，两两组合数为4

( ) 62

，若用 t 检验做 6 次比较，且每次比较

的检验水准选为 0 . 0 5 Ⅰ，则每次比较不犯类错误的概率为（ 1 － 0 . 0 5）， 6 Ⅰ次均不犯

类错误的概率为6(1 - 0 . 0 5 ) ，这时，总的检验水准变为

61 - (1 - 0 . 0 5 ) 0 . 2 6 ，比 0 . 0 5

大多了。因此，样本均数间的多重比较不能用两样本均数比较的 t 检验。

例如，有 4 个样本均数，两两组合数为4

( ) 62

，若用 t 检验做 6 次比较，且每次比较

的检验水准选为 0 . 0 5 Ⅰ，则每次比较不犯类错误的概率为（ 1 － 0 . 0 5）， 6 Ⅰ次均不犯

类错误的概率为6(1 - 0 . 0 5 ) ，这时，总的检验水准变为

61 - (1 - 0 . 0 5 ) 0 . 2 6 ，比 0 . 0 5

大多了。因此，样本均数间的多重比较不能用两样本均数比较的 t 检验。



下面介绍三种多重比较方法： Bonfferoni t检验、 Dunnett-t检验和 SNK-q检验。

Bonfferoni t检验 (1)建立检验假设，确定检验水准 H0 ： μA=μB，即任两对比组的总体均数相等 H1 ： μA≠μB，即任两对比组的总体均数不

等


' 2 2 0.050.0167

( 1) 3(3 1)m k k


(2) 计算检验统计量

(3)确定 P值，作出推断结论


=1 1

( )A B

A B A B

X X

A B

X X X Xt

SMS

n n

误差

误差

第六节多个样本均数间的多重比较多个样本均数间的多重比较

两均数之差

A BX X

标准误

A BX XS

对比组A 与 B

(1)(2) (3)

t P

(4) (5)

1 与 3 3.7652 1.2483 3.016 0.002~0.005

1 与 2 3.3952 1.2650 2.684 0.005~0.01

2 与 3 0.3700 1.2800 0.289 >0.50


Dunnett- t 检验适用于 g-1 个实验组与一个对照组均数

差别的多重比较，检验统计量为 t ，亦称 t检验。

计算公式为 :

ν=ν 误差 0

0

XX

i

iS

XXt

0

0

XX

i

iS

XXt



00

1 1iX X

i

S MSn n

误差

00

1 1iX X

i

S MSn n

误差

iX，in为第i个实验组的样本均数和样本例数，0X，0n为对照组的样本均数和样本例

数。



对例 9-2 资料，本例也可用 LSD-t检验，但一般用 Dunnett-t 检验。

(1)建立检验假设，确定检验水准 H0 ： μT=μC，即任一实验组与对照组

的总体均数相等 H1 ： μT≠μC，即任一实验组的总体均

数低于对照组的总体均数 α=0.05



(2) 计算检验统计量

=1 1

( )T C

T C T CD

X X

T C

X X X Xt

SMS

n n

误差

误差

两均数之差T CX X对比组

T 与 C(1)

(2) tD

P

A 与 C -1.5900 -7.760 <0.01

B 与 C -1.1940 -5.827 <0.01

(2)(3)

0.2049


(3)确定 P 值，作出推断结论将表中 tD取绝对值，并以计算 MS 误差时的

自由度 ν 误差 =18 和实验组数 a=k−1=2( 不含对照组 ) 查附表 5 的 Dunnett t 界值表得 P 值，按 α=0.05 水准， A 方案与 C方案、 B方案与C方案均拒绝 H0 ，接受 H1 ，有统计学意义。可以认为 A 方案与 C方案、 B方案与 C方案大白兔血中白蛋白的减少量不同。

第六节多个样本均数间的多重比较SNK-q检验

SNK （ Student-Newman-Keuls ）检验，亦称 q检验，适用于多个样本均数两两之间的全面比较。检验统计量 q 的计算公式为 :

ν=ν 误差 i j

i j

X X

X Xq

S

i j

i j

X X

X Xq

S



1 1

2i jX Xi j

MSS

n n

误差 1 1

2i jX Xi j

MSS

n n

误差

iX，in和jX，jn为两对比组的样本均数和样本例数。 iX，in和jX，jn为两对比组的样本均数和样本例数。



例 9-5 请对例 9-1 资料中治疗 4 周后，餐后 2 小时血糖下降值的三组总体均数进行两两比较。

(1)建立检验假设，确定检验水准 H0 ： μA=μB，即任两对比较组的总体均数

相等H1 ： μA≠μB，即任两对比较组的总体均数

不相等 0.05



(2) 计算检验统计量首先将三个样本均数由小到大排列，并编组次

(3)确定 P值，作出推断结论

iX

组别高剂量组 (i=1) 低剂量组 (i=2) 对照组 (i=3)

9.1952 5.8000 5.4300

组次 1 2 3


两均数之差A BX X

两均数之差标准误

A BX XS

q

(2)(4)

(3)

对比组A 与 B

(1)(2) , (3)

对比组内包含组数

a

q临界值

P0.05 0.01

(5) (6) (7) (8)

1 与 3 3.7652 0.8827 4.266 3 3.40 4.28 0.01~0.05

1 与 2 3.3952 0.8945 3.796 2 2.83 3.76 <0.01

2 与 3 0.3700 0.9051 0.409 2 2.83 3.76 >0.05

第九章 方差分析

Documents

第九章方差分析