第九章 完全随机和随机区组试验的统计分析

Post on 12-Jan-2016

290 Views

Category:

Documents

5 Downloads

Preview:

Click to see full reader

DESCRIPTION

第九章 完全随机和随机区组试验的统计分析. 第一节 完全随机试验设计的统计分析 第二节 单因素随机区组试验结果的统计分析 第三节 多因素随机区组试验结果的统计分析. 第一节 完全随机试验设计的统计分析. 一、组内观察值数目相等的单向分组资料的方差分析 二、组内观察值数目不等的单向分组资料的方差分析. 第一节 完全随机试验设计的统计分析. 完全随机试验设计是指每一供试单位都有同等机会 ( 等概率 ) 接受所有可能处理的试验设计方法,没有局部控制,但要求在尽可能一致的环境中进行试验。它用于估算试验误差的自由度最多,统计显著性要求的 F 值最小。 - PowerPoint PPT Presentation

TRANSCRIPT

第九章 完全随机和随机区组试验的统计分析

第一节 完全随机试验设计的统计分析

第二节 单因素随机区组试验结果的统计分析

第三节 多因素随机区组试验结果的统计分析

第一节 完全随机试验设计的统计分析

一、组内观察值数目相等的单向分组资料的方差分析

二、组内观察值数目不等的单向分组资料的方差分析

第一节 完全随机试验设计的统计分析

完全随机试验设计是指每一供试单位都有同等机会( 等概率 ) 接受所有可能处理的试验设计方法,没有局部控制,但要求在尽可能一致的环境中进行试验。它用于估算试验误差的自由度最多,统计显著性要求的 F 值最小。 单向分组资料是指观察值仅按一个方向分组的资料示。所用的试验设计为完全随机试验设计。

一、组内观察值数目相等的单向分组资料的方差分析二、组内观察值数目不等的单向分组资料的方差分析三、组内又分亚组的单向分组资料的方差分析

分类

一、组内观察值数目相等的单向分组资料的方差分析 这是在 k 组处理中,每处理皆含有 n 个供试单位的资料如表6.1。  在作方差分析时,其任一观察值的线性模型皆由           表示,方差分析如表 6.10 。ijiijy

2)( yyn i22 n

22 n

2)( iij yy 2 2

2)( yyij

表 6.10 组内观察值数目相等的单向分组资料的方差分析

变 异 来 源

自由度DF

平方和SS

均方MS

F

期望均方 EMS

固定模型 随机模型

处理间 k- 1 MSt MSt/MSe

误 差 k(n -1)

MSe

总变异 nk- 1

[ 例 6.10] 作一水稻施肥的盆栽试验,设 5 个处理,A 和 B 系分别施用两种不同工艺流程的氨水, C 施碳酸氢铵, D 施尿素, E 不施氮肥。每处理 4 盆 ( 施肥处理的施肥量每盆皆为折合纯氮 1.2 克 ) ,共 5×4=20 盆,随机放置于同一网室中,其稻谷产量 ( 克 / 盆 ) 列于表 6.11 ,试测验各处理平均数的差异显著性。

iTiy

表 6.11 水稻施肥盆栽试验的产量结果

处 理 观察值 (yij)(克 /盆 )

A (氨水 1) 24 30 28 26 108 27.0

B (氨水 2) 27 24 21 26 98 24.5

C (碳酸氢铵 )

31 28 25 30 114 28.5

D (尿素 ) 32 33 33 28 126 31.5

E (不施 ) 21 22 16 21 80 20.0

526 26.3

(1) 自由度和平方和的分解

总变异自由度 DFT=nk - 1=5×4 - 1=19

处理间自由度 DFt=k - 1=5 - 1=4

误差 ( 处理内 ) 自由度 DFe=k(n - 1)=5×(4 - 1)=15

矫正数 8138334552622 .)/(nkTC

2402213024 2222 .CCySST

23014)8098108( 2222 .C/CnTSS it

010123012402 ...SSe

(2) F 测验将上述结果录入表 6.12

表 6.12 表 6.11资料的方差分析

变异来源 DF SS MS F F0.05 F0.01

处理间 4 301.2 75.30 11.19** 3.06 4.89

处理内 (试验误差 )

15 101.0 6.73

总变异 19 402.2

假设 H0: , HA:

不全相等。

为了测验 H0 ,计算处理间均方对误差均方的比率,

算得 F =75.3/6.73=11.19

查 F 表当 v1=4 , v2=15 时, F0.01=4.89 ,现实得 F=

11.19>F0.01 ,故否定 H0 ,

推断这个试验的处理平均数间是有极显著差异的。

EBA EBA 、、、

(3) 各处理平均数的比较

算得单个平均数的标准误 29714736 . /. SE

根据 =15 ,查 SSR 表得 p=2 , 3 , 4 , 5 时的 SS

R0.05

与 SSR0.01 值,将 值分别乘以 SE 值,即得 值,列

于表 6.13 。进而进行多重比较 ( 表 6.14) 。

SSR LSR

p SSR0.05 SSR0.01 LSR0.05 LSR0.01

2 3.01 4.17 3.90 5.41

3 3.16 4.37 4.10 5.67

4 3.25 4.50 4.22 5.84

5 3.31 4.58 4.29 5.94

表 6.13 多重比较时的 值计算LSR

表 6.14 施肥效果的显著性 (SSR测验 )

处 理 平均产量(克 /盆 )

差异显著性

5% 1%

尿 素 31.5 a A

碳酸氢铵 28.5 ab AB

氨水 1 27.0 bc AB

氨水 2 24.0 c BC

不 施 20.0 d C 推断:根据表 6.14 多重比较结果可知,施用氮肥 (A 、B 、 C 和 D) 与不施氮肥有显著差异,且施用尿素、碳酸氢铵、氨水 1 与不施氮肥均有极显著差异;尿素与碳酸氢铵、碳酸氢铵与氨水 1 、氨水 1 与氨水 2 处理间均无显著差异。

二、组内观察值数目不等的单向分组资料的方差分析

若 k 个处理中的观察值数目不等,分别为 n1 , n2 ,…,

nk ,在方差分析时有关公式因 ni 不相同而需作相应改变。

主要区别点如下:

(1) 自由度和平方和的分解

knDF

kDF

nDF

ie

t

iT

误差自由度

处理间自由度

总变异自由度

1

1

k

i

n

jtTiije

k

iiiiit

T

i

SSSSyySS

CnTyynSS

CyyySS

1 1

2

1

22

22

)(

)(

)(

(6·19)

(6·20)

(2) 多重比较平均数的标准误为:

)11

(2

)(2

1

BA

e

B

e

A

e

nn

MS

n

MS

n

MSSE

上式的 nA 和 nB 系两个相比较的平均数的样本容量。

但亦可先算得各 ni 的平均数 n0 。

))((

)(

1

22

0 kn

nnn

i

ii

然后有:0nMSSE e

或 02 nMSs eyy ji

(6·22)

(6·21)

(6·23)

(6·24)

[ 例 6.11] 某病虫测报站,调查四种不同类型的水稻田28 块,每块田所得稻纵卷叶螟的百丛虫口密度列于表 6.15 ,试问不同类型稻田的虫口密度有否显著差异?

iT iy

y in

表 6.15 不同类型稻田纵卷叶螟的虫口密度

稻田类型

编 号ni

1 2 3 4 5 6 7 8

Ⅰ 12 13 14 15 15 16 17 102 14.57 7

Ⅱ 14 10 11 13 14 11 73 12.17 6

Ⅲ 9 2 10 11 12 13 12 11 80 10.00 8

Ⅳ 12 11 10 9 8 10 12 72 10.29 7

T=327 11.68 28

该资料 =7+6+8+7=28 故

总变异自由度 DFT = - 1=28 - 1=27

稻田类型间自由度 DFt =k - 1=4 - 1=3

误差自由度 DFe = - k=28 - 4=24

in

in

in

求得:89381828)327( 2 ./C

11226893818004045121312 222 ...CSST

13967728806737102 2222 .C////SSt

98129.SSSSSS tTe

表 6.16 表 6.15资料的方差分析

变异来源 DF SS MS F F0.01

稻田类型间 3 96.13 32.04 5.91** 4.72

误 差 24 129.98 5.42

总变异 27 226.11

表 6.16 所得 F=5.91>F0.01 ,因而应否定 H0 :

即 4 块麦田的虫口密度间有极显著差异。4321

F 测验显著,再作平均数间的比较。需进一步计算 n0 ,

并求得 SE(LSR 测验)或 (LSD 测验 ) 。如在此可有:

ji yys

798.6)14(28

)7867(28 22222

0

n

)(88007425 头. /. SE

)(04117

4252头.

.s

ji yy

随机区组试验结果的统计分析,可应用第六章所述

两向分组单个观察值资料的方差分析法。

这里可将处理看作 A因素,区组看作 B因素,其剩

余部分则为试验误差。设试验有 个处理, 个区

组,则其自由度和平方和的分解式如下:

k n

第二节 单因素随机区组试验结果的统计分析

总自由度 =区组自由度 +处理自由度 +误差自由度

(12·3)

1)1)((1)(1)(1 knknnk

k n n k k n

trtr yyyyyynyykyy1 1 1 1 1 1

2222 )()()()(

(12·2)

y表示各小区产量(或其他性状), 表示区组平均

数, 表示处理平均数, 表示全试验平均数。

总平方和=区组平方和+处理平方和+试验误差平方和

[例 12.3] 有一小麦品比试验,共有A、 B、 C、 D、 E、

F、 G、 H 8个品种 (k =8) ,其中 A是标准品种,采用随

机区组设计,重复 3次 (n =3) ,小区计产面积 25m2,其

产量结果列于表12.3,试作分析。

ry

ty y

表 12.3 小麦品比试验 (随机区组 )的产量结果 (kg)

tT ty

rT

ry y

品 种 区 组

Ⅰ Ⅱ Ⅲ

A 10.9 9.1 12.2 32.2 10.7

B 10.8 12.3 14.0 37.1 12.4

C 11.1 12.5 10.5 34.1 11.4

D 9.1 10.7 10.1 29.9 10.0

E 11.8 13.9 16.8 42.5 14.2

F 10.1 10.6 11.8 32.5 10.8

G 10.0 11.5 14.1 35.6 11.9

H 9.3 10.4 14.4 34.1 11.4

83.1 91.0 103.9 T=278.0

10.4 11.4 13.0 =11.6

(1) 自由度和平方和的分解

① 自由度的分解:

区组

品种

误差

② 平方和的分解:

矫正数

2318)(31 nkDFT

2131 nDFR

7181 kDFt

141)(81)(31)1)(( knDFe

3220.1783

278.02

nk

TC

2

区组

品种

误差

=84.61-27.56-34.08=22.97

nk

T CySS1

2 84.6114.49.110.9 222 C

n

rrR C

k

TyykSS

1

22)(

27.563220.178

103.991.083.1 222

k

ttt C

n

TyynSS

1

22)(

34.083220.173

34.137.132.2 222

tRT

k n

tre SSSSSSyyyySS 1 1

2)(

(2) F 测验

将上述计算结果列入表 12.4 ,算得各变异来源的 MS值。

表 12.4 表 12.3 结果的方差分析

变异来源 DF SS MS F F0.05

区组间 2 27.56 13.78 8.40 3.74

品种间 7 34.08 4.87 2.97 2.77

误 差 14 22.97 1.64

总变异 23 84.61

对区组间 MS作 F测验,在此有 H0: ,

HA: 、 、 不全相等 ( 、 、 分别代

表区组Ⅰ、Ⅱ、Ⅲ的总体平均数 ),

得 F =13.78/1.64=8.40 > F0.05,所以 H0应予否定,说

明 3个区组间的土壤肥力有显著差别。在这个试验中,

区组作为局部控制的一项手段,对于减少误差是相当

有效的 (一般区组间的 F测验可以不必进行,因为试验

目的不是研究区组效应 )。

321

1 2 3321

对品种间 MS 作 F 测验,有 H0: , HA:

、 、…、 不全相等( 、 、…、

分别代表品种A、 B、…、H的总体平均数),得

F =4.87/1.64=2.97 > F0.05,所以 H0应予否定,说明 8 个

供试品种的总体平均数有显著差异。需进一步作多重比较。

(3) 品种间平均数的多重比较

① 最小显著差数法 (LSD 法 ) 本例目的是要测验各供试品种是否与标准品种A有显著差异,宜应用LSD

HBA

A B H A B

H

法。首先应算得品种间平均数或总和数差数的标准误。在以各品种的小区平均产量作比较时,差数标准误为:

n

MSs e

yy

2 21

(12·4)

从而

01.001.0

05.005.0

21

21

tsLSD

tsLSD

yy

yy

(12·5)

如果以各品种的小区总产量作比较,则因总产量大 n 倍,故差数标准误为:

(12·4)—(12·7) 中,为方差分析表中的误差项均方 MS; t值的,即误差项自由度。凡品种与对照的差异达到或超过者为显著,达到或超过者为极显著。

如果试验结果需以亩产量表示,只要将总产量和总产量的 LSD 皆乘以 cf 即可。

ee

TT nMSnn

MSs 2

2 21

(12·6)

并有:

01.001.0

05.005.0

21

21

tsLSD

tsLSD

TT

TT

(12·7)

在此,如以各品种的小区平均产量 ( 即表 12.3 的 )进行比较,则

由于 时, =2.145 , =2.977 ,故

(kg) ,

(kg)

如对各品种的三个小区总产量 (表 12.3 的 ) 进行比较,则

1.0531.642

21 yys (kg)

14 05.0t 01.0t2.252.1451.05 05.0LSD

3.132.9771.05 01.0LSD

tT

如以亩产量表示试验结果,则可算得化各品种总产量为亩产量的改算系数:

因此,品种 A 的亩产量 = (kg)

3.1421

1.6432TTs

6.742.1453.14 05.0LSD

(kg)

(kg)

(kg)

9.352.9773.14 01.0LSD

8.88253

666.67

cf

2868.8832.2 cfTA

品种 B的亩产量 = (kg)

……,余类推

并且有

亩产量 (kg)

亩产量 (kg)

上述结果皆列于表 12.5 不论哪一种比较,结果都完全一样,只有 E品种与对照有极显著的差异,其余品种都和对照没有显著差异。

3308.8837.1 cfTB

59.88.886.74 05.0LSD

83.08.889.35 01.0LSD

表 12.5 表 12.3 资料各品种产量和对照相比的差异显著性 tytT tytT

品 种 的比较 的比较 亩产量的比较

差 异 差 异 kg/亩 差 异

E 14.2 3.5** 42.5 10.3** 378 92**

B 12.4 1.7 37.1 4.9 330 44

G 11.9 1.2 35.6 3.4 316 30

H 11.4 0.7 34.1 1.9 302 16

C 11.4 0.7 34.1 1.9 302 16

F 10.8 0.1 32.5 0.3 288 2

A(CK) 10.7 32.2 286

D 10.0 -0.7 29.9 -2.3 266 -20

② 新复极差测验 (LSR 法 ) 如果我们不仅要测验

各品种和对照相比的差异显著性,而且要测验各品

种相互比较的差异显著性,则宜应用 LSR 法。首先,

应算得品种的标准误 SE。

在小区平均数的比较时为

n

MSSE e (12·8)

在小区总数的比较时为 enMSSE (12·9)

在亩产量的比较时为

然后,查附表 8当 时, 自 2至 的

SSR0.05和SSR0.01值,进而算得 LSR0.05和LSR0.01值。

本例如以小区平均数为比较标准,则有

查附表 8,得到自由度、不同显著水平和秩次距p下的SSR值,进而算得 LSR值 (表 12.6) 。品种平均数差

cf enMSSE (12·10)

1)1)(( kn p k

0.743

1.64SE (kg)

异显著性结果见表 12.7 。

表 12.6 表 12.3 资料新复极差测验的最小显著极差

14,05.0SSR

14,01.0SSR

14,05.0LSR

14,01.0LSR

p 2 3 4 5 6 7 8

3.03 3.18 3.27 3.33 3.37 3.39 3.41

4.21 4.42 4.55 4.63 4.70 4.78 4.83

2.24 2.35 2.42 2.46 2.49 2.51 2.52

3.12 3.27 3.37 3.43 3.48 3.54 3.57

表 12.7 表 12.3 资料的新复极差测验结果

产量 ( ty 品 种 ) 差 异 显 著 性

5% 1%

E 14.2 a A

B 12.4 ab AB

G 11.9 ab AB

H 11.4 b AB

C 11.4 b AB

F 10.8 b AB

A 10.7 b AB

D 10.0 b B

结果表明: E品种与 H、 C、 F、 A、 D 5 个品种有

5% 水平上的差异显著性, E 品种与 D 品种有 1% 水平

上的差异显著性,其余各品种之间都没有显著差异。

以上是以各品种的小区平均产量为比较标准。如以各

品种总产量或亩产量为比较标准,则只要应用由 (1

2·9) 或 (12·10) 算出的 SE 值即可,方法类同,

不再赘述。

用时,仅需选择上述 3种比较的任一种。

第三节 多因素随机区组试验结果统计分析

一、二因素随机区组试验结果统计分析

二、三因素随机区组试验结果统计分析

一、二因素试验的统计分析

设有 A和 B两个试验因素,各具 a和 b个水平,

那么共有 ab个处理组合,作随机区组设计,有 r次

重复,则该试验共得 rab个观察值。它与单因素随机

区组试验比较,在变异来源上的区别仅在于前者的处

理项可分解为 A因素水平间 (简记为 A)、 B因素水

平间 (简记为 B)、和 AB 互作间 (简记为 AB) 三个部

分。

(13·1)

(13·2)

11

2

1

2

1

etRT

abr

klrjkl

ab

kl

r

r

abr

jkl

SSSSSSSS

yyyyyyryyabyy

abrabrabr

误差平方和处理平方和区组平方和总平方和

)()()()(

误差自由度处理自由度区组自由度总自由度1)1)((1)(1)(1

22

BABA

BABA

11

2

1

2

1

2

ABBAt

ab

lkkl

b

l

a

k

ab

kl

SSSSSSSS

yyyyryyrayyrbyyr

babaab

平方和的平方和的平方和处理组合平方和

)()()()(

自由度的自由度的自由度处理组合的自由度1)1)((1)(1)(1)(其中,

2

其中, j=1, 2 …, , r; k=1, 2 …, , a; l=1,

2 …, , b ; 、 、 、 和 分别为第 r个区组

平均数、

A因素第 k个水平平均数、 B因素第 l个水平平均

数、处理组合 AkBl平均数和总平均数。表 13.1 二因素随机区组试验自由度的分解

ry ky ly kly y

CnTr 2

CrTAB 2

BA

B

A

1)1)((

1

1

ba

b

a

BAtAB

BB

AA

SSSSSSSS

CraTSS

CrbTSS2

2

Cy 2

SSR=

SSt=

SST=

变异来源 DF 平 方 和 区 组 r-1

处理组合 ab-1

误 差 (r-1)(ab-1) SSe=SST-SSR-SSt

总变异 rab-1

二、三因素试验的统计分析

设有 A、 B、 C三个试验因素,各具 a、 b、

c个水平,作随机区组设计,设有 r个区组,则该

试验共有 rabc 个观察值,其各项变异来源及自由度

的分解见表 13.15 。

表 13.15 三因素随机区组试验的平方和及自由度分解变异来源 DF SS

区 组 r-1

处 理 abc-1

A a-1

B b-1

C c-1

A×B (a-1)(b-1) -SSA-SSB

A×C (a-1)(c-1) -SSA-SSC

B×C (b-1)(c-1) -SSB-SSC

A×B×C (a-1)(b-1)(c-1) SSABC=SSt-SSA-SSB-SSC-SSAB-SSAC-SSBC

误 差 (r-1)(abc-1) SSe=SST-SSt-SSR

总变异 rabc-1

CabcTSS rR 2

CrTSS ABCt 2

CrbcTSS AA 2

CracTSS BB 2

CrabTSS CC 2

CrcTSS ABAB 2

CrbTSS ACAC 2

raTSS BCBC2

CySST 2

top related