单因素方差分析 两因素方差分析 无交互作用的两因素方差分析...

25
单单单单单单单 单单单单单单单 单单单单单单单单单单单单单 单单单单单单单单单单单单单 单单单单

Upload: serina-stephenson

Post on 03-Jan-2016

193 views

Category:

Documents


15 download

DESCRIPTION

方差分析. 单因素方差分析 两因素方差分析 无交互作用的两因素方差分析 有交互作用的两因素方差分析. 在实际问题中 , 经常需要分析哪几种因素对试验结果有显著影响 , 这些起显著作用的因素在何种状态下对试验有最好的效果. 为解决这些问题 , 需要做好 两方面 的工作:. (1) 试验设计 : 要求试验方案能很好地反映观测因素的影响作用 , 且试验次数尽可能少 , 以节约人力、物力和时间;. (2) 方差分析 : 通过观测数据对因素的影响大小作出合理推断. 2. 7.3 单因素方差分析. 一、单因素方差分析有关概念. - PowerPoint PPT Presentation

TRANSCRIPT

单因素方差分析 两因素方差分析 无交互作用的两因素方差分析 有交互作用的两因素方差分析

方差分析

2

在实际问题中 , 经常需要分析哪几种因素对试验结果有显著影响 , 这些起显著作用的因素在何种状态下对试验有最好的效果 .

为解决这些问题 , 需要做好两方面的工作:

(1) 试验设计 : 要求试验方案能很好地反映观测因素的影响作用 , 且试验次数尽可能少 , 以节约人力、物力和时间;

(2) 方差分析 : 通过观测数据对因素的影响大小作出合理推断 .

3

一、单因素方差分析有关概念

7.3 单因素方差分析

1, , rA r A A因素 的 个不同水平用 表示.

方差分析的目的是在众多因素中找出有显著影响的因素 , 为此需要做试验 , 试验中可以变化的、影响试验指标的因素称为因素 (或称因子 ), 用大写字母 A 、 B 、 C 、……表示 , 因素在试验中所取的不同状态称为水平 .

4

例 1 某灯泡厂用四种不同的灯丝生产四种灯泡 .从每种灯泡中随机抽取若干个灯泡测其寿命( 单位 : 小时 ), 得数据如表 . 试问这四种灯丝生产的灯泡的使用寿命是否有显著差异?

灯泡使用寿命数据1 2 3 4 5 6 7 8 平均值

甲 1600 1610

1650

1680

1700

1700

1780

1674

乙 1500 1640

1400

1700

1750

1598

丙 1640 1550

1600

1620

1640

1600

1740

1800

1649

丁 1510 1640

1530

1570

1520

1680

1575

5

这里试验指标为灯泡的使用寿命 , 因素为灯丝 ,

第一 : 即使采用同一种灯丝生产的灯泡 , 其使用寿命也有差异 ,说明使用寿命是随机变量 ;

第二 : 不同灯丝生产的灯泡 , 其使用寿命的均值有一定差异 .

从表中可以看出:

有四个水平 :

6

另外 , 此处研究的是灯丝对灯泡使用寿命的影响问题 , 因此上述数据不能认为出自同一个总体 , 而应视为分别从四个总体 X1,…, X4 抽取的容量分别为7 , 5 , 8 , 6的样本观测值 . 本例中仅考虑灯丝这一因素对灯泡寿命的影响 , 可以认为同一种灯丝生产的灯泡就是一个总体 . 在方差分析中总是假定各总体相互独立 , 且服从同方差的正态分布 , 即第 i 种灯丝生产的灯泡寿命 Xi 是一随机变量

2~ ( , ) , 1,2,3,4i iX N i

7

试验的目的就是检验假设 :

0 1 4 1 1 4: : , ,H H 不全相同

若原假设成立 H0, 则认为不同灯丝的灯泡寿命 Xi 没有显著差异 , 即灯泡寿命差异只是由其它随机因素引起的 . 方差分析是检验同方差的若干正态总体均值是否相等的一种统计分析方法 .

二、数学模型

检验问题:

2

2

~ ( , )

1,2, , ; 1, 2, ,

,

i j i

i j i

i

X N

X i r j n

相互独立 ,

未知

0 1 1 1: : , ,r rH H 不全相同

一般地设因素 A 有 r 个不同水平 A1,…,Ar , 在 Ai

下试验结果 Xi ~N(μi,σ2), i =1,…, r. 在 Ai 下做了ni(≥2) 次试验 , 相当于从总体 Xi 中抽取一组样本 Xi1,…,Xini, 他们相互独立 , 故方差分析模型为:

拒绝 H0 , 表示因素 A 的作用显著 , 否则认为因素 A 不显著 .

9

引入几个记号 , 并对模型作等价变形

1 1

1, , ,

, ( 1, , ; 1, , )

r r

i j i j i i i ii i

i j

i

i i i

i

i i

X n n nn

i r j n

A j

A

一般平

示随机因素对 下第个指标的影响,为随机误差;

称为 ; 称为该因素的第 水平均 的效应.

10

2

1

2

, 1, , ; 1, ,

~ (0, )

0

, ,

i j i i j i

i j

r

i ii

i

X i r j n

N

n

等价方差分析模型

未知

且相互独立

0 1 1 1: 0 : , , 0r rH H 等价检验问题

不全为为

11

三、单因素方差分析

试验指标数据可列成下表形式

12

1. 平方和分解公式

1 1

1 1 1

1

1,

i i

i

n n

ii i j i jj ji

nr r

i j ii j i

X X X Xn

X X n nn

记 , ,

2

1 1

( )inr

T i ji j

S X X

2

1 1

[( ) ( )]inr

i ii ji j

X X X X

13

2 2

1 1 1 1

1 1

( ) ( )

2 ( )( ) 1

i i

i

n nr r

i ii ji j i j

nr

i ii ji j

X X X X

X X X X

2 2

1 1 1 1

( ) ( )i in nr r

i ii ji j i j

X X X X

2 2

1 1 1

( ) ( )inr r

i ii j ii j i

X X n X X

14

注 1 这里显然有

1 1

( )( )inr

i ii ji j

X X X X

1

( ) ( )r

i i ii ii

X X n X n X

1 1

( )( )inr

i ii j ii j

X X X n X

1 1

( ) ( )inr

i ii ji j

X X X X

0

15

T e AS S S 得平方和分解公式

2

1 1

( )inr

ie i ji j

S X X

其中

2

1

( )r

iA ii

S n X X

反映误差的波动 , 称为误差的偏差平方和 .

在假设 H0 成立 ,SA 反映误差的波动 ;

若假设 H0 不成立 , 则 SA 反映了不同效应之间的差异 ( 含误差 ). 称为因素 A 的偏差平方和 .

16

2. 有关分布、检验统计量与拒绝域

22

( ) , ( ) ( )ee

SE n r E S n r

2 AS( ) 的分布

1 eS() 的分布

22 2

1 1

1 1( ) ~ ( )

inr

ie i ji j

S X X n r

0 2

1~ ( 1)TH S n

若 成立,由

22

~ ( 1)ASr

17

0/ ( 1)( 1, )

/ ( )~

e

HAS r

F F r n rS n r

若 成立

1{( , , ) : ( 1, ) }nW x x F F r n r

(3 ) 检验统计量

若 F >Fα(r-1,n-r) , 认为因素 A 取不同水平对试验指标的影响显著 .

(4) 检验水平 α下的拒绝域

18

F0.1 <F ≤ F0.05(r-1,n-r)

具体来说 ,针对不同的检验水平 α取值情况 :

F >F0.01(r-1,n-r)

认为因素 A 的影响高度显著 , 用**表示

F0.05 <F ≤F0.01(r-1,n-r)

认为因素 A 的影响显著 , 用*表示

认为因素 A 的影响不显著

认为因素 A 有一定影响 , 用 (* ) 表示

F ≤ F0.1(r-1,n-r)

19

3. 单因素方差分析表

e T AS S S

具体计算 ST 、 SA 和 Se 时可用变形的公式 :2 2

1 1

( )inr

T i ji j

S X n X

2 2

1

( ) ( )r

iA ii

S n X n X

20

在例 1 中 ,r =4,n1=7,n2=5,n3=8,n4=6,

n = n1+n2+n3+n4=26

来源 平方和 自由度 均方和 F 比 临界值 显著性

因素 A 39776.4 313258.3 1.638

F0.1=

2.35误差 e 178089 22 8095

总和 217865.4 25

方差分析表

由于 F=1.638 < 2.35 = F0.1(3,22) , 故接受 H0,

即认为灯丝对灯泡的寿命没有显著影响 .

21

例 2 燃烧温度对砖的密度的影响 , 观测4种温度下砖的密度 , 得数据如下

1 2 3 4 5

100℃ 21.8 21.9 21.7 21.6 21.7

125℃ 21.7 21.4 21.5 21.4

150℃ 22.9 22.8 22.8 22.6 22.5

175℃ 21.9 21.7 21.8 21.4

问燃烧温度对砖密度的影响是否显著? (α=0.01)

22

r =4,n1=5,n2=4,n3=5,n4=4

来源 平方和 自由度均方和 F 比 临界值 显著性

因素 A 424.5 3 141.555.03

F0.01=

5.56**

误差 e 36 14 2.571

总和 460.5 17

方差分析表

由于 F = 55.03 > 5.56 = F0.01(3,14) , 故拒绝 H0,

即认为温度对砖密度的影响高度显著 #

解n = n1+n2+n3+n4=18

23

4. 未知参数的点估计

(1)

1, ,

i iii

i i

X X X X

i r

、 、 分别是

、、 的无偏估计,

22(2) eS

n r

是 的无偏估计

24

5. 未知参数的区间估计

/2

, , 1, 2, ,

( )( )

i i

ei

i

X X i r

St n r

n n r

其中

(1) 1i 的置信度为 置信区间:

25

2(2) 1 的置信度为 置信区间:

2 2/2 1 /2

,( ) ( )

e eS S

n r n r