第八章 假设检验的基本概念

Post on 15-Jan-2016

147 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

第八章 假设检验的基本概念. 第一节 检验假设与 P 值. 假设检验基本思想. 假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面 ( H 0 ) 出发间接判断要解决的问题 ( H 1 ) 是否成立。然后在 H 0 成立的条件下计算检验统计量,最后获得 P 值来判断 。. 问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验 (hypothesis test) 。. - PowerPoint PPT Presentation

TRANSCRIPT

2023年4月212023年4月21日 星期五日 星期五

第八章

假设检验的基本概念

2023年4月212023年4月21日 星期五日 星期五

第一节

检验假设与 P 值

2023年4月212023年4月21日 星期五日 星期五

假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面 (

H0) 出发间接判断要解决的问题 (H1) 是

否成立。然后在 H0 成立的条件下计算检

验统计量,最后获得 P 值来判断。

假设检验基本思想

2023年4月212023年4月21日 星期五日 星期五

问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验 (hypothesis test) 。

2023年4月212023年4月21日 星期五日 星期五

例 8–1 通过以往大规模调查,已知某地一般新生儿的头围均数为 34.50cm ,标准差为 1.99

cm 。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿 55 人,测得其头围均数为 33.89cm ,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?

2023年4月212023年4月21日 星期五日 星期五

假设检验的目的——就是判断差别是由哪种原因造成的。

①  抽样误差造成的;②  本质差异造成的。

2023年4月212023年4月21日 星期五日 星期五

一般新生儿头围 34.50cm

33.89cn

矿区新生儿头围 34.50cm

X

一种假设 H0

另一种假设 H1

抽样误差

总体不同

2023年4月212023年4月21日 星期五日 星期五

第二节

假设检验的基本步骤

2023年4月212023年4月21日 星期五日 星期五

例 8–1 通过以往大规模调查,已知某地一般新生儿的头围均数为 34.50cm ,标准差为 1.99cm 。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿 55 人,测得其头围均数为 33.89cm ,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?

2023年4月212023年4月21日 星期五日 星期五

1.建立检验假设,确定检验水准(选用单侧或双侧检验)

(1)无效假设又称零假设,记为 H0;

(2)备择假设又称对立假设,记为 H1。

对于检验假设,须注意:

① 检验假设是针对总体而言,而不是针对样本; ② H0和 H1是相互联系,对立的假设,后面的结论是 根据 H0和 H1作出的,因此两者不是可有可无,而是 缺一不可;

2023年4月212023年4月21日 星期五日 星期五

③    H1 的内容直接反映了检验单双侧。若 H

1 中只是 0 或 <0 ,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。

④  单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。

2023年4月212023年4月21日 星期五日 星期五

(3) 检验水准,过去称显著性水准,是预

先规定的概率值,它确定了小概率事件的

标准。在实际工作中常取 = 0.05 。可根

据不同研究目的给予不同设置。

2023年4月212023年4月21日 星期五日 星期五

H0: 34.50 (该矿区新生儿的头围与当地一般新生儿头围均数相同)

H1: 34.50 (该矿区新生儿的头围与当地一般新生儿头围均数不同)

0.05

2023年4月212023年4月21日 星期五日 星期五

根据变量和资料类型、设计方

案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。

2. 计算检验统计量

(33.89-34.50) (1.99 / 55) 2.273u

2023年4月212023年4月21日 星期五日 星期五

3. 确定 P 值,下结论如例 8–1 已得到 P<0.05, 按所取检验水准 0.05, 则拒绝 H0 ,接受H1 ,差异有统计学意义(统计结论),可以认为矿区新生儿的头围均数与一般新生儿不同,矿区新生儿的头围小于一般新生儿(专业结论)。

2023年4月212023年4月21日 星期五日 星期五

/ 2,t / 2,t t

P

1

2023年4月212023年4月21日 星期五日 星期五

若P ,按所取检验水准 ,拒绝0H,

接受1H “ ”,下有差别的结论。其统计学依

据是,在0H成立的条件下,得到现有检验结

果的概率小于,因为小概率事件不可能在

一次试验中发生,所以拒绝0H。

2023年4月212023年4月21日 星期五日 星期五

若 ,不拒绝 H0 ,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论。

P

2023年4月212023年4月21日 星期五日 星期五

第三节

大样本均数的假设检验

2023年4月212023年4月21日 星期五日 星期五

均数比较 u 检验的主要适用条件为:

1. 单样本数据,每组例数等于或大于 60 例;两样本数据,两组例数的合计等于或大于 60 例,而且基本均等。

2.样本数据不要求一定服从正态分布总体。

3.两总体方差已知。

4.理论上要求:单样本是从总体中随机抽取,两样本为随机分组资料。观察性资料要求组间具有可比性,即比较组之间除了研究因素以外,其他可能有影响的非研究因素均应相同或相近。

2023年4月212023年4月21日 星期五日 星期五

一、单样本均数的 u 检验 (one-sampl

e u-test) 适用于当 n 较大 ( 如 n>60) 或 已知时。检验统计量分别为

0

0 0

0 00

0

( )

( )

X

X

X Xu n

S S n

X Xu

n

较大时

已知时

P121 例 8-2

2023年4月212023年4月21日 星期五日 星期五

P121 例 8-2

例 8–2 (续例 7-5 ) 1995 年,已知某地 20 岁应征男青年的平均身高为 168.5cm 。 2003 年,在当地 20 岁应征男青年中随机抽取 85 人,平均身高为 171.2 cm ,标准差为 5.3cm ,问 2003 年当地 20 岁应征男青年的身高与 1995 年相比是否不同?

2023年4月212023年4月21日 星期五日 星期五

P121 例 8-2

0 171.2 168.54.70

/ 5.3 / 85

Xu

S n

检验界值 u0.05/2 = 1.96 , u0.01/2 = 2.58, u >u0.01/2, 得 P<0.01 ,按 α=0.05水准,拒绝 H0 ,接受 H1 , 2003 年当地 20 岁应征男青年与 1995 年相比,差别有统计学意义。可认为 2003年当地 20 岁应征男青年的身高有变化,比 1995 年增高了。

2023年4月212023年4月21日 星期五日 星期五

P121 例 8-2

由例 7-5 可知, 2003 年当地 20 岁应征男青年身高总体均数的 95% 的可信区间为 170.1~172.3cm 。该区间的下限已高于 1995 年身高的总体均数168.5cm ,也说明 2003 年 20 岁应征男青年增高了。

2023年4月212023年4月21日 星期五日 星期五

1 2

1 2 1 2

2 21 2

1 2

X X

X X X Xu

S S Sn n

二、两样本比较的 u 检验 (two-sam

ple u-test) 适用于两样本含量较大 ( 如 n

1>30 且 n2>30) 时。检验统计量为 

P122 例 8-3

两均数之差的标准误的估计值

2023年4月212023年4月21日 星期五日 星期五P122 例 8-3

两均数之差的标准误的估计值

例 8-3(续例 7-7) 为比较某药治疗流行性出血热的疗效,将 72名流行性乙型脑炎患者

随机分为试验组和对照组,两组的例数、均数、标准差分别为: 1 32n , 1 2.9X , 1 1.9S ;

2 40n , 2 5.2X , 2 2.7S 。问试验组和对照组的平均退热天数有无差别?

1 2

2 2 2 21 1 2 2

2.9 5.24.23

/ / 1.9 / 32 2.7 / 40

X Xu

S n S n

2023年4月212023年4月21日 星期五日 星期五

由于 u0.05/2=1.96 , u0.01/2=2.58 , |u|>u

0.01/2, 得 P<0.01 ,按 α=0.05 水准,拒绝 H0

,接受 H1 ,两组间差别有统计学意义。可以认为试验组和对照组退热天数的总体均数不相等,两组的疗效不同。试验组的平均退热天数比对照组短。例 7-7 已计算了的 95%

的可信区间: 天,给出了两总体均数差别的数量大小。

P122 例 8-3

两均数之差的标准误的估计值

3.3 ~ 1.3

2023年4月212023年4月21日 星期五日 星期五

第四节

大样本率的假设检验

2023年4月212023年4月21日 星期五日 星期五

率的 u 检验的应用条件: 1 、 n 较大,如每组例数大于 60 例。 2 、样本 p或 1-p 均不接近 100% 和

0 。 3 、 np 和 n(1-p) 均大于 5 。

2023年4月212023年4月21日 星期五日 星期五

一、单样本率的 u 检验

适用于样本率与已知的总体率的比较

P123 例 8-4

0 0

0 0(1 )p

p pu

n

2023年4月212023年4月21日 星期五日 星期五

例 8–4 已知某地 40岁以上成年男性高血压患病

率为 8.5% ( π0 ),经健康教育数年后,随机

抽取该地成年男性 1000名,查出高血压患者 5

5 例,患病率( p)为 5.5% 。问经健康教育后

,该地成年男性高血压患病率是否有降低?

2023年4月212023年4月21日 星期五日 星期五

0.055 0.0853.402

0.085(1 0.085) /1000u

单侧界值 u0.01=2.33 ,现 |u| > u0.01, 故P<0.01, 按 α=0.05 水准拒绝 H0 ,接受H1 ,差异有统计学意义,可认为经健康教育后,该地成年男性高血压患病率有所降低。

2023年4月212023年4月21日 星期五日 星期五

二、两个率比较的 u 检验

推断两个总体率是否相同

P124 例 8-5

1 2

1 2 1 2

1 2

1 1(1 )( )p p c c

p p p pu

p p n n

2023年4月212023年4月21日 星期五日 星期五

例 8–5 某医院用黄芪注射液和胎盘球蛋白进行穴

位注射治疗小儿支气管哮喘病人,黄芪注射液

治疗 117 例,有效 103 例;胎盘球蛋白治疗 55

例,有效 49 例。试比较两种疗法有效率有无差

2023年4月212023年4月21日 星期五日 星期五

%37.8855117

49103

cp

0.8803 0.89090.0054

0.8837(1 0.8837) /(1/117 1/ 55)u

u0.05/2=1.96 ,现 |u|<u0.05/2 , 故 P>0.05,按 α=0.05 检验水准接受 H0 ,差异无统计学意义,尚不能认为两种疗法治疗小儿支气管哮喘的疗效有差别。

2023年4月212023年4月21日 星期五日 星期五

第五节 检验水准与两类错误

2023年4月212023年4月21日 星期五日 星期五

I 型错误和 II 型错误 假设检验是利用小概率反证法思想,从

问题的对立面 (H0) 出发间接判断要解决的问题 (H1) 是否成立,然后在假定 H0 成立的条件下计算检验统计量,最后根据 P 值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝 H0 ,都可能犯错误。详见表 8-1 。

2023年4月212023年4月21日 星期五日 星期五

I 型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)

II 型错误:“实际有差别,但下了不拒绝 H0

的结论”,假阴性错误。犯这种错误的概率是

(其值未知) 。

但 n 一定时, 增大, 则减少 。

2023年4月212023年4月21日 星期五日 星期五

假设检验的结果 客观实际

拒绝 H0 “ ”接受 H0

H0成立 I型错误( ) 推断正确(1 )

H0不成立

即 H1成立 推断正确(1 ) II型错误( )

可能发生的两类错误

图 8-2 I 型错误与 II 型错误示意图 ( 以单侧 u检验为例 )

H1: <0

成立

界值 0

1 1

2023年4月212023年4月21日 星期五日 星期五

1- :检验效能( power ) :当两总体确有差

别,按检验水准 所能发现这种差别的能力。

2023年4月212023年4月21日 星期五日 星期五

减少(增加) I 型错误,将会增加(减少) II 型错误

增大 n 同时降低与

2023年4月212023年4月21日 星期五日 星期五

减少 I 型错误的主要方法:假设检验时设定 值。

减少 II 型错误的主要方法:提高检验效能。

提高检验效能的最有效方法:增加样本量。

如何选择合适的样本量:实验设计。

2023年4月212023年4月21日 星期五日 星期五

第六节 单侧检验与双侧检验

2023年4月212023年4月21日 星期五日 星期五

图 8–3 双侧 u 检验的检验水准 α

图 8–4 单侧 u 检验的检验水准 α

单侧检验 概念

2023年4月212023年4月21日 星期五日 星期五

第七节

假设检验的统计意义与实际意义

2023年4月212023年4月21日 星期五日 星期五

1. 要有严密的研究设计,尤其是下因果结论。

2. 不同的资料应选用不同检验方法。

3. 正确理解“显著性”一词的含义 ( 用统计学意义一词替代 ) 。

2023年4月212023年4月21日 星期五日 星期五

4. 结论不能绝对化 ,提倡使用精确 P 值。

5. 注意统计“显著性”与医学 / 临床 /生物

学 “显著性” 的区别

2023年4月212023年4月21日 星期五日 星期五

6. 可信区间与假设检验各自不同的作用,要结合使用。

一方面,可信区间亦可回答假设检验的问题,算得的

可信区间若包含了 H0 ,则按水准,不拒绝 H0 ;若不

包含 H0 ,则按水准,拒绝 H0 ,接受 H1 。

2023年4月212023年4月21日 星期五日 星期五

另一方面,可信区间不但能回答差

别有无统计学意义,而且还能比假

设检验提供更多的信息,即提示差

别有无实际的专业意义。

2023年4月212023年4月21日 星期五日 星期五

有实际专业意义的值

H0

(2)

(3)

(4)

(5)

(1)

有实际 可能有实际 无实际 样本例数 可接受

专业意义 专业意义 专业意义 太少 H0

有统计学意义 无统计学意义

可信区间在统计推断上提供的信息

2023年4月212023年4月21日 星期五日 星期五

虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率 检验水准

的前提下进行计算,而假设检验能够获得一较为确切的概率 P值。

top related