第七章 计数资料的假设检验

26
1 第第第 第第第第第第第第第

Upload: afi

Post on 23-Jan-2016

158 views

Category:

Documents


4 download

DESCRIPTION

第七章 计数资料的假设检验. 某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?. 两个率 P 1 ( 14% ) , P 2 ( 25% )不同。. 总体率的 假设 检验. 当两个样本率不同时 , 有两种可能 : ▲ P 1 , P 2 所代表的总体率相同 , 由于抽样误差的存在 , 造成了样本率不同 , 这种差别在统计上叫 差别无统计学意义 。 ▲ P 1 , P 2 所代表的总体率不同 , 即两个样本来不同的总体 , 其差别有统计学意义 。 用统计学方法进行判断属于那种情况。(反证法). x 2 检验. 是一种假设检验的方法 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第七章   计数资料的假设检验

1

第七章 计数资料的假设检验

Page 2: 第七章   计数资料的假设检验

2

某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?

组 别 发 病 人 数 未 发 病人数 观察例数 发病率(%)实 验 组 14 86 100 14

对 照 组 30 90 120 25

合计 44 176 220 20

两个率 P1 ( 14% ) , P2 ( 25% )不同。

Page 3: 第七章   计数资料的假设检验

总体率的假设检验

当两个样本率不同时 , 有两种可能 :▲ P1 , P2 所代表的总体率相同 , 由于抽样误差的存

在 , 造成了样本率不同 , 这种差别在统计上叫差别无统计学意义。

▲ P1 , P2 所代表的总体率不同 , 即两个样本来不同的总体 , 其差别有统计学意义。

用统计学方法进行判断属于那种情况。(反证法)

Page 4: 第七章   计数资料的假设检验

4

x2 检验

是一种假设检验的方法符合假设检验的规律统计量(率或比)服从 x2 分布

Page 5: 第七章   计数资料的假设检验

5

某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?

组 别 发 病 人 数 未 发 病人数 观察例数 发病率(%)实 验 组 14 86 100 14

对 照 组 30 90 120 25

合计 44 176 220 20

1 4 8 6 3 0 9 0

A :观察例数

T :理论频数

Page 6: 第七章   计数资料的假设检验

6

x2 检验的基本公式

x2 = ( A-T ) 2/T▲ A :表示实际频数,即实际观察到的例数。▲ T :理论频数,即如果假设检验成立,应该观察

到的例数。▲ :求和符号,所有格子的值之和▲ 自由度: = ( R-1 ) x ( C-1 ) R 行数, C 列数 注意:是格子数,而不是例数。

Page 7: 第七章   计数资料的假设检验

7

如果假设检验成立, A 与 T 不应该相差太大。理论上可以证明 ( A-T ) 2/T 服从 x2 分布,计

算出 x2 值后,查表判断这么大的 x2 是否为小概率事件,以判断建设检验是否成立。

Page 8: 第七章   计数资料的假设检验

8

x2 分布规律

自由度一定时, P 值越小, x2 值越大,反比关系。当 P 值一定时,自由度越大, x2 越大。 =1 时, P=0.05 , x2 =3.84 P=0.01 , x2 =6.63 P=0.05 时, =1 , x2 =3.84 =2 , x2 =5.99

Page 9: 第七章   计数资料的假设检验

1 、四格表资料的 x2 检验

什么是四格表资料?凡是两个率或构成比资料都可以看做四格表资料。

组 别 发 病 人 数 未 发 病人数 观察例数 发病率(%)实 验 组 14 86 100 14

对 照 组 30 90 120 25

合计 44 176 220 20

1 4 8 63 0 9 0

某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?

Page 10: 第七章   计数资料的假设检验

10

组 别 阳 性 阴 性 合计1 a b a+b2 c d c+d合计 a+c b+d a+b+c+d

四格表的一般形式

理论频数 T 计算公式为: TRC=NRxNC/N

NR :所在的行合计, NC :所在的列合计

Page 11: 第七章   计数资料的假设检验

四格表资料的专用公式

x2 =(ad-bc)2 xN/(a+b)(c+d)(a+c)(b+d)

该公式从基本公式推导而来,结果相同;计算较为简单。

适用条件:N>40 且T 5当不满足时用校正公式。x2 = ( |A-T|-0.5 ) 2/T或x2 =(|ad-bc|-n/2)2 xN(a+b)(c+d)(a+c)(b+d)

Page 12: 第七章   计数资料的假设检验

12

SPSS 计算程序

1.ANALYZE-DESCRIPTIVE STATISTICS-CROSSTABS

2.data-weight cases-frequency variable-ok

Page 13: 第七章   计数资料的假设检验

Chi-Square Tests

4.125b 1 .042

3.466 1 .063

4.224 1 .040

.044 .030

4.106 1 .043

220

Pearson Chi-Square

Continuity Correctiona

Likelihood Ratio

Fisher's Exact Test

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

Computed only for a 2x2 tablea.

0 cells (.0%) have expected count less than 5. The minimum expected count is 20.00.

b.

×é±ð * ½á¹û Crosstabulation

Count

14 86 100

30 90 120

44 176 220

ʵÑé×é

¶ÔÕÕ×é

×é±ð

Total

+ _

½á¹û

Total

Page 14: 第七章   计数资料的假设检验

14

例 题

上例:问此药是否有效。 第一步:建立假设 H0 : 1=2 =20%

H1 : 1 ‡ 2

第二步:确定显著性水平 =0.05 (x2 =3.84) 第三步:计算统计量: n =220>40 ,每格的 T 值大于 5 , x2 =4.125 第四步:确定 P 值 第五步:判断结果

Page 15: 第七章   计数资料的假设检验

15

2 、配对(列联表)资料的 2 检验

有 93 份咽喉涂抹标本,每份标本分别接种在甲乙两种培养基上,观察其生长情况,结果如下表,两种培养基的效果是否不同?

甲乙两种培养基的生长情况

乙培养法甲培养法

合计阳性 阴性

阳性 37 10 47

阴性 19 27 46

合计 56 37 93

Page 16: 第七章   计数资料的假设检验

16

SPSS 计算程序

1.data-weight cases 2.ANALYZE-nonparametric test-2 related s

amples-test pairs-Mcnemar-OK

¼×ÅàÑø»ù & ÒÒÅàÑø»ù

37 10

19 27

¼×ÅàÑø»ù1

2

1 2

ÒÒÅàÑø»ù

Test Statisticsb

93

2.207

.137

N

Chi-Squarea

Asymp. Sig.

¼×ÅàÑø»ù & ÒÒÅàÑø»ù

Continuity Correcteda.

McNemar Testb. =0.05, x2 =3.84

Page 17: 第七章   计数资料的假设检验

例:问两种培养基的效果是否不同第一步:建立假设 H0 : B=C=b+c/2 H1 : B‡C

第二步:确定显著性水平 =0.05第三步:计算统计量 : b+c>40 时,基本公式: x2 = ( A-T ) 2/T , 专用公式: x2 = ( b-c ) 2/ b+c b+c40 时, 校正公式: x2 = ( |A-T|-0.5 ) 2/T x2 = ( lb-cl-1 ) 2/ b+c自由度: = ( 2-1 ) x ( 2-1 ) =1第四步:确定 P 值第五步:判断结果

Page 18: 第七章   计数资料的假设检验

18

3 、行 x 列表的 x2 检验

四格表是指只有 2 行 2 列,当行数或列数超过 2 时,统称为行 x 列表。

行 x 列表的 x2 检验是对多个样本率(或构成比)的检验。 基本公式: x2 = ( A-T ) 2/T 专用公式: x2 =n x ( A2 /nR x nC

-1 ) 自由度: = ( R-1 ) x ( C-1 ) 适用条件:表中不宜有 1/5 以上格子的理论频数小于 5 ,

或有一个格子的理论频数小于 1 。

Page 19: 第七章   计数资料的假设检验

19

为了解花生黄曲霉素污染,随机观察了三个地区,结果见下表。试问这三个地区花生的黄曲霉素污染率是否不同?

三个地区花生的黄曲霉素污染情况

调查地区受检样品

合计 污染率(%)未污染 污染

甲 6 23 29 79.3

乙 30 14 44 31.8

丙 8 3 11 27.3

合计 44 40 84 47.6

Page 20: 第七章   计数资料的假设检验

20

µØÇø * ÊÇ·ñÊܵ½ÁË»ÆÇúù¶¾ËصÄÎÛȾ Crosstabulation

Count

6 23 29

30 14 44

8 3 11

44 40 84

1

2

3

µØÇø

Total

δÎÛȾ ÎÛȾÁË

ÊÇ·ñÊܵ½ÁË»ÆÇúù¶¾ËصÄÎÛȾ

Total

Chi-Square Tests

17.907a 2 .000

18.755 2 .000

14.315 1 .000

84

Pearson Chi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)

0 cells (.0%) have expected count less than 5. Theminimum expected count is 5.24.

a.

=2, =0.05, x2 =5.99

Page 21: 第七章   计数资料的假设检验

21

主要内容(计数资料的统计分析)

一、相对数二、应用相对数的注意事项三、率的标准误四、率的可信区间五、 x2 检验:四格表,配对资料,行 × 列表

Page 22: 第七章   计数资料的假设检验

22

前半段课程 小 结

Page 23: 第七章   计数资料的假设检验

23

基本内容

统计描述 统计推断 (1) 统计推断 (2)计量资料 频数分布

集中趋势离散趋势

抽样误差标准误 t u F 检验秩和检验可信区间

直线相关与回归偏相关多元线性回归因子分析

计数资料 相对数(率、比)

率的标准误;可信区间;2 检验

Logistic 回归

Page 24: 第七章   计数资料的假设检验

24

思考:1. 均数与标准差适合用于什么资料的描述?2. 标准差和标准误有何区别和联系?3. 可信区间和参考(正常)值范围有何不同?4. 假设检验的基本思想是什么?步骤是什么?5. 计量资料假设检验的类型有哪些?6. 方差分析适用于什么样的设计?7. 相关与回归的区别与联系是什么?8. 相对数用于什么资料的描述?9. 计数资料的主要检验方法是什么?

Page 25: 第七章   计数资料的假设检验

25

分析计算

要求:

1. 选择合适的计算程序;

2. 在计算机上计算出结果;

3. 会看结果;

4. 完整的书写过程。

Page 26: 第七章   计数资料的假设检验

26

祝大家取得好成绩!

王晓莉