第十六章 分类变量的统计描述

31
第第第第 第第第第第 第第第

Upload: linus-tyler

Post on 04-Jan-2016

69 views

Category:

Documents


4 download

DESCRIPTION

第十六章 分类变量的统计描述. 主要内容. 常用相对数 应用相对数的注意事项 标准化法 为什么引入相对数 ? 绝对数的局限性. 某医师分析 1998 年甲乙两地高血压患病情况,甲地患病 450 人,乙地患病 720 人,乙地比甲地多患病 270 人。. 绝对数 :某事物现象的实际发生数. 已知甲地调查人数为 8000 人,乙地调查人数为 16000 人. 甲地高血压患病率 =5.63% 乙地高血压患病率 =4.5%. 相对数 : 两个有联系的指标之比. 表 16-1 不同地区学生脊柱侧凸患病率. 第一节 常用相对数. 一、常用相对数 1. 率 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第十六章 分类变量的统计描述

第十六章 分类变量的统计描述

Page 2: 第十六章 分类变量的统计描述

2

主要内容

常用相对数应用相对数的注意事项标准化法

为什么引入相对数 ?

绝对数的局限性 .

Page 3: 第十六章 分类变量的统计描述

某医师分析 1998年甲乙两地高血压患病情况,甲地患病 450人,乙地患病 720人,乙地比甲地多患病 270人。

已知甲地调查人数为 8000 人,乙地调查人数为16000 人

绝对数:某事物现象的实际发生数

甲地高血压患病率 =5.63%

乙地高血压患病率 =4.5%

相对数:两个有联系的指标之比

Page 4: 第十六章 分类变量的统计描述

地区编号 受检人数 阳性数 患病率(‰ ) 阳性数构成比

1 1637 5 3.05 1.39

2 2177 6 2.76 1.66

3 2080 11 5.29 3.05

4 2110 12 5.69 3.32

5 2347 20 8.52 5.54

6 3871 44 11.37 12.19

7 9247 109 11.79 30.19

8 7388 100 13.54 27.70

9 2914 54 18.53 14.96

合计 33798 361 10.68 100.00

表 16-1 不同地区学生脊柱侧凸患病率

Page 5: 第十六章 分类变量的统计描述

一、常用相对数 1.率 2.构成比 3.相对比

第一节 常用相对数

重要区别:分子、分母

Page 6: 第十六章 分类变量的统计描述

地区编号 受检人数 阳性数 患病率(‰ ) 阳性数

构成比 各区与 1 区之比

1 1637 5 3.05 1.39 1.00

2 2177 6 2.76 1.66 1.33

3 2080 11 5.29 3.05 1.27

4 2110 12 5.69 3.32 1.29

5 2347 20 8.52 5.54 1.43

6 3871 44 11.37 12.19 2.36

7 9247 109 11.79 30.19 5.65

8 7388 100 13.54 27.70 4.51

9 2914 54 18.53 14.96 1.78

合计 33798 361 10.68 100.00 -  

表 16-1 不同地区学生脊柱侧凸患病率

率构成比

相对比

Page 7: 第十六章 分类变量的统计描述

一 . 率

含义:又称频率指标。

通常是某种现象实际发生的观察单位数与可能发

生该现象的总数之比。

应用:说明某现象在一定条件下发生的频率大小或强度,反映事物的普遍及严重程度。

计算: K 实际发生某现象的观察单位数

率可能发生某现象的观察单位总数

Page 8: 第十六章 分类变量的统计描述

K 为比例基数,如 100%, 1000‰ ,万 / 万,十万 / 十万,等。

比例基数的选择: 使计算的结果能保留 12 位整数,以便阅读; 如:患病率通常用百分率、千分率;婴儿死亡率用千分率;

肿瘤死亡率以十万分率表示。

率的特点:不受其它率的影响; 各率相互独立,其和不为 1

合计率不可直接相加应为分子、分母分别相加后 再相除。

Page 9: 第十六章 分类变量的统计描述

二 . 构成比

含义:又称为构成指标,指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用百分数表示。

应用:用以说明某一事物内部各组成部分所占的比重或分布

计算:

通常以 100% 为比例基数

100% 某一组成部分的观察单位数

构成比同一事物各组成部分的观察单位总数

Page 10: 第十六章 分类变量的统计描述

某地 1992 年护理人员学历构成学历 人数 构成比(%)

本科 99 0. 14

大专 1248 1. 74

中专 53521 72. 65

无学历 18763 25. 47

合计 73667 100. 00

构成比

Page 11: 第十六章 分类变量的统计描述

特点: 1 、各组成部分的构成比之和为 100% ,分子为分母一部分

2 、某一部分比重变化,则其它部分也相应变化

Page 12: 第十六章 分类变量的统计描述

三 . 相 对 比

含义:是指两个有联系的指标之比,常以百分 数或倍数表示

计算:

特点: 1. 甲、乙可以性质相同,也可以性质不同 2. 甲、乙可以是绝对数、相对数或平均数

)(倍数或百分数指标乙指标甲

相对比 %)(

)(

B

AR

Page 13: 第十六章 分类变量的统计描述

例:某年某地出生婴儿中,男性婴儿为 242 ,女性婴儿为 230 。则出生婴儿性别比例为:

或出生婴儿性别比例为 1.052: 1

%2.105%100230

242=

Page 14: 第十六章 分类变量的统计描述

例:某地某病 1949 年死亡率为 3.3/10 万, 1975年为 0.1/10 万,则这两年相对比为:

%03.3%1003.3

1.0)(33

1.0

3.3 或,倍

Page 15: 第十六章 分类变量的统计描述

第二节 应用相对数的注意事项

一、计算率和构成比时分母不宜过小。

二、正确区分构成比和率。表 16-2 某市 1980 年与 1990 年传染病的构成

疾病1980 年 1990 年

病例数 构成比( % ) 病例数 构成比( % )痢疾 3604 49.39 2032 37.92

肝炎 1203 16.49 1143 21.33

流脑 698 9.56 542 10.11

麻疹 890 12.20 767 14.31

其他 902 12.36 875 16.33

合计 7297 100.00 5359 100.00

Page 16: 第十六章 分类变量的统计描述

三、对率和构成比进行比较时,应注意资料的可比性。

观察对象是否同质:哮喘发病率的比较,观察季节不同结果就不一样

观察对象内部结构是否相同:即其他影响因素在被比较总体之间的分布或构成是否一致。

如上级医院的病死率高于基层医院,因病情构成不同不能直接比较;

如比较某地甲亢的发病率,性别构成不同不能直接比较 处理方法:标准化、多因素分析。

应用相对数应注意的问题

Page 17: 第十六章 分类变量的统计描述

四、率的标准化

五、两样本率比较时应进行假设检验

Page 18: 第十六章 分类变量的统计描述

第三节、率的标准化法

表 16-3 某年甲、乙两地儿童传染病发病率(‰ )

年龄组 /岁

甲地   乙地

人口数

人口构成

发病数 发病率   人口

数人口构成

发病数

发病率

1 ~ 25420.121

9316

124.31

  10140.259

3117

115.38

5 ~ 42850.205

4168 39.21 1905

0.4871

16 8.40

10~12

14029

0.6727

120 8.55   9930.253

64 4.03

合计 20856

1.0000

604 28.96   39121.000

0 137 35.03

Page 19: 第十六章 分类变量的统计描述

i iN pp

N

iPi iN P

iNiP i iN P

年龄组

标准人口

甲地 乙地实际发病率 预期发病数 实际发病

率预期发病数

1~ 3556 124.31 422 115.38 410

5~ 6190 39.21 243 8.40 52

10~ 12

15021 8.55 128 4.03 61

合计 24767 - 813 - 523

‰11.12‰100024767

523'

32.83‰‰100024767

813'

i

ii

i

ii

N

PNP

N

PNP

乙地标化后的发病率:

甲地标化后的发病率:

Page 20: 第十六章 分类变量的统计描述

标化法的基本思想:采用统一的标准构成计算标准化率,以消除构成不同对各组总率的影响,使求得的标准化率具有可比性。

标准化率:也称调整率,经标准化处理后的率

Page 21: 第十六章 分类变量的统计描述

1. 选择标准: 标准人口数、标准人口构成比选定标准的原则: 有代表性、较稳定、容易获得,便于比较

2. 计算标准化率:

标准化法的步骤

Page 22: 第十六章 分类变量的统计描述

标准构成: 1 、通用的或便于比较的标准。 (如全国、全省人口构成做标准) 2 、两组之和的人口数或人口构成; 3 、某一组的人口数或人口构成;

标准化方法:直接法和间接法

(二)标准化率的计算:

Page 23: 第十六章 分类变量的统计描述

直接法的使用条件是已经有被观察的人群中各年龄组的患病率(或发病率、死亡率等)资料。

第一步:选择方法 直接法或间接法

若缺乏各年龄组的患病率资料,仅有各年龄组的观察单位数和总的患病率,则选择间接法

计算公式

Page 24: 第十六章 分类变量的统计描述

计算公式:

( 1 )选择人口数作标准

i iN pp

N Ni :为标准年龄别人口数;

Pi :为实际年龄别死亡率;N :为标准人口总数。

(一)直接法

i iN p 是被标化组按标准组年龄组人口数算得得预期死

亡数,除以标准组得总人口数就是直接法得标化率

Page 25: 第十六章 分类变量的统计描述

( 2 )选择人口构成比作标准

ii

Np p

N

iN

N标准组人口构成比

Page 26: 第十六章 分类变量的统计描述

间接法:选择死亡率做标准

P:为标准总死亡率, r:为实际总死亡数,

ni: 为实际组别人口数,

Pi: 为标准年龄别死亡率,

∑ niPi: 为预期死亡数,

r/∑niPi: 为标准化死亡比 , 用 SMR表示。

i i

rp P P SMR

n P

(二)间接法

什么是 SMR?

Page 27: 第十六章 分类变量的统计描述

标准化死亡比( SMR )

定义:标准化死亡比( standard mortality

ratio ,简称 SMR )是在死亡资料分析用的较多的一个相对数指标,是指某人群中实际观察到的死亡人数与该人群标准化后计算出的期望死亡人数之比。

计算公式:某人群实际死亡人数

标准化死亡比=该人群期望死亡人数

Page 28: 第十六章 分类变量的统计描述

标准化死亡率( Pi )

吸烟 不吸烟 人数ni

预期患病数 niPi

人数 ni 预期患病数 niPi

35~

45~

55~

65~

7.0425.70108.25263.94

49705426332811710624

189370 104766004327540

13.3326.9265.0072.69

75~ 451.87 6137 14532 65.67

合计 16.32 137216

100.67

396247 243.61

3.510.9630.4428.0427.73

已知吸烟者中死于肺癌人数为 432人,不吸烟者中死于肺癌 210人

标准化率的计算 - 间接法

吸烟标化患病率 =P×r/∑niPi=34.60×432/100.67=148.48/10万不吸烟标化患病率 =P×r/∑niPi=3460×210/243.61=29.83/10万

Page 29: 第十六章 分类变量的统计描述

1 、内部构成不同的率比较时应标准化后再比较; 2 、该法的目的是采用统一标准,消除混杂因素影响,使其具

有可比性。选定的标准不不同,算得的标准化率也不同。 标准化后的率并不表示率的实际水平,只能表示相互比较资

料间的相对水平。 3 、各组分率大小交叉出现时则不宜采用标准化法处理;如不

就算标准化率,而分别比较各分组的率,也可得出正确结论,但不能比较总率的大小。

4 、两样本标准化率是样本值,存在抽样误差,若想得出标化组和被标化组的总率是否相等的结论,还应作假设检验。

(三)率的标准化应注意的问题

Page 30: 第十六章 分类变量的统计描述

小 结

掌握率、构成比、相对比的概念、计算方法标准化法的基本思想和计算方法

Page 31: 第十六章 分类变量的统计描述

SPSS软件