医学统计学 medical statistics

51
预预预预预 预预 [email protected]

Upload: melia

Post on 10-Jan-2016

26 views

Category:

Documents


4 download

DESCRIPTION

医学统计学 Medical Statistics. 预防教研室 宋花玲 [email protected]. 思考题 1 :. 随机抽取 50 - 59 岁男性正常人、糖尿病患者各 11 人,测定其血浆胆固醇含量分别为 3.20±0.70 (mmol/L) 、 5.35±1.19(mmol/L) ,问两组人的血浆胆固醇有无差别?为什么?. t = 5.136 p

TRANSCRIPT

Page 1: 医学统计学 Medical Statistics

预防教研室 宋花玲

[email protected]

Page 2: 医学统计学 Medical Statistics

思考题思考题 11 :: 随机抽取 50 - 59 岁男性正常人、

糖尿病患者各 11 人,测定其血浆胆固醇含量分别为 3.20±0.70 (mmol/L) 、 5.35±1.19(mmol/L) ,问两组人的血浆胆固醇有无差别?为什么?

t = 5.136 p<0.01

Page 3: 医学统计学 Medical Statistics

思考题思考题 22 ::

A 药和 B 药分别治疗 60 名患者, A药的治愈率为 80 %, B 药的治愈率为 90 %,证明 A 药的疗效优于 B 药,这种说法对吗?为什么?

χ2 = 2.35 p = 0.1250

Page 4: 医学统计学 Medical Statistics

美国于 1958 年开始在外科手术中采用麻醉剂氟烷( halothane )。到 1962 年时,以其不易燃、不易爆、副作用小等优点大约普及到了一半手术。

不料,突然有报告称数例病人术后恢复的同时突然恶化、发热、死亡,尸解显示肝脏大片坏死,

一时间疑云四起。氟烷是否损害肝脏?是否应禁止用于手术?

思考题思考题 33 ::

Page 5: 医学统计学 Medical Statistics

在有较完整病案资料的 34 家医院中抽取 1960 ~ 1964年间的 85 万例手术病例。

不分死因,术后 6 星期内,粗死亡率为 20‰ 。

按所用麻醉剂区分,氟烷、硫喷妥钠( pentothal sodium ) 、 环 丙 烷 ( cyclopropane ) 、 乙 醚 ( ether )和其他麻醉剂相应的粗死亡率分别为 17‰ , 17‰ ,34‰ , 19‰ 和 30‰ 。是否由此可以认为氟烷的死亡威胁小于其他麻醉剂的死亡威胁呢?

经过年龄、性别、医院等等的校正,相应的死亡率分别为 21‰ 、 20‰ 、 26‰ 、 20‰ 和 25‰

Page 6: 医学统计学 Medical Statistics

     某地区 5 种急性传染病的死亡情况 1985 年 1990 年 病 名 死亡人数 构成 ( % ) 死亡人数 构成 ( % )

伤寒 - 副伤寒 33 10.96 14 10.61

流 脑 27 8.97 23 17.42

痢 疾 210 69.77 71 53.79

白 喉 26 8.64 13 9.85

百日咳 5 1.66 11 8.33

合 计 301 100.00 132 100.00

流脑的预防工作 1990 年不如 1985 年吗?为什么?

思考题思考题 44 ::

Page 7: 医学统计学 Medical Statistics

当人类科学家在探索问题的丛林中遇到难以逾越的障碍时,唯有统计学工具可以为其开辟一条前进的通道”

---法兰西斯 .高而顿

Page 8: 医学统计学 Medical Statistics

国内著名的经济学家、人口学家马寅初:

学者不能离开统计学而研学; 政治家不能离开统计学而施政; 事业家不能离开统计学而执业; 军事家不能离开统计学而谋略。

Page 9: 医学统计学 Medical Statistics

“ 医学统计学是国内外临床医学专业的一门重要的基础学科,是 21 世纪临床医生在从事临床工作和科学研究过程中必须掌握和了解的基本知识,统计学方法被医学界比喻为统计学方法被医学界比喻为整个医学大厦中的支柱整个医学大厦中的支柱”

Page 10: 医学统计学 Medical Statistics

医学统计学的学习要求:

理解基本的统计原理培养统计思维能力正确选择、运用统计分析方法

不要求公式的推导和记忆、复杂的手工计算

Page 11: 医学统计学 Medical Statistics

学习方法:

理解课堂讲授内容通过课堂练习题 、课后练习题加以巩固通过实际工作中文献资料的阅读、统计方法的运用进一步理解医学统计学的精髓

Page 12: 医学统计学 Medical Statistics

医学统计学课程进度医学统计学课程进度1 绪论 2 计量资料的统计描述3 计量资料的统计推断4 计量资料的统计推断5 方差分析6 直线相关与回归7 计数资料的描述,率的抽样误差与假设检验 8 习题讲解9 计数资料的统计推断:卡方检验 10 统计图表 秩和检验11 医学科研设计的基本原则和常见类型12 习题讲解

Page 13: 医学统计学 Medical Statistics

第七章 绪论第七章 绪论

Charpter7Charpter7 :: IntroductionIntroduction

Page 14: 医学统计学 Medical Statistics

主 要 内 容主 要 内 容 一、统计学与医学统计学二、统计工作的步骤三、统计学的几个基本概念四、统计资料的类型五、统计学的应用及存在的问题

Page 15: 医学统计学 Medical Statistics

一、统计学与医学统计学一、统计学与医学统计学

统计学是收集、分析、解释与呈现数据资料的一门科学。

Statistics :“ a science dealing with the collection, analysis, interpretation and presentation of masses of numerical data”

----Webster 国际大辞典

Page 16: 医学统计学 Medical Statistics

统计学 (statistics)

运用概率论、数理统计等原理与方法,研究数据的搜集、整理、分析的科学。

医学统计学 (statistics of medicine)

运用统计学的原理和方法,研究医学科研中有关数据的搜集、整理、分析的科学。

统计学与医学统计学

Page 17: 医学统计学 Medical Statistics

二、统计工作的基本步骤二、统计工作的基本步骤 1. 设计:包括调查设计和实验设计。

2. 收集资料:取得准确可靠的原始资料

3. 整理资料:对资料进行清理、改错,数量化

4. 分析资料:统计描述、统计推断

Page 18: 医学统计学 Medical Statistics

1.1. 设计(设计( designdesign ))设计设计:制定计划,对整个过程进行安排。是整个工作

的关键。(1) 研究目的和假说。(2) 研究总体、研究对象、观察单位。(3) 是否施加干预,如何施加干预?(4)需搜集那些资料,如何搜集?(5)设置观察指标。(6)资料的整理和汇总,计算有关统计量。(7)控制误差。(8) 预期结果。(9) 时间和经费的安排等。

包括调查设计和实验设计

Page 19: 医学统计学 Medical Statistics

调查设计(调查设计( survey designsurvey design )) 调查设计调查设计: 客观描述研究总体,不对研究总体施加任何干

预,目的在于摸清某一事物的水平和分布状态 专业设计和统计设计

1 、明确调查目的、确定研究指标2 、确定研究对象和观察单位3 、选择调查方法4 、决定采取的调查方式5 、设计调查项目和调查表6 、样本含量的估计

Page 20: 医学统计学 Medical Statistics

实验设计(实验设计( experiment designexperiment design ))

将一组随机抽取的实验对象随机分配到两种或多种处理组,观察比较不同处理因素的效应

原则:对照、随机、重复

(1) 实验研究设计:以动物或生物材料为研究对象,在研究过程中对研究对象施加干预。

(2) 临床试验设计:以人为研究对象,在研究过程中施加干预。

Page 21: 医学统计学 Medical Statistics

2.2. 搜集资料搜集资料搜集资料搜集资料:根据计划取得可靠、完整的资料。

资料的来源:统计报表和报告卡、日常性工作、专题调查或实验。

资料的收集: 计划的内容: 原则:准确、完整、及时

Page 22: 医学统计学 Medical Statistics

3.3. 整理资料整理资料

整理资料整理资料: 原始资料的整理、清理、核实、查对,使

其条理化、系统化便于计算和分析。

可借助于计算机(软件: Epi-Data, StudyBuilder, dBASE, Excel… )来完成。

Page 23: 医学统计学 Medical Statistics

4.4. 分析资料分析资料分析资料分析资料 ((统计分析统计分析 )): 运用统计学的基本原理和方法,根据研究设计

的目的、要求、资料的类型和分布特征选择正确的统计分析方法,进行分析计算有关的指标和数据,揭示事物内部的规律。

统计描述、统计推断统计描述、统计推断

可借助于计算机(常用软件: SPSS、 SAS、 STATA)完成。

Page 24: 医学统计学 Medical Statistics

三、统计学中的几个基本概念三、统计学中的几个基本概念

1 、总体与样本2 、同质和变异3 、参数和统计量4 、误差5 、频率与概率6 、变量及变量值

Page 25: 医学统计学 Medical Statistics

总体:根据研究目的确定的同质的研究对象的全体。更确切地说,是同质的所有观察单位某种观察值的集合。

有限总体和无限总体 样本:从总体中随机抽取的部分观察单位,其实测值

的集合。总体中有代表性的一部分。

观察单位(个体):最基本的研究单位

样本量( sample size )样本中所包含的观察单位数

1.1.总体与样本总体与样本 (population and sampl(population and sample)e)

Page 26: 医学统计学 Medical Statistics

研究目的

总体上海 2002 年全体正常 18 岁男子身高值

观测单位 每个正常 18 岁男子

观测值 正常 18 岁男子身高值

了解上海 2002 年全体正常 18 岁男子身高情况

Page 27: 医学统计学 Medical Statistics

22 、、同质和变异同质和变异(( homogeneity and variationhomogeneity and variation ))

同质同质:除了实验因素外影响被研究指标 的非实验因素相同。

变异变异:在同质的基础上被观察个体之间 的差异

Page 28: 医学统计学 Medical Statistics

33 、、参数和统计量参数和统计量(( Parameter and statisticsParameter and statistics ))参数( parameter):根据总体的分布特征而计算的总体的统计指标。如总体均数、总体标准差、总体率 是固定的常数 但一般未知

统计量( statistics):根据样本的分布特征而计算的样本的统计指标。如样本均数、样本标准差、样本率 在参数附近随机波动

Page 29: 医学统计学 Medical Statistics

33 、、参数和统计量参数和统计量(( Parameter and statisticsParameter and statistics ))

总体总体 样本 抽取部分观察单位

统计量统计量

参 数参 数

Page 30: 医学统计学 Medical Statistics

4. 4. 误 差误 差(( ErrorError ))

误差:泛指测量值与真值之差 (1) 过失误差:可以避免(2)系统误差:数据搜集和测量过程中由

于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。

可以避免

Page 31: 医学统计学 Medical Statistics

4. 4. 误 差误 差(( ErrorError ))(3) 随机测量误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。如测量一个人身高: 178.12 178.09 178.15cm

不可避免(4) 抽样误差:由于抽样所引起的样本统计量与总体参数之间的差异称为抽样误差

不可避免 但可以计算并在一定范围内控制抽样误差

Page 32: 医学统计学 Medical Statistics

5. 5. 概率和频率概率和频率(probability and frequency) (probability and frequency)

确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件必然事件;肯定不发生某种结果的叫不可能事件。

随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件随机事件。 随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的。

Page 33: 医学统计学 Medical Statistics

5. 5. 概率和频率概率和频率(probability and frequency)(probability and frequency)

实验者 Buffon(法)

k.pearson(英)k.pearson(英)

投掷次数 4040 12000 24000

“正面”次数 2048 6019 12012

频 率 0.5069 0.5016 0.5005

频率:在相同条件下,独立地重复 n次试验,随机事件 A出现 f次,则称 f/n 为随机事件 A出现的频率。 例如投掷硬币,历史上有人对此做过实验得到如下结果:

Page 34: 医学统计学 Medical Statistics

5. 5. 概率和频率概率和频率(probability and frequency)(probability and frequency)

概率:描述随机事件发生的可能性大小的度量,用大写的 P表示;取值: 0~ 1之间。 P 越接近于 1 ,说明发生的可能性越大,越接近于 0 ,说明发生的可能性越小。

小概率事件:通常一个事件的发生 P ≤ 0.05 (5%)或 P ≤ 0.01( 1 %)称为小概率事件 ( 习惯 ) ,统计学上认为不大可能发生。 在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。频率是概率的估计值

Page 35: 医学统计学 Medical Statistics

66 、、变量及变量值变量及变量值

变量:观察对象的特征或指标称为变量。如人的性别、年龄、体重、身高等

变量值:对变量的测得值称为变量值或观察值,亦称为资料

Page 36: 医学统计学 Medical Statistics

变量及变量值变量及变量值

Page 37: 医学统计学 Medical Statistics

四、统计资料的类型四、统计资料的类型

根据是否定量(变量值的性质)可将资料分为:

计量资料、计数资料、等级资料

Page 38: 医学统计学 Medical Statistics

资料的类型资料的类型

有效正常11.5816.80B组女55108

……………………

无效异常15.6622.56对照男554

有效异常10.9317.33B组女433

好转正常12.5720.00对照女452

治愈正常11.4718.67A 组男371

疗效评价

心电图

舒张压(kPa)

收缩压(kPa)

治疗分组

性别

年龄(岁 )

患者编号

108例高血压患者治疗后的临床记录

Page 39: 医学统计学 Medical Statistics

1. 1. 计量资料计量资料

定义:用定量的方法对观察单位准确测量后所得的资料。例如:体重与身高

特点:有度量衡单位 多为连续性资料

Page 40: 医学统计学 Medical Statistics

2. 2. 计数资料计数资料

定义:用定性的方法得到的资料。 将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

特点:没有度量衡单位 多为间断性资料

Page 41: 医学统计学 Medical Statistics

3. 3. 等级资料等级资料

定义:将观察单位按某种属性的不同程度分成等 级后分组计数所得的资料。 是介于计量资料和计数资料之间的一种资料

特点:其变量值具有半定量性质 表现为等级大小或属性程度

Page 42: 医学统计学 Medical Statistics

资料的类型资料的类型

Page 43: 医学统计学 Medical Statistics

不同类型资料间的转化不同类型资料间的转化

不同资料转化举例(每分钟脉搏次数)

计量资料 计数资料 等级资料

75 缓 脉( <60 )

82 正常(60 ~ 100)

125 正常脉(60~100)

96 异常(<60或>100)

56 速 脉( >100 )

Page 44: 医学统计学 Medical Statistics

五、医学统计学的应用及问题五、医学统计学的应用及问题

医学研究的设计、结果的分析、医学研究的设计、结果的分析、解释,病因的探讨,药物的疗效解释,病因的探讨,药物的疗效…………

Page 45: 医学统计学 Medical Statistics

医学统计学的作用

1.提高其医学研究与实践成果的可靠性与可信性

2. 确保科学研究工作的质量

3. 不断提高医学领域的学术水平

Page 46: 医学统计学 Medical Statistics

医学统计学的应用中存在的问题医学统计学的应用中存在的问题

统计图表及方法的误用

统计数据的伪造

Page 47: 医学统计学 Medical Statistics

医学论文中的统计学问题医学论文中的统计学问题

•60 年代到 80 年代,国外医学杂志调查结果:有统计错误的论文 20%~72%。

•1996 年对 4586篇论文统计(中华医学会系列杂志占 6.9%),数据分析方法误用达55.7%。

Page 48: 医学统计学 Medical Statistics

统计数据的真实性问题统计数据的真实性问题

1976 年 New Science 杂志关于科研舞弊行为的调查

( 1) 74% 的调查表反映有不正当修改数据的情况

( 2) 17%拼凑实验结果

( 3) 7%凭空捏造数据

( 4) 2%故意曲解结果

Page 49: 医学统计学 Medical Statistics

Fancy statistical methods cannot rescue garbage data

Fancy statistical methods can help you gain insight into your data, over and above what seems obvious on its face

You should always worry about whether the sampled results are representative of the population, and whether your sample allows you to make inferences about the population.

Page 50: 医学统计学 Medical Statistics

it is a function of statistical method to emphasize that precise conclusions cannot be draw from inadequate data.

-------E Pearson

“ 统计方法特别强调:有缺陷的数据得不出明确的结论!”

Page 51: 医学统计学 Medical Statistics

为了了解某地 20~29岁健康女性血红蛋白的正常值范围,现随机调查了该地 2000名 20~29岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是( ),是什么资料? A.该地所有 20~29 的健康女性

B.该地所有 20~29 的健康女性的血红蛋白测量值 C.抽取的这 2000名 20~29岁女性 D.抽取的这 2000名 20~29岁女性的血红蛋白测量值