唯统计论
DESCRIPTION
唯统计论. “请给个铜币吧,”一个乞丐在议会广场拦住财政部的统计专家说,“我已经三天没有吃东西了。” “啊,”统计专家亲切地问,“和去年同期相比怎样?” 有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上面写着: “擦眼泪 11 次;系鞋带 15 次;给每个孩子吹玩具气球各 5 次;每个气球的平均寿命 10 秒钟;警告孩子不要横穿马路 26 次;孩子坚持要穿马路 26 次;我还要再过这样的星期六 0 次。”. 统计学是现代医学大厦的一个重要支柱 - PowerPoint PPT PresentationTRANSCRIPT
唯统计论
“请给个铜币吧,”一个乞丐在议会广场拦住财政部的统计专家说,“我已经三天没有吃东西了。”
“啊,”统计专家亲切地问,“和去年同期相比怎样?”
有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上面写着: “擦眼泪 11次;系鞋带 15次;给每个孩子吹玩具气球各 5 次;每个气球的平均寿命 10秒钟;警告孩子不要横穿马路 26次;孩子坚持要穿马路 26次;我还要再过
这样的星期六0 次。”
统计学是现代医学大厦的一个重要支柱统计学是现代医学大厦的一个重要支柱
————美国医学会杂志(美国医学会杂志( JAMAJAMA)主)主编编
统计学是挖掘数据背后的真理统计学是挖掘数据背后的真理 —— —— MedSci.cn MedSci.cn
医学论文中的统计学问题医学论文中的统计学问题
60 年代到 80 年代,国外医学杂志调查结果:有统计 错误的论文 20%~72% 。 1996 年对 4586 篇论文统计(中华医学会系列杂志 占 6.9% ),数据分析方法误用达 55.7% 。 2001年《中华预防医学杂志》:中华医学会系列杂 志误用约 54%(1995篇 ) 。 如果广大医师没有一定的统计学知识,没有独立分析和判决的能力,将会把出现在上述 70%以上文献中的部分或完全不可靠的结论作为正确的而接受下来。
一、统计方法的选择应从科研设计开始
实验设计包括统计分析方法- 无科学设计、设计不严谨,数据量不够、统计结果与专业结论自相矛盾、无法得出期望的统计结果,“亡羊补牢”。
严谨完善的科研设计是正确运用统计方法的前提。- Fancy statistical methods cannot rescue garbage data
- Fancy statistical methods can help you gain insight into your data, over and above what seems obvious on its face
- You should always worry about whether the sampled results are representative of the population, and whether your sample allows you to make inferences about the population.
二、统计方法的选择要遵循基本原则
研究目的 设计类型 结局变量的类型 适用条件
研究目的转换成数据资料
- 只能由高级向低级转化:连续型 -有序 -分类 -二值
研究目的 拟分析指标 结局变量
等级资料
计数资料
计量资料
1000名
某市人群
随机抽样
某市高血压患病
率变量:血压 ,性别,年龄,家族史,高盐饮食… …
收缩压: 130mmHg, 110mmHg… …(计量)高血压 :有或无(计数)高血压程度 :轻,中,重(等级)
文献研究 -review, systemic review,Meta分析
实验研究
实地观察研究
调查研究
适用条件:
- 资料分布特征:正态分布,二项分布, Poission分布
- 样本量大小,理论频数,方差齐性
医学科学研究
医学科学研究
病例对 照研究
队列研究
分析性研究
描述性研究:现况研究
析因设计
交叉设计随机区组设计
完全随机设计配对设计
分析的目的 资料的类型 资料的分布 设计方案 样本含量大小
二、统计方法的选择要遵循基本原则
三、统计分析要有明确的思路
先统计描述后统计学推断 先单因素分析后多因素分析 先计量资料,后计数和等级资料
常用的统计分析方法
统计描述
离散程
度集中趋
势统计图
表
研究目的 资料类型
计量资料 等级资料 计数资料
统计推断 统计描述统计推断 统计推断
t检验
方差分析
秩和检验
相对比
构成比
率
2卡方检验
条件no
按性质分为:
表达 方式欠妥
科学性不够严谨
原则性错误
五、医学论文中常出现的统计学错误
按分析思路分为:
资料的表达 和描述错误
统计推断方法错误
结果表达错误
统计表和统计图
描述平均水平和离散趋势
描述相对数
(一)资料的表达 和描述
统计表 -结构不合理,不符合要求
统计表 - 表中数据的含义未表达清楚
统计图
恰当的选用图形 ,标题,图例 ,坐标,美观 论文中除非表示趋势 ,一般不建议用图。
计量资料描述:平均水平和离散趋势
使用正态分布方法表达呈偏态 分布的资料( × ) 应选用中位数 (M),描述其离散趋势 应选用四分位数间距(QR)
计数资料描述:相对数(率,构成比)
不能以构成比代替率:率 - 某一确定人群中某事件发生的频率
- 某日新闻联播 - 我国高血压 现状不容乐观,发病率 已高达约 10%。
- 发病率 (incidence rate):
- 患病率 (prevalence rate):
K平均人口数该期间可能发生某病的病例数观察期间新发生的某病
发病率=
K该期间的平均人口数
例数观察期间某病的现患病患病率=
- 2003年 , 有人撰文并在网上报道如下:第一阶段医护人员感染率为 33%,并解释说:在感染“非典”的 100人中,有 33人是医护人员。-《 600例小儿烧伤休克期治疗分析》: 600例烧伤患儿 , 210例早期有休克症状,其中 3 岁以下者 110例,占 52%, 3 岁以上者 100例,占 48%,年龄越小,休克发生率越 高。
错用患病率 和发病率 :
表 5 资料是假设的某地 1955 年和 1956年疟疾发病人 数资料,已知该地人口在两年中没有什么变动。
表 5 各种疟疾的构成情况
从表中可以看到, 1956年间日疟疾和三日疟的百分比都上升了,但由此得出间日疟和三日疟增多的结论 ,是否正确?
1955年 1956年 类 别
发病人数 %
发病人数 %
恶性疟 68 70.1 21 42.0
间日疟 12 12.4 12 24.0
三日疟 17 17.5 17 34.0
合 计 97 100.0 50 100.0
计数资料描述:相对数(率,构成比)
计算相对数的分母过小( × ) 一般要求观察单位数不小于 30
计数资料描述:相对数(率,构成比)
用实际频数来描述
计数资料描述:相对数(率,构成比)
表 3 两种方法治愈率的比较
两组研究对象构成不一致,需要进行标准化 两个样本率比较时应该进行假设检验。 比较相对数时应注意可比性。
组别 新 疗 法 一般疗法
治疗人数 治愈人数 治愈率(%) 治疗人数 治愈人数 治愈率(%) 成人 42 32 80 70 49 70
儿童 80 40 50 30 12 40
合计 120 72 60 100 61 61
计数资料描述:相对数(率,构成比)
二、统计方法的选择要遵循基本原则
研究目的 设计类型 结局变量的类型 适用条件
(二)统计学推断常见错误 – 计量资料
误将计量资料判为计数资料
忽视 t 检验和方差分析的前提条件
单因素分析中实验设计类型判断错误
多因素分析中实验设计类型判断错误
忽视 t 检验和方差分析的前提条件
医学论文中 t 检验的流行 不考虑 t 检验的应用前提,对两组的比较一律用 t 检验 将各种实验设计类型一律视为多个单因素两水平设计, 多次用 t 检 验进行均值之间的两两比较
根据设计类型:- 单因素两水平: t检验,秩和检验 条件:正态分布,方差齐性 设计:单组、配对、成组设计
- 单因素多水平(≥ 3):方差检验,秩和检验- 多因素单水平或多水平:方差检验,秩和检验
( × )
( √ )
误将定量资料判为定性资料
原作者: X2 检验 ( × ) 需要专业和统计知识相结合 研究目的是样本的 ER,RR检测率
实例:小儿皮肤血管瘤雌、孕激素受体的研究 -采用免疫组化对皮肤组织的ER,PR受体进行检测。对标本进行免疫组化染色,高倍镜下对肿瘤区内计数 500个细胞,计数 ER, PR 阳性细胞百分率。
原作者:两组独立样本 t 检验 ( × )
误用成组设计资料的 t 检验分析配对设计计量资料
对对数的差值进行正态性检验 偏态分布: Wilcoxon 秩和检验
实例:用改良的 Seldinger’s插管技术对 8例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。治疗前后测血 hCG。
原作者: t 检验 ( × )
计量资料单因素多组比较分析
经过正态性和方差齐性检验:取对数或平方根变换 正态分布: ANOVA,Dunett-t检验 ;偏态分布: Kruskal-Wallis
实例:研究血清 CEA,CA19-9, CA72-4 和 CA242 4项肿瘤标志在患者手术前,手术后及转移复发方面差异有无显著意义。
析因设计资料
原作者:配对设计资料的 t 检验( × )
实例:为探讨发育期营养不良伴发癫痫持续状态对海马神经发生的影响,将 28只新生Wistar大鼠建模为 4组,分别为营养良好组,营养不良组,营养良好 +惊厥组,营养不良 +惊厥组,每组 7只,测量各组齿状回 Brdu阳性细胞数。
正态分布:析因设计资料的方差检验 单独效应,主效应和交互效应
析因设计资料
(二)统计学推断常见错误 – 计数资料
资料整理过失及误差和对资料类型判断错误导致
盲目套用 χ2 检验
误用 χ2 检验回答相关性问题
实验设计类型判断错误
来自横断面研究设计来自队列研究设计来自病例对 照研究设计来自配对研究设计
列联表资料的 11种形式
双向无序 结果变量为有序变量的单向有序 双向有序且属性不同 双向有序且属性相同
结果变量为二值变量 结果变量为多值有序变量 结果变量为多值名义变量
四格表
R×C 列联表
高维列联表
计数资料整理错误:四格表形式
若消毒后的 20根螺纹管就是消毒前的那 20根螺纹管
McNemar χ2 检验公式
一般四格表资料
表 18 不同分娩方式与重症肝炎孕妇的结局 分娩方式 例 数 存 活 死 亡
剖宫产 9 8 1
阴道分娩 13 4 9
合 计 22 12 10
原作者: 一般的 χ2 检验 ( × )实际频数太小,根据总体样本量和理论频数来判断公式n≥40,理论频数 T大于 5 :一般四格表 χ2 公式n≥40,但有理论频数满足 1≤T<5:校正公式n<40或有理论频数小于 1时 Fisher精确检验
配对四格表资料
表 19 PCR 法与 ELISA 法检测结果
原作者: 一般的 χ2 检验 ( × )
配对设计下卡方检验:McNemar 检验 b+c<40, 应用矫正公式
PCR法 ELISA法
+
+ 23 0 5 92
实例: 研究者分别用两种方法检验 120份标本, PCR法检测得到 28份标本为阳性结果, ELISA法检测得到 23份标本为阳性结果。
表 19 (b)以PCR法为“金标准”推算ELISA法测定结果
方 法 阳性例数 阴性例数
PCR法 28 0
ELISA法 23 5
要看是否有评判检测结果正确与否的“金标准” 要看能否以其中一种检测方法为基法。
单向有序 R×C列联表资料
原作者: R×C χ2 检验 ( × ) 排除性别、病程等非 实验因素影响 单项有序 R×C列联表:秩和检验, Ridit分析
双向有序属性不同 R×C列联表资料
原作者: R×C χ2 检验 ( × ) 双向有序且属性不同 不同分化程度下 P16各等级的频数分布有无差别 - 秩和检验 希望研究“分化程度”与“ P16取值的等级”之间是否存在相关, 可选用 Spearman等级相关、典型相关分析。
双向有序属性相同 R×C列联表资料
原作者: R×C χ2 检验 ( × ) 双向有序且属性相同,目的是分析两种方法的结果之间是否具有一致性 ,做一致性检验 ,即 Kappa检验。
实例:中老年职工最大呼气流量与工作能力的关系 -采用工作能力指数(WAI)法和 75%肺活量位最大呼气流量( V75)法评价 285名中老
年职工的工作能力,并分为差,中,好三个等级
常见: 资料未经过任何统计处理 未交代选用的是何种统计分析方法,仅给出 P值 但未给出统计量的具体值
(三)统计检验结果表达
( × )
( √ ) 完善的表达 方式: 所选用的统计分析方法; 统计量的具体取值及其自由度; 假设检验的具体 P值; 有关总体参数的 95%可信区间;
正确解读统计学意义和实际意义
统计的结论必须和专业结论有机的相结合 统计显著性 ≠ 临床“显著性”?
某大型降压类药物 RCT临床试验,发现 A组药物平均收缩压下降较 B组多 2 mmHg,统计学显示 P<0.001,表明两组有统计学显著性差异,但是否有临床疗效显著差异?
某研究组采用基因治疗 6例血友病患儿 ,取得极其满意疗效,但例数太少,也无对照组。无法进行统计,这种研究
有临床意义吗?
案例 1:因为 2 mmHg本身就在血压测 量误差范围,没有任何临床意义案例 2:发表在 NEJM, 2011; 365: 2357上
统计意义与临床意义只有携手,做统计意义的主人,才是“真意义”
正确解读“ P<0.01”与“ P<0.05”的真正含义
根据 P值是“ <0.05”还是“ <0.01”作出肯定程度不同的专业结论。 例如,当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到“ P<0.001”,则认为甲药极显著地优于乙药;若得到“ P<0.01”,则认为甲药非常显著地优于乙药;若得到“ P<0.05”,则认为甲药显著地优于乙药 。
( × )
( √ ) 统计学上根据假设检验原理推算出来的 P 值,表示 拒绝特定的零假设可能犯假阳性错误的概率的理论值,它的大小不反映对比的两者之间差别的程度大小。
注视小概率事 件
1949年 ,西方某国家曾有过一个真实的故事。丈夫到法院要求离婚,唯一的理由是他去海外服兵役 50个星期后,回
家发现妻子在家分娩。(无亲子鉴定技术出现)法官如何判案?你认为呢?
一例因因急性髓性白血病 ,合并HIV感染患者 。因为大剂量化疗,会加重HIV感染,因此,难以决策该用何种方案?
通过骨髓移植,发现一例合适配型中,携带 CCR5⊿32突变,移植后,患者两 个病同时被治愈了
Meta分析发现“小概率事 件”中的问题
靶向抗癌药物的致命性不良反应事件• 背景 : 传统化疗药物致命性不良反应事件 ,很清晰 . 但是靶向制剂 ,虽然也有不良反应 , 但是温和得多,而且多是小样本事件(因为价格高昂,研究样本量不会太大,因此不良事件观察也较少),这是Meta分析基础。
• Meta分析必要性:通过Meta分析获得更大的样本,从而得出更可靠的结论。发现一些潜在问题。
• Schutz FA,Richards CJ,Je Y,et al. Meta-Analysis of Randomized Controlled Trials for the Incidence and Risk of Treatment-Related Mortality in Patients With Cancer Treated With Vascular Endothelial Growth Factor Tyrosine Kinase Inhibitors. J Clin Oncol. 2012 Feb 6.
“统计笑话”
• 一位统计学家得到信息:“每一百万乘坐飞机人中只有一个人会携带炸弹”。 于是他每次坐飞机要携带一个炸弹。 被机场管理员发现后,他解释原因说: 一架飞机上有一个人携带炸弹的几率是百万分之一,同时有两个人携带炸弹的几率是万亿分之一,所以不可能发生。
Thank you very much Thank you very much for your attention!for your attention!
http://www.medsci.cn
电话 400-640-8988 021-64087586/64088675/64085339
传真 021-64085875
Email: [email protected]