3.2《 独立性的基本思想 及其初步应用 》

15
3.2 独独独独独独独独 独独独独独独

Upload: ila-love

Post on 01-Jan-2016

33 views

Category:

Documents


2 download

DESCRIPTION

3.2《 独立性的基本思想 及其初步应用 》. 教学目标. 通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性 . 教学重点 :理解独立性检验的基本思想及实施步骤 . 教学难点 :了解独立性检验的基本思想、了解随机变量的含义. 问题 :. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 3.2《 独立性的基本思想 及其初步应用 》

3.2 《独立性的基本思想及其初步应用》

Page 2: 3.2《 独立性的基本思想 及其初步应用 》

教学目标 通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性 .

教学重点:理解独立性检验的基本思想及实施步骤 . 教学难点:了解独立性检验的基本思想、了解随机变量的含义 .

Page 3: 3.2《 独立性的基本思想 及其初步应用 》

某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了 515 个成年人,其中吸烟者 220 人,不吸烟者 295 人,调查结果是:吸烟的 220 人中 37 人患病, 183 人不患病;不吸烟的 295 人中 21 人患病, 274 人不患病。

根据这些数据能否断定:患肺癌与吸烟有关吗?

Page 4: 3.2《 独立性的基本思想 及其初步应用 》

患病 不患病 总计吸烟 37 183 220

不吸烟 21 274 295总计 58 457 515

为了研究这个问题,我们将上述问题用下表表示:

列 2×2联表

在不吸烟者中患病的比重是 在吸烟者中患病的比重是

7.12%16.82%上述结论能什么吸烟与患病有关吗?能有多大把握

认为吸烟与患病有关呢?

Page 5: 3.2《 独立性的基本思想 及其初步应用 》

患病 不患病 总计吸烟 a b a+b

不吸烟 c d c+d

总计 a+c b+d a+b+c+d

列出 2×2 列联表

假设 H0 :吸烟和患病之间没有关系 即 H0 : P(AB) = P(A)P(B) 其中 A 为某人吸烟, B 为某人患病

设 n = a + b+ c+ d 则 P(A)

n

ba

P(B)

n

ca

故 P(AB) n

ca

n

ba

吸烟且患病人数n

ca

n

banABPn

)(

吸烟但未患病人数n

db

n

banBAPn

)(

不吸烟但患病人数n

ca

n

dcnBAPn

)(

不吸烟且未患病人数n

db

n

dcnBAPn

)(

Page 6: 3.2《 独立性的基本思想 及其初步应用 》

怎样描述实际观测值与估计值的差异呢?

统计学中采用

nca

nba

n

nca

nba

na

2

2)(

ndb

nba

n

ndb

nba

nb

2)(

nca

ndc

n

nca

ndc

nc

2)(

ndb

ndc

n

ndb

ndc

nd

2)(

))()()((

)( 22

dcbadbca

bcadn

 化简得

2 (

2观测值 预期值)用卡方统计量:

预期值来刻画实际观测值与估计值的差异.

Page 7: 3.2《 独立性的基本思想 及其初步应用 》

独立性检验

第一步: H0 : 吸烟和患病之间没有关系

通过数据和图表分析,得到结论是:吸烟与患病有关

结论的可靠程度如何?

患病 不患病 总计吸烟 a b a+b

不吸烟 c d c+d

总计 a+c b+d a+b+c+d

第二步:列出 2×2 列联表

用 χ2统计量研究这类问题的方法

步骤

Page 8: 3.2《 独立性的基本思想 及其初步应用 》

第三步:引入一个随机变量:卡方统计量

第四步:查对临界值表,作出判断。

dcban 其中

2

2 n ad bc

a b c d a c b d

P(≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001

x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

Page 9: 3.2《 独立性的基本思想 及其初步应用 》

P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001

x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

828.102

635.62

706.22

706.22

0.1% 把握认

为 A与 B无关1% 把握认为 A与 B无关

99.9% 把握认为 A与 B有关99% 把握认

为 A与 B有关90% 把握认

为 A与 B有关

10% 把握认为A与 B无关没有充分的依据显示 A与 B有关,但也不能显示 A与 B无关

例如

Page 10: 3.2《 独立性的基本思想 及其初步应用 》

独立性检验

通过公式计算

患病 不患病 总计吸烟 49 2099 2148

不吸烟 42 7775 7817

总计 91 9874 9965

632.56

91987421487817

2099424977759965 22

H0 : 吸烟和患病之间没有关系解:

Page 11: 3.2《 独立性的基本思想 及其初步应用 》

已知在 成立的情况下,0H

故有 99.9% 的把握认为 H0 不成立,即有 99.9% 的把握认为“患病与吸烟有关系”。

即在 成立的情况下, 大于 10.828 概率非常小,近似为 0.001

0H2

现在的 =56.632 的观测值远大于 10.828 ,出现这样的观测值的概率不超过 0.001 。

2

001.0)828.10( 2 P

Page 12: 3.2《 独立性的基本思想 及其初步应用 》

反证法原理与假设检验原理

反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。

假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。

Page 13: 3.2《 独立性的基本思想 及其初步应用 》

例 1. 在 500 人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外 500 名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?

未感冒 感冒 合计使用血清 258 242 500

未使用血清 216 284 500

合计 474 526 1000

解:设 H0:感冒与是否使用该血清没有关系。

075.7500500526474

2162422842581000 22

因当 H0成立时, χ2≥6.635的概率约为 0.01,故有 99%的把握认为该血清能起到预防感冒的作用。

P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001

x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

Page 14: 3.2《 独立性的基本思想 及其初步应用 》

P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001

x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

有效 无效 合计口服 58 40 98

注射 64 31 95

合计 122 71 193

解:设 H0:药的效果与给药方式没有关系。

3896.1959871122

40643158193 22

因当 H0成立时, χ2≥1.3896的概率大于 15%,故不能否定假设 H0,即不能作出药的效果与给药方式有关的结论。

< 2.072

例 2:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的 193 个病人的数据,能否作出药的效果和给药方式有关的结论?

Page 15: 3.2《 独立性的基本思想 及其初步应用 》

P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001

x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

例 3:气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,问:它们的疗效有无差异?

有效 无效 合计复方江剪刀草 184 61 245

胆黄片 91 9 100

合计 275 70 345

解:设 H0:两种中草药的治疗效果没有差异。

098.1110024570275

91619184345 22

因当 H0成立时, χ2≥10.828的概率为 0.001,故有 99.9%的把握认为,两种药物的疗效有差异。