学案 5 回归分析与独立性检验

20
学学 学学 5 5 学学学学学学学学学学 学学学学学学学学学学

Upload: maile-arnold

Post on 01-Jan-2016

79 views

Category:

Documents


4 download

DESCRIPTION

学案 5 回归分析与独立性检验. 考 向 预 测. 课内考点突破. 考 纲 解 读. 规 律 探 究. 填填知学情. 考点 1. 考点 2. 考 纲 解 读. 返回目录. 考 向 预 测. 2012年高考,试题难度仍以中低档题为主,有可能在选择、填空题中考查. 返回目录. 1. 随机误差 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 学案 5   回归分析与独立性检验

学案学案 5 5 回归分析与独立性检验回归分析与独立性检验

Page 2: 学案 5   回归分析与独立性检验

考点考点 11

考点考点 22

填填知学情填填知学情

课内考点突课内考点突破破

规 律 探 究规 律 探 究

考 纲 解 读考 纲 解 读

考 向 预 测考 向 预 测

Page 3: 学案 5   回归分析与独立性检验

考 纲 解 读考 纲 解 读

回归分析了解回归分析的思想、方法及其简单应用 .

独立性检验了解独立性检验的思想、方法及其初步应用 .

返回目录

Page 4: 学案 5   回归分析与独立性检验

2012 年高考 , 试题难度仍以中低档题为主 , 有可能在选择、填空题中考查 .

考 向 预 测考 向 预 测

返回目录

Page 5: 学案 5   回归分析与独立性检验

1. 随机误差

由于所有的样本点不共线,而只是散布在某一条直线的附近,实际上, y=bx+a+e,e 是 y 与 =b

x+a 之间的误差 . 通常 e 为随机变量,称为随机误差,它的均值 E(e)=0, 方差 D ( e ) =σ2>0. 这样线性回归模型的完整表达式为

.

y=bx+a+e

E(e)=0,D(e)=σ2{

y

返回目录

Page 6: 学案 5   回归分析与独立性检验

随机误差 e 的方差 σ2 越小,通过回归直线 =bx+a 预报真实值 y 的精确度越高 . 随机误差是引起预报值 与真实值 y 之间的误差的原因之一,其大小取决于随机误差的方差 .

2. 残差

对于样本点 (x1,y1),(x2,y2),…,(xn,yn) 而言,相应于它们的随机误差为 ei=yi-yi=yi-bxi-a,i=1,2,…,n,

其估计值为 ei= = ,i=1,2,…,

n,ei 称为相应于点 (xi,yi) 的残差 .

y

a-bx-y y-y iiii

y

返回目录

Page 7: 学案 5   回归分析与独立性检验

3. 残差分析

在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据 . 然后,可以通过残差 e1,e2,…,en 来判断模型拟合的效果,判断原始数据中是否存在可疑数据 . 这方面的分析工作称为残差分析 .

4. 残差图

作图时纵坐标为残差,横坐标可以选为样本编号,这样作出的图形称为残差图 .

返回目录

Page 8: 学案 5   回归分析与独立性检验

5. 列联表

假设有两个分类变量 X 和 Y ,它们的值域分别为{x1,x2} 和 {y1,y2} ,其样本频数列联表为

此表称为 2×2 列联表 .

根据观测数据计算由公式 .

给出的检验随机变量 K2 的值 k ,其值越大,说明“ X 与Y 有关系”成立的可能性越大 .

y1 y2 总计

x1 a b a+b

x2 c d c+d

总计 a+c b+d

(其中 n=a+b+c+d 为样本容量)

a+b+c+d

d)c)(bd)(ab)(c(a

bc)-n(adK

22

++++=

返回目录

Page 9: 学案 5   回归分析与独立性检验

考点考点 1 1 回归分析回归分析

每立方米混凝土的水泥用量 x( 单位: kg) 与 28 天后混凝土的抗压强度 Y (单位: kg/cm2 )之间的关系有如下数据 : X 150 160 170 180 190 200 210 220 230 240 250 260

Y 56.9 58.3 61.6 64.6 68.1 71.3 74.1 77.4 80.2 82.6 86.4 89.7

返回目录

Page 10: 学案 5   回归分析与独立性检验

【分析】【分析】求回归直线方程和相关系数,通常用计算器来完成 . 在有的较专门的计算器中,可通过直接按键得出回归直线方程的系数和相关系数 . 而如果用一般的科学计算器进行计算,则要先列出相应的表格,有了表格中的相关数据,回归方程中的系数和相关系数都容易求出 .

( 1 )对变量 Y 与 x 进行相关性检验;

( 2 )如果 Y 与 x 之间具有线性相关关系,求回归直线方程 .

返回目录

Page 11: 学案 5   回归分析与独立性检验

【解析】【解析】( 1 )由题目中的数据得如下表格 :

i 1 2 3 4 5 6

xi 150 160 170 180 190 200

yi 56.9 58.3 61.6 64.6 68.1 71.3

xiyi 8535 9328 10472 11628 12939 14260

i 7 8 9 10 11 12

xi 210 220 230 240 250 260

yi 74.1 77.4 80.2 82.6 86.4 89.7

xiyi 15561 17028 18446 19824 21600 23322

返回目录

Page 12: 学案 5   回归分析与独立性检验

查得 r0.05=0.576,

因 r > r0.05, 说明变量 Y 与 x 之间具有线性相关关系 .

943 182 12

1i

==

∑ ii yx

572.94, 54 600, 51812

1

212

1

2 ====

∑∑i

ii

i yx

72.6y205,x ==

999.0)6.7212-4.54572)(20512-518600(

6.7220512-182943r

22≈

××

××=

返回目录

Page 13: 学案 5   回归分析与独立性检验

为了进行相关性检验,通常将有关数据列成表格,然后借助于计算器算出各个量,为求回归直线方程扫清障碍 .

(2)

a=y-bx=10.28.

于是所求的线性回归方程是 : =0.304x+10.28.

304.020512-518600

6.7220512-182943b 2 ≈

×

××=

y

返回目录

Page 14: 学案 5   回归分析与独立性检验

在 10 年期间,一城市居民的年收入与某种商品的销售额之间的关系有如下数据 :

第几年 1 2 3 4 5

城市居民年收入(亿元)

32.2 31.1 32.9 35.8

37.1

某商品销售额(万元)

25.0 30.0 34.0 37.0

39.0

第几年 6 7 8 9 10

城市居民年收入(亿元)

38.0 39.0 43.0 44.6

46.0

某商品销售额(万元)

41.0 42.0 44.0 48.0

51.0返回目录

Page 15: 学案 5   回归分析与独立性检验

(1) 略

(2) =1.447x-15.843.

(1) 画出散点图 ;

(2) 如果散点图中的各点大致分布在一条直线附近,

求 Y 与 x 之间的回归直线方程 .

y

返回目录

Page 16: 学案 5   回归分析与独立性检验

考点考点 2 2 独立性检验独立性检验

在某医院,因为患心脏病而住院的 665名男性病人中,有 214人秃顶,而另外 772名不是因为患心脏病而住院的男性病人中有 175人秃顶 .请用独立性检验方法判断秃顶与患心脏病是否有关系?

【分析】【分析】首先由题目中的数据画出 2×2 列联表,然后根据表中的数据算出 K2 的值,据 K2 的值就可以判断秃顶与心脏病是否有关系 .

返回目录

Page 17: 学案 5   回归分析与独立性检验

【解析】【解析】根据题目所给的数据得到如下 2×2 列联表 :

根据表中的数据,得到 :K2=

所以有 99% 的把握认为“秃顶与患心脏病有关” .

患心脏病 患其他病 合计秃顶 214 175 389

不秃顶 451 597 1048

合计 665 772 1437

6.635.16.373772665048 1389

451)175-597(214437 1 2

>×××

×××≈

返回目录

Page 18: 学案 5   回归分析与独立性检验

( 1 )独立性检验的关键是准确地计算

K2 ,在计算时,要充分利用 2×2 列联表 .

( 2) 学习相关和无关的判定一定要结合实际问题,

从现实中寻找例子,从而增强学习数学的兴趣 .

返回目录

Page 19: 学案 5   回归分析与独立性检验

为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取了 300名学生,得到如下 2×2 列联表 :

判定性别与是否喜欢数学的关系 .

经计算知 K2≈4.514 > 3.841. 95% 的把握可判定高中生的性别与是否喜欢数学课程有关系 .

喜欢数学 不喜欢数学 合计男 37 85 122

女 35 143 178

合计 72 228 300

返回目录

Page 20: 学案 5   回归分析与独立性检验

1.1. 独立性检验可以先考虑定义,然后再考虑用独立性检验可以先考虑定义,然后再考虑用 KK22

值,以及相关系数值,以及相关系数 rr 的值进行判断的值进行判断 ..

2.2. 在进行回归分析之前一定要进行相关性检验,在进行回归分析之前一定要进行相关性检验,

可以用散点图,也可以用相关系数可以用散点图,也可以用相关系数 ..

返回目录