学案 5 回归分析与独立性检验
DESCRIPTION
学案 5 回归分析与独立性检验. 考 向 预 测. 课内考点突破. 考 纲 解 读. 规 律 探 究. 填填知学情. 考点 1. 考点 2. 考 纲 解 读. 返回目录. 考 向 预 测. 2012年高考,试题难度仍以中低档题为主,有可能在选择、填空题中考查. 返回目录. 1. 随机误差 - PowerPoint PPT PresentationTRANSCRIPT
学案学案 5 5 回归分析与独立性检验回归分析与独立性检验
考点考点 11
考点考点 22
填填知学情填填知学情
课内考点突课内考点突破破
规 律 探 究规 律 探 究
考 纲 解 读考 纲 解 读
考 向 预 测考 向 预 测
考 纲 解 读考 纲 解 读
回归分析了解回归分析的思想、方法及其简单应用 .
独立性检验了解独立性检验的思想、方法及其初步应用 .
返回目录
2012 年高考 , 试题难度仍以中低档题为主 , 有可能在选择、填空题中考查 .
考 向 预 测考 向 预 测
返回目录
1. 随机误差
由于所有的样本点不共线,而只是散布在某一条直线的附近,实际上, y=bx+a+e,e 是 y 与 =b
x+a 之间的误差 . 通常 e 为随机变量,称为随机误差,它的均值 E(e)=0, 方差 D ( e ) =σ2>0. 这样线性回归模型的完整表达式为
.
y=bx+a+e
E(e)=0,D(e)=σ2{
y
返回目录
随机误差 e 的方差 σ2 越小,通过回归直线 =bx+a 预报真实值 y 的精确度越高 . 随机误差是引起预报值 与真实值 y 之间的误差的原因之一,其大小取决于随机误差的方差 .
2. 残差
对于样本点 (x1,y1),(x2,y2),…,(xn,yn) 而言,相应于它们的随机误差为 ei=yi-yi=yi-bxi-a,i=1,2,…,n,
其估计值为 ei= = ,i=1,2,…,
n,ei 称为相应于点 (xi,yi) 的残差 .
y
a-bx-y y-y iiii
y
返回目录
3. 残差分析
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据 . 然后,可以通过残差 e1,e2,…,en 来判断模型拟合的效果,判断原始数据中是否存在可疑数据 . 这方面的分析工作称为残差分析 .
4. 残差图
作图时纵坐标为残差,横坐标可以选为样本编号,这样作出的图形称为残差图 .
返回目录
5. 列联表
假设有两个分类变量 X 和 Y ,它们的值域分别为{x1,x2} 和 {y1,y2} ,其样本频数列联表为
此表称为 2×2 列联表 .
根据观测数据计算由公式 .
给出的检验随机变量 K2 的值 k ,其值越大,说明“ X 与Y 有关系”成立的可能性越大 .
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d
(其中 n=a+b+c+d 为样本容量)
a+b+c+d
d)c)(bd)(ab)(c(a
bc)-n(adK
22
++++=
返回目录
考点考点 1 1 回归分析回归分析
每立方米混凝土的水泥用量 x( 单位: kg) 与 28 天后混凝土的抗压强度 Y (单位: kg/cm2 )之间的关系有如下数据 : X 150 160 170 180 190 200 210 220 230 240 250 260
Y 56.9 58.3 61.6 64.6 68.1 71.3 74.1 77.4 80.2 82.6 86.4 89.7
返回目录
【分析】【分析】求回归直线方程和相关系数,通常用计算器来完成 . 在有的较专门的计算器中,可通过直接按键得出回归直线方程的系数和相关系数 . 而如果用一般的科学计算器进行计算,则要先列出相应的表格,有了表格中的相关数据,回归方程中的系数和相关系数都容易求出 .
( 1 )对变量 Y 与 x 进行相关性检验;
( 2 )如果 Y 与 x 之间具有线性相关关系,求回归直线方程 .
返回目录
【解析】【解析】( 1 )由题目中的数据得如下表格 :
i 1 2 3 4 5 6
xi 150 160 170 180 190 200
yi 56.9 58.3 61.6 64.6 68.1 71.3
xiyi 8535 9328 10472 11628 12939 14260
i 7 8 9 10 11 12
xi 210 220 230 240 250 260
yi 74.1 77.4 80.2 82.6 86.4 89.7
xiyi 15561 17028 18446 19824 21600 23322
返回目录
查得 r0.05=0.576,
因 r > r0.05, 说明变量 Y 与 x 之间具有线性相关关系 .
943 182 12
1i
==
∑ ii yx
572.94, 54 600, 51812
1
212
1
2 ====
∑∑i
ii
i yx
72.6y205,x ==
999.0)6.7212-4.54572)(20512-518600(
6.7220512-182943r
22≈
××
××=
返回目录
为了进行相关性检验,通常将有关数据列成表格,然后借助于计算器算出各个量,为求回归直线方程扫清障碍 .
(2)
a=y-bx=10.28.
于是所求的线性回归方程是 : =0.304x+10.28.
304.020512-518600
6.7220512-182943b 2 ≈
×
××=
y
返回目录
在 10 年期间,一城市居民的年收入与某种商品的销售额之间的关系有如下数据 :
第几年 1 2 3 4 5
城市居民年收入(亿元)
32.2 31.1 32.9 35.8
37.1
某商品销售额(万元)
25.0 30.0 34.0 37.0
39.0
第几年 6 7 8 9 10
城市居民年收入(亿元)
38.0 39.0 43.0 44.6
46.0
某商品销售额(万元)
41.0 42.0 44.0 48.0
51.0返回目录
(1) 略
(2) =1.447x-15.843.
(1) 画出散点图 ;
(2) 如果散点图中的各点大致分布在一条直线附近,
求 Y 与 x 之间的回归直线方程 .
y
返回目录
考点考点 2 2 独立性检验独立性检验
在某医院,因为患心脏病而住院的 665名男性病人中,有 214人秃顶,而另外 772名不是因为患心脏病而住院的男性病人中有 175人秃顶 .请用独立性检验方法判断秃顶与患心脏病是否有关系?
【分析】【分析】首先由题目中的数据画出 2×2 列联表,然后根据表中的数据算出 K2 的值,据 K2 的值就可以判断秃顶与心脏病是否有关系 .
返回目录
【解析】【解析】根据题目所给的数据得到如下 2×2 列联表 :
根据表中的数据,得到 :K2=
所以有 99% 的把握认为“秃顶与患心脏病有关” .
患心脏病 患其他病 合计秃顶 214 175 389
不秃顶 451 597 1048
合计 665 772 1437
6.635.16.373772665048 1389
451)175-597(214437 1 2
>×××
×××≈
返回目录
( 1 )独立性检验的关键是准确地计算
K2 ,在计算时,要充分利用 2×2 列联表 .
( 2) 学习相关和无关的判定一定要结合实际问题,
从现实中寻找例子,从而增强学习数学的兴趣 .
返回目录
为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取了 300名学生,得到如下 2×2 列联表 :
判定性别与是否喜欢数学的关系 .
经计算知 K2≈4.514 > 3.841. 95% 的把握可判定高中生的性别与是否喜欢数学课程有关系 .
喜欢数学 不喜欢数学 合计男 37 85 122
女 35 143 178
合计 72 228 300
∴
返回目录
1.1. 独立性检验可以先考虑定义,然后再考虑用独立性检验可以先考虑定义,然后再考虑用 KK22
值,以及相关系数值,以及相关系数 rr 的值进行判断的值进行判断 ..
2.2. 在进行回归分析之前一定要进行相关性检验,在进行回归分析之前一定要进行相关性检验,
可以用散点图,也可以用相关系数可以用散点图,也可以用相关系数 ..
返回目录