market survey & forecast 市场调查与预测 (8) 制作:陈晓慧...
DESCRIPTION
Market survey & Forecast 市场调查与预测 (8) 制作:陈晓慧 武汉理工大学出版社 2009 年 4 月. 第八章 回归分析预测法. - PowerPoint PPT PresentationTRANSCRIPT
回归分析起源于生物学的研究。英国的著名生物学家达尔文达尔文在 19 世纪末,发现了一个非常有趣的现象,父亲身材高大的,其子也比较高大,父亲矮小的,其父亲身材高大的,其子也比较高大,父亲矮小的,其子也比较矮小。子也比较矮小。即父亲的身高与儿子的身高之间有密切的关系。在大量的研究资料中,又发现身高有一种身高有一种向平均身高回归的倾向,向平均身高回归的倾向,这种身高倾向平均数的现象称为回归( Regression )。经济学家经研究发现,生物界的这种现象,在经济领域中也存在这种现象,例如,证券市场的任何一支股票,无论是牛市或熊市股票的价格都向着平均价格回归。也正因为如此,回归分析在许多领域中都得到了广泛的应用,并且取得了很好的效果。
第八章 回归分析预测法第八章 回归分析预测法
回归分析预测回归分析预测法法是在分析因变量与自变量之间的是在分析因变量与自变量之间的相互关系,建立变量间的数量关系近似表达的函数方相互关系,建立变量间的数量关系近似表达的函数方程,并进行参数估计和显著性检验以后,应用回归方程,并进行参数估计和显著性检验以后,应用回归方程式预测因变量变化的方法程式预测因变量变化的方法。。回归分析预测法是市场预测的基本方法,目前,这种方法发展的很成熟了,回归预测方法种类繁多,按回归方程的变量分,有一元、多元回归方程;按回归性质分有线性、非线性回归等。本章专门讨论一元和二元线性回归问题。 ◆回归分析预测法的步骤回归分析预测法的步骤11 、确定预测目标和影响因素、确定预测目标和影响因素 市场预测的目标是因变量,研究者可根据预测的目的来确定。例如,以未来 5 年小家电需求为目的的市场预测,它的因变量就是未来 5 年小家电的需求量。
第一节 回归分析预测法的概述第一节 回归分析预测法的概述
22 、进行相关性分析、进行相关性分析 对变量之间对变量之间的相关关系进行分析。这一过程主要包
括两个方面:① 确定变量之间关系确定变量之间关系,即确定变量之间是否存在不具
有数值对应关系的确定依存关系。换句话说,当自变量的确定值为 x ,与其对应值为 y 。这是回归分回归分析法预测的前提析法预测的前提。
② 确定变量之间的相关密切程度,这是相关分析的主确定变量之间的相关密切程度,这是相关分析的主要目的和主要内容。要目的和主要内容。
33 、建立回归预测模型、建立回归预测模型 就是依据变量之间的相关关系,用恰当的数学表就是依据变量之间的相关关系,用恰当的数学表
达式表示出来。达式表示出来。
44 、回归方程模型检验、回归方程模型检验 建立回归方程的目的是预测,但方程用于预测之前建立回归方程的目的是预测,但方程用于预测之前
需要检验回归方程的拟合程度和回归参数的显著性,需要检验回归方程的拟合程度和回归参数的显著性,只有通过了有关的检验后,回归方程才可用于预测,只有通过了有关的检验后,回归方程才可用于预测,常用的检验方法有相关系数常用的检验方法有相关系数 rr 检验、检验、 FF 检验、检验、 tt 检检验等。验等。
55 、预测、预测
一是点点预测预测,二是区间区间预测预测。 点预测点预测::就是所求的预测值为一个数值。 区间预测区间预测::所求的预测值有一个数值范围。通常要
用正态分布的原理估计其标准误差,求得预测值的置信区间 [ŷ00-δ , ŷ00+ δ] 。
第二节 一元线性回归方程分析法第二节 一元线性回归方程分析法一、一元线性回归模型一、一元线性回归模型
( Element Linear Regression Model )
我们知道经济变量之间通常存在着各种各样的相互关系。例如,收入和消费收入和消费;价格与需求量之间价格与需求量之间,都有一定的关系。就收入与消费的关系而言,一般来说,收入高,消费支出就高;就价格与需求而言,价格越高,需求量就越少。
年 份人均收入(元)
x
人均消费(元)
y年 份
人均收入(元) x
人均消费( 元) y
1980
1981
1982
1983
480510545590
420450490530
198419851986
640780760
580620680
从表中可知, x 和 y 呈现线性规律,设回归线性方程为: ŷii=a+bx (1) 由( 1 )可得到 x 和 y 之间的定量关系表示为:
n21);,0(
0
ˆ
2
2
,,,—即服从正态分布,
的随机变量。方差为为随机误差,是一个均值其中
iNe
e
eyebxay
i
i
iiiii
(2)
下面是 1980 年以来人平均收入和人平均消费支出的七组数据,见表
回归直线
回归直线的散点图回归直线的散点图
iy
其中: (2) 中:
a 和 b— 回归系数 ; a— 截距 ;b— 斜率。
二 、 回归参数估计二 、 回归参数估计
由一组观察值画出散点图,如图所示,这样的直线可画出很多条,而回归直线只有一条,因为只有回归直线最接近实际观察值。要拟合一条最理想的回归直线,就要确定 a 和 b 。确定 a 和 b 的
方法有多种,其中应用最多的是
最小二乘法。最小二乘法。
tt
),( nn yx
),( 11 yx
),( 22 yx
),( ii yx
2
111
111
1
1
2
111
2
05
bna04
0)(2b
Q
0)(2a
Q
3
min)()ˆ(
iiii
n
iii
n
ii
n
iii
ii
n
ii
n
i
n
ii
i
n
iii
n
iii
n
iii
n
iii
n
ii
xbxayxbxxaxyx
xybxay
xbxay
bxay
bxayyyeQ
)得:由(
)得:由(
)求极值,有:即对(
( 3 )
( 4 )
( 5 )
( 6 )
(7)
设任意一个回归值 ŷii实际观察 yii 之间存在的误差为 eii ,令 则有 :min
1
2
n
iieQ
最小二乘法最小二乘法
因变量的平均值。—
自变量的平均值;—其中:
ny
n
xx
xnx
yxnyx
xxn
yxyxnb
xbyn
xb
n
ya
i
i
22i
ii
2i
2
i
iiii
ii
y
)( ( 8 )
aa 和和 bb 求出之后,在理论上来说线性回归模型就应求出之后,在理论上来说线性回归模型就应确定了,但在实际应用中,并非如此。由于在实践中确定了,但在实际应用中,并非如此。由于在实践中 ,,经常是资料不全,由(经常是资料不全,由( 88 )确定的)确定的 aa 和和 bb 就会有所不就会有所不同。因此,同。因此,为了避免这种情况出现的过大误差,在允许为了避免这种情况出现的过大误差,在允许
即由 即由 ,,求得的求得的 a, b a, b 称为称为最小二乘法最小二乘法 .. min1
2
n
iieQ
三、回归方程的显著性检验三、回归方程的显著性检验
由(由( 66)、()、( 77)解得)解得 a,ba,b 分别为:分别为:
误差的情况下,必须在误差的情况下,必须在 aa 和和 bb 求出之后,进行可靠性求出之后,进行可靠性检验。检验。其方法如下:其方法如下:
显著性检验显著性检验①回归方程 F 显著性检验;
②相关系数 r 显著性检验。FF 检验检验 检验方程中: y=a+bx 中的 a,b 是否能够描述收集到的数据反映的规律,
)(其表达式为:
余
回
1mnS
mSF
/
/
将通过上式计算 F 的值,与 F 分布表查到的 Fc临界值比较,从而判断回归方程是否具有显著性。 ① ① 当 当 FF> > F F cc ( (αα,m,n-m-1,m,n-m-1)) ,则回归方程与实际直线,则回归方程与实际直线方程拟和的程度好,方程拟和的程度好, xx 和和 yy 之间的变化是符合回归模之间的变化是符合回归模型; 型; ② ② 当当 FF ≤ F ≤ FCC (( αα ,, m,n-m-1m,n-m-1 ))时,时,则回归模型与
实际直线方程拟和程度不好, x 和 y 之间的变化不符合实际直线的变化,预测模型无效。相关系数显著性检验相关系数显著性检验 检验相关系数 r ,反映自变量 x 与因变量 y 之间的线性相关关系的强弱程度。其计算方法为:
2i
2ii
2
2i
2ii
2ii
2
2
yy
yy1
S
S1
S
Sr
r1r0
yy
yy1
yy
S
S1
S
Sr
)(
)ˆ(
)(
)ˆ(
)(
ˆˆ
总
余
总
回
总
回
总
回
计算式为:,则可见,
)( ii yy( 1)( 2 )
判断判断 rr 显著性显著性 ① ① 按(按( 11 )或()或( 22 )求出)求出 rr ② ②选择选择 αα ③ ③从相关系数临界表中查出从相关系数临界表中查出 rrcc
当当 rr» » rrcc,,时,时, xx 和和 yy 高度相关高度相关 PP238238
回归方程的精度分析回归方程的精度分析
1mn
yySS
2ii
y
)(
1-m-n余
%/ 15yS y
( 12 )
( 13 )精确度令人满意。)成立时,回归方程的当( 13
(一)有关概念:(一)有关概念:11 、点估计、点估计 在一元线性回归模型中,是指对于自变量 x 的一个给定值 x00 , ŷ=a+bx, 就可以得到一个 ŷ00 ,称为点估计。 22 、区间估计、区间估计 回归模型通过检验合格之后,则该模型可用来预测了,但通常指出预测区间,这个区间又称为置信区置信区间间。 对于观察数据量 n ≤30 的小样本而言,因变量 y 的
估计值 ŷ00 的置信区间为:置信区间为: [ŷ00-δ , ŷ00+ δ]
四、预测区间估计四、预测区间估计
2i
20
y1mn2 xx
xx
n
11S
)(
)()(,/ t其中:
( 18 )
( 19 )
分布的临界值;的显著水平,在—式中: t1)-m-(nt 21mn2 /)(,/
应用应用11
年份 1988 1989 1990 1991 1992 1993 1994
结婚人数
X (百对)47 40 43 55 66 72 70
销售额 y
( 百万元 )40 35 37 44 55 58 56
某地区 1988~1994 年结婚人数与某家电产品销售额如表 6-2 所示,假定 1995 年该地区的结婚人数将达 74 百对,试预测同时期年该家电产品的销售额。
表 6-2
解:解: 11 、画散点图、画散点图。如图 6-3 由图可知:结婚人数与 家电产品的销售量呈线性关系,故可用一元线性回归模型进行预测。
22i
ii
2i
2
i
iiii
ii
xnx
yxnyx
xxn
yxyxnb
xbyn
xb
n
ya
)(
图 6-3
并将有关计算 a,b 的数据填入表中
22 、确定一元回归预测模型参数、确定一元回归预测模型参数 a,ba,b 。 其中: 。 其中:
结婚人数
家电产品的销售量
年份 结婚人数xi (百
对)
销售额Yi (百万
元)
x²ii y²ii xiiyii
1988 47 40 2209 1600 1880
1989 40 35 1600 1225 1400
1990 43 37 1849 1369 1591
1991 55 44 3025 1936 2420
1992 66 55 4356 3025 3630
1993 72 58 5184 3364 4176
1994 70 56 4900 3136 3920
n=7 ∑=393 ∑=325 ∑=23123 ∑=15655 ∑=19017
调查资料数据和回归计算数据表
由表中的数据计算 a,b
4457
393730325
n
xb
n
ya
730393231237
325393190177
xxn
yxyxnb
ii
22i
2
i
iiii
..
.)(
则所求的一元线性回归预测方程为:
ŷ=a+bx=5.44+0.73x
b=0.73 的经济含义是该地区结婚人数每增加 1 百对,该家电销售额将 0.73 百万元。
3 、模型检验
(1) 方差分析 57.770
7
32539319017
n
yixiyxS iixy
86.10587
39323123
)( 222
n
yxS iixx
71.5657
32511565
)()(
2222
n
yyyySS iiiyy总
∴S 回 =S²XY/Sxx=770.57²/1058.86=560.77,m=1 S 余=Syy-S²XY/Sxx=565.71-770.57²’1058.86=4.94 n-m-1=7-1-1=5,S 总 =Syy=565.71, n-m-1=7-1=6,(2)F 检验
58.5675/94.4
7.560
1/
mnSm
S
F余
回
则:
当 α=0.05,Fc(α,m,n-m-1)=Fc(0.05,1,5)=6.61∵F=567.58 > Fc=6.61∴回归模型具有显著性水平 , 即 x 和 y 高度相关 , 模型有效 .
(3) 相关系数 r 显著性检验
立模型有效。具有高度线性相关,建与说明
总
回
yx
rmnr
S
S
c 9956.07545.0)51,05.0(
9956.01r
994.0117
94.4
1-m-n
余SS y
4 、预测模型点估计及置信区间 1995年的结婚人数 x00=74(百对 )时 ,在同期内相应的家电产品销售额为 : =5.44+0.73ŷ ×74=59.46(百万元 )5 、计算标准误差
当置信度为 95.4% 时 , 预测值 y0 的置信区间为 :[ŷ0-2Sy,ŷ0+2Sy]=[59.46-2×0.994,59.46+2×0.994]=[57.47,61.45]
第三节 多元线性回归预测分析法第三节 多元线性回归预测分析法 在进行市场预测时,常常会遇到变量并非是两者之间的关系,而是几个因素共同发生的作用,用一元线性回归分析法就不能进行预测了,这时要用多元线性回归方程进行预测。一、多元线性回归预测法的概念一、多元线性回归预测法的概念 影响因变量的因素有两个或两个以上,且自变量与因变量的分布呈线性趋势的回归,用这种回归分析进行预测的方法称为多元线性回归预测。二、多元线性回归预测法二、多元线性回归预测法一般形式: ŷii=a+b11x11+b22x22+……+bmmxmm
其中: x11 , x22 ,……, xn n 为自变量, a, b11, b22, ……, bnn 为回归方程的参数
存在两个自变量条件下的多元线性回归方程称为二元线性回归方程,它是多元回归方程的特例。11 、建立线性回归方程、建立线性回归方程 多元回归方程(以二元为例)线性回归预测法的步骤如下: ŷii=a+b11x11+b22x22+……+bmmxm m ( 1 )
22
221122
21212
11i
2211
xbxxbxnayx
xxbxbxnayx
xbxbnay
将相关数据代入上式方程组,得到参数 a, b11, b22, 则多元回归方程为: ŷii=a+b11x11+b22x22 ( 2 )22 、检验、检验(1)(1)利用复相关系数检验回归方程整体显著性。利用复相关系数检验回归方程整体显著性。
i2
2ii
2ii
yny
y2x2bxiy1bya2y1R
yy
yy1R
简捷公式为:
)(
)(
当给定一个 α,并根据自由度 =n-m-1,就可查出 rc判断了(( 22 )) tt 检验检验 检验每一个自变量与因变量在指定的显著水平上是否存在线性相关关系。例题(略)。
以上学到得的都是线性的,但在实际应用中,碰到的问题经常是非线性的,有些可将其线性化,有
如下形式: 11 、三角函数 、三角函数 y=a + sin ty=a + sin t (1) 令 x= sin t , 则( 1 )可变为: y=a+x (2) 即( 1 )可转化为线性方程。 22 、指数函数、指数函数
BtAy
lnbBlna,A,ylny
lnblnayln
aby t
t令( 3 )
( 4 )
第四节 回归分析中的非线性问题第四节 回归分析中的非线性问题
33 、幂函数、幂函数
44 、双曲函数、双曲函数
55 、对数函数、对数函数
BtAy
lntBlna,A,ylny
blntlnayln
y
则有:
令:b
at b
bxay
xyy
则有:
令t
b,
t
bay
bxay
lnt,x,yy
blntay
则有:令
应用2
某店在 1984~1993 年的商品流通费用率和商品零售额的具体情况见表 6-7 ,若 1995 年商品销售额 36.33 万元,请预测 1995 年的商品流通费用率。年份 1984 1985 1986 1987 1988 1990 1991 1992 1993 1994 ∑
Yi(%) 7.0 6.2 5.8 5.3 5.0 4.6 4.5 4.4 4.2 4.0 51.0
Xi( 万元 )
10.2 11.7 13.0 15.0 16.5 19.0 22.0 25.0 28.5 32
解题步骤:( 1 )散点图( 2 )确定预测模型
bxay
xyy
则有:
令t
b,
t
bay
(( 33 )确定参数)确定参数 a,ba,b ,,
可得预测模型 :ŷ=2.5611+42.8726/x(4)(4)相关系数相关系数 rr 检验检验
(( 55 )进行预测)进行预测 当 x=36.33 时, ŷ1995=2.5611+42.8726/x=3.74%
5611.210
5922.08726.42
10
0.51
8726.42)5822.0(03959.010
0.515922.02140.310
)(222
n
xb
n
ya
xxn
yxyxnb
ii
ii
iiii
9898.0]02.5158.26810][5922.03959.010[
0.515922.02140.310
])([])([r
2
2222
iiii
iiii
yynxxn
yxyxn
则预测模型为: ŷ=2.2256+7.621x'= 2.2256+7.621/x(2) 对回归预测模型的统计检验
28571322240
45571220
S
SSS
714318322240455712
SSS
209
63004124
n
yyS
3222409
3871535990
n
xxS
4557129
6303871171517
n
yxyxS
2
xx
xy2
yy
2
xx
xy2
22i2
iyy
22i2
ixx
iiiixy
..
).(
..).(
).(.
)(
.).(
.)(
...
.
余
回
5951mnmFc89101728571
714318
1mnS
mSF .),,,(.
/..
/
/
)(余
回则即商品流通费用率 y 与销售额倒数变量 x‘ 之间存在正线性关系。
( 3 )计算 x´ 的控制范围 由公式:
08287606217
428602225622
b
Sy2ay
015378606217
4286022256223
b
Sy2ay
2y23y
42860728571S
S
m
M
mM
y
..
..%
..
..%.
%,%,.
/
则有:
。。余
1-m-n
∴x'mm=min{0.0153786,0.082876}=0.0153786 x'MM=max{0.0153786,0.082876}=0.082876
∵ x'mm=1/ x'mm =12.066( 百万元 ) x‘M M =1/ x’M M =65.065( 百万元 )∴销售额控制在 12.066~65.065 百万元之间,而流通费用率控制在 2% ~3.2% 之间的概率近似为 95 。 4% 。