market survey & forecast 市场调查与预测 (8) 制作:陈晓慧...

30
Market survey & Forec ast 市市市市市市市 市市市市市市市 (8) (8) 市市 市市市 市市 市市市 市市市市市市市市市 市市市市市市市市市 2009 2009 4 4

Upload: kenyon

Post on 22-Jan-2016

183 views

Category:

Documents


0 download

DESCRIPTION

Market survey & Forecast 市场调查与预测 (8) 制作:陈晓慧 武汉理工大学出版社 2009 年 4 月. 第八章 回归分析预测法. - PowerPoint PPT Presentation

TRANSCRIPT

Market survey & Forecast 市场调查与预测市场调查与预测

(8)(8)

制作:陈晓慧制作:陈晓慧

武汉理工大学出版社武汉理工大学出版社

20092009 年年 44 月月

回归分析起源于生物学的研究。英国的著名生物学家达尔文达尔文在 19 世纪末,发现了一个非常有趣的现象,父亲身材高大的,其子也比较高大,父亲矮小的,其父亲身材高大的,其子也比较高大,父亲矮小的,其子也比较矮小。子也比较矮小。即父亲的身高与儿子的身高之间有密切的关系。在大量的研究资料中,又发现身高有一种身高有一种向平均身高回归的倾向,向平均身高回归的倾向,这种身高倾向平均数的现象称为回归( Regression )。经济学家经研究发现,生物界的这种现象,在经济领域中也存在这种现象,例如,证券市场的任何一支股票,无论是牛市或熊市股票的价格都向着平均价格回归。也正因为如此,回归分析在许多领域中都得到了广泛的应用,并且取得了很好的效果。

第八章 回归分析预测法第八章 回归分析预测法

回归分析预测回归分析预测法法是在分析因变量与自变量之间的是在分析因变量与自变量之间的相互关系,建立变量间的数量关系近似表达的函数方相互关系,建立变量间的数量关系近似表达的函数方程,并进行参数估计和显著性检验以后,应用回归方程,并进行参数估计和显著性检验以后,应用回归方程式预测因变量变化的方法程式预测因变量变化的方法。。回归分析预测法是市场预测的基本方法,目前,这种方法发展的很成熟了,回归预测方法种类繁多,按回归方程的变量分,有一元、多元回归方程;按回归性质分有线性、非线性回归等。本章专门讨论一元和二元线性回归问题。 ◆回归分析预测法的步骤回归分析预测法的步骤11 、确定预测目标和影响因素、确定预测目标和影响因素 市场预测的目标是因变量,研究者可根据预测的目的来确定。例如,以未来 5 年小家电需求为目的的市场预测,它的因变量就是未来 5 年小家电的需求量。

第一节 回归分析预测法的概述第一节 回归分析预测法的概述

22 、进行相关性分析、进行相关性分析 对变量之间对变量之间的相关关系进行分析。这一过程主要包

括两个方面:① 确定变量之间关系确定变量之间关系,即确定变量之间是否存在不具

有数值对应关系的确定依存关系。换句话说,当自变量的确定值为 x ,与其对应值为 y 。这是回归分回归分析法预测的前提析法预测的前提。

② 确定变量之间的相关密切程度,这是相关分析的主确定变量之间的相关密切程度,这是相关分析的主要目的和主要内容。要目的和主要内容。

33 、建立回归预测模型、建立回归预测模型 就是依据变量之间的相关关系,用恰当的数学表就是依据变量之间的相关关系,用恰当的数学表

达式表示出来。达式表示出来。

44 、回归方程模型检验、回归方程模型检验 建立回归方程的目的是预测,但方程用于预测之前建立回归方程的目的是预测,但方程用于预测之前

需要检验回归方程的拟合程度和回归参数的显著性,需要检验回归方程的拟合程度和回归参数的显著性,只有通过了有关的检验后,回归方程才可用于预测,只有通过了有关的检验后,回归方程才可用于预测,常用的检验方法有相关系数常用的检验方法有相关系数 rr 检验、检验、 FF 检验、检验、 tt 检检验等。验等。

55 、预测、预测

一是点点预测预测,二是区间区间预测预测。 点预测点预测::就是所求的预测值为一个数值。 区间预测区间预测::所求的预测值有一个数值范围。通常要

用正态分布的原理估计其标准误差,求得预测值的置信区间 [ŷ00-δ , ŷ00+ δ] 。

第二节 一元线性回归方程分析法第二节 一元线性回归方程分析法一、一元线性回归模型一、一元线性回归模型

( Element Linear Regression Model )

我们知道经济变量之间通常存在着各种各样的相互关系。例如,收入和消费收入和消费;价格与需求量之间价格与需求量之间,都有一定的关系。就收入与消费的关系而言,一般来说,收入高,消费支出就高;就价格与需求而言,价格越高,需求量就越少。

年 份人均收入(元)

x

人均消费(元)

y年 份

人均收入(元) x

人均消费( 元) y

1980

1981

1982

1983

480510545590

420450490530

198419851986

640780760

580620680

从表中可知, x 和 y 呈现线性规律,设回归线性方程为: ŷii=a+bx (1) 由( 1 )可得到 x 和 y 之间的定量关系表示为:

n21);,0(

0

ˆ

2

2

,,,—即服从正态分布,

的随机变量。方差为为随机误差,是一个均值其中

iNe

e

eyebxay

i

i

iiiii

(2)

下面是 1980 年以来人平均收入和人平均消费支出的七组数据,见表

回归直线

回归直线的散点图回归直线的散点图

iy

其中: (2) 中:

a 和 b— 回归系数 ; a— 截距 ;b— 斜率。

二 、 回归参数估计二 、 回归参数估计

由一组观察值画出散点图,如图所示,这样的直线可画出很多条,而回归直线只有一条,因为只有回归直线最接近实际观察值。要拟合一条最理想的回归直线,就要确定 a 和 b 。确定 a 和 b 的

方法有多种,其中应用最多的是

最小二乘法。最小二乘法。

tt

),( nn yx

),( 11 yx

),( 22 yx

),( ii yx

2

111

111

1

1

2

111

2

05

bna04

0)(2b

Q

0)(2a

Q

3

min)()ˆ(

iiii

n

iii

n

ii

n

iii

ii

n

ii

n

i

n

ii

i

n

iii

n

iii

n

iii

n

iii

n

ii

xbxayxbxxaxyx

xybxay

xbxay

bxay

bxayyyeQ

)得:由(

)得:由(

)求极值,有:即对(

( 3 )

( 4 )

( 5 )

( 6 )

(7)

设任意一个回归值 ŷii实际观察 yii 之间存在的误差为 eii ,令 则有 :min

1

2

n

iieQ

最小二乘法最小二乘法

因变量的平均值。—

自变量的平均值;—其中:

ny

n

xx

xnx

yxnyx

xxn

yxyxnb

xbyn

xb

n

ya

i

i

22i

ii

2i

2

i

iiii

ii

y

)( ( 8 )

aa 和和 bb 求出之后,在理论上来说线性回归模型就应求出之后,在理论上来说线性回归模型就应确定了,但在实际应用中,并非如此。由于在实践中确定了,但在实际应用中,并非如此。由于在实践中 ,,经常是资料不全,由(经常是资料不全,由( 88 )确定的)确定的 aa 和和 bb 就会有所不就会有所不同。因此,同。因此,为了避免这种情况出现的过大误差,在允许为了避免这种情况出现的过大误差,在允许

即由 即由 ,,求得的求得的 a, b a, b 称为称为最小二乘法最小二乘法 .. min1

2

n

iieQ

三、回归方程的显著性检验三、回归方程的显著性检验

由(由( 66)、()、( 77)解得)解得 a,ba,b 分别为:分别为:

误差的情况下,必须在误差的情况下,必须在 aa 和和 bb 求出之后,进行可靠性求出之后,进行可靠性检验。检验。其方法如下:其方法如下:

显著性检验显著性检验①回归方程 F 显著性检验;

②相关系数 r 显著性检验。FF 检验检验 检验方程中: y=a+bx 中的 a,b 是否能够描述收集到的数据反映的规律,

)(其表达式为:

1mnS

mSF

/

/

将通过上式计算 F 的值,与 F 分布表查到的 Fc临界值比较,从而判断回归方程是否具有显著性。 ① ① 当 当 FF> > F F cc ( (αα,m,n-m-1,m,n-m-1)) ,则回归方程与实际直线,则回归方程与实际直线方程拟和的程度好,方程拟和的程度好, xx 和和 yy 之间的变化是符合回归模之间的变化是符合回归模型; 型; ② ② 当当 FF ≤ F ≤ FCC (( αα ,, m,n-m-1m,n-m-1 ))时,时,则回归模型与

实际直线方程拟和程度不好, x 和 y 之间的变化不符合实际直线的变化,预测模型无效。相关系数显著性检验相关系数显著性检验 检验相关系数 r ,反映自变量 x 与因变量 y 之间的线性相关关系的强弱程度。其计算方法为:

2i

2ii

2

2i

2ii

2ii

2

2

yy

yy1

S

S1

S

Sr

r1r0

yy

yy1

yy

S

S1

S

Sr

)(

)ˆ(

)(

)ˆ(

)(

ˆˆ

计算式为:,则可见,

)( ii yy( 1)( 2 )

判断判断 rr 显著性显著性 ① ① 按(按( 11 )或()或( 22 )求出)求出 rr ② ②选择选择 αα ③ ③从相关系数临界表中查出从相关系数临界表中查出 rrcc

当当 rr» » rrcc,,时,时, xx 和和 yy 高度相关高度相关 PP238238

回归方程的精度分析回归方程的精度分析

1mn

yySS

2ii

y

)(

1-m-n余

%/ 15yS y

( 12 )

( 13 )精确度令人满意。)成立时,回归方程的当( 13

(一)有关概念:(一)有关概念:11 、点估计、点估计 在一元线性回归模型中,是指对于自变量 x 的一个给定值 x00 , ŷ=a+bx, 就可以得到一个 ŷ00 ,称为点估计。 22 、区间估计、区间估计 回归模型通过检验合格之后,则该模型可用来预测了,但通常指出预测区间,这个区间又称为置信区置信区间间。 对于观察数据量 n ≤30 的小样本而言,因变量 y 的

估计值 ŷ00 的置信区间为:置信区间为: [ŷ00-δ , ŷ00+ δ]

四、预测区间估计四、预测区间估计

2i

20

y1mn2 xx

xx

n

11S

)(

)()(,/ t其中:

( 18 )

( 19 )

分布的临界值;的显著水平,在—式中: t1)-m-(nt 21mn2 /)(,/

应用应用11

年份 1988 1989 1990 1991 1992 1993 1994

结婚人数

X (百对)47 40 43 55 66 72 70

销售额 y

( 百万元 )40 35 37 44 55 58 56

某地区 1988~1994 年结婚人数与某家电产品销售额如表 6-2 所示,假定 1995 年该地区的结婚人数将达 74 百对,试预测同时期年该家电产品的销售额。

表 6-2

解:解: 11 、画散点图、画散点图。如图 6-3 由图可知:结婚人数与 家电产品的销售量呈线性关系,故可用一元线性回归模型进行预测。

22i

ii

2i

2

i

iiii

ii

xnx

yxnyx

xxn

yxyxnb

xbyn

xb

n

ya

)(

图 6-3

并将有关计算 a,b 的数据填入表中

22 、确定一元回归预测模型参数、确定一元回归预测模型参数 a,ba,b 。 其中: 。 其中:

结婚人数

家电产品的销售量

年份 结婚人数xi (百

对)

销售额Yi (百万

元)

x²ii y²ii xiiyii

1988 47 40 2209 1600 1880

1989 40 35 1600 1225 1400

1990 43 37 1849 1369 1591

1991 55 44 3025 1936 2420

1992 66 55 4356 3025 3630

1993 72 58 5184 3364 4176

1994 70 56 4900 3136 3920

n=7 ∑=393 ∑=325 ∑=23123 ∑=15655 ∑=19017

调查资料数据和回归计算数据表

由表中的数据计算 a,b

4457

393730325

n

xb

n

ya

730393231237

325393190177

xxn

yxyxnb

ii

22i

2

i

iiii

..

.)(

则所求的一元线性回归预测方程为:

ŷ=a+bx=5.44+0.73x

b=0.73 的经济含义是该地区结婚人数每增加 1 百对,该家电销售额将 0.73 百万元。

3 、模型检验

(1) 方差分析 57.770

7

32539319017

n

yixiyxS iixy

86.10587

39323123

)( 222

n

yxS iixx

71.5657

32511565

)()(

2222

n

yyyySS iiiyy总

∴S 回 =S²XY/Sxx=770.57²/1058.86=560.77,m=1 S 余=Syy-S²XY/Sxx=565.71-770.57²’1058.86=4.94 n-m-1=7-1-1=5,S 总 =Syy=565.71, n-m-1=7-1=6,(2)F 检验

58.5675/94.4

7.560

1/

mnSm

S

F余

则:

当 α=0.05,Fc(α,m,n-m-1)=Fc(0.05,1,5)=6.61∵F=567.58 > Fc=6.61∴回归模型具有显著性水平 , 即 x 和 y 高度相关 , 模型有效 .

(3) 相关系数 r 显著性检验

立模型有效。具有高度线性相关,建与说明

yx

rmnr

S

S

c 9956.07545.0)51,05.0(

9956.01r

994.0117

94.4

1-m-n

余SS y

4 、预测模型点估计及置信区间 1995年的结婚人数 x00=74(百对 )时 ,在同期内相应的家电产品销售额为 : =5.44+0.73ŷ ×74=59.46(百万元 )5 、计算标准误差

当置信度为 95.4% 时 , 预测值 y0 的置信区间为 :[ŷ0-2Sy,ŷ0+2Sy]=[59.46-2×0.994,59.46+2×0.994]=[57.47,61.45]

第三节 多元线性回归预测分析法第三节 多元线性回归预测分析法 在进行市场预测时,常常会遇到变量并非是两者之间的关系,而是几个因素共同发生的作用,用一元线性回归分析法就不能进行预测了,这时要用多元线性回归方程进行预测。一、多元线性回归预测法的概念一、多元线性回归预测法的概念 影响因变量的因素有两个或两个以上,且自变量与因变量的分布呈线性趋势的回归,用这种回归分析进行预测的方法称为多元线性回归预测。二、多元线性回归预测法二、多元线性回归预测法一般形式: ŷii=a+b11x11+b22x22+……+bmmxmm

其中: x11 , x22 ,……, xn n 为自变量, a, b11, b22, ……, bnn 为回归方程的参数

存在两个自变量条件下的多元线性回归方程称为二元线性回归方程,它是多元回归方程的特例。11 、建立线性回归方程、建立线性回归方程 多元回归方程(以二元为例)线性回归预测法的步骤如下: ŷii=a+b11x11+b22x22+……+bmmxm m ( 1 )

22

221122

21212

11i

2211

xbxxbxnayx

xxbxbxnayx

xbxbnay

将相关数据代入上式方程组,得到参数 a, b11, b22, 则多元回归方程为: ŷii=a+b11x11+b22x22 ( 2 )22 、检验、检验(1)(1)利用复相关系数检验回归方程整体显著性。利用复相关系数检验回归方程整体显著性。

i2

2ii

2ii

yny

y2x2bxiy1bya2y1R

yy

yy1R

简捷公式为:

)(

)(

当给定一个 α,并根据自由度 =n-m-1,就可查出 rc判断了(( 22 )) tt 检验检验 检验每一个自变量与因变量在指定的显著水平上是否存在线性相关关系。例题(略)。

以上学到得的都是线性的,但在实际应用中,碰到的问题经常是非线性的,有些可将其线性化,有

如下形式: 11 、三角函数 、三角函数 y=a + sin ty=a + sin t (1) 令 x= sin t , 则( 1 )可变为: y=a+x (2) 即( 1 )可转化为线性方程。 22 、指数函数、指数函数

BtAy

lnbBlna,A,ylny

lnblnayln

aby t

t令( 3 )

( 4 )

第四节 回归分析中的非线性问题第四节 回归分析中的非线性问题

33 、幂函数、幂函数

44 、双曲函数、双曲函数

55 、对数函数、对数函数

BtAy

lntBlna,A,ylny

blntlnayln

y

则有:

令:b

at b

bxay

xyy

则有:

令t

b,

t

bay

bxay

lnt,x,yy

blntay

则有:令

应用2

某店在 1984~1993 年的商品流通费用率和商品零售额的具体情况见表 6-7 ,若 1995 年商品销售额 36.33 万元,请预测 1995 年的商品流通费用率。年份 1984 1985 1986 1987 1988 1990 1991 1992 1993 1994 ∑

Yi(%) 7.0 6.2 5.8 5.3 5.0 4.6 4.5 4.4 4.2 4.0 51.0

Xi( 万元 )

10.2 11.7 13.0 15.0 16.5 19.0 22.0 25.0 28.5 32

解题步骤:( 1 )散点图( 2 )确定预测模型

bxay

xyy

则有:

令t

b,

t

bay

(( 33 )确定参数)确定参数 a,ba,b ,,

可得预测模型 :ŷ=2.5611+42.8726/x(4)(4)相关系数相关系数 rr 检验检验

(( 55 )进行预测)进行预测 当 x=36.33 时, ŷ1995=2.5611+42.8726/x=3.74%

5611.210

5922.08726.42

10

0.51

8726.42)5822.0(03959.010

0.515922.02140.310

)(222

n

xb

n

ya

xxn

yxyxnb

ii

ii

iiii

9898.0]02.5158.26810][5922.03959.010[

0.515922.02140.310

])([])([r

2

2222

iiii

iiii

yynxxn

yxyxn

则预测模型为: ŷ=2.2256+7.621x'= 2.2256+7.621/x(2) 对回归预测模型的统计检验

28571322240

45571220

S

SSS

714318322240455712

SSS

209

63004124

n

yyS

3222409

3871535990

n

xxS

4557129

6303871171517

n

yxyxS

2

xx

xy2

yy

2

xx

xy2

22i2

iyy

22i2

ixx

iiiixy

..

).(

..).(

).(.

)(

.).(

.)(

...

.

5951mnmFc89101728571

714318

1mnS

mSF .),,,(.

/..

/

/

)(余

回则即商品流通费用率 y 与销售额倒数变量 x‘ 之间存在正线性关系。

( 3 )计算 x´ 的控制范围 由公式:

08287606217

428602225622

b

Sy2ay

015378606217

4286022256223

b

Sy2ay

2y23y

42860728571S

S

m

M

mM

y

..

..%

..

..%.

%,%,.

/

则有:

。。余

1-m-n

∴x'mm=min{0.0153786,0.082876}=0.0153786 x'MM=max{0.0153786,0.082876}=0.082876

∵ x'mm=1/ x'mm =12.066( 百万元 ) x‘M M =1/ x’M M =65.065( 百万元 )∴销售额控制在 12.066~65.065 百万元之间,而流通费用率控制在 2% ~3.2% 之间的概率近似为 95 。 4% 。

————————完————