统计学导论

105
0 2 4 6 8 10 12 14 16 18 50-60 70-80 90-100 0% 5% 10% 15% 20% 25% 30% 35% ` 计计计计

Upload: harding-conway

Post on 01-Jan-2016

43 views

Category:

Documents


0 download

DESCRIPTION

统计学导论. 第九章 时间序列分析. 第一节 时间序列分析概述 第二节 时间序列的水平分析与速度分析 第三节 长期趋势的测定 第四节 季节变动和循环波动测定 第五节 时间序列预测模型. 第一节 时间序列分析概述. 时间序列的概念 时间序列的种类 时间序列的编制原则. 表 9-1. 一、时间序列的概念. 时间序列( time series ) — 动态数列 , 把同一现象在不同时间上的观察数据按时间先后顺序排列起来所形成的数列。 两个基本要素: 时间 t ; 时间 t 的数据(水平) y t . 基期水平与报告期水平; - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 统计学导论

02468

1012141618

50- 60 70- 80 90- 100

0

5

10

15

20

25

30

35

`

统计学导论

9-2

第九章 时间序列分析 第一节 时间序列分析概述 第二节 时间序列的水平分析与速度分析 第三节 长期趋势的测定 第四节 季节变动和循环波动测定 第五节 时间序列预测模型

9-3

第一节 时间序列分析概述

时间序列的概念 时间序列的种类 时间序列的编制原则

9-4

表 9-1年 份 国内生产

总值第三产业所占

比重()年底总人口

(万人)人均国内生产总值 ( 元 人 )

居民消费水平 ( 元 )

1990 mdashmdash mdashmdash 114333 mdashmdash mdashmdash

1991 216178 334 115823 1879  1992 266381 343 117171 2287  1993 346344 327 118517 2939  1994 467594 319 119850 3923  1995 584781 307 121121 4854 2236

1996 678846 301 122389 5576 2641

1997 744626 309 123626 6054 2834

1998 783452 321 124761 6308 2972

1999 820675 329 125786 6551 3138

2000 894681 334 126743 7086 3397

2001 973148 341 127627 7651 3609

2002 1051723 343 128453 8214 3818

2003 1172519 332 129227 9101 4089

9-5

一时间序列的概念

时间序列( time series )mdash 动态数列 把同一现象在不同时间上的观察数据按时间先后顺序排列起来所形成的数列

两个基本要素 时间 t 时间 t 的数据(水平) yt

基期水平与报告期水平 期初水平( y0 或 y1 ) 期末水平( yn )与中间水平

时间序列是动态分析的依据

9-6

二时间序列的种类

(一)绝对数时间序列mdashmdash最基本的时间序列 时期序列 时点序列

(二)相对数时间序列 如 第三产业所占比重序列

(三)均值时间序列 如居民消费水平序列

有关的绝对数序列派生的

9-7

(一)绝对数时间序列

又称为总量指标时间序列 是指一系列同类的总量指标数据按时间先后

顺序排列而形成的序列反映现象在各个时间上达到的绝对水平

可分为时期序列和时点序列 时期序列如国内生产总值序列 时点序列如年末总人口序列

9-8

时期序列和时点序列的特点 ① 时期序列的各个数据为时期指标 ( 流量 ) 表示现象在

各段时期内的总量时期序列的各个数据为时点指标 ( 存量 ) 反映现象在各个时点上所处的状态和所达到的水平

② 时期序列中各期数据具有可加性通过加总即可得到更长一段时间内的总量时期序列中不同时点上的数据不能相加即它们相加的结果没有意义

③ 时期序列中数值大小与所属时期长短有直接的关系时期序列中各时点数值大小与时点间隔长短没有直接的联系

④ 时期序列中各期数据是对每段时间内发生的数量连续登记的结果时点序列中数据通常不可能也不必要连续登记

9-9

三时间序列的编制原则

保证时间序列中各项数据的可比性是编制时间序列的基本原则 ( 一 ) 时间一致 ( 二 ) 总体范围一致 ( 三 ) 经济内容计算口径和计算方法一致

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 2: 统计学导论

9-2

第九章 时间序列分析 第一节 时间序列分析概述 第二节 时间序列的水平分析与速度分析 第三节 长期趋势的测定 第四节 季节变动和循环波动测定 第五节 时间序列预测模型

9-3

第一节 时间序列分析概述

时间序列的概念 时间序列的种类 时间序列的编制原则

9-4

表 9-1年 份 国内生产

总值第三产业所占

比重()年底总人口

(万人)人均国内生产总值 ( 元 人 )

居民消费水平 ( 元 )

1990 mdashmdash mdashmdash 114333 mdashmdash mdashmdash

1991 216178 334 115823 1879  1992 266381 343 117171 2287  1993 346344 327 118517 2939  1994 467594 319 119850 3923  1995 584781 307 121121 4854 2236

1996 678846 301 122389 5576 2641

1997 744626 309 123626 6054 2834

1998 783452 321 124761 6308 2972

1999 820675 329 125786 6551 3138

2000 894681 334 126743 7086 3397

2001 973148 341 127627 7651 3609

2002 1051723 343 128453 8214 3818

2003 1172519 332 129227 9101 4089

9-5

一时间序列的概念

时间序列( time series )mdash 动态数列 把同一现象在不同时间上的观察数据按时间先后顺序排列起来所形成的数列

两个基本要素 时间 t 时间 t 的数据(水平) yt

基期水平与报告期水平 期初水平( y0 或 y1 ) 期末水平( yn )与中间水平

时间序列是动态分析的依据

9-6

二时间序列的种类

(一)绝对数时间序列mdashmdash最基本的时间序列 时期序列 时点序列

(二)相对数时间序列 如 第三产业所占比重序列

(三)均值时间序列 如居民消费水平序列

有关的绝对数序列派生的

9-7

(一)绝对数时间序列

又称为总量指标时间序列 是指一系列同类的总量指标数据按时间先后

顺序排列而形成的序列反映现象在各个时间上达到的绝对水平

可分为时期序列和时点序列 时期序列如国内生产总值序列 时点序列如年末总人口序列

9-8

时期序列和时点序列的特点 ① 时期序列的各个数据为时期指标 ( 流量 ) 表示现象在

各段时期内的总量时期序列的各个数据为时点指标 ( 存量 ) 反映现象在各个时点上所处的状态和所达到的水平

② 时期序列中各期数据具有可加性通过加总即可得到更长一段时间内的总量时期序列中不同时点上的数据不能相加即它们相加的结果没有意义

③ 时期序列中数值大小与所属时期长短有直接的关系时期序列中各时点数值大小与时点间隔长短没有直接的联系

④ 时期序列中各期数据是对每段时间内发生的数量连续登记的结果时点序列中数据通常不可能也不必要连续登记

9-9

三时间序列的编制原则

保证时间序列中各项数据的可比性是编制时间序列的基本原则 ( 一 ) 时间一致 ( 二 ) 总体范围一致 ( 三 ) 经济内容计算口径和计算方法一致

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 3: 统计学导论

9-3

第一节 时间序列分析概述

时间序列的概念 时间序列的种类 时间序列的编制原则

9-4

表 9-1年 份 国内生产

总值第三产业所占

比重()年底总人口

(万人)人均国内生产总值 ( 元 人 )

居民消费水平 ( 元 )

1990 mdashmdash mdashmdash 114333 mdashmdash mdashmdash

1991 216178 334 115823 1879  1992 266381 343 117171 2287  1993 346344 327 118517 2939  1994 467594 319 119850 3923  1995 584781 307 121121 4854 2236

1996 678846 301 122389 5576 2641

1997 744626 309 123626 6054 2834

1998 783452 321 124761 6308 2972

1999 820675 329 125786 6551 3138

2000 894681 334 126743 7086 3397

2001 973148 341 127627 7651 3609

2002 1051723 343 128453 8214 3818

2003 1172519 332 129227 9101 4089

9-5

一时间序列的概念

时间序列( time series )mdash 动态数列 把同一现象在不同时间上的观察数据按时间先后顺序排列起来所形成的数列

两个基本要素 时间 t 时间 t 的数据(水平) yt

基期水平与报告期水平 期初水平( y0 或 y1 ) 期末水平( yn )与中间水平

时间序列是动态分析的依据

9-6

二时间序列的种类

(一)绝对数时间序列mdashmdash最基本的时间序列 时期序列 时点序列

(二)相对数时间序列 如 第三产业所占比重序列

(三)均值时间序列 如居民消费水平序列

有关的绝对数序列派生的

9-7

(一)绝对数时间序列

又称为总量指标时间序列 是指一系列同类的总量指标数据按时间先后

顺序排列而形成的序列反映现象在各个时间上达到的绝对水平

可分为时期序列和时点序列 时期序列如国内生产总值序列 时点序列如年末总人口序列

9-8

时期序列和时点序列的特点 ① 时期序列的各个数据为时期指标 ( 流量 ) 表示现象在

各段时期内的总量时期序列的各个数据为时点指标 ( 存量 ) 反映现象在各个时点上所处的状态和所达到的水平

② 时期序列中各期数据具有可加性通过加总即可得到更长一段时间内的总量时期序列中不同时点上的数据不能相加即它们相加的结果没有意义

③ 时期序列中数值大小与所属时期长短有直接的关系时期序列中各时点数值大小与时点间隔长短没有直接的联系

④ 时期序列中各期数据是对每段时间内发生的数量连续登记的结果时点序列中数据通常不可能也不必要连续登记

9-9

三时间序列的编制原则

保证时间序列中各项数据的可比性是编制时间序列的基本原则 ( 一 ) 时间一致 ( 二 ) 总体范围一致 ( 三 ) 经济内容计算口径和计算方法一致

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 4: 统计学导论

9-4

表 9-1年 份 国内生产

总值第三产业所占

比重()年底总人口

(万人)人均国内生产总值 ( 元 人 )

居民消费水平 ( 元 )

1990 mdashmdash mdashmdash 114333 mdashmdash mdashmdash

1991 216178 334 115823 1879  1992 266381 343 117171 2287  1993 346344 327 118517 2939  1994 467594 319 119850 3923  1995 584781 307 121121 4854 2236

1996 678846 301 122389 5576 2641

1997 744626 309 123626 6054 2834

1998 783452 321 124761 6308 2972

1999 820675 329 125786 6551 3138

2000 894681 334 126743 7086 3397

2001 973148 341 127627 7651 3609

2002 1051723 343 128453 8214 3818

2003 1172519 332 129227 9101 4089

9-5

一时间序列的概念

时间序列( time series )mdash 动态数列 把同一现象在不同时间上的观察数据按时间先后顺序排列起来所形成的数列

两个基本要素 时间 t 时间 t 的数据(水平) yt

基期水平与报告期水平 期初水平( y0 或 y1 ) 期末水平( yn )与中间水平

时间序列是动态分析的依据

9-6

二时间序列的种类

(一)绝对数时间序列mdashmdash最基本的时间序列 时期序列 时点序列

(二)相对数时间序列 如 第三产业所占比重序列

(三)均值时间序列 如居民消费水平序列

有关的绝对数序列派生的

9-7

(一)绝对数时间序列

又称为总量指标时间序列 是指一系列同类的总量指标数据按时间先后

顺序排列而形成的序列反映现象在各个时间上达到的绝对水平

可分为时期序列和时点序列 时期序列如国内生产总值序列 时点序列如年末总人口序列

9-8

时期序列和时点序列的特点 ① 时期序列的各个数据为时期指标 ( 流量 ) 表示现象在

各段时期内的总量时期序列的各个数据为时点指标 ( 存量 ) 反映现象在各个时点上所处的状态和所达到的水平

② 时期序列中各期数据具有可加性通过加总即可得到更长一段时间内的总量时期序列中不同时点上的数据不能相加即它们相加的结果没有意义

③ 时期序列中数值大小与所属时期长短有直接的关系时期序列中各时点数值大小与时点间隔长短没有直接的联系

④ 时期序列中各期数据是对每段时间内发生的数量连续登记的结果时点序列中数据通常不可能也不必要连续登记

9-9

三时间序列的编制原则

保证时间序列中各项数据的可比性是编制时间序列的基本原则 ( 一 ) 时间一致 ( 二 ) 总体范围一致 ( 三 ) 经济内容计算口径和计算方法一致

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 5: 统计学导论

9-5

一时间序列的概念

时间序列( time series )mdash 动态数列 把同一现象在不同时间上的观察数据按时间先后顺序排列起来所形成的数列

两个基本要素 时间 t 时间 t 的数据(水平) yt

基期水平与报告期水平 期初水平( y0 或 y1 ) 期末水平( yn )与中间水平

时间序列是动态分析的依据

9-6

二时间序列的种类

(一)绝对数时间序列mdashmdash最基本的时间序列 时期序列 时点序列

(二)相对数时间序列 如 第三产业所占比重序列

(三)均值时间序列 如居民消费水平序列

有关的绝对数序列派生的

9-7

(一)绝对数时间序列

又称为总量指标时间序列 是指一系列同类的总量指标数据按时间先后

顺序排列而形成的序列反映现象在各个时间上达到的绝对水平

可分为时期序列和时点序列 时期序列如国内生产总值序列 时点序列如年末总人口序列

9-8

时期序列和时点序列的特点 ① 时期序列的各个数据为时期指标 ( 流量 ) 表示现象在

各段时期内的总量时期序列的各个数据为时点指标 ( 存量 ) 反映现象在各个时点上所处的状态和所达到的水平

② 时期序列中各期数据具有可加性通过加总即可得到更长一段时间内的总量时期序列中不同时点上的数据不能相加即它们相加的结果没有意义

③ 时期序列中数值大小与所属时期长短有直接的关系时期序列中各时点数值大小与时点间隔长短没有直接的联系

④ 时期序列中各期数据是对每段时间内发生的数量连续登记的结果时点序列中数据通常不可能也不必要连续登记

9-9

三时间序列的编制原则

保证时间序列中各项数据的可比性是编制时间序列的基本原则 ( 一 ) 时间一致 ( 二 ) 总体范围一致 ( 三 ) 经济内容计算口径和计算方法一致

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 6: 统计学导论

9-6

二时间序列的种类

(一)绝对数时间序列mdashmdash最基本的时间序列 时期序列 时点序列

(二)相对数时间序列 如 第三产业所占比重序列

(三)均值时间序列 如居民消费水平序列

有关的绝对数序列派生的

9-7

(一)绝对数时间序列

又称为总量指标时间序列 是指一系列同类的总量指标数据按时间先后

顺序排列而形成的序列反映现象在各个时间上达到的绝对水平

可分为时期序列和时点序列 时期序列如国内生产总值序列 时点序列如年末总人口序列

9-8

时期序列和时点序列的特点 ① 时期序列的各个数据为时期指标 ( 流量 ) 表示现象在

各段时期内的总量时期序列的各个数据为时点指标 ( 存量 ) 反映现象在各个时点上所处的状态和所达到的水平

② 时期序列中各期数据具有可加性通过加总即可得到更长一段时间内的总量时期序列中不同时点上的数据不能相加即它们相加的结果没有意义

③ 时期序列中数值大小与所属时期长短有直接的关系时期序列中各时点数值大小与时点间隔长短没有直接的联系

④ 时期序列中各期数据是对每段时间内发生的数量连续登记的结果时点序列中数据通常不可能也不必要连续登记

9-9

三时间序列的编制原则

保证时间序列中各项数据的可比性是编制时间序列的基本原则 ( 一 ) 时间一致 ( 二 ) 总体范围一致 ( 三 ) 经济内容计算口径和计算方法一致

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 7: 统计学导论

9-7

(一)绝对数时间序列

又称为总量指标时间序列 是指一系列同类的总量指标数据按时间先后

顺序排列而形成的序列反映现象在各个时间上达到的绝对水平

可分为时期序列和时点序列 时期序列如国内生产总值序列 时点序列如年末总人口序列

9-8

时期序列和时点序列的特点 ① 时期序列的各个数据为时期指标 ( 流量 ) 表示现象在

各段时期内的总量时期序列的各个数据为时点指标 ( 存量 ) 反映现象在各个时点上所处的状态和所达到的水平

② 时期序列中各期数据具有可加性通过加总即可得到更长一段时间内的总量时期序列中不同时点上的数据不能相加即它们相加的结果没有意义

③ 时期序列中数值大小与所属时期长短有直接的关系时期序列中各时点数值大小与时点间隔长短没有直接的联系

④ 时期序列中各期数据是对每段时间内发生的数量连续登记的结果时点序列中数据通常不可能也不必要连续登记

9-9

三时间序列的编制原则

保证时间序列中各项数据的可比性是编制时间序列的基本原则 ( 一 ) 时间一致 ( 二 ) 总体范围一致 ( 三 ) 经济内容计算口径和计算方法一致

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 8: 统计学导论

9-8

时期序列和时点序列的特点 ① 时期序列的各个数据为时期指标 ( 流量 ) 表示现象在

各段时期内的总量时期序列的各个数据为时点指标 ( 存量 ) 反映现象在各个时点上所处的状态和所达到的水平

② 时期序列中各期数据具有可加性通过加总即可得到更长一段时间内的总量时期序列中不同时点上的数据不能相加即它们相加的结果没有意义

③ 时期序列中数值大小与所属时期长短有直接的关系时期序列中各时点数值大小与时点间隔长短没有直接的联系

④ 时期序列中各期数据是对每段时间内发生的数量连续登记的结果时点序列中数据通常不可能也不必要连续登记

9-9

三时间序列的编制原则

保证时间序列中各项数据的可比性是编制时间序列的基本原则 ( 一 ) 时间一致 ( 二 ) 总体范围一致 ( 三 ) 经济内容计算口径和计算方法一致

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 9: 统计学导论

9-9

三时间序列的编制原则

保证时间序列中各项数据的可比性是编制时间序列的基本原则 ( 一 ) 时间一致 ( 二 ) 总体范围一致 ( 三 ) 经济内容计算口径和计算方法一致

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 10: 统计学导论

9-10

第二节 时间序列的水平分析与速度分析

时间序列分析的水平指标 时间序列分析的速度指标 水平分析与速度分析的结合与应用

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 11: 统计学导论

9-11

一时间序列分析的水平指标

描述现象在某一段时间上发展变化的水平高低及其增长变化的数量多少

包括 发展水平 平均发展水平 增长量 平均增长量

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 12: 统计学导论

9-12

(一)平均发展水平

平均发展水平是不同时间上发展水平的平均数 统计上习惯把这种不同时间上数据的平均数称为

序时平均数 它将现象在不同时间上的数量差异抽象掉从动

态上说明现象在一定发展阶段的一般水平 不同性质的时间序列其计算方法也有所不同

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 13: 统计学导论

9-13

1 绝对数时间序列的平均发展水平 ( 1 )时期序列的平均发展水平

采用简单算术平均法

【例 9-1 】根据表 9-1 的数据计算我国 1991-2003 年国内生产总值的年平均水平

n

y

n

yyyy

n

ii

n

121

066923813

8900094)9117251126638821617(

13

11

1

n

iiy

ny

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 14: 统计学导论

9-14

( 2 )时点序列的平均发展水平 连续时点序列mdashmdash用简单算术平均法

对社会经济现象而言已知每天数据可视为连续序列

不连续时点数列计算序时平均数不连续时点数列计算序时平均数 先求分段平均数先求分段平均数

用来代表相邻两个时点之间各个时点上的水平用来代表相邻两个时点之间各个时点上的水平 假定现象均匀变化分段平均数=相邻两点数据的简假定现象均匀变化分段平均数=相邻两点数据的简

单算术平均单算术平均 再求全期总平均数再求全期总平均数

求全期总平均数=分段平均数的加权算术平均求全期总平均数=分段平均数的加权算术平均 权数权数 ff =时点间的间隔长度=时点间的间隔长度

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 15: 统计学导论

9-15

4y

221 yy

1f 2f3f

y

1y 2y 3y

232 yy

243 yy

不连续时点数列计算序时平均数mdash图示不连续时点数列计算序时平均数mdash图示

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 16: 统计学导论

9-16

不连续时点数列计算序时平均数的公式不连续时点数列计算序时平均数的公式

121

12122

3212

21

nfff

nfnyny

fyy

fyy

y121

12122

3212

21

nfff

nfnyny

fyy

fyy

y

当时点间隔相等上式简化为当时点间隔相等上式简化为

ldquo ldquo首末折半法首末折半法rdquomdashmdashrdquomdashmdash

121322

1

n

nynyyy

y

y

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 17: 统计学导论

9-17

【例 9-2 】 某地区 2004 年生猪存栏数量的几个时点数据 试计算该地区全年的生猪平均存栏数量 时 间 上年 123

1131 430 731 1031 1231

存栏数 ( 万头 ) 47 24 41 34 56 45

间隔(天) mdashmdash 1 3 3 3 2

1254023331

22

45563

2

56343

2

34413

2

41241

2

2447

y

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 18: 统计学导论

9-18

【例 9-3 】 根据表 9-1 中各年年末人口数计算 1991~

2003 年这 13 年间的平均人口数 解

由不连续时点序列计算平均发展水平的计算公式是有假定条件的实际中计算结果通常只是近似值

一般认为间隔越短计算结果就越准确 例如由一年中各月底数计算的全年平均数就比只用年初和年末两

项数据计算的结果更准确

2312258813

1593647)

2

129227128453117171115823

2

114333(

114

1

y

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 19: 统计学导论

9-19

2 相对数 ( 或平均数 ) 序列的平均发展水平

相对数 ( 或平均数 ) zi= yi xi (yi 和 xi 为总量指标 ) 由于各个 zi 的对比基数 xi 不尽相同所以不能

将各期 zi 简单算术平均 正确的计算方法是

分别计算绝对数序列 y 和 x 的平均发展水平 再由这两个平均发展水平对比来得到所求的平均发

展水平即

x

yz

其实质是对各期的相对数(或平均数)加权算术平均

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 20: 统计学导论

9-20

【例 9-4 】 根据表 9-1 的数据试计算 1991~ 2003 年中

国人均国内生产总值的平均发展水平 解

年平均国内生产总值为 6923806 亿元 平均人口数为 12258823 万人 故人均国内生产总值的平均发展水平 ( 单位元 人 )

02564823122588

0669238

x

yz

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 21: 统计学导论

9-21

1 增长量(增减量)=报告期水平-基期水平 说明现象在观察期内增长的绝对数量 基期不同有逐期增长量与累计增长量之分

逐期增长量=报告期水平-上期水平 逐期增长量说明现象逐期增长的数量

累计增长量=报告期水平-固定基期水平 累计增长量说明一段时期内总共增长的数量

关系累计增长量=相应时期的逐期增长量总和

同比增长量=报告期水平 -上年同期水平

(二)增长量与平均增长量

0yyt

1 ii yy

t

iiit yyyy

110 )()(

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 22: 统计学导论

9-22

2 平均增长量

平均增长量 逐期增长量的序时平均数 计算方法采用算术平均法

n

ny

yny

iiy

0

1

)( 1(

发展水平项数累计增长量

逐期增长量的个数逐期增长量)平均增长量

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 23: 统计学导论

9-23

例 9-3

解居民消费水平的年平均增长量为

年份1995

1996 1997 1998 1999

2000 2001 2002

2003

居民消费水平 2236 2641 2834 2972 3138 3397 3609 3818

4089

逐期增长量 405 193 138 166 259 212 209 271

累计增长量 405 598 736 902

1161 1373 1582

1853

6252318

1853

8

271209212259166138193405

根据下表数据计算我国居民消费水平的增长量和平均增长量

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 24: 统计学导论

9-24

二时间序列分析的速度指标

(一)发展速度=报告期水平基期水平 说明现象在观察期内发展变化的相对程度 有环比发展速度与定基发展速度之分

环比发展速度=报告期水平上期水平

反映现象逐期发展变动的程度也可称为逐期发展速度 定基发展速度=报告期水平固定基期水平

反映现象在较长一段时间内总的发展变动程度也称为发展总速度

1 ii yy

0 yyt

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 25: 统计学导论

9-25

发展速度(续) 二者关系

定基发展速度=相应时期的环比发展速度之积 相邻两定基发展速度之商=相应的环比发展速度

为了消除季节变动因素的影响可计算

上年同期水平报告期水平同比发展速度

11

2

0

1

0

t

tt

y

y

y

y

y

y

y

y

10

1

0

t

ttt

y

y

y

y

y

y

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 26: 统计学导论

9-26

(二)增长速度(增长率)

增长速度(增减速度)mdashmdash增长量与基期水平之比说明现象增长变化的相对程度

)( 1001 or 发展速度基期水平增长量

增长速度 )( 1001 or 发展速度基期水平增长量

增长速度

基期不同分环比增长速度与定基增长速度基期不同分环比增长速度与定基增长速度

环比增长速度=逐期增长量上期水平 =环比发展速度-1定基增长速度=累计增长量固定基期水平 =定基发展速度-1

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 27: 统计学导论

9-27

二者关系 定基增长速度(总增长速度)不等于相应各

环比增长速度之和(积) 几种速度指标之间的相互关系如下所示

环比增长速度环比增长速度

环比发展速度环比发展速度

定基增长速度定基增长速度

定基发展速度定基发展速度1

乘 除

1

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 28: 统计学导论

9-28

为了消除季节变动因素的影响也常常计算

1 =同比发展速度上年同期水平同比增长量同比增长速度

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 29: 统计学导论

9-29

速度的表现形式和文字表述 速度指标的表现形式一般为 倍数也

有用permil番数等等 翻 m 番则有报告期水平 = 基期水平 times2m

速度的文字表述bull发展速度mdash相当于发展为增长到减少到下降为hellip

bull报告期水平增长为基期水平的hellip bull以基期水平为 100 报告期水平增长为hellip

bull增长速度mdash提高(了)减少(了)下降(了)hellip

bull 报告期水平比基期水平增长(了)的hellip bull 以基期水平为 100 报告期水平增长(了)hellip

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 30: 统计学导论

9-30

(三)平均发展速度和平均增长速度

平均增长速度mdashmdash表示逐期增长变动的平均程度即各期环比增长速度的一般水平但不能对各环比增长速度直接平均 因为算术平均法或几何平均法都不符合增长速度这

种现象的性质 正确的计算方法

平均增长速度=平均发展速度mdash 1 平均增长速度为正(负)值表明平均说来现象在考察期内逐期递增(减)

增率)平均增长速度(平均递平均发展速度

平均速度

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 31: 统计学导论

9-31

平均发展速度的计算方法

1几何平均法计算平均发展速度(水平法)以 xi 表示环比发展速度根据环比发展速度与

总速度的关系计算平均发展速度可该采用几何平均法

nnG xxxx 21

n Rn 发展总速度

三个计算公式实质上是一致的可根据所掌握的数据来选择

nn

y

yn

0

最初水平最末水平

n=环比发展速度个数 =时间序列水平项数- 1

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 32: 统计学导论

9-32

【例 9-7 】 根据表 9-4 的数据计算中国 1991~ 2003 年居民消

费水平的平均发展速度和平均增长速度 解平均发展速度可根据三种资料来计算

84107071105810621083105610491073118118 Gx

8410782918 Gx

841072236

40898 Gx

平均增长速度= 10784 -100= 784即 1991 ~ 2003 年间我国居民消费水平平均每年递增 784

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 33: 统计学导论

9-33

用所求平均发展速度代表各环比发展速度bull 推算的最末一期的水平与实际相等bull 推算的总速度(最末一期的定基速度)也与实际

相等 几何平均法计算平均发展速度着眼于最末一期的水平故

称为ldquo水平法rdquobull 如果关心现象在最后一期应达到的水平时采用水平

法计算平均发展速度比较合适几何平均法较为简单直观既便于各种速度之间的推算

也便于预测未来某期的水平因此有着广泛的应用

几何平均法的特点

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 34: 统计学导论

9-34

平均发展速度的应用 根据平均速度预测现象经过一段时间以后

可能达到的水平n

Gn xyy )(0 例如若我国居民消费水平继续按上面所求出的平

均速度递增则可预测到 2010 年居民消费水平可达

y2010= y2003times( 平均发展速度 )7

= 4089times107847=693548( 元 )

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 35: 统计学导论

9-35

平均发展速度的应用(续) 利用平均发展速度的原理还可在年度增长率 zy 与月增长率 zm (季增长率 zs )之间进行换算它们的关系可表示为

1)1(1)1( 124 msy zzz

例如某地区居民消费总额 2003 年 9月为 200亿元 2005年 5 为 260亿元则居民民消费总额的月平均增长率和年平均增长率分别为

3211200

26020 3211

200

26020 62111)03211( 12

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 36: 统计学导论

9-36

2 方程式法计算平均发展速度 各期实际水平的总和为

以平均发展速度 作为各环比发展速度的代表值用它来推算各期水平并能使所推算的各期水平总和与实际相等则有

bull将各期水平 yi 用期初水平与各期环比发展速度 xi 的乘积来表示则上式可变成为

解上述方程其正根=平均发展速度

n

iin yyyyy

1321

n

iin yxxxxyxxxyxxyxy

13210321021010

Fx

0

132 )()()()(y

yxxxx

n

ii

nFFFF

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 37: 统计学导论

9-37

方程式法计算平均发展速度的特点

方程式法计算结果取决于考察期内各期实际水平的累计总和所以计算平均发展速度的方程式法又称为ldquo累计法rdquo 以所求平均发展速度代替各期环比发展速度推算的考察期内各期水平的累计总和与实际相等

着眼于考察全期的累计水平时就适合用方程式法来计算平均发展速度

例采用方程式法计算居民消费水平的平均发展速度

8506112236

26498)()()()( 832 FFFF xxxx 6855108Fx

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 38: 统计学导论

9-38

三水平分析与速度分析的结合与应用1正确选择基期

首先要根据研究目的正确选择基期 基期的选择一般要避开异常时期

2注意数据的同质性 不容许有 0 和负数否则就不适宜计算速度而只能直接用绝

对数进行水平分析 如果现象在某各阶段内的发展非常不平衡大起大落就会降

低甚至丧失平均速度以及平均发展水平和平均增长量的代表性和意义

3 将总平均速度与分段平均速度及环比速度结合分析4 将速度与水平结合起来分析

既要考虑速度的快慢也要考虑实际水平的高低 把相对速度与绝对水平结合可计算增长 1 的绝对量

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 39: 统计学导论

9-39

(续) 增长 1 的绝对量是用来补充说明增长速度的 一般只对环比增长速度计算其计算公式为

100100)(1 1

1

1

1

i

i

ii

ii y

y

yyyy

=的绝对量=增长

例  销售额 ( 万元 ) 增长率 ()

增长 1的绝对量

( 万元 )

  甲企业 乙企业 甲企业 乙企业 甲企业 乙企业2004 1400 120  mdash mdash  mdash   mdash  2005 1680 180 20 50 14 12

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 40: 统计学导论

9-40

第三节 长期趋势的测定

时间序列的构成与分解 长期趋势的测定方法

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 41: 统计学导论

9-41

一时间序列的构成与分解

(一)时间序列的构成因素按照影响的性质和作用形式将时间序列的众多影响因素归结为 以下四种

长期趋势 ( Trend )

季节变动 ( Seasonal Fluctuation )

循环变动 (Cyclical Variation)

不规则变动 (Irregular Variations )

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 42: 统计学导论

9-42

1 长期趋势 ( Trend )

长期趋势是指现象在相当长一段时间内沿某一方向持续发展变化的一种态势或规律性 它是时间序列中最基本的构成因素 由影响时间序列的基本因素作用形成

长期趋势有不同多种不同的类型 按变化方向不同来分有上升趋势下降趋势和水平趋势三类 按变化的形态来分长期趋势可分为线性趋势 和非线性趋势两类

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 43: 统计学导论

9-43

2 季节变动 (Seasonal Fluctuation )

季节变动mdashmdash泛指现象在一年内所呈现的较有规律的周期性起伏波动 周期长度可以是一年也可以小于一年

例如农产品的生产销售和储存通常都有淡季和旺季之分以一年为一个周期

例如超市的营业额和顾客人数的变动常常以七天为一个周期每个周末是高峰期

引起季节变动的原因既可能是自然条件(如一年四季的更替)也可能是法规制度和风 俗习惯等(如节假日)

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 44: 统计学导论

9-44

3 循环变动 (Cyclical Fluctuation )

循环变动指在较长时间内(通常为若干年)呈现出涨落相间峰谷交替的周期性波动 例如出生人数以 20~ 25 年为一个周期 太阳黑子数目大约 11 年为一个周期

太阳黑子数目的变化

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 45: 统计学导论

9-45

3 循环变动 ( 续 )

循环变动与长期趋势的异同 都是需要长期观察才能显现的规律性 但长期趋势是沿着单一方向的持续变动而循环

变动是具有循环特征的波动通常围绕长期趋势上下起伏

循环变动与季节变动的异同 都是属于周期性波动 但对循环波动的识别和分析更为困难

循环变动周期至少在一年以上周期长短很不固定 波动形态和波幅等规律性也都不是很规则 引起循环变动的原因通常也不那么直观明显

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 46: 统计学导论

9-46

4 不规则变动 (Irregular Variation ) 不规则变动(又称为剩余变动)mdashmdash是没有规律可寻的变动它是从时间序列分离了长期趋势季节变动和循环变动之后剩余的因素

可细分为随机扰动和异常变动两种类型 随机扰动是短暂的不可预期的和不可重复出现的众多细

小因素综合作用的结果表现为以随机方式使现象呈现出方向不定时大时小的起落变动但从较长观察时间内的总和或平均来看一定程度上可以相互抵消

异常变动则是指一些具有偶然性突发性的重大事件如战争社会动乱和自然灾害等引起的变动其单个因素的影响较大不可能相互抵消在时间序列分析中往往需要对这种变动进行特殊处理

后面所讲的不规则变动一般仅指随机扰动

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 47: 统计学导论

9-47

(二)时间序列因素分解的模型

按照四种构成因素相互作用的方式不同可以将上述关系设定为不同的合成模型实际中最常用的有乘法模型和加法模型 若以 Y 表示序列的数值 T 表示趋势值 S

表示季节变动值 C 表示循环变动值 I 表示不规则变动值下标 t 表示时间( t=12hellipn )

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 48: 统计学导论

9-48

加法模型

假定四种因素的影响是相互独立的 每种因素的数值均与 Y 的计量单位和表现形式相同

如绝对数序列中各种因素的数值都为绝对量 季节变动和循环变动的数值有正有负在它们各自

的一个周期范围内正负数值相互抵消因而总和或平均数为零不规则变动的数值也是有正有负但只有从长时间来看其总和或平均数才趋于零

对各因素的分离采用减法 如 ( Yt ndashSt )表示从序列中剔除季节变动的影响

ttttt ICSTY

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 49: 统计学导论

9-49

乘法模型

假定四种因素的影响作用大小是有联系的 只有趋势值与 Y 的计量单位和表现形式相同(一般为绝

对量)其余各种因素的数值均表现为以趋势值为基准的一种相对变化率通常以百分数表示

各个时间上的季节变动和循环变动数值在 100 上下波动在它们各自的一个周期范围内其平均值为 100 不规则变动值也是在 100 上下波动但只有从长时间来看其平均值才趋于 100

对各因素的分离则采用除法 例如( Yt St )表示从时间序列中剔除季节变动的影响

ttttt ICSTY

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 50: 统计学导论

9-50

二长期趋势的测定方法

长期趋势的测定和分析是时间序列分析中最主要的一项任务测定长期趋势不仅可以认识现象发展变化的基本趋势和规律性并作为预测的重要依据而且也是准确地测定其他构成因素的基础

(一)时距扩大法 将原序列中若干项数据合并使数据所包含的不规则变动在

一定程度上被相互抵消了由较长时间上的数据形成的新序列更清晰地显示出现象发展的长期趋势

对于包含季节变动的序列若将数据的时期扩大到一个季节周期(如将月度或季度数据合并为年度数据)可使季节变动也相互抵消

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 51: 统计学导论

9-51

【例 9-9 】 某企业历年的产品销售量数据如表 9-5 所示

年份199

3199

4199

51996

1997

1998

1999

2000

2001

2002

2003

2004

销售量(万件) 54 50 52 67 82 70 89 88 84 98 91 106 用时距扩大法依次将每三年的销售量进行合并得到新的销售量序列可更清楚地看出销售量不断增长的长期趋势

时距扩大法的优点计算非常简单直观 局限性新序列的项数大大减少丢失了原时间序列所包含的

大量信息不能详细反映现象的变化过程不利于进一步的深入分析

年份1993-1995

1996-1998

1999-2001

2002-2004

销售总量(万件) 156 219 261 295

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 52: 统计学导论

9-52

(二)移动平均法移动平均法( Moving Average )是采用逐项递进的办

法将原时间序列中的若干项数据进行平均通过平均来消除或减弱时间序列中的不规则变动和其他变动从而呈现出现象发展变化的长期趋势 若平均的数据项数为 K 就称为 K 期 ( 项 )移动平均 分为简单移动平均法和加权移动平均法两种

简单移动平均法将各项数据等同看待计算每个移动平均值时采用简单算术平均

加权移动平均法给各期观测值赋予不同的权数采用加权算术平均来计算每个移动平均值

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 53: 统计学导论

9-53

移动平均法(续)年份

销售量

3年移动平均

1 54  2 50

3 52

4 67

5 82

6 70

7 89

8 88

9 84

10 98

11 91

12 106  

520

56336700

7300

8033

8233

8700

9000

9100

9833

5年移动平均

  

6100

6420

7200

7920

8260

8580

9000

9340

  

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12年份

销售量

产量3年移动平均5年移动平均

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 54: 统计学导论

9-54

移动平均法的特点1移动平均法对原时间序列具有修匀或平滑的作用平均

的时距项数 k 越大移动平均的修匀作用越强2移动平均值代表的是所平均数据的中间位置上的趋势值

mdashmdash即中心化移动平均法 平均项数 k 为奇数时只需一次移动平均即得各期趋势值 当 k 为偶数时则需对移动平均的结果进行中心化处理

即再作一次两项移动平均3当序列包含周期性变动时平均的项数 k 应与周期长度

一致 在消除不规则变动的同时也消除周期性波动使移动平

均值序列只反映长期趋势 季度数据通常采用 4 期移动平均月度数据通常采用 12

期移动平均

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 55: 统计学导论

9-55

移动平均法的特点4移动平均值序列的项数比原序列少首尾缺少对应的趋

势值 平均项数 k 为奇数时新序列首尾各减少( k -1 ) 2

项 k 为偶数时首尾各减少 k 2 项

5 当现象呈非线性趋势时加权移动平均比简单移动平均效果为好 确定权数通常遵循ldquo近大远小rdquo的原则 采用中心化移动平均法其权数一般呈ldquo中间大两端

小rdquo的对称结构 例如 5 期移动平均中 5 个观测值的权数可分别为 12321 或者

也可以是 13531 等等6 移动平均法不能直接进行外推预测

只有在现象发展变化呈水平趋势的情况下移动平均值才能用于预测

预测时通常将移动平均值放在平均时距的最末一期上

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 56: 统计学导论

9-56

(三)趋势方程拟合法mdashmdash 根据时间序列拟合以时间 t 为解释变量

所考察指标 y 为被解释变量的回归方程(在此称为趋势方程或趋势模型)

1线性趋势方程 当时间序列的逐期增长量大致相同长期趋

势可近似地用一条直线来描述时就称时间序列具有线性趋势线性趋势方程形式为

btayt ˆ

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 57: 统计学导论

9-57

线性趋势方程 a 为趋势线的截距表示 t =0 时的趋势值

(即既定时间序列长期趋势的初始值 b 为趋势线的斜率表示当时间 t 每变动一

个单位趋势值的平均变动量 估计参数 a b 的方法通常采用最小二乘法

与直线回归方程中参数的计算公式相同

btayt ˆ

tbya

ttn

ytytnb tt

22 )(

)(

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 58: 统计学导论

9-58

【例 9-11 】

解根据最小二乘法拟合的趋势方程为

= 4610606+484266 t

年份 t 观测值 y1993 1 54

1994 2 50

1995 3 52

1996 4 67

1997 5 82

1998 6 70

1999 7 89

2000 8 88

2001 9 84

2002 10 98

2003 11 91

2004 12 106

ty

mdashmdash 根据趋势方程可计算各期趋势值及残差

mdashmdash 根据趋势方程也可进行外推预测

趋势值 残差5095 305

5579 -579

6063 -863

6548 152

7032 116

8

7516 -516

8000 900

8485 315

8969 -569

9453 347

9938 -838

10422 178

2005 13  1090

6

2006 14  1139

0

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12 年份

销售量

y观测值趋势值

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 59: 统计学导论

9-59

2 非线性趋势方程mdashmdash (1) K 次曲线

当现象的 K 级增长量大体接近一常数时可拟合 K 次曲线趋势方程 二级增长量(二次差)mdash对逐期增长量序列再求逐期增长量 三级增长量(三次差)mdash对二级增长量序列再求逐期增长量 hellip以次类推可计算时间序列的 K 级增长量

Kkt tbtbtbtbby ˆ 3

32

210

K 次曲线趋势方程

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 60: 统计学导论

9-60

二次曲线和三次曲线

三次曲线

实际中最常用的是二次曲线和三次曲线

2210ˆ tbtbbyt

33

2210ˆ tbtbtbbyt

二次曲线

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 61: 统计学导论

9-61

( 2 )指数曲线

当现象的逐期发展速度或增长速度大体相同时即现象大致按几何级数递增或递减时其长期趋势可拟合为指数曲线方程

a 相当于时间序列长期趋势的初始值 b 相当于平均发展速度若 b gt 1 呈递增趋势

b lt 1 时间序列呈递减趋势 估计参数 a 和 b 可通过对数变换来线性化

tt aby ˆ t

t aey ˆ或)( be

指数曲线bgt0blt0

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 62: 统计学导论

9-62

EXCEL 中的ldquo添加趋势线rdquo功能非线性趋势方程中参数的求解方法 通过线性变换(再利用 EXCEL 中的ldquo回归rdquo功能) 直接运用 EXCEL 中的ldquo添加趋势线rdquo功能它可以拟合多种趋势模型其操作方法是 先绘制出时间序列的折线图 然后在折线上任意一处点击右键选择ldquo添加趋势线rdquo 在随即弹出的对话框中选择趋势线类型确定即可 若在对话框的选项中选择了ldquo显示公式rdquo和ldquo输出 R 平方

值rdquo图中就会显示出根据最小二乘法拟合的趋势方程和相应的决定系数 R2

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 63: 统计学导论

9-63

【例 9-12 】 1989~ 2003 年中国海关出口商品总额的数据

如表 9-9 所示试测定其长期趋势 解从折线图可见出口总额呈现不断上升

的趋势其长期趋势可用二次曲线来拟合

决定系数 R2=09576

2819163274197689ˆ ttyt y=16 819t 2- 41 327t+689 97

R2=0 9576

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额二次曲线趋势

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 64: 统计学导论

9-64

【例 9-12 】mdashmdash指数趋势 也可用指数曲线来拟合长期趋势

tty )( 1492162481ˆ

tt ey 1391062481ˆ 或

y = 48162 e01391t

R2=09833

0

1000

2000

3000

4000

5000

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

出口总额指数曲线趋势

决定系数 R2=09833 从 R2看指数曲线的拟

合效果更好

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 65: 统计学导论

9-65

( 3 )其它非线性趋势曲线 用来拟合现象非线性趋势的曲线还有修正指

数曲线龚泊兹曲线和逻辑斯蒂曲线等等 修正指数曲线的方程形式为

tt abKy ˆ (0ltblt1)

数学特征变量值的一次差的环比比率相等 直观的曲线特征 现象初期增长迅速随后增长率逐渐下降直至最终以常数 K 为增长的极限

可用三点法或三和法来估计模型中的三个参数

修正指数曲线

修正指数曲线Y=K

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 66: 统计学导论

9-66

龚泊兹曲线( Compertz curve ) 龚泊兹曲线的方程形式为

(Kgt0)

数学特征变量值的对数一次差的环比比率相等 直观的趋势特征初期增长缓慢随后逐渐加快

达到一定程度后增长率又逐渐下降 直至接近一条水平线 Y=K

取对数 可转化为修正指数曲线

tbt Kay ˆ Compertz Curve

Y=K

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 67: 统计学导论

9-67

逻辑斯蒂曲线( Logistic curve )

逻辑斯蒂曲线的方程形式为

数学特征变量值倒数的一次差的环比比率相等 所适合的场合与龚泊兹曲线的适合场合比较类似

tt abKy

(Kgt0agt01nebgt0)

逻辑斯蒂曲线

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 68: 统计学导论

9-68

第四节 季节变动和循环波动测定

季节变动的测定方法 循环变动的测定方法 不规则变动的测定方法

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 69: 统计学导论

9-69

一季节变动的测定方法 测定季节变动的意义

掌握现象的季节变动规律为决策和预测提供重要依据 从原序列中剔除季节变动的影响更好地分析其他因素

季节变动的测定 乘法模型中季节变动的测定和分离都通过季节指数实现 按是否消除长期趋势影响来分测定方法可分为两大类

一是不考虑长期趋势的影响直接根据原序列去测定 常用方法是同期平均法

二是先剔除长期趋势然后根据趋势剔除后的序列来测定 常用方法是移动平均趋势剔除法

至少要有三个以上季节周期的数据如果季节变动的规律性不是很稳定则所需要的数据还应更多一些为好

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 70: 统计学导论

9-70

( 一 ) 同期平均法 基本原理是假定时间序列呈水平趋势通过对多年同期的

数据进行简单算术平均以消除不规则变动再将各季节水平(同期平均数)与水平趋势值对比即可得到季节指数

一般步骤 1 计算同期平均数 ( i =12hellipL )

即将不同年份同一季节的多个数据进行简单算术平均其目的是消除不规则变动的影响一般要先将各年同一季节的数据对齐排列

2 计算全部数据的总平均数 用以代表消除了季节变动和不规则变动之后的全年平均水

平亦即整个时间序列的水平趋势值 3 计算季节指数(也称为季节比率 ) Si

iy

y

100y

yS i

i

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 71: 统计学导论

9-71

季节指数 Sigt100 表示现象在第 i 期处于旺季即第 i 期水平

高于全年平均水平 Silt100 表示第 i 期是个淡季即该季节的水平低于全

年平均水平 在一个完整的季节周期中季节指数的总和等于季节周期的

时间项数或季节指数的均值等于 1

1001

L

iiS

LSLS

L

ii

1或

否则就要进行调整(即归一化处理)调整方法是用各项季节指数除以全部季节指数的均值(或将所求的各项季节指数都乘以一个调整系数即可)

L

iiSL

S 1

1季节指数的调整系数

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 72: 统计学导论

9-72

季节指数图【例 9-13 】

某企业生产的一种学生学习用复读机的销售量数据如表 9-10 所示试用同期平均法计算各月的季节指数

  JanFeb

Mar

Apr

May

Jun JulyAug

SepOct

Nov

Dec

2001

51 53 45 24 25 18 37 80 120 56 28 29

2002

46 48 40 23 23 21 32 74 101 50 25 27

2003

41 63 47 22 21 23 30 86 139 51 33 29

2004

53 55 50 21 31 20 35 90 112 60 31 37

同月平均

4775

5475

455

225

2520

533

582

5118

5425

2925

305

季节指数()

1016 116

5 968

479

532 436 713 1755

2511

1154

622 649 100

平均

 

 

 

47

0

50

100

150

200

250

300

1 2 3 4 5 6 7 8 9 10 11 12 月份

()

季节指数

同期平均法简单易理解但只适用于呈水平趋势的序列 当现象呈现出明显上升(下降)趋势时总会高估(低估)年

末季节指数相应地低估(高估)年初季节指数

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 73: 统计学导论

9-73

(二)移动平均趋势剔除法 趋势剔除法的基本原理首先测定出各期趋势值然后从原序列中消除趋势成份最后再通过平均的方法消除不规则变动从而测定出季节变动程度

最常用的趋势剔除法是移动平均趋势剔除法 采用移动平均法测定长期趋势剔除趋势后再计

算季节指数 实质上此方法也适用于包含循环变动的场合

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 74: 统计学导论

9-74

移动平均趋势剔除法的步骤1 计算移动平均值 (M)

对原序列计算平均项数等于季节周期 L 的中心化移动平均值旨在可消除原序列中的季节变动 S 和不规则变动 I

若序列不包含循环变动即 Y=TS I 则 M =T 假定时间序列也包含循环变动即 Y=TSCI 则 M= TC

可称之为趋势 - 循环值2剔除原序列中的趋势成份(或趋势 - 循环成份)

Y M 得到只含季节变动和不规则变动的比率序列即

IST

IST

M

Y

IS

CT

ICST

M

Y

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 75: 统计学导论

9-75

移动平均趋势剔除法的步骤

3 消除不规则变动 I 将各年同期(同月或同季)的比率( SI )进行简单算术平均可消除不规则变动 I 从而可得到季节指数 S

4调整季节指数 对所求季节指数进行归一化处理

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 76: 统计学导论

9-76

【例 9-14 】 年份 季度 销售额 Y

第一年

1 29

2 90

3 108

4 14

第二年 

1 35

2 112

3 130

4 24

第三年

1 40

2 108

3 126

4 28

第四年

1 48

2 139

3 179

4 33

第五年

1 56

2 152

3 192

4 35

四项移均mdash  

6025

6175

6725

7275

7525

7650

7550

7450

7550

7750

8525

9850

9975

10175

10500

10825

10875

mdash

中心化四季移动平均值( M )

mdash

mdash

6100

6450

7000

7400

7588

7600

7500

7500

7650

8138

9188

9913

10075

10338

10663

10850

mdash

mdash

趋势 - 循环剔除值( YM )

mdash

mdash

17705

02171

05000

15135

17133

03158

05333

14400

16471

03441

05224

14023

17767

03192

05252

14009

mdash

mdash

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 77: 统计学导论

9-77

例(续)

表 9-14 季节指数的计算表  1 2 3 4 总和一 mdash mdash 17705 02171  二 05000 15135 17133 03158  三 05333 14400 16471 03441  四 05224 14023 17767 03192  五 05252 14009 mdash mdash  

合计 20810 57567 69076 11962  平均 05202 14392 17269 02990 39854

季节指数 () 05222 14445 17332 03001 40000

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 78: 统计学导论

9-78

二循环变动的测定方法 循环变动通常很难识别和分解

周期往往不固定其规律性不很明显 它需要相当长时间的观察数据 必须借助于定性分析

(一)直接法 用同比发展速度或年距发展速度的波动来粗略地

描述循环变动的特征 简便直观但没有消除不规则波动的影响往往

也不能真正消除长期趋势和季节变动的影响很难准确描述循环波动的峰谷和振荡幅度等特征

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 79: 统计学导论

9-79

直接法测定循环变动(例)同比(年距)发展速度 ( )

  1 2 3 4

二 12069 12444 12037 17143

三 11429 9643 9692 11667

四 12000 12870 14206 11786

五 11667 10935 10726 10606

60

80

100

120

140

160

180

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

()同比发展速度

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 80: 统计学导论

9-80

(二)剩余法(分解法) 基本思想以因素构成模型为基础分别从时间序

列中分离出长期趋势和季节变动因素再消除不规则变动则剩余的成份就是时间序列的循环变动

步骤假定因素构成模型为 Y = TSCI 第一消除季节变动得到无季节影响的序列 第二由无季节影响序列计算出各期趋势值 T 再剔除趋

势求得循环和不规则变动序列 CI

最后对 CI 进行移动平均消除 I 求得 C

ICTS

Y

ICT

ICT

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 81: 统计学导论

9-81

三不规则变动的测定 剩余法思路清晰但计算复杂其准确性受其他各因素分离效果的影响对 CI 的移动平均以多长时距为宜理论上也无法一概而论实际应用中难免出现一定的随意性

三不规则变动的测定 不规则变动没有规律可寻不可能像其他因素那样可以直接进行测定因此只能从时间序列中逐一将长期趋势季节变动和循环变动分离出去之后剩余的因素统统归结为不规则变动又称为剩余变动或残余变动

不规则变动无法预测其未来确切的波动方向和具体数值只能在事后进行测定和分析对不规则变动的事后分析有利于分析现象变化的具体原因以便在以后的决策和行动中采取有效的防范措施和应对措施

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 82: 统计学导论

9-82

【例 9-15 】 根据表 9-12 的数据用剩余法测定某销售公司的饮料销售额的循环波动和不规则变动

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Y(销售额)TCI

T(趋势值)

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

循环变动(C)=MA(CI 3)

0 70

0 75

0 80

0 85

0 90

0 95

1 00

1 05

1 10

1 15

1 20

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

(I )不规则变动

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 83: 统计学导论

9-83

第五节 时间序列预测模型

其中最主要的是长期趋势的预测其常用的方法有 趋势外推预测 移动平均和指数平滑预测 自回归预测

时间序列预测通常是建立在时间序列因素分解之基础上的分别对各种构成因素进行预测后再合成所研究现象的预测值

时间序列预测模型最一般的形式为

tttt CSTY ˆˆˆˆ

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 84: 统计学导论

9-84

一趋势外推预测 趋势外推预测mdashmdash利用趋势方程去预测现

象在未来时间上的长期趋势值 按原来的时间顺序将预测期的时间变量值 t 代

入趋势方程中即可计算出预测期的趋势值 趋势外推法简单方便但必须注意该方

法实质上就是假定影响现象长期趋势的基本因素在预测期仍然起着同样的作用

实际应用中须认真分析影响趋势的基本因素是否会显著变化而且外推时间不宜太远

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 85: 统计学导论

9-85

【例 9-16 】 根据例 9-15 中所拟合的趋势直线方程并结

合季节指数(见表 9-15 )预测第六年各季度的饮料销售额

解趋势直线方程为 预测值依次为

tTt 29033698849ˆ

036252220)2129033698849(ˆˆ 12121 = STy

34817644451)2229033698849(ˆˆ 22222 = STy

30621773321)2329033698849(ˆˆ 32323 STy

6183830010)2429033698849(ˆˆ 42424 STy

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 86: 统计学导论

9-86

二移动平均和指数平滑预测(一)移动平均预测

mdashmdash就是用移动平均值作为下一期的预测值 有简单移动平均预测和加权移动平均预测两种 与测定趋势的移动平均法有所不同

每个 K 期移动平均值不是代表观测值中间一期的趋势值而是第 K+1 期的趋势预测值

移动平均值的位置也不再是居中放置而是置于第 K 期(所平均数据末尾一期)或直接置于第 K+1 期(预测期)

加权移动平均法用于预测时按ldquo近大远小rdquo的原则确定权数即离预测期较远的数据给以较小的权数而离预测期较近的数据给以较大的权数

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 87: 统计学导论

9-87

移动平均预测 ( 的公式) 简单移动平均预测第 t+1 期预测值的公式为

1

0

1211

k

iit

ktttttt y

kk

yyyyMy

加权移动平均预测第 t+1 期预测值的公式为

121

1122111

ˆ

Ktttt

Ktkttttttttt wwww

wywywywyMy

wi 为观测值 yi 的权数且 wt gtwt-1 gthellipgt wt-k+1 常常取自然数 K K-1 hellip 2 1

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 88: 统计学导论

9-88

移动平均预测(续) 移动平均预测的局限性

只具有预测未来一期趋势值的预测功能 只适用于呈水平趋势的时间序列

如果现象的发展变化具有明显的上升(或下降)趋势则移动平均预测的结果就会产生偏高(或偏低)的滞后偏差即预测值的变化滞后于实际趋势值的变化

移动平均的项数 K越大滞后偏差就越大

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 89: 统计学导论

9-89

(二)指数平滑预测1 指数平滑法( Exponential smoothing )的基本原理 用 Et 表示第 t 期的指数平滑值其计算公式为

α 为平滑系数 (0ltαlt1) 指数平滑具有递推性质 展开后

1)1( ttt EyE

011

33

22

1 )1()1()1()1()1( EyyyyyE ttttttt

E0 为初始值通常设 E0= y0 trarrinfin 时最后一项系数趋近于 0 其余各项的系数构成一个无穷递减等比数列该数列总和为 1

可见指数平滑值 Et 实质上是以前各期观测值的加权算术平均数各期观测值的系数就是其权数权数呈指数形式递减

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 90: 统计学导论

9-90

指数平滑法的主要优点

按ldquo近大远小rdquo原则给各期观测值赋予了不同的权数既充分利用了以前各期观测值的信息又突出了近期数据的影响能够及时跟踪反映现象的最新变化

它采用递推公式更便于连续计算因为实际计算时不必保留以前全部信息只需上期的平滑值和最新的观测值两项数据即可

其权数确定也较为简便只需确定最新一期数据的权数其他各项观测值的权数可自动生成

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 91: 统计学导论

9-91

平滑系数 α 的选择α 的选择是指数平滑法的关键一般可从以下几个方面来考虑 (1) 如果认为时间序列中随机波动成份较大为了尽可能

消除随机波动的影响可选择较小的 α 反之若认为随机波动成份较小为了及时跟踪现象的变化突出最新数据的信息可选择较大的 α

(2) 如果现象趋势的变化很平缓可选择较小的 α 如果现象趋势的变化比较剧烈例如呈阶梯式特征应选择较大的 α

(3) 通过大小不同的 α 值进行试算使得预测误差最小的 α值就是最合适的平滑系数

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 92: 统计学导论

9-92

2 一次指数平滑预测模型 当时间序列呈水平趋势或没有明显波动规律

时可以用一次指数平滑进行短期预测

一次指数平滑预测的基本思想如果第 t 期的预测没有误差则第 t 期预测值仍然是第 t+1 期的预测值如果有预测误差则不外乎

一部分是随机波动所引起的误差预测时应尽可能予以剔除 另一部分是由于 t 期的现象与以前比较确实有了实质性变化而造成的误

差对此须及时跟踪反应这就要求根据预测误差调整预测值 α 值实质上体现了预测者对预测误差中实质性变化所占比重的估计

11 )1(ˆ tttt EyEy

)ˆ(ˆˆ 1 tttt yyyy 或

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 93: 统计学导论

9-93

【例 9-17 】 要求用移动平均

法和指数平滑法进行预测

解 采用 5日移动平

均加权移动平均预测中各期数据的权数由近到远分别为 5432 1

指数平滑法预测取 α=04

日期 价格 移动平均 加权移动平均 指数平滑值

1 720      2 709     7200

3 705     7156

4 720     7114

5 732     7148

6 720 7172 7195 7217

7 725 7172 7205 7210

8 738 7204 7231 7226

9 751 7270 7289 7288

10 742 7332 7369 7377

11 735 7352 7399 7394

12 725 7382 7398 7376

13 717 7382 7354 7326

14 721 7340 7283 7263

15 728 7280 7240 7242

16 730 7252 7240 7257

17   7242 7256 7274

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 94: 统计学导论

9-94

3 二次指数平滑的预测模型 二次指数平滑 E(2) 是对第一次指数平滑值序列

E(1)再计算指数平滑值 即 )2(

1)1()2( )1( ttt EEE

当现象有明显上升或下降趋势时指数平滑值 E(1) 与趋势值 之间存在明显的滞后偏差 E(2) 与 E(1) 之间也存在着同样的滞后偏差根据三者之间滞后偏差的数量关系可得出线性趋势模型中参数估计值 at 和 bt 的并由此得到相应的线性趋势预测模型

y

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 95: 统计学导论

9-95

3 二次指数平滑的预测模型(续) 利用二次指数平滑建立的线性趋势预测模型及其参

数估计值的计算公式为

)(1

2

)2()1(

)2()1(

ttt

ttt

EEb

EEa

Kbay ttKt ˆ ( K=12hellip )

二次指数平滑预测模型是以最近一期的一二次指数平滑值来估计线性趋势预测模型的参数因此其参数估计值是根据数据的最新变化而不断修正的

此预测方法适宜对现象进行短中期预测

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 96: 统计学导论

9-96

【例 9-18 】 根据表 9-5 的数据利用指数平滑法进行预测

解取 α=045 两次平滑的初始值都取为 y1 参数估计值为

171036791429722004 a

714

)67914297()550450(2004

b

87107171417103

ˆˆ 120042005

yy

58112271417103

ˆˆ 220042006

yy

年份

销售量

一次指数平滑值 E

(1)

二次指数平滑值 E

(2)

at bt 预测值

93 54540

0 540

0      

94 50522

0 531

9 5121

-081

 

95 52521

1 527

0 5152

-049

5040

96 67588

1 554

5 6217 275

5103

97 82692

5 616

6 7683 621

6492

98 70695

9 652

3 7394 357

8304

99 89783

2 711

2 8552 589

7751

00 88826

8 763

2 8903 520

9142

01 84832

7 794

5 8710 313

9423

02 98899

0 841

5 9565 470

9022

03 91903

9 869

6 9383 281

10035

04 106

9742

9167

10317

471

9664

2005 年和 2006 年的销售量预测值为

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 97: 统计学导论

9-97

三自回归预测 同一时间序列前后观测值之间的相关关系称

为自相关 观测值 yt 对其以前若干期观测值 yt-k ( k=12

hellip )的回归称为自回归 根据自回归模型进行预测就是自回归预测 yt-k 也称为滞后期观测值 k 称为滞后期

若考虑 p 个滞后期观测值则自回归模型mdashmdash称为 p 阶自回归模型通常记为 AR(p) 可写为如下形式

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 98: 统计学导论

9-98

p 阶自回归模型 AR(p)

模型中 a 为常数项

在自回归模型的识别和参数估计过程中通常要求先将观测值作零均值化处理所以自回归模型通常不含常数项 a

φ1 φ2hellipφp 是模型的参数 εt 为随机误差项

对自回归预测最直观的解释就是时间序列 第 t 期的水平可以根据其以前若干期观测值的线性组合来预测

tptpttt yyyay 2211

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 99: 统计学导论

9-99

自回归预测的基本步骤 第一步预测模型的识别

对时间序列的特性进行识别判断是否适合建立自回归模型自回归模型的滞后期是多长

识别的依据主要是自相关系数和偏自相关系数 第二步估计模型参数

可将自回归模型视为多元线性回归模型 可使用最小二乘法来估计其参数

第三步模型的检验 即根据残差的分布估计量的 t 统计量模型的判定系

数 R2等对所估计的模型进行检验经过检验认为适用的模型方能用于预测

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 100: 统计学导论

9-100

模型的识别 建立自回归模型的条件是时间序列具有平稳性

平稳性是指时间序列的统计特性不随着时间推移而变化具体地说平稳时间序列必须满足其序列均值恒为一常数其方差也不随着时间而改变自相关系数只与时间间隔 k 有关而与时间起点 t 无关等条件

一般说来无明显的上升或下降趋势观测值大体在一个固定数值上下波动的序列是平稳的

判断时间序列的平稳性通常需要计算自相关系数判断准则是随着滞后期 k 加大自相关系数以指数形式或正弦波形式衰减即自相关函数图形呈拖尾状

n

tt

n

ktktt

k

yy

yyyy

1

2

1

)(

))((

自相关系数的计算公式为(ρk 表示对整个序列 观测值 yt

与 yt-K 之间的相关系数 )

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 101: 统计学导论

9-101

偏自相关系数与自回归模型阶数的判断 偏自相关系数能够排除中间各项数据的影响而反映 t

期与 t-k 期的真实相关关系 偏自相关系数越大表明对任意时间 t yt 与 yt-k 之间的联

系程度强 偏自相关系数可以用来判断与 yt 显著相关的滞后期观

测值有几个由此可确定自回归模型的阶数 当滞后期大于 p 后偏自相关系数就不显著了(趋于 0 )

则称时间序列的偏自相关函数是 p 阶截尾的自回归模型就应包含 p 个滞后期观测值

偏自相关系数的计算可采用下列递推公式 32

1

1

1

11

1

11

111

kr

r

k

k

iiik

k

iikikk

kk

)(

)(

12111 kiikkkkikik 其中

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 102: 统计学导论

9-102

【例 9-19 】 根据例 9-17 的价格时间序列建立自回归模型 解先计算滞后期 k=123hellip 时的自相关系数和偏自相关系

数利用统计软件来计算( SPSS EViews等软件均可)其中 AC 即自相关系数 PAC 即偏自相关系数

从图形可见该序列的自相关系数具有拖尾特征滞后一二期的偏相关系数较高滞后三期以上的偏相关系数无显著意义 可建立二阶自回归预测模型 MA(2)

根据最小二乘法可估计出模型参数并得到如下模型(括号内为参数的 t 统计量的值该预测模型的 R2=0607 标准误差为 00788 )

)()()( 013201947892

467809411083793ˆ 21

ttt yyy

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 103: 统计学导论

9-103

四预测误差 预测误差是指现象的实际值与预测值之差

误差小预测结果的精度就高 要衡量一个预测模型的质量优劣就只能分析预

测模型在原时间序列范围内的预测误差大小 衡量预测模型的误差常用的指标有

1 平均绝对误差( MAE )

n

ttt yy

nMAE

1|ˆ|

1

2 平均相对误差( MPE )

n

t t

tt

y

yy

nMPE

1|

ˆ|

1 这两种误差受异常值的影响较小对多个模型的预测误差进行比较时采用平均相对误差可以避免绝对水平和计量单位不同的影响

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 104: 统计学导论

9-104

预测误差(续) 3 均方误差( MSE )

n

ttt yy

nMSE

1

2)ˆ(1

n

ttt yy

nMSERMSE

1

2)ˆ(1

4 均方根误差( RMSE )

均方误差和均方根误差由于取误差的平方来计算因此受异常值的影响较大

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力

Page 105: 统计学导论

9-105

结束语

所有的时间序列预测都有一个关键的假定前提那就是现象在原时间序列考察期内所呈现的趋势和规律性将在预测期内基本保持不变从而要求影响现象的各种主要影响因素的作用和结构基本不变只有在这种前提下对原时间序列预测误差小的预测模型才能对现象的未来具有较强的预测能力