第 5 章

46
第5第 线线线线线线线线线

Upload: carter-ayala

Post on 30-Dec-2015

34 views

Category:

Documents


5 download

DESCRIPTION

第 5 章. 线性回归模型的应用. 线性回归模型的应用. 5.1 多元线性回归分析与因素控制 5.1.1 多元回归与因素控制 5.1.2 缺失变量偏差 5.1.3 分割回归、 F-W 定理和影响消除 5.2 模型中变量的形式 5.2.1 对数模型和弹性 5.2.2 非线性自变量. 线性回归模型的应用. 5.3 虚拟变量 5.3.1 虚拟变量的引入方式 5.3.2 引入多个虚拟变量 5.4 参数约束检验 5.4.1 参数约束检验方法 - PowerPoint PPT Presentation

TRANSCRIPT

第 5 章

线性回归模型的应用

线性回归模型的应用5.1 多元线性回归分析与因素控制 5.1.1 多元回归与因素控制 5.1.2 缺失变量偏差 5.1.3 分割回归、 F-W 定理和影响消除5.2 模型中变量的形式 5.2.1 对数模型和弹性 5.2.2 非线性自变量

线性回归模型的应用5.3 虚拟变量 5.3.1 虚拟变量的引入方式 5.3.2 引入多个虚拟变量5.4 参数约束检验 5.4.1 参数约束检验方法 5.4.2 参数约束检验应用重要概念

5.1 多元线性回归分析与因素控制5.1.1 多元回归与因素控制5.1.2 缺失变量偏差5.1.3 分割回归、 F-W 定理和影响消除

5.1 多元线性回归分析与因素控制5.1.1 多元回归与因素控制 经济数据的生成受很多因素的影响,要研究所关注因素对经济过程的影响,必须对其它因素的影响进行控制。 例子 5.1 气温与冷饮消费

不能丢掉相关变量 AirCd ,否则可能产生缺失变量内生性问题。

u WhetherAirCdColdr 210

5.1 多元线性回归分析与因素控制5.1.2 缺失变量偏差 丢掉相关变量,相当于将其放入误差项,如果丢掉的变量与其他解释变量相关,间接地就导致解释变量与误差项相关。 的估计偏差:

例子 5.1 (续) 若回归的模型是:

)ˆ(E)ˆ(Bias

u WhetherColdr 20

5.1 多元线性回归分析与因素控制5.1.2 缺失变量偏差例子 5.1 (续) 且 AirCd受Whether 影响表示为:

为上式中对 的估计偏差的大小和方向由 和 共同决定。

v WhetherAirCd 10

11222 ˆ)ˆ(E)ˆ(Bias

1 1

1 1

5.1 多元线性回归分析与因素控制5.1.2 缺失变量偏差结论 1 :缺失变量偏误设完整回归模型为

,误差项 满足外生性假设。丢掉变量 后的模型为 。 与

的关系可表示为回归 ,

为 的 OLS 估计。丢掉变量 导致的 OLS 估计偏误为

uQXXY kk 110

u QvXXY kk 110 Q kiX i ,,2,1,

wXXQ kk 110 i i

Q

kiiii ,,2,1,ˆ)ˆBias(

5.1 多元线性回归分析与因素控制5.1.2 缺失变量偏差 例子 5.2 货币需求量 邹志庄的模型

泰勒和纽豪斯的模型

ttttt uXXXY 3322110

tttttt uYXXXY 143322110

5.1 多元线性回归分析与因素控制5.1.3 分割回归、 F-W 定理和影响消除 分割回归步骤:

第一步:对以 为因变量, 、 为自变量的回归模型 进行 OLS 估计,得到

回归残差 ; 第二步:对以 为因变量, 、 为自变量的回归模型 进行 OLS 估计,得到

回归残差 ;

iiiii uXXXY 3322110

1X 2X 3X

iiii vXXX 332201 iv

Y 2X 3X

iiii wXXY 33220

iw

5.1 多元线性回归分析与因素控制5.1.3 分割回归、 F-W 定理和影响消除 分割回归步骤:

第三步:对以 为因变量, 为自变量进行一元线性回归 , 的 OLS 估计 便是 的 OLS估计。 结 论 2 : 等于回归系数 的 OLS 估计。 (F-W 定理 )其直观意义即是: 的回归系数的 OLS 估计,等于剔除

和 的影响后 对 的一元线性回归的回归系数OLS 估计。

iiiii uXXXY 3322110

iw iv

iii vw ˆˆ

1

1

1X

2X 3X Y 1X

5.2 模型中变量的形式5.2.1 对数模型和弹性5.2.2 非线性自变量

5.2 模型中变量的形式5.2.1 对数模型和弹性• 前面的模型中回归系数刻画的都是边际效应:解

释变量变化以单位所能引起的被解释变量变化的单位。(不能消除单位的影响)

• 弹性则采用相应的百分比变化,不受单位的影响。• 对数模型的回归系数表示的就是弹性

• 取对数能降低数据量级 , 宏观数据经常取对数。 uXXXXY kkmmmm 11110 logloglog

5.2 模型中变量的形式5.2.2 非线性自变量 将加入的非线性自变量看做新的自变量,模型就还是线性的。• 平方项:年龄对工资收入的影响、平均成

本和产量的关系(例子 5.4 )、工资收入和阅历的关系

• 双曲线模型• 逻辑曲线模型 生灭过程(例子 5.5 )

)/1(10 XY

0),1/()1/( XeeY uXuX

5.3 虚拟变量5.3.1 虚拟变量的引入方式5.3.2 引入多个虚拟变量

5.3 虚拟变量• 只取值 0和 1 的自变量称为虚拟变量,也

称为哑变量( dummy variable )或者二值变量( binary variable )。

• 此处仅讨论解释变量取虚拟变量的情况,被解释变量取虚拟变量(二元选择模型)的情形留待第 7 章解释。

5.3 虚拟变量5.3.1 虚拟变量的引入方式 假设家庭消费支出受可支配收入影响,计量模型为

iii uIC 10

收入家庭0

1

低高收入家庭

D

5.3 虚拟变量5.3.1 虚拟变量的引入方式 加法方式

代表不同收入家庭自发性消费的差异。

加法方式引入的虚拟变量,用于体现不同对象对应模型的常数项变化。

iiicdi uIDC 1

)(0

)(cd

5.3 虚拟变量5.3.1 虚拟变量的引入方式 乘法方式

代表不同收入家庭边际消费倾向的差异。

乘法方式引入的虚拟变量,用于体现不同对象对应模型的斜率参数的变化。

iiiisdi uIIDC 1

)(0

)(sd

5.3 虚拟变量5.3.1 虚拟变量的引入方式 混合方式

检验不同收入家庭消费模型是否有差异。

iiisdi

cdi uIDDC )( )(

1)(

0

0: )()(0 s

dcdH

5.3 虚拟变量5.3.2 引入多个虚拟变量 当属性分类超过两个时,需要引入多个虚拟变量来刻画不同类别对象的差异。结 论 3 :虚拟变量的个数 对于带截距项的模型,为表示某一属性不同类别引入虚拟变量时,虚拟变量的个数等于类别个数减去 1 。 若虚拟变量数与类别数相同,则存在完全共线性,模型无法估计。

5.3 虚拟变量5.3.2 引入多个虚拟变量 例子 5.6 性别、高等教育和工资收入 uDDY expe322110

uDDDDY 21322110 expe

uDDDDDY expeexpe 121322110

未受过高等教育受过高等教育

0

11D

女性男性

0

12D

5.4 参数约束检验5.4.1 参数约束检验方法5.4.2 参数约束检验应用

5.4 参数约束检验5.4.1 参数约束检验方法• 原理:比较受约束的和不受约束的模型的

残差平方和是否有明显差别检验统计量:

无约束模型回归残差平方和:约束模型回归残差平方:无约束模型中解释变量个数:约束条件个数: 样本容量:

))1(/(SSR

/)SSRSSR(

ur

urr

kn

qTr

urSSR

rSSR

nk

q

5.4 参数约束检验5.4.1 参数约束检验方法结论 4 :参数约束检验统计量 在约束条件(原假设)成立时,统计量

服从自由度为 q 和( n-(k+1) )的 F 分布。原假设:

rT

参数约束正确:0H

5.4 参数约束检验5.4.2 参数约束检验应用

参数约束检验应用

冗余变量联合检验

例子 5.3 高等教育规模 -不同地区

故认为不同地区的高等教育规模模型没有显著差异。

uXXY kk 110

0:H 10 kqk

uXXXXXDdDdY 554433221122110 lnlnlnln 0:H 210 dd

72.5)23,2(51.0))17(31/(6514.0

2/)6514.06802.0(

))1(/(SSR

/)SSRSSR(05.0

ur

urr

Fkn

qTr

参数约束检验应用冗余变量联合检验例子 5.3 高等教育规模 -不同地区EViews 实现该检验: 先对无约束模型进行回归,在结果输出界面点击

View→Coefficient Diagnostics→Redundant Variables Test-Likelihood Ratio… ,

在弹出的对话框中键入需要检验的冗余变量,点击 OK

参数约束检验应用

冗余变量联合检验例子 5.3 高等教育规模 -不同地区得到结果:

参数约束检验应用函数形式检验RESET( Regression Equation Specification Error Test )

步骤: 1. 对 进行回归,得拟合值

2.对 进行回归

3. 对原假设 进行检验

uXXY 22110

uXXY 22110

22110ˆˆˆ XXY

32

2122110

ˆˆ YYXXY

0: 210 H

参数约束检验应用

函数形式检验例子 5.7 工资模型中的高阶项

uIQmarriedexpereducagelwage 543210:I

3

12

154

3210:II

lwageflwagefIQmarried

expereducagelwage

)413,2(515.2))17(421/(26.49

2/)26.4986.49(

))1(/(SSR

/)SSRSSR(05.0

ur

urr Fkn

qTr

参数约束检验应用

函数形式检验例子 5.7 工资模型中的高阶项EViews实现该检验: 对原模型进行 OLS 回归,在回归结果界面点击 View→Stability Diagnostics→Ramsey RESET Test 在弹出的对话框中键入需要添加的拟合项阶数

参数约束检验应用

函数形式检验例子 5.7 工资模型中的高阶项得到结果:

参数约束检验应用

线性约束检验

例子 5.8 规模报酬不变生产函数

)',...,,(,)',...,(,)',...,(,' 212121 qqq XXXXX

22110 XXY

0,0,KALP ue

PlnY Lln1 X Kln2 X

Aln0 1 2

参数约束检验应用

线性约束检验例子 5.8 规模报酬不变生产函数

EViews实现该检验: 在估计结果界面点击

View→CoefficientDiagnostics→Wald Test-Coefficient Restrictions… ,在弹出窗口键入线性约束

)21,1(023.0))12(23/(074569.0

1/)074569.0074652.0(

))1(/(SSR

/)SSRSSR(05.0

ur

urr Fkn

qTr

参数约束检验应用

线性约束检验例子 5.8 规模报酬不变生产函数得到结果:

参数约束检验应用

参数断点检验( Breakpoint Test )模型参数在某处发生结构性变化 设有两组样本,样本容量分别为 和 ,

设第一组数据的回归模为 ,第二组样本的回归模型为 ,将两个数据集合合并后采用的回归模型为

1n 2n)1()1(

1)1(

1)1(

0 uXXY kk )2()2(

1)2(

1)2(

0 uXXY kk

uXXY kk 110

kiii ,,1,0,:H )2()1(0

参数约束检验应用

参数断点检验( Breakpoint Test )步骤: 1. 用第一组数据对 回

归,得出残差平方和

2. 用第二组数据对 回归,回归残差为 ,无约束残差平方和为

3. 用合并数据对 回归,得约束的残差平方和 ,约束条件个数

)1()1(1

)1(1

)1(0 uXXY kk

1SSR)2()2(

1)2(

1)2(

0 uXXY kk

2SSR

21ur SSRSSRSSR

uXXY kk 110

rSSR 1kp

参数约束检验应用

参数断点检验( Breakpoint Test )步骤: 4. 定义检验统计量

)])1(2[,1(~

)]1(2/[)SSRSSR(

)1/()]SSRSSR([SSR

21

21r

knkF

kn

kTt

参数约束检验应用

参数断点检验( Breakpoint Test )若样本为时间序列,则称之为邹检验( Chow

Breakpoint Test )

例子 5.9 贝塔系数(股价与指数的关系) ttttt uYXXY 111

参数约束检验应用

参数断点检验( Breakpoint Test )例子 5.9 贝塔系数(股价与指数的关系)第一个样本得到

第二个样本得到

11 97.084.085.002.0 tttt YXXY

126636.0SSR1

11 86.018.141.162.0 tttt YXXY

373328.0SSR 2

499964.0SSR ur

参数约束检验应用

参数断点检验( Breakpoint Test )例子 5.9 贝塔系数(股价与指数的关系)整体样本得到

11 94.015.124.125.0 tttt YXXY

528167.0SSR r

37.2)284,4(00.4

)42292/(499964.0

4/)499964.0528167.0(

)]1(2/[)SSRSSR(

)1/()]SSRSSR([SSR

01.0

21

21r

F

kn

kTr

参数约束检验应用

参数断点检验( Breakpoint Test )EViews实现该检验: 对整个样本区间进行回归(即第三个回归),在回归结

果输出界面顺序点击 View→Stability Tests→Chow Breakpoint Test , 弹出对话框中键入断点日期

参数约束检验应用

参数断点检验( Breakpoint Test )得到结果:

如果对横截面数据进行断点检验,首先确定将样本分为两个子样本的指标变量(例如性别),然后对合并样本进行回归,并在结果输出界面点击 View→Coefficient Diagnostics→Factor Breakpoint Test ,在弹出的对话框中输入指标变量(例如性别),点击 OK输出断点检验结果。

重要概念1. 当影响因变量的自变量有多个,并且自变量之间存在

相关关系时,为正确估计所关注自变量对因变量的影响,需要将相关自变量一同引入模型。

2. 丢失相关自变量会引起估计偏出,估计偏差的大小与关注变量和缺失的相关变量的相关程度以及缺失变量对因变量的回归系数确定。如果缺失变量与关注变量不相关(无关变量),则不会引起估计偏误;如果缺失变量对因变量没有解释能力,也不会引起估计偏误。

3. F-W 定理表明,多元线性回归系数的 OLS 估计可以采用多次线性回归的 OLS 估计得到。分割回归的原理在于首先消除掉相关变量对因变量和所关注自变量的影响,通过线性回归取残差的方法消除相关变量的影响。分割回归从另一个侧面解释了多元回归的因素控制作用。

重要概念4. 在应用中,可以对回归模型中的变量进行对数变换,由

此得出的回归系数为因变量关于自变量的弹性或者半弹性。根据需要,可以引入自变量的平方项和交叉相乘项,更为灵活地反映自变量对因变量的影响。一些因变量和自变量的非线性模型,可以变换为线性模型,并可以用 OLS 对模型参数进行估计。

5. 当自变量为属性变量时,需要用虚拟变量表示。根据需要虚拟变量可以加分、乘法和混合三种方法引入模型。某一属性有 k个类别时,如果模型有截距项,为避免完全共线性,只能引入 k-1 个虚拟变量,此时虚拟变量的回归系数表示与基础类别的差异。

6. 参数约束检验用于检验回归模型的回归系数是否满足给定的约束条件,检验的思想是对约束模型和无约束模型的残差平方和进行比较,并以此为基础构造 F检验统计量。参数约束检验可用于冗余变量检验、回归函数形式检验、回归系数线性约束检验以及参数断点检验。