計量経済学講義 - u-toyama.ac.jp...ln ロジット...

32
計量経済学 講義 10 回 回帰分析 Part 3 2017 11 1 日(水)1 限(金曜授業実施日) 担当教員: 唐渡 広志 研究室: 経済学研究棟4432号室 email: [email protected] website: http://www3.u-toyama.ac.jp/kkarato/ 1

Upload: others

Post on 10-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

計量経済学 講義第 10 回 回帰分析 Part 3

2017 年 11 月 1 日(水)1 限(金曜授業実施日)担当教員: 唐渡 広志

研究室: 経済学研究棟4階432号室email: [email protected]: http://www3.u-toyama.ac.jp/kkarato/

1

Page 2: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

講義の目的

ロジスティック関数の推定方法について学びます。

多重回帰分析について学びます。

keywords: ロジスティック関数,集計ロジットモデル,多重回帰モデル,回帰平面

教科書: pp. 122 – 143(第3章)

2

Page 3: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

【復習1】Excel での回帰分析

関数:slope, intercept, rsqなど

散布図:観測点を右クリックして近似曲線の追加

分析ツールの「回帰分析」

表示された結果の意味について理解

3

Page 4: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

【復習2】非線形式の回帰分析

4

1. べき関数

両辺の対数をとり,両対数モデルを推定する。データとして,ln y, ln xを利用する。

2. 指数関数

両辺の対数をとり,半対数モデルを推定する。データとして,ln y, X を利用する。

bの意味 = 弾力性xが 1% 変化するときの,y の変化率 [%]

cの意味 = 変化率xが 1 単位変化するときの,y の変化率 [%]

Page 5: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

0 5 10 15 20 25

0.0

0.2

0.4

0.6

0.8

1.0

x

ロジスティック関数

5

X

X

eey

1

y

「増え方」が増加

「増え方」が減少

←飽和

耐久消費財の普及率を推定するのに便利な形をしている。

急速な勢いで普及

ある程度普及すると飽和

01 yyX ると,が大きく(小さく)な

普及率

Page 6: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

耐久消費財の普及率

6

020406080

100

1955 1975 1995 2015

普及率

(%)

年次

カラーテレビ

020406080

100

1955 1975 1995 2015

普及率

(%)

年次

乗用車

020406080

100

1985 1995 2005 2015

普及率

(%)

年次

携帯電話

データ出所:『消費動向調査』(内閣府)

85.01

ˆ

2

09.071.178

09.071.178

Re

eyi

i

X

X

i

82.01

ˆ

2

32.034.634

32.034.634

Re

eyi

i

X

X

i

59.01

ˆ

2

15.086.286

15.086.286

Re

eyi

i

X

X

i

Page 7: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

ロジット (1)

7

iある耐久

消費財の保有2値変数

1 もっている 1

2 もっていない 0

3 もっていない 0

4 もっている 1

5 もっていない 0・・・

・・・

5056 もっている 1合計 1760

平均(普及率)

= 比率

y1985= 1760/5056= 0.35

1985年の調査 2012年の調査

iある耐久

消費財の保有2値変数

1 もっている 1

2 もっている 1

3 もっている 1

4 もっていない 0

5 もっている 1・・・

・・・

4825 もっている 1合計 3965

平均(普及率)

= 比率

y2012= 3965/4825= 0.82

毎年の調査

(年によって調査人数は違うこともある。多くの場合,同じ人に調査はできない。)

普及率(比率)データ 28,,,,, 2012198719861985 nyyyyyi

普及率データは各年次の集計値になっている

1986,1987, ..., 2011年

Page 8: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

ロジット (2)

8

ni yyyy ,,, 21

もっていない人の割合

もっている人の割合

:1:

yy

X

X

eey

1

XX

XX

X

X

eeee

eey

11

11

111

X

X

X

X

e

e

ee

yy

11

11

Xy

y1

ln

yと 1−y の比をとる

両辺の対数をとる

とよぶのことをロジット )(1

ln Logity

y

右辺が単純化されている

もいうで「集計ロジット」とは各年次の集計値なのiy

ロジスティック関数

Page 9: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

ロジットとロジスティック関数

9

X

X

eey

1 yyX

1ln

になっている。ロジット

について解いたものがをおける比率ロジスティック関数に

yy

Xy

1ln

ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)

-4 -2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

z

y

0.0 0.2 0.4 0.6 0.8 1.0

-4-2

02

4y

z

Z

Z

eey

1 yyZ

1lnロジスティック関数

ロジット

Page 10: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

ロジスティック関数の推定: 普及率の分析

10

ni yyyy ,,, 21

各年次の普及率データ

nie

eyi

i

X

X

i ,,2,1,1

ni XXXX ,,, 21

年次

例. 表3.9 (p.124) ルームエアコンの普及率

1-yを計算ロジット ln (y/(1-y)) を計算ロジットを被説明変数 Yとして回帰分析 i

i

ii X

yy

Y1

ln

計算手順

Page 11: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

ロジットモデルの限界効果 (Marginal Effects)

11

の関係と普及率年次 ii yX 1年でどれぐらい普及率は変化するのか(何%増えるのか)?

。の変化は示していない普及率

のかを示している。がどのように変化する年でロジットは

yY1

ii

ii X

yy

Y1

ln

yyz

zzzz

zz

dXdy

zedXdzz

zy

zzyez

X

X

1111

111,

1

22

とおくと

普及率は 1 年で by(1−y) だけ変化する

yは Xの値によって変わるので,代表的な Xの値で評価した y* と利用する。たとえば:代表的な Xの値 = Xの平均

X

X

ee

y ˆˆ

ˆˆ*

1** 1ˆ yyME限界効果

Page 12: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

12

例. 表3.9 (p.124) ルームエアコンの普及率

102.0ˆ,921.201ˆ1993

推定値

年次の平均X

022.0683.01683.0102.01ˆ

683.0159.21

159.21

159.2770.0exp770.01993102.0921.201ˆˆ

**

ˆˆ

ˆˆ*

ˆˆ

yyMEe

ey

eX

X

X

X

限界効果による推定結果の解釈1993年時点では1年あたり 2.2% づつ普及率が上昇している。

Page 13: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

練習問題 (1)

13

表3.30 駅前の違法駐輪と駐輪場

ロジット

収容可能台数割合

駅乗り入れ台数

違法駐輪台数

i

ii

ii

i

ii

yy

Y

XXNI

y

1ln

5

以下のデータから違法駐輪割合のロジットモデルを分析しなさい。

推定値と限界効果(ME)

962.0ˆ,441.0.,476.0,894.2442.1ˆ

22 RadjRXY ii

推定結果

今と同じ規模の駐輪場がもう一つできると,違法駐輪割合が36%削減できる。

Page 14: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

逆数の説明変数

14

フィリップス曲線: インフレと失業のトレードオフ関係

[%]:[%]:

失業率

物価上昇率

i

i

UY

ii

i uU

Y 1

-505

1015202530

0.0 2.0 4.0 6.0

Y 物価上昇率

[%]

U 完全失業率[%]

y = 16.148x - 3.678R² = 0.4834

-505

1015202530

0 0.2 0.4 0.6 0.8 1

物価上昇率

[%]

1/U

を推定としてを完全失業率の逆数 iiiii

uXYXU1

Page 15: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

非線形式推定のまとめ

15

xbayaxy b

lnlnln:ベキ関数

UY 1:逆数の説明変数

bauXY

xXyYxy

,exp

ln,lnを推定両対数モデル

としてを対数変換し,と

cXayaey cX

lnln:指数関数

cauXY

yYy

,exp

lnを推定半対数モデル

としてを対数変換し,

** 1ˆ1

ln

1:

yyME

Xy

ye

eyX

X

限界効果

ロジットモデル

ロジスティック関数

を利用して計算する。

れるの代表的な値で定義さ限界効果は

を推定

集計ロジットモデル

としては比率データ。

*

1ln

yX

uXYy

yYy

を推定

として

uXYU

X 1

Page 16: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

多重回帰分析説明変数が二つ以上ある場合の回帰分析

一つの結果に対して,複数の原因が考えられる経済現象;

ある財の需要

• 結果:需要量

• 原因:その財の価格,他の財の価格,所得,好みなど

ある財の生産

• 結果:生産量

• 原因:労働投入量,資本投入量,中間財投入量など

労働者の賃金

• 結果:賃金

• 原因:業種,職種,企業規模,年齢,学歴,性別,能力など

犯罪の発生

• 結果:犯罪の発生件数

• 原因:失業,貧困,不平等,家庭環境など

16

Page 17: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

多重回帰モデル (1)

17

iii uXY

iiiii uXXXY 4433221

,:2:1

個ータは推定すべき回帰パラメ

個説明変数の数が iX

iiii uXXY 33221

321

32

,,:3,:2

個ータは推定すべき回帰パラメ

個説明変数の数が ii XX

4321

432

,,,:4,,:3個ータは推定すべき回帰パラメ

個説明変数の数が iii XXX

Page 18: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

多重回帰モデル (2)

18

iKiKjijiii uXXXXY 2211

一般的な表現

説明変数の番号

データの番号

::

ji

個の未知パラメタ説明変数の係数:

個の説明変数説明変数:

切片は定数項の係数

K

KXXX

X

Kj

Kijii

i

,,,,

1,,,,

1,,1,1

2

2

1

1

普通は明示しない

Page 19: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

多重回帰モデル (3)

19

個の推定すべきパラメタは

個ののとき,説明変数は例

3,,2,3.

321

32 ii XXK

nnnn

iiii

uXXY

uXXY

uXXYuXXY

33221

33221

232322212

131321211

1

1

11

切片は定数項の係数11 1,,1,1iX

niuXXY iiii ,,2,1,33221

Page 20: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

多重回帰モデル (4)

20

を推定する回帰モデル iii uXY

に回帰する。説明変数を定数項と被説明変数 ii XY

を推定する回帰モデル iiii uXXY 33221

に回帰する。

および説明変数を定数項,被説明変数 iii XXY 32

を推定する

徒歩時間[分]駅までの

][面積

価格[百万円]土地取引

ii

m

ii uXXY 33221

2

表3.11の場合

に回帰する。徒歩時間」

および「駅までの「面積」を定数項,「土地取引価格」

「回帰する」という表現

Page 21: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

21

最小2乗推定値の計算公式:K = 3のケース

33221

2233322

2232233

2233322

3233322

ˆˆˆ

ˆ

ˆ

XXY

SSSSSSS

SSSSSSS

yy

yy

最小2乗法

22

22

ˆSS

uXY yiii単純回帰モデル:

233333

222222

2

2

XXSX

XXSX

ii

ii

乗和偏差の

乗和偏差の

記号の意味

YYXXSYX

YYXXSYX

iiyii

iiyii

3333

2222

の偏差の積和と

の偏差の積和と

nXXnXX ii 3322 ,

のとき3K

Page 22: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

理論値,残差,決定係数

22

iii XXY 33221ˆˆˆˆ

推定回帰平面

残差の定義:実績値から理論値を引くという意味で単純回帰モデルと同じ

iii

iii

XXY

YYu

33221ˆˆˆ

ˆˆ

決定係数:単純回帰モデルと同じ定義式

2

2

2

2ˆˆ2ˆ

:2:2

YY

uYYYY

S

SR

i

i

i

i

yy

yy

乗和実績値の偏差

乗和理論値の偏差

のとき3K

Page 23: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

推定回帰平面の図示

23

à– ¾• Ï ”‚ ª2‚ ‚ ̉ñ‹ Aƒ ‚ƒ fƒ ‹‚ Æ„’ è‚ ³‚ ê‚ ½‰ñ‹ A• ½– Ê

10 15 20 25 30

0

50

100

150

0

5

10

15

20

25

30 X3

Y

2X

Y3X

X2i X3i Yi

10 7 42.312 1 2.814 4 52.616 0 32.518 3 84.320 15 93.622 30 145.324 2 67.726 8 86.328 15 111.6

iii XXY 33221ˆˆˆˆ

Page 24: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

例3.5 (表3.10, pp.128-129)

24

7,16,6

1846

31326

4240

32

332223

332

3333

222

2222

YXX

XXXXSYYYYS

YYXXSXXS

YYXXSXXS

iiiiyy

iiyi

iiyi

412.1ˆˆˆ

038.0ˆ

033.1ˆ

33221

2233322

2232233

2233322

3233322

XXY

SSSSSSS

SSSSSSS

yy

yy

計算はp.129を参照

iii XXY 32 038.0033.1412.1ˆ理論値(推定回帰平面)

Page 25: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

「分析ツール」による回帰分析 (1)

25

「入力 X 範囲」に説明変数データをまとめて指定する

表3.11 (p.130)

Page 26: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

「分析ツール」による回帰分析 (2)

26

13394.57ˆˆˆ33221 XXY

347838.0ˆ2233322

3233322 SSS

SSSS yy

82492.3ˆ2233322

2232233 SSS

SSSS yy

iii XXY 32 82.335.013.57ˆ理論値(推定回帰平面)

推定値の見方

Page 27: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

推定結果の意味 (1)

27

表3.11 (p.130) JR西荻窪駅周辺(東京都杉並区)

niuXXY ii

m

ii ,,2,1,33221

2 徒歩時間[分]駅までの

][面積

価格[百万円]土地取引

駅までの徒歩時間が同じで,面積が 1 m2 増えると,価格は b2 だけ変化する面積が同じで,駅までの徒歩時間が 1 分増えると,価格は b3 だけ変化する

モデル

推定結果 iii XXY 32 82.335.013.57ˆ

駅までの徒歩時間が同じで,面積が 1 m2 増えると,価格は 0.35百万円 (35万円)上昇する面積が同じで,駅までの徒歩時間が 1 分増えると,価格は 3.82百万円 (382万円)下落する。

Page 28: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

推定結果の意味 (2)

28

点予測

面積 X2が 200 m2 で,駅までの徒歩時間 X3が10分の土地取引価格

万円百万円 884545.881082.320035.013.57iY

駅までの徒歩時間が同じで,面積が 1 m2 増えると,価格は b2 だけ変化する

32

32

82.3135.013.57ˆ82.335.013.57ˆ

XXY

XXY 徒歩時間が同じ

面積が 1 m2 増える引き算

35.035.0135.0ˆˆ22 XXYY

駅までの徒歩時間が同じで,面積が 1 m2 増えると,価格は 0.35百万円 (35万円)上昇する

(図3.14, 3.15, 3.16も参照)

Page 29: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

練習問題 (3)過去10年間のデータを元に,ある地域の梨の収穫量{Yi}(10 a あたり kg )を定数項,「7月の平均気温[℃]」 {X2i} ,「4-7月の平均月間降水量[mm]」 {X3i}に回帰したところ次の結果が得られた。

以下の問いに答えなさい。

29

iii XXY 32 3.12.677.388ˆ

[1]. 「7月の平均気温」が24℃, 4-7月の平均月間降水量が150mm のときの

収穫量を予測しなさい。

[2]. 「7月の平均気温」が1℃下がると,収穫量はどのように変化すると予測で

きるか。降水量は例年どおりと仮定して予測しなさい。

Page 30: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

残差2乗和の自由度

30

iii uXY

,0ˆ,0ˆ:1

2 nu

uXu

X

i

iii

i

の自由度はなって二つのルールが制約に

残差のルール

個説明変数の数が

,0ˆ,0ˆ,0ˆ,:2

2

32

32

nu

uXuXu

XX

i

iiiii

ii

の自由度はなって三つのルールが制約に

残差のルール

個説明変数の数が

iiii uXXY 33221

iKiKii uXXY 221

KnuK

uXuXuXu

XXXK

i

iKiiiiii

Kiii

の自由度はって個のルールが制約にな

残差のルール

個説明変数の数が

2

32

32

ˆ

0ˆ,,0ˆ,0ˆ,0ˆ,,,:1

Page 31: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

残差分散と自由度調整済み決定係数

31

iiii uXXY 33221 3ˆ

ˆ2

2

nui

iKiKii uXXY 221 Knui

22 ˆ

ˆ

残差分散

2

2

2

2 ˆ1

1

ˆ

1.yyy

i

snS

Knu

Radj

自由度調整済み決定係数

yy

i

yy

yy

Su

SS

R2

ˆˆ2 ˆ1

決定係数

残差2乗和の自由度 = n –説明変数の数 – 1 と覚えておく。

p.135 自由度調整済み決定係数の性質も参照

説明変数が 3 個

説明変数が K個

Page 32: 計量経済学講義 - u-toyama.ac.jp...ln ロジット になっている。ロジスティック関数における比率を について解いたものが y y y X 1 ln ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)-4

32

まとめ

集計された比率データ(例. 普及率)に対して集計ロジットモデルを適用して,ロジスティック関数を推定することができる。

説明変数が複数ある回帰分析を多重回帰分析とよぶ。回帰パラメータの計算公式が単純回帰分析とは異なっている。

多重回帰分析における回帰パラメータの推定値は,当該変数以外の変数を一定とするときの当該変数が被説明変数に与える影響を示している。

説明変数の数が増えると,残差2乗和の自由度が減る。説明変数が複数ある場合,決定係数よりも「自由度調整済み決定係数」の方が当てはまりの指標として重要になる。