計量経済学講義 - u-toyama.ac.jp...ln ロジット...
TRANSCRIPT
計量経済学 講義第 10 回 回帰分析 Part 3
2017 年 11 月 1 日(水)1 限(金曜授業実施日)担当教員: 唐渡 広志
研究室: 経済学研究棟4階432号室email: [email protected]: http://www3.u-toyama.ac.jp/kkarato/
1
講義の目的
ロジスティック関数の推定方法について学びます。
多重回帰分析について学びます。
keywords: ロジスティック関数,集計ロジットモデル,多重回帰モデル,回帰平面
教科書: pp. 122 – 143(第3章)
2
【復習1】Excel での回帰分析
関数:slope, intercept, rsqなど
散布図:観測点を右クリックして近似曲線の追加
分析ツールの「回帰分析」
表示された結果の意味について理解
3
【復習2】非線形式の回帰分析
4
1. べき関数
両辺の対数をとり,両対数モデルを推定する。データとして,ln y, ln xを利用する。
2. 指数関数
両辺の対数をとり,半対数モデルを推定する。データとして,ln y, X を利用する。
bの意味 = 弾力性xが 1% 変化するときの,y の変化率 [%]
cの意味 = 変化率xが 1 単位変化するときの,y の変化率 [%]
0 5 10 15 20 25
0.0
0.2
0.4
0.6
0.8
1.0
x
ロジスティック関数
5
X
X
eey
1
y
「増え方」が増加
「増え方」が減少
←飽和
耐久消費財の普及率を推定するのに便利な形をしている。
急速な勢いで普及
ある程度普及すると飽和
01 yyX ると,が大きく(小さく)な
普及率
耐久消費財の普及率
6
020406080
100
1955 1975 1995 2015
普及率
(%)
年次
カラーテレビ
020406080
100
1955 1975 1995 2015
普及率
(%)
年次
乗用車
020406080
100
1985 1995 2005 2015
普及率
(%)
年次
携帯電話
データ出所:『消費動向調査』(内閣府)
85.01
ˆ
2
09.071.178
09.071.178
Re
eyi
i
X
X
i
82.01
ˆ
2
32.034.634
32.034.634
Re
eyi
i
X
X
i
59.01
ˆ
2
15.086.286
15.086.286
Re
eyi
i
X
X
i
ロジット (1)
7
iある耐久
消費財の保有2値変数
1 もっている 1
2 もっていない 0
3 もっていない 0
4 もっている 1
5 もっていない 0・・・
・・・
5056 もっている 1合計 1760
平均(普及率)
= 比率
y1985= 1760/5056= 0.35
1985年の調査 2012年の調査
iある耐久
消費財の保有2値変数
1 もっている 1
2 もっている 1
3 もっている 1
4 もっていない 0
5 もっている 1・・・
・・・
4825 もっている 1合計 3965
平均(普及率)
= 比率
y2012= 3965/4825= 0.82
毎年の調査
(年によって調査人数は違うこともある。多くの場合,同じ人に調査はできない。)
普及率(比率)データ 28,,,,, 2012198719861985 nyyyyyi
普及率データは各年次の集計値になっている
1986,1987, ..., 2011年
ロジット (2)
8
ni yyyy ,,, 21
もっていない人の割合
もっている人の割合
:1:
yy
X
X
eey
1
XX
XX
X
X
eeee
eey
11
11
111
X
X
X
X
e
e
ee
yy
11
11
Xy
y1
ln
yと 1−y の比をとる
両辺の対数をとる
とよぶのことをロジット )(1
ln Logity
y
右辺が単純化されている
もいうで「集計ロジット」とは各年次の集計値なのiy
ロジスティック関数
ロジットとロジスティック関数
9
X
X
eey
1 yyX
1ln
になっている。ロジット
について解いたものがをおける比率ロジスティック関数に
yy
Xy
1ln
ロジットはロジスティック関数の逆関数である(指数関数の対数をとったので)
-4 -2 0 2 4
0.0
0.2
0.4
0.6
0.8
1.0
z
y
0.0 0.2 0.4 0.6 0.8 1.0
-4-2
02
4y
z
Z
Z
eey
1 yyZ
1lnロジスティック関数
ロジット
ロジスティック関数の推定: 普及率の分析
10
ni yyyy ,,, 21
各年次の普及率データ
nie
eyi
i
X
X
i ,,2,1,1
ni XXXX ,,, 21
年次
例. 表3.9 (p.124) ルームエアコンの普及率
1-yを計算ロジット ln (y/(1-y)) を計算ロジットを被説明変数 Yとして回帰分析 i
i
ii X
yy
Y1
ln
計算手順
ロジットモデルの限界効果 (Marginal Effects)
11
の関係と普及率年次 ii yX 1年でどれぐらい普及率は変化するのか(何%増えるのか)?
。の変化は示していない普及率
のかを示している。がどのように変化する年でロジットは
yY1
ii
ii X
yy
Y1
ln
yyz
zzzz
zz
dXdy
zedXdzz
zy
zzyez
X
X
1111
111,
1
22
とおくと
普及率は 1 年で by(1−y) だけ変化する
yは Xの値によって変わるので,代表的な Xの値で評価した y* と利用する。たとえば:代表的な Xの値 = Xの平均
X
X
ee
y ˆˆ
ˆˆ*
1** 1ˆ yyME限界効果
例
12
例. 表3.9 (p.124) ルームエアコンの普及率
102.0ˆ,921.201ˆ1993
推定値
年次の平均X
022.0683.01683.0102.01ˆ
683.0159.21
159.21
159.2770.0exp770.01993102.0921.201ˆˆ
**
ˆˆ
ˆˆ*
ˆˆ
yyMEe
ey
eX
X
X
X
限界効果による推定結果の解釈1993年時点では1年あたり 2.2% づつ普及率が上昇している。
練習問題 (1)
13
表3.30 駅前の違法駐輪と駐輪場
ロジット
収容可能台数割合
駅乗り入れ台数
違法駐輪台数
i
ii
ii
i
ii
yy
Y
XXNI
y
1ln
5
以下のデータから違法駐輪割合のロジットモデルを分析しなさい。
推定値と限界効果(ME)
962.0ˆ,441.0.,476.0,894.2442.1ˆ
22 RadjRXY ii
推定結果
今と同じ規模の駐輪場がもう一つできると,違法駐輪割合が36%削減できる。
逆数の説明変数
14
フィリップス曲線: インフレと失業のトレードオフ関係
[%]:[%]:
失業率
物価上昇率
i
i
UY
ii
i uU
Y 1
-505
1015202530
0.0 2.0 4.0 6.0
Y 物価上昇率
[%]
U 完全失業率[%]
y = 16.148x - 3.678R² = 0.4834
-505
1015202530
0 0.2 0.4 0.6 0.8 1
物価上昇率
[%]
1/U
を推定としてを完全失業率の逆数 iiiii
uXYXU1
非線形式推定のまとめ
15
xbayaxy b
lnlnln:ベキ関数
UY 1:逆数の説明変数
bauXY
xXyYxy
,exp
ln,lnを推定両対数モデル
としてを対数変換し,と
cXayaey cX
lnln:指数関数
cauXY
yYy
,exp
lnを推定半対数モデル
としてを対数変換し,
** 1ˆ1
ln
1:
yyME
Xy
ye
eyX
X
限界効果
ロジットモデル
ロジスティック関数
を利用して計算する。
れるの代表的な値で定義さ限界効果は
を推定
集計ロジットモデル
としては比率データ。
*
1ln
yX
uXYy
yYy
を推定
として
uXYU
X 1
多重回帰分析説明変数が二つ以上ある場合の回帰分析
一つの結果に対して,複数の原因が考えられる経済現象;
ある財の需要
• 結果:需要量
• 原因:その財の価格,他の財の価格,所得,好みなど
ある財の生産
• 結果:生産量
• 原因:労働投入量,資本投入量,中間財投入量など
労働者の賃金
• 結果:賃金
• 原因:業種,職種,企業規模,年齢,学歴,性別,能力など
犯罪の発生
• 結果:犯罪の発生件数
• 原因:失業,貧困,不平等,家庭環境など
16
多重回帰モデル (1)
17
iii uXY
iiiii uXXXY 4433221
,:2:1
個ータは推定すべき回帰パラメ
個説明変数の数が iX
iiii uXXY 33221
321
32
,,:3,:2
個ータは推定すべき回帰パラメ
個説明変数の数が ii XX
4321
432
,,,:4,,:3個ータは推定すべき回帰パラメ
個説明変数の数が iii XXX
多重回帰モデル (2)
18
iKiKjijiii uXXXXY 2211
一般的な表現
説明変数の番号
データの番号
::
ji
個の未知パラメタ説明変数の係数:
個の説明変数説明変数:
切片は定数項の係数
K
KXXX
X
Kj
Kijii
i
,,,,
1,,,,
1,,1,1
2
2
1
1
普通は明示しない
多重回帰モデル (3)
19
個の推定すべきパラメタは
個ののとき,説明変数は例
3,,2,3.
321
32 ii XXK
nnnn
iiii
uXXY
uXXY
uXXYuXXY
33221
33221
232322212
131321211
1
1
11
切片は定数項の係数11 1,,1,1iX
niuXXY iiii ,,2,1,33221
多重回帰モデル (4)
20
を推定する回帰モデル iii uXY
に回帰する。説明変数を定数項と被説明変数 ii XY
を推定する回帰モデル iiii uXXY 33221
に回帰する。
および説明変数を定数項,被説明変数 iii XXY 32
を推定する
徒歩時間[分]駅までの
][面積
価格[百万円]土地取引
ii
m
ii uXXY 33221
2
表3.11の場合
に回帰する。徒歩時間」
および「駅までの「面積」を定数項,「土地取引価格」
「回帰する」という表現
21
最小2乗推定値の計算公式:K = 3のケース
33221
2233322
2232233
2233322
3233322
ˆˆˆ
ˆ
ˆ
XXY
SSSSSSS
SSSSSSS
yy
yy
最小2乗法
22
22
ˆSS
uXY yiii単純回帰モデル:
233333
222222
2
2
XXSX
XXSX
ii
ii
乗和偏差の
乗和偏差の
記号の意味
YYXXSYX
YYXXSYX
iiyii
iiyii
3333
2222
の偏差の積和と
の偏差の積和と
nXXnXX ii 3322 ,
のとき3K
理論値,残差,決定係数
22
iii XXY 33221ˆˆˆˆ
推定回帰平面
残差の定義:実績値から理論値を引くという意味で単純回帰モデルと同じ
iii
iii
XXY
YYu
33221ˆˆˆ
ˆˆ
決定係数:単純回帰モデルと同じ定義式
2
2
2
2ˆˆ2ˆ
1ˆ
:2:2
YY
uYYYY
S
SR
i
i
i
i
yy
yy
乗和実績値の偏差
乗和理論値の偏差
のとき3K
推定回帰平面の図示
23
à– ¾• Ï ”‚ ª2‚ ‚ ̉ñ‹ Aƒ ‚ƒ fƒ ‹‚ Æ„’ è‚ ³‚ ê‚ ½‰ñ‹ A• ½– Ê
10 15 20 25 30
0
50
100
150
0
5
10
15
20
25
30 X3
Y
2X
Y3X
X2i X3i Yi
10 7 42.312 1 2.814 4 52.616 0 32.518 3 84.320 15 93.622 30 145.324 2 67.726 8 86.328 15 111.6
iii XXY 33221ˆˆˆˆ
例3.5 (表3.10, pp.128-129)
24
7,16,6
1846
31326
4240
32
332223
332
3333
222
2222
YXX
XXXXSYYYYS
YYXXSXXS
YYXXSXXS
iiiiyy
iiyi
iiyi
412.1ˆˆˆ
038.0ˆ
033.1ˆ
33221
2233322
2232233
2233322
3233322
XXY
SSSSSSS
SSSSSSS
yy
yy
計算はp.129を参照
iii XXY 32 038.0033.1412.1ˆ理論値(推定回帰平面)
「分析ツール」による回帰分析 (1)
25
「入力 X 範囲」に説明変数データをまとめて指定する
表3.11 (p.130)
「分析ツール」による回帰分析 (2)
26
13394.57ˆˆˆ33221 XXY
347838.0ˆ2233322
3233322 SSS
SSSS yy
82492.3ˆ2233322
2232233 SSS
SSSS yy
iii XXY 32 82.335.013.57ˆ理論値(推定回帰平面)
推定値の見方
推定結果の意味 (1)
27
表3.11 (p.130) JR西荻窪駅周辺(東京都杉並区)
niuXXY ii
m
ii ,,2,1,33221
2 徒歩時間[分]駅までの
][面積
価格[百万円]土地取引
駅までの徒歩時間が同じで,面積が 1 m2 増えると,価格は b2 だけ変化する面積が同じで,駅までの徒歩時間が 1 分増えると,価格は b3 だけ変化する
モデル
推定結果 iii XXY 32 82.335.013.57ˆ
駅までの徒歩時間が同じで,面積が 1 m2 増えると,価格は 0.35百万円 (35万円)上昇する面積が同じで,駅までの徒歩時間が 1 分増えると,価格は 3.82百万円 (382万円)下落する。
推定結果の意味 (2)
28
点予測
面積 X2が 200 m2 で,駅までの徒歩時間 X3が10分の土地取引価格
万円百万円 884545.881082.320035.013.57iY
駅までの徒歩時間が同じで,面積が 1 m2 増えると,価格は b2 だけ変化する
32
32
82.3135.013.57ˆ82.335.013.57ˆ
XXY
XXY 徒歩時間が同じ
面積が 1 m2 増える引き算
35.035.0135.0ˆˆ22 XXYY
駅までの徒歩時間が同じで,面積が 1 m2 増えると,価格は 0.35百万円 (35万円)上昇する
(図3.14, 3.15, 3.16も参照)
練習問題 (3)過去10年間のデータを元に,ある地域の梨の収穫量{Yi}(10 a あたり kg )を定数項,「7月の平均気温[℃]」 {X2i} ,「4-7月の平均月間降水量[mm]」 {X3i}に回帰したところ次の結果が得られた。
以下の問いに答えなさい。
29
iii XXY 32 3.12.677.388ˆ
[1]. 「7月の平均気温」が24℃, 4-7月の平均月間降水量が150mm のときの
収穫量を予測しなさい。
[2]. 「7月の平均気温」が1℃下がると,収穫量はどのように変化すると予測で
きるか。降水量は例年どおりと仮定して予測しなさい。
残差2乗和の自由度
30
iii uXY
2ˆ
,0ˆ,0ˆ:1
2 nu
uXu
X
i
iii
i
の自由度はなって二つのルールが制約に
残差のルール
個説明変数の数が
3ˆ
,0ˆ,0ˆ,0ˆ,:2
2
32
32
nu
uXuXu
XX
i
iiiii
ii
の自由度はなって三つのルールが制約に
残差のルール
個説明変数の数が
iiii uXXY 33221
iKiKii uXXY 221
KnuK
uXuXuXu
XXXK
i
iKiiiiii
Kiii
の自由度はって個のルールが制約にな
残差のルール
個説明変数の数が
2
32
32
ˆ
0ˆ,,0ˆ,0ˆ,0ˆ,,,:1
残差分散と自由度調整済み決定係数
31
iiii uXXY 33221 3ˆ
ˆ2
2
nui
iKiKii uXXY 221 Knui
22 ˆ
ˆ
残差分散
2
2
2
2 ˆ1
1
ˆ
1.yyy
i
snS
Knu
Radj
自由度調整済み決定係数
yy
i
yy
yy
Su
SS
R2
ˆˆ2 ˆ1
決定係数
残差2乗和の自由度 = n –説明変数の数 – 1 と覚えておく。
p.135 自由度調整済み決定係数の性質も参照
説明変数が 3 個
説明変数が K個
32
まとめ
集計された比率データ(例. 普及率)に対して集計ロジットモデルを適用して,ロジスティック関数を推定することができる。
説明変数が複数ある回帰分析を多重回帰分析とよぶ。回帰パラメータの計算公式が単純回帰分析とは異なっている。
多重回帰分析における回帰パラメータの推定値は,当該変数以外の変数を一定とするときの当該変数が被説明変数に与える影響を示している。
説明変数の数が増えると,残差2乗和の自由度が減る。説明変数が複数ある場合,決定係数よりも「自由度調整済み決定係数」の方が当てはまりの指標として重要になる。