統計学 回帰分析、最小二乗法2 - keio...

29
1 統計学 回帰分析、最小二乗法2 担当: 長倉 大輔 (ながくら だいすけ)

Upload: others

Post on 23-Jan-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

11

統計学回帰分析、最小二乗法2

担当: 長倉 大輔

(ながくら だいすけ)

Page 2: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

22

回帰分析、最小二乗法2

単回帰分析

説明変数が定数項以外に一つしかない以下のような回帰モデルは単回帰モデルと呼ばれ、単回帰モデルを用いた分析は単回帰分析と呼ばれる。

Yi = α + β Xi + ui, i = 1, …, n .

以下では単回帰モデルにおける α と β の最小二乗推定量の(確率的)性質について見て行く。

Page 3: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

33

回帰分析、最小二乗法2

確率的モデル

このモデルにおいて、誤差項 uiは定数項 α と説明変数Xiだけでは説明しきれない被説明変数 Yi の変動を表すものであり、

E [ui] = 0, var(ui) = σ2

を満たす確率変数であると仮定する(より正式な仮定は後程述べる)。

Page 4: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

44

回帰分析、最小二乗法2

確率的モデル

よって Yi も確率変数であり (以下では Xiを確率変数でないと仮定するので) 、

E(Yi) = E(α + βXi + ui) = α + βXi + E(ui)

= α + βXi

var(Yi) = var (α + βXi + ui ) = var(ui) = σ2

となる。

Yi が確率的に決まるこのようなモデルを確率的モデルと呼ぶ。

Page 5: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

55

回帰分析、最小二乗法2

回帰モデルの標準的仮定

さらに、最小二乗推定量 と は Yi (と Xi) の関数であるので、これらも確率変数である。これら最小二乗推定量の確率的性質を導くために、先ほどの単回帰モデルは以下の条件を満たすと仮定する。

仮定1: 説明変数 Xi は確率変数ではない。

仮定2: nが大きくなるにつれて、 は∞に近づく

n

ii XX

1

2)(

Page 6: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

66

回帰分析、最小二乗法2

回帰モデルの標準的仮定

仮定3: E[ui] = 0

仮定4: var (ui) = E[ui2] = σ2

仮定5: cov(ui, uj) = E[ui uj] = 0 (ただし i ≠ j)

仮定6: ui は正規分布に従う。

Page 7: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

77

回帰分析、最小二乗法2

最小二乗推定量の期待値

以上の仮定のもので、まず最小二乗推定量の期待値を求めてみよう。

最小二乗推定量は(以前のスライド参照)

で与えられる。

XY ˆˆ 2

1

2

XnX

YXnYX

n

ii

n

iii

Page 8: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

88

回帰分析、最小二乗法2

最小二乗推定量の期待値

まず、

であり、Yi = α + βXi + ui である事に注意すると、

と書き直せる(ここで確率変数は ui だけである事に注意)。

n

ii

n

iii

n

ii

n

iii

XX

YXX

XnX

YXnYX

1

2

1

2

1

2

1

)(

)(

n

ii

n

iii

n

ii

n

iii

n

ii

n

ii

XX

uXX

XX

XXX

XX

XX

1

2

1

1

2

1

1

2

1

)(

)(

)(

)(

)(

)(ˆ

Page 9: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

99

回帰分析、最小二乗法2

最小二乗推定量の期待値

この第1項は より 0 であり、第2項は

である事に注意すると β である。

0)(1

n

ii XX

n

iii

n

ii

n

iii

n

iii

n

ii

XXX

XXXXXX

XXXXXX

1

11

11

2

)(

)()(

))(()(

Page 10: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1010

回帰分析、最小二乗法2

最小二乗推定量の期待値

よって は

と表すことができる。この両辺の期待値を取ると

を得る。これより は βの不偏推定量である事がわかる。

n

ii

n

iii

XX

uXX

1

2

1

)(

)(ˆ

n

ii

n

iii

XX

uEXXE

1

2

1

)(

)()()ˆ(

Page 11: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1111

回帰分析、最小二乗法2

最小二乗推定量の期待値

同様に の期待値も求めることができる。今、

であり(ここで である)、 であるので、

が得られる。これより は αの不偏推定量である事がわかる。

uXXuXXY )ˆ(ˆˆˆ

n

iiunu

1

10)( uE

)()ˆ()ˆ( uEEXE

Page 12: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1212

回帰分析、最小二乗法2

最小二乗推定量の分散

また、 の分散は、

となる。

n

ii

n

i

iin

ii

n

i

iin

ii

n

ii

n

iii

XX

uXX

XX

uXX

XXXX

uXX

1

2

2

1

2

2

1

2

12

1

21

2

1

)(

)var()(

)(

1

)(var

)(

1

)(

)(var)ˆvar(

Page 13: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1313

回帰分析、最小二乗法2

最小二乗推定量の分散

同様に の分散も求めることができる。今、

であるので

0)(

)(

,)(cov)(

1

1,

)(

)(cov),ˆcov(

1

2

1

2

111

2

11

2

1

n

ii

n

ii

n

i

i

n

i

iin

ii

n

i

in

ii

n

iii

XXn

XX

uuXXXXn

unXX

uXXu

Page 14: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1414

回帰分析、最小二乗法2

最小二乗推定量の分散

の分散は、

2

2

で与えられる。

n

ii

n

ii

n

ii XXn

X

nXX

X

uXn

X

uXuX

uX

1

2

1

222

1

2

22

22

)()(

),ˆcov()ˆvar(

],)ˆcov[(]var[])ˆvar[(

])ˆ(var[)ˆvar(

Page 15: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1515

回帰分析、最小二乗法2

最小二乗推定量の期待値と分散

まとめると、

となる。

,)ˆ(,)ˆ( EE

,)(

)ˆvar(

1

2

2

n

ii XX

n

ii

n

ii

XXn

X

1

2

1

22

)()ˆvar(

Page 16: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1616

回帰分析、最小二乗法2

最小二乗推定量の分布

先ほどは最小二乗推定量の期待値と分散を求めた。

これらを求める際に「仮定6: ui は正規分布に従う」は実は使っていない(使用した仮定は仮定1, および仮定3 – 5 である)。

もし仮定6 が満たされるならば、最小二乗推定量は正規分布に従う事を示す事ができる。 これは以下のように確かめられる。

Page 17: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1717

回帰分析、最小二乗法2

最小二乗推定量の分布

最小二乗推定量 は

であるので、正規分布に従う確率変数 ui, i =1,…., nの

線形の和になっている。よって正規分布の性質より、の分布も正規分布になる。

nn

ii

n

n

ii

n

ii

n

iii

uXX

XXu

XX

XX

XX

uXX

1

21

1

2

1

1

2

1

)(

)(

)(

)(

)(

)(ˆ

Page 18: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1818

回帰分析、最小二乗法2

最小二乗推定量の分布

同様に、 についても

であり、第2項と第3項は正規分布に従うのでその和である も正規分布に従う。

uX )ˆ(ˆ

Page 19: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

1919

回帰分析、最小二乗法2

最小二乗推定量の分布

まとめると、

ここで

および

である。

),(~ˆ),,(~ˆ 22 NN および

n

ii XX

1

2

22

)(

n

ii

n

ii

XXn

X

1

2

1

22

2

)(

Page 20: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

2020

回帰分析、最小二乗法2

σ2 の推定

ここまでは単回帰モデルにおいて係数 α と βの最小二乗法による推定法を見てきた。

単回帰モデルには ui の分散 σ2 という、もう一つ未知パラメーターがある。これを推定する方法を考えよう。

Page 21: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

2121

回帰分析、最小二乗法2

σ2 の推定

もし ui が直接観察できるのであれば、σ2 を推定する自然な方法として、E(ui

2) = σ2 である事に注意すると、

が考えられる。これは

であるので、σ2 の不偏推定量になっている。

n

i

iun

1

22 1

22

1

22 )(1

)(

n

nuE

nE

n

i

i

Page 22: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

2222

回帰分析、最小二乗法2

σ2 の推定

しかしながら実際には ui は直接観測できない。

よく用いられる方法は、ui の代わりに、残差

を用いて、

という推定量によって推定する方法である。これはσ2 の最小二乗推定量と呼ばれる。

iii XYu ˆˆˆ

n

i

iun

1

22 ˆ2

1

Page 23: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

2323

回帰分析、最小二乗法2

σ2 の推定

ここで、和を nではなく n –2 で割っているのは推定量の不偏性を保つためである。これを見てみよう。まず

より

であるのでこの両辺を二乗し和をとると

ii

iii

iii

Xu

XuX

XYu

)ˆ()ˆ(

ˆˆ

ˆˆˆ

iii Xuu )ˆ()ˆ(ˆ

Page 24: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

2424

回帰分析、最小二乗法2

σ2 の推定

を得る。さらに最小二乗法の1階の条件より

であるので

n

iii

n

ii

n

ii

n

ii

n

i

n

ii

n

ii

Xu

Xu

Xuu

1

11

1

22

1

2

1

2

1

2

ˆ)ˆ(2

)ˆ)(ˆ(2ˆ)ˆ(2

)ˆ()ˆ(ˆ

0ˆ,0ˆ11

n

iii

n

ii Xuu

Page 25: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

2525

回帰分析、最小二乗法2

σ2 の推定

となる。この両辺の期待値を取ると

を得る。

n

ii

n

ii

n

i

n

ii

n

ii

X

Xuu

1

1

22

1

2

1

2

1

2

)ˆ)(ˆ(2

)ˆ()ˆ(ˆ

n

ii

n

ii

n

ii

X

XnuEn

1

1

2

1

22

)ˆ,ˆcov(2

)ˆvar()ˆvar(ˆ

Page 26: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

2626

回帰分析、最小二乗法2

σ2 の推定

ここで はすでに導出してあり(演習問題、問題2も参照)、それらを代入すると

となる。よってこれを先ほどの式に代入して

)ˆ,ˆcov(),ˆvar(),ˆvar(

2

1

2

11

22

1

2

1

2

1

2

1

22

1

2

1

22

11

2

2)(

2

)(

2

)()(

)ˆ,ˆcov(2)ˆvar()ˆvar(

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

XX

XXX

XX

XX

XX

X

XX

X

XXn

Page 27: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

2727

回帰分析、最小二乗法2

σ2 の推定

となる。これより

となる。 はσ2の不偏推定量である。

2

1

2

2

1

22

)2(ˆ

nuE

uEn

n

ii

n

ii

22

1

22

2

)2(ˆ

2

1)ˆ(

n

nuE

nE

n

i

i

2

Page 28: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

28

演習問題

問題 1

の不偏性を、まず

である事を示し、次に の別表現である。

の期待値を取る事よって示しなさい。

)()( XXYYE ii

2

1

1

)(

))((ˆ

XX

XXYY

n

ii

n

iii

Page 29: 統計学 回帰分析、最小二乗法2 - Keio Universityuser.keio.ac.jp/~nagakura/stat2017A/stat5_slide_2017...var(Y i) = var (α+ βX i + u i) = var(u i) = σ2 となる。Y i

29

演習問題

問題 2

最小二乗推定量 の共分散が

である事を確認しなさい。(ヒント: である事と、

である事を用いると簡単に求められます)。

ˆˆ と 

uX )ˆ(ˆ

0),ˆcov( u

n

ii XX

X

1

2

2

)()ˆ,ˆcov(