kapitel 11 heteroskedastizit¨at · pdf filekapitel 11 heteroskedastizit¨at “you...

22
Kapitel 11 Heteroskedastizit¨ at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem Das Wort “Skedastizit¨ at” kommt vom griechischen “skedastikos” und kann sehr frei mit ‘Streuung’ ¨ ubersetzt werden. In der Statistik bezieht sich dieser Begriff meist auf die Streuung (Varianz) der St¨ orterme. Das ebenfalls griechische “hetero” kann mit anders oder ungleich ¨ ubersetzt werden, deshalb versteht man in der ¨ Okonome- trie unter Heteroskedastizit¨ at eine ‘ungleiche Varianz der St¨ orterme’. Genau darin besteht das Problem, denn bei Vorliegen von Heteroskedastizit¨ at wird die Gauss- Markov Annahme einer konstanten Varianz der St¨ orterme verletzt, E(ε i |X) = σ 2 . Das bedeutet, bei Heteroskedastizit¨ at h¨ angt die Varianz der St¨ orterme ε i in irgend einer Form von den erkl¨ arenden x Variablen ab. Vor allem in ¨ alteren Lehrb¨ uchern wird h¨ aufig der Eindruck erweckt, dass Homoske- dastizit¨ at der Normalfall und Heteroskedastizit¨ at eine unangenehme Ausnahmeer- scheinung sei. Diese Sichtweise ist irref¨ uhrend, heteroskedastische St¨ orterme d¨ urften eher den Normalfall als die Ausnahme darstellen. Es gibt tats¨ achlich keinen vern¨ unf- tigen Grund der a priori die Annahme homoskedastischer St¨ orterme rechtfertigen urde. Deshalb empfiehlt es sich im Zweifelsfall von heteroskedastischen St¨ ortermen auszugehen. Wenn wir bisher der Homoskedastizit¨ at so breiten Raum einger¨ aumt haben geschah dies ausschließlich um die Darstellung zu vereinfachen — auf Kosten der Realit¨ atsn¨ ahe. Erinnern wir uns, falls die Gauss-Markov Annahmen erf¨ ullt sind, ist der OLS Sch¨ atzer effizient. In diesem und in dem n¨ achsten Kapitel werden wir untersuchen, welche Konsequenzen eine Verletzung der Gauss-Markov Annahme A4 ε i i.i.d.(02 ) hat, und welche Maßnahmen dagegen ergriffen werden k¨ onnen. 1

Upload: trinhkhuong

Post on 05-Feb-2018

223 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Kapitel 11

Heteroskedastizitat

“You and I know that truly consistentestimators are imagined, not real.”

(Leamer, 2010)

11.1 Das Problem

Das Wort “Skedastizitat” kommt vom griechischen “skedastikos” und kann sehr freimit ‘Streuung’ ubersetzt werden. In der Statistik bezieht sich dieser Begriff meistauf die Streuung (Varianz) der Storterme. Das ebenfalls griechische “hetero” kannmit anders oder ungleich ubersetzt werden, deshalb versteht man in der Okonome-trie unter Heteroskedastizitat eine ‘ungleiche Varianz der Storterme’. Genau darinbesteht das Problem, denn bei Vorliegen von Heteroskedastizitat wird die Gauss-Markov Annahme einer konstanten Varianz der Storterme verletzt, E(εi|X) 6= σ2.Das bedeutet, bei Heteroskedastizitat hangt die Varianz der Storterme εi in irgendeiner Form von den erklarenden x Variablen ab.

Vor allem in alteren Lehrbuchern wird haufig der Eindruck erweckt, dass Homoske-dastizitat der Normalfall und Heteroskedastizitat eine unangenehme Ausnahmeer-scheinung sei. Diese Sichtweise ist irrefuhrend, heteroskedastische Storterme durfteneher den Normalfall als die Ausnahme darstellen. Es gibt tatsachlich keinen vernunf-tigen Grund der a priori die Annahme homoskedastischer Storterme rechtfertigenwurde. Deshalb empfiehlt es sich im Zweifelsfall von heteroskedastischen Stortermenauszugehen. Wenn wir bisher der Homoskedastizitat so breiten Raum eingeraumthaben geschah dies ausschließlich um die Darstellung zu vereinfachen — auf Kostender Realitatsnahe.

Erinnern wir uns, falls die Gauss-Markov Annahmen erfullt sind, ist der OLSSchatzer effizient. In diesem und in dem nachsten Kapitel werden wir untersuchen,welche Konsequenzen eine Verletzung der Gauss-Markov Annahme A4

εi ∼ i.i.d.(0, σ2)

hat, und welche Maßnahmen dagegen ergriffen werden konnen.

1

Page 2: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 2

Erinnern wir uns an die Herleitung der Varianz von β2 im Modell y = β1+ β2xi + εiaus dem Kapitel ‘Eigenschaften des OLS Schatzers’

var(β2) = E[β2 − E(β2)]2

= E[β2 − β2]2 (wenn E(β2) = β2)

= E

(∑

i

wiεi

)2

(da β2 = β2 +∑

wiεi)

= E(w2

1ε21 + w2

2ε22 + · · ·+ w2

nε2n + · · ·

· · ·+ 2w1w2ε1ε2 + · · ·+ 2wn−1wnεn−1εn)

= E

(n∑

i=1

w2i ε

2i

)

︸ ︷︷ ︸= σ2

∑iw

2i wenn

homoskedastisch

+E

n∑

i=1

n∑

j=2

j>i

2wiwjεiεj

︸ ︷︷ ︸= 0 wenn keineAutokorrelation

mit wi :=(xi−x)∑j(xj−x)2

.

Damit

var(β2) =σ2

∑i(xi − x)2

muss gelten

1. keine Heteroskadastizitat:E(ε21) = E(ε22) = . . . = E(ε2n) = σ2

(zur Erinnerung: E(ε2i ) = var(εi) := σ2i )

2. keine Autokorrelation:E(ε1ε2) = E(ε1ε3) = . . . = E(εn−1εn) = 0,oder kurzerE(εiεj) = 0 ∀ i, j mit i 6= j und i, j = 1, . . . , n.

Falls die Regressoren stochastisch sind muss dies jeweils fur die bedingten Erwar-tungswerte gelten E(εi|X) = 0, var(εi|X) = σ2 sowie cov(εi, εj|X) = 0 fur i 6= j.

Im Falle von Heteroskedastizitat ist die Annahme var(εi|X) = σ2 verletzt, d.h.die var(εi|X) ist nicht konstant, oder in anderen Worten, die Storterme sind nicht‘identically distributed’, jeder Storterm kann eine unterschiedliche Varianz haben.

Wenn die Varianzen der Storterme εi von den erklarenden xVariablen abhangen wirdsich var(εi|X) von Beobachtung zu Beobachtung unterscheiden, deshalb benotigenwir fur das σ2 einen Subindex i, d.h. im Falle von Heteroskedastizitat ist die bedingteVarianz der Storterme abhangig von einer oder mehreren erklarenden Variablen

var(εi|X) = σ2(X) = σ2i

wobei der Subindex i der Varianz der Storterme (σ2i ) zum Ausdruck bringen soll,

dass sich die Varianzen der Storterme der Grundgesamtheit systematisch zwischenden Beobachtungen unterscheiden konnen.

Page 3: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 3

Die restlichen Annahmen von εi|X ∼ i.i.d.(0, σ2i ) wollen wir im Moment aufrecht

erhalten, d.h. wir nehmen weiterhin an E(εi|X) = 0 und cov(εi, εj|X) = 0 furi 6= j (die Verletzung der zweiten Annahme werden wir im nachsten Kapitel uberAutokorrelation untersuchen).

Wenn E(ε2i |X) = σ2i kann die Varianz- Kovarianzmatrix der Storterme nicht mehr

einfach als σ2I geschrieben werden, sondern nur noch als

E(εε′) =

σ21 0 0 . . . 00 σ2

2 0 . . . 0...

......

. . ....

0 0 0 . . . σ2n

6= σ2I

Abbildung 11.1 zeigt das Problem.

Homoskedastizitat: E(ε2i |X) = σ2

y

x

E(y|x)

bc

bc

bc

bc

Heteroskedastizitat: E(ε2i |X) = σ2i

y

x

E(y|x)

bc

bc

bc

bc

Abbildung 11.1: Homoskedastizitat vs. Heteroskedastizitat. Im rechten Panelnimmt die Varianz der Storterme (σ2(x)) mit x zu.

Manchmal kann Heteroskedastizitat schon in einem einfachen Streudiagramm (Scat-terplott) erkannt werden (vgl. Abbildung 11.2).

Das Problem der Heteroskedastizitat ist vor allem (aber nicht nur) fur Querschnitts-daten relevant. Wenn man zum Beispiel die Urlaubsausgaben von Haushalten inAbhangigkeit vom Einkommen untersucht ist zu erwarten, dass die Varianz bei rei-cheren Haushalten großer ist als bei weniger wohlhabenden Haushalten, weil armereHaushalte generell niedrigere Urlaubsausgaben haben werden, wahrend manche rei-che Haushalte sehr viel Urlaub machen, andere nur wenig, da es ihnen moglicherweisezu Hause am besten gefallt, oder weil sie schlichtweg keine Zeit haben. Deshalb istin diesem Fall zu erwarten, dass die Varianz der Storterme systematisch mit demHaushaltseinkommen zunimmt. Ein anderes Beispiel sind Einkommensunterschiedezwischen Mannern und Frauen, die haufig mittels Lohngleichungen geschatzt wer-den. Die Empirie zeigt, dass Frauen im Durchschnitt deutlich weniger verdienen alsManner, selbst wenn fur verschiedene Charakteristika wie Bildung, Berufserfahrungetc. kontrolliert wird. Vermutlich unterscheidet sich aber auch die Varianz der Ein-kommen zwischen Mannern und Frauen, denn wahrend es bei den Mannern sowohl

Page 4: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 4

-200

-100

0

100

200

300

400

500

600

0 20 40 60 80 100

X

YY vs. X

200

300

400

500

600

700

800

900

0 20 40 60 80 100

XY

Y vs. X

Abbildung 11.2: Heteroskedastische Storterme im Streudiagramm, die Varianzder Storterme ist nicht konstant, E(ε2i |X) = σ2

i .

sehr schlecht als auch sehr gut Verdienende gibt, die Varianz also groß ist, ist dieVarianz der Einkommen von Frauen moglicherweise niedriger, weil sie fruher an die‘glaserne Decke’ stoßen. Wir werden gleich sehen, dass in diesem Fall selbst ein ein-facher t-Test, mit dem die Mittelwerte der Einkommen von Mannern und Frauenverglichen werden, ungultig ist!

Die gute Nachricht ist, dass die OLS Schatzer fur die Koeffizienten auch im Fallevon Heteroskedastizitat erwartungstreu und konsistent sind. Wir erinnern uns, dasswir fur den Beweis der Erwartungstreue den ‘wahren’ Zusammenhang in der Grund-gesamtheit in die Formel fur den OLS-Schatzer eingesetzt und den Erwartungswertgebildet haben. Als Resultat erhielten wir

E(β) = β + E[(X ′X)−1X ′ε]

d.h. fur die Erwartungstreue ist – neben einer korrekten (linearen) Spezifikation,vollem Spaltenrang und E(εi) = 0) – essentiell, dass die erklarenden x-Variablenexogen sind, das heißt, dass sie mit den Stortermen εi der Grundgesamtheit unkor-reliert sind, oder genauer, dass E(εi|X) = 0. Die Annahme εi ∼ i.i.d.(0, σ2), die auchHomoskedastizitat impliziert, wurde nur fur den Gauss-Markov Beweis der Effizienzdes OLS Schatzers benotigt.

Intuitiv besteht das Problem bei Heteroskedastizitat darin, dass die OLS–MethodeBeobachtungen mit großer Varianz starker gewichtet als jene mit kleineren Vari-anzen. Aufgrund dieser impliziten Gewichtung sind die mit OLS geschatzten Ko-effizienten β zwar weiterhin erwartungstreu und konsistent, aber nicht effizient!Schlimmer noch, die mit OLS geschatzten Standardfehler der Koeffizienten sind beiVorliegen von Heteroskedstizitat verzerrt! Deshalb sind statistische Tests und Konfi-denzintervalle bei Heteroskedastizitat, die auf OLS Standardfehler beruhen, generellungultig!!!

Page 5: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 5

In Kapitel 4.1.3 (Eigenschaften des OLS-Schatzers) haben wir gezeigt, dass im bi-

variaten Fall die Varianz der Zufallsvariable β2 definiert ist als

var(β2) = E[β2 − E(β2)]2

= E(w2

1ε21 + w2

2ε22 + · · ·+ w2

nε2n + · · ·

· · ·+ 2w1w2ε1ε2 + · · ·+ 2wn−1wnεn−1εn)

mit

wi :=(xi − x)∑j(xj − x)2

Wenn alle xi (und damit wi) deterministisch sind folgt

var(β2) = w21 E(ε

21) + w2

2 E(ε22) + · · ·+ w2

n E(ε2n) +

+2w1w2 E(ε1ε2) + · · ·+ 2wn−1wn E(εn−1εn)

Nur wenn E(ε21) = E(ε22) = · · · = E(ε2n) = σ2 (d.h. keine Heteroskedastizitat vorliegt)und E(ε1ε2) = · · · = E(εn−1εn) = 0 (d.h. keine Autokorrelation vorliegt) gilt

var(β2) =σ2

∑i (xi − x)2

Die Verallgemeinerung fur die multiple Regression in Matrixschreibweise ist

var(β) = E

([β − E(β)

] [β − E(β)

]′)= E

(X ′X)−1X ′ εε′︸︷︷︸

6=σ2I

X(X ′X)−1

Nur wenn E(εε′) = σ2I vereinfacht sich obiger Ausdruck zu var(β) = σ2(X ′X)−1.

Wenn aber E(εε′) 6= σ2I – wie z.B. bei Heteroskedastizitat – lasst sich obiger Aus-druck nicht weiter vereinfachen, deshalb liefert der OLS-Schatzer fur die Varianz-Kovarianzmatrix var(β) = σ2(X ′X)−1 verzerrte (d.h. falsche!) Schatzungen fur dieStandardfehler der Koeffizienten.

Weil’s so wichtig ist noch einmal: bei Heteroskedastizitat gilt

1. Die mit OLS geschatzten Koeffizienten sind erwartungstreu und konsi-stent,

2. aber die OLS Schatzer fur die Koeffizienten sind nicht effizient!

3. Die mit OLS geschatzten Standardfehler der Koeffizienten sind verzerrt,deshalb sind darauf beruhende Hypothesentests ungultig!

11.2 Wie erkennt man Heteroskedastizitat?

Zur Erkennung von Heteroskedastizitat gibt es eine Reihe von Tests, die sich v.a.darin unterscheiden, wie viel a priori Information uber Art und Ursache der Hete-roskedastizitat benotigt wird. Generell haben Tests, die vorhandene a priori Infor-mation nutzen, eine hohere Trennscharfe (power) als Tests, die relativ allgemein undunspezifisch sind.

Page 6: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 6

11.2.1 Goldfeld-Quandt Test

Der intuitiv einleuchtendste Test auf Heteroskedastizitat ist vermutlich der Goldfeld-Quandt Test, der im wesentlichen darin besteht, die Varianz von zwei (oder mehr)Subsamples mit Hilfe eines ublichen F -Tests zu vergleichen. Dieser Test bietet sichinsbesondere dann an, wenn sich in der Stichprobe einzelne Gruppen klar unter-scheiden lassen, wie z.B. bei Lohnunterschieden zwischen Mannern und Frauen.

Der Goldfeld-Quandt Test wird in folgenden Schritten durchgefuhrt:

1. Bildung zweier Subsamples nach der Variable, von der man vermutet, dasssich die Varianz mit ihr andert (z.B. Geschlecht). Bei intervallskalierten Da-ten kann man den Datensatz vorher nach dieser Variable sortieren, bzw. eineentsprechende Dummy Variable fur die Subsamples bilden.

Bei intervallskalierten Variablen und einer genugend großen Stichprobe wirdmanchmal vorgeschlagen ca. ein Funftel der Daten (Beobachtungen) in derMitte auszuschließen, um die Trennscharfe des Tests zu verbessern.

2. Fur beide Subsamples werden getrennte Regressionen geschatzt.

3. Bei Vorliegen von Heteroskedastizitat ist die Varianz der Storterme beiderRegressionen σ2

1 und σ22 verschieden. Mit Hilfe der Quadratsummen der Re-

siduen beider Regressionen kann man die Nullhypothese H0 : σ21 = σ2

2 testen.Wenn die Nullhypothese wahr ist wurden wir erwarten, dass ε′1ε1/(n1 − k) ≈ε′2ε2/(n2 − k). Wenn sie sehr unterschiedlich sind widerspricht dies der Null-hypothese der Homoskedastizitat.

Die F-verteilte Teststatistik fur den Test dieser Nullhypothese ist

F =ε′1ε1/(n1 − k)

ε′2ε2/(n2 − k)∼ Fn1−k,n2−k

wobei man darauf achten muss, dass im Zahler die großere Quadratsumme derResiduen steht.1 Wenn F großer ist als der entsprechende kritische Wert mussdie Nullhypothese der Homoskedastizitat verworfen werden.

11.2.2 Breusch-Pagan-Godfrey Test

Fur den Breusch-Pagan Test ist keine Bildung von Subsamples erforderlich, under ist auch deutlich allgemeiner. Dieser Test ist besonders machtig, wenn man ei-ne ziemlich klare Vorstellung von der Art der Heteroskedastizitat hat, d.h. einebegrundete Vorstellung davon, von welchen Variablen die Varianz der Stortermeabhangen konnte.

Der Breusch–Pagan Test beruht auf der Beziehung zwischen den quadrierten OLS-Residuen und ausgewahlten Variablen, von denen wir vermuten, dass sie die Hete-roskedastizitat verursachen.

1Man beachte, dass ε′ε/(n− k) das Quadrat des Standardfehlers der Regression ist).

Page 7: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 7

Die Nullhypothese lautet, dass keine Heteroskedastizitat vorliegt, und die Alterna-tivhypothese, dass im Modell

yi = β1 + β2xi2 + · · ·+ βkxik + εi

Heteroskedastizitat der Art

σ2i = σ2f(γ1 + γ2zi2 + · · ·+ γlzli)

vorliegt, wobei wobei f eine (beinahe) beliebige differenzierbare Funktion sein kann,und die zl erklarende Variablen fur die Heteroskedastizitat sind. Als z Variablenkonnen auch einige oder alle der x Variablen verwendet werden, dies spielt keineRolle.

Der Test beruht auf einer Hilfsregression, in der die z Variablen auf die quadriertenOLS Residuen regressiert werden. Es gibt verschiedene Versionen dieses Tests, inder einfachsten Form erfolgt die Durchfuhrung in folgenden Schritten:

1. Schatze die OLS-Regression

yi = β1 + β2xi2 + · · ·+ βkxik + εi

und berechne die Datenreihe mit den quadrierten Residuen ε2i dieser Regres-sion.

2. Regressiere in einer Hilfsregression die erklarenden z-Variablen und ein Inter-zept auf diese quadrierten OLS-Residuen ε2i , d.h.

ε2i = γ1 + γ2zi2 + · · ·+ γlzil + νi

wobei l die Anzahl der Koeffizienten der Hilfsregression bezeichnet (inkl. In-terzept). Wie erwahnt konnen auch die erklarenden x Variablen der ursprung-lichen Variablen als z Variablen dieser Hilfsregression verwendet werden.Der Test wird mit Hilfe des Bestimmtheitsmaßes R2

ε2 dieser Hilfsregressionberechnet.

3. Man kann zeigen, dass die Teststatistik

LM = nR2ε2 ∼ χ2

l−1

(d.h. Anzahl der Beobachtungen n mal Bestimmtheitmaß der HilfsregressionR2

ε2) asymptotisch χ2-verteilt mit l − 1 Freiheitsgraden ist.2

Die Nullhypothese der Homoskedastizitat wird verworfen, wenn nR2ε2 großer

ist als der kritische Wert der χ2-Verteilung mit l − 1 Freiheitsgraden.

Dieser Test gilt nur in großen Stichproben (d.h. ist nur asymptotisch gultig), in klei-nen Stichproben wird haufig einfach ein F -Test auf die gemeinsame Signifikanz derz-Variablen in der Hilfsregression durchgefuhrt, der immerhin gewisse Anhaltspunk-te fur das Vorliegen von Heteroskedastizitat geben kann. In dieser Form ahnelt derBreusch–Pagan Test dem White-Test.

2Dies ist ein Spezialfall eines Lagrange-Multiplier-Tests.

Page 8: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 8

Beispiel Wooldridge (2005, 281)

EViews

wfopen "http://www.hsto.info/econometrics/data/hprice1.csv"

equation eqbp.ls log(price) c log(lotsize) log(sqrft) bdrms

eqbp.makeresids uhat

series uhatsq = uhat^2

equation eqbp2.ls uhatsq c log(lotsize) log(sqrft) bdrms

scalar LM = eqbp2.@regobs*eqbp2.@r2

scalar pvalue = 1-@cchisq(LM,eqbp2.@ncoef-1)

’ oder einfacher

eqbp.hettest(type=BPG) c log(lotsize) log(sqrft) bdrms

R

rm(list=ls())

HPRICE1 <- read.csv("http://www.hsto.info/econometrics/data/hprice1.csv",

header = TRUE, sep = ",", dec=".",

quote="\"", stringsAsFactors=F)

eqbp <- lm(log(PRICE) ~ log(LOTSIZE) + log(SQRFT) + BDRMS, data=HPRICE1)

uhatsq <- (resid(eqbp))^2

eqbp2 <- lm(uhatsq ~ log(LOTSIZE) + log(SQRFT) + BDRMS, data=HPRICE1)

LM <- nobs(eqbp2)*summary(eqbp2)$r.squared

p_value <- 1-pchisq(LM,length(coefficients(eqbp2))-1)

cat("LM = ", LM, " p-value = ", p_value)

# oder einfacher

library(AER)

bptest(eqbp)

Stata

clear

insheet using "http://www.hsto.info/econometrics/data/hprice1.csv"

gen lprice = log(price)

gen llotsize = log(lotsize)

gen lsqrft = log(sqrft)

reg lprice llotsize lsqrft bdrms

predict uhat, resid

gen uhatsq = uhat^2

reg uhatsq llotsize lsqrft bdrms

scalar LM = e(r2)*e(N)

scalar pvalue = chi2tail(e(df_m),LM)

disp "Breusch-Pagan test: LM = " LM ", p-value = " pvalue

/* oder einfacher */

reg lprice llotsize lsqrft bdrms

estat hettest, rhs iid

Page 9: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 9

Nach diesem Test kann die Nullhypothese der Homoskedastizitat nicht verworfenwerden.

11.2.3 White–Test

Der White–Test ist im allgemeinen empfehlenswert, wenn eher wenig uber die Formder Heteroskedastizitat bekannt ist. Außerdem hangt er nicht so stark von der Nor-malverteilungsannahme ab wie der Breusch-Pagan-Godfrey Test und ist einfachdurchzufuhren. Auch deshalb wird er haufig angewandt.

Getestet wird die Nullhypothese

H0 : σ2i = σ2 fur alle i

Die Grundidee beruht auf einem Vergleich der Matrizen[(X ′X)−1X ′εε′X(X′X)−1]

und ihrem Pendant bei Homoskedastizitat σ2(X ′X)−1. Umso großer die Differenzzwischen diesen beiden Matrizen ist, umso mehr spricht fur das Vorliegen von He-teroskedastizitat.

Der wesentliche Unterschied zwischen dem Breusch-Pagan Test und dem White Testbesteht darin, dass fur die Hilfsregression zusatzlich die Quadrate und Kreuzproduk-te aller erklarenden Variablen berucksichtigt werden.

Wenn z.B. eine Gleichung mit drei Regressoren geschatzt wird

yi = β1 + β2xi2 + β3xi3 + β4xi4 + εi

wird die Hilfsregression

ε2i = γ1 + γ2xi2 + γ3xi3 + γ4xi4 +

γ5x2i2 + γ6x

2i3 + γ7x

2i4 +

γ8xi2xi3 + γ9xi2xi4 + γ10xi3xi4

geschatzt.

Man kann wieder zeigen, dass die Teststatistik

LM = nR2ε2 ∼ χ2

l−1

(d.h. Anzahl der Beobachtungen n mal Bestimmtheitmaß der Hilfsregression R2ε2)

asymptotisch χ2-verteilt mit l−1 Freiheitsgraden ist (im Beispiel oben ist l−1 = 9).

Die Nullhypothese der Homoskedastizitat wird wieder verworfen, wenn der Wert LMgroßer ist als der kritische Wert der χ2-Statistik.

Beispiel mit R

# White Test

bptest(eqbp, varformula = ~ log(LOTSIZE) + log(SQRFT) + BDRMS +

I(log(LOTSIZE))^2 + I(log(SQRFT))^2 + I(BDRMS)^2 +

I(log(LOTSIZE)*log(SQRFT)) + I(log(LOTSIZE)*BDRMS) +

I(log(SQRFT)*BDRMS), data=HPRICE1)

Page 10: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 10

Man erkennt sofort, dass fur diesen Test ziemlich viele Freiheitsgrade benotigt wer-den. Sollten sehr wenige Freiheitsgrade zur Verfugung stehen wird manchmal emp-fohlen, als erklarende Variable Potenzen der gefitteten Werte fur y zu verwenden, dadiese eine Linearkombination der erklarenden Variablen x darstellen (vgl. Woold-ridge, 2005, p. 283).

Ein Nachteil des White-Tests besteht darin, dass er nicht konstruktiv ist, das heißt,ein signifikanter Wert der Teststatistik gibt keine Hinweise auf die Ursachen derHeteroskedastizitat.

Achtung: Alle Tests auf Heteroskedastizitat sind sehr anfallig auf allgemeine Fehl-spezifikationen, wir z.B. falsche Funktionsformen oder fehlende Variablen (omittedvariables)! Heteroskedastizitattests sind nur in sonst korrekt spezifizierten Modellenaussagekraftig! Deshalb empfiehlt es sich, die Spezifikation vor der Heteroskedasti-zitat zu testen, z.B. durch einen RESET-Test (dieser Test wird in einem spaterenKapitel uber Spezifikationstests vorgestellt).

11.3 Maßnahmen gegen Heteroskedastizitat

In kaum einem anderen Bereich der angewandten Okonometrie hat sich die Praxisuber die letzten Jahre derart stark geandert wie im Umgang mit Heteroskedastizitat.Diese geanderte Praxis hat auch damit zu tun, dass mittlerweile mit den robustenStandardfehlern eine einfache Alternative zu den bei Heteroskedastizitat verzerrtenOLS-Standardfehlern zur Verfugung steht.

11.3.1 Heteroskedastiekonsistente (robuste) Standardfehler

Wir erinnern uns, im Fall von Heteroskedastizitat sind die OLS Koeffizienten er-wartungstreu und konsistent – aber nicht effizient. Die OLS Standardfehler derKoeffizienten sind verzerrt und auch nicht konsistent, weshalb darauf beruhendeTeststatistiken ungultig sind.

Deshalb wird haufig vorgeschlagen, selbst bei Heteroskedastizitat einer unbekanntenForm die OLS Schatzungen fur die Koeffizienten zu verwenden, allerdings anstelleder verzerrten OLS Schatzer fur die Standardfehler sogenannte heteroskedastierobu-ste Standardfehler (auch robuste oder nach ihrem (Wieder-)Entdecker Hal Whiteauch White-Standardfehler genannt) zu verwenden.

Erinnern wir uns, im Falle von Heteroskedastizitat ist die wahre Varianz-Kovarianzmartrix der Koeffizienten β gleich

var(β) = E

([β − E(β)

] [β − E(β)

]′)

= E[(X ′X)−1X ′εε′X(X ′X)−1

]

= (X ′X)−1X ′ E(εε′)X(X ′X)−1

= (X ′X)−1X ′ΩX(X ′X)−1

Page 11: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 11

wobei Ω = E(εε′) eine n× n Matrix mit unbeobachtbaren Parametern der Grund-gesamtheit ist.

Das Problem ist die Schatzung einer geeigneten Matrix Ω. Heteroskedastie-konsistente Schatzer fur die Varianz-Kovarianzmatrix der Koeffizienten haben haufigdie Form

varw(β) = (X ′X)−1X ′ΩX(X ′X)−1

und werden oft Sandwich Kovarianzmatrizen genannt, da die Matrix X ′ΩX wie ineinem Sandwich zwischen den Matrizen (X ′X)−1 liegt.

Fur homoskedastische Storterme ist E(εε′) = σ2I, deshalb ist var(β) = σ2(X ′X)−1.

Fur heteroskedastische Storterme ist es leider nicht ganz so einfach, denn in diesemFall ist

E(εε′) =

σ21 0 0 . . . 00 σ2

2 0 . . . 0...

......

. . ....

0 0 0 . . . σ2n

= diagσ2

i

wobei diagσ2i eine Diagonalmatrix mit den σ2

i auf den Hauptdiagonalelementenist (dies gilt nur bei Abwesenheit von Autokorrelation. Bei Vorliegen von Autokor-relation ist E(εε′) keine Diagonalmatrix; mehr dazu im nachsten Kapitel).

Die Varianz-Kovarianzmatrix des Koeffizientenvektors bei Heteroskedastizitat istdeshalb

var(β) =[(X ′X)−1X ′ diagσ2

i X(X ′X)−1]

Die Schatzung dieser Varianz-Kovarianzmartrix von β ist unmoglich, da die Anzahlder σ2

i gleich der Anzahl der Beobachtungen n ist, weshalb insgesamt (mit den Koef-fizienten) mehr Parameter geschatzt werden mussten als Beobachtungen vorliegen.

In einem sehr einflussreichen Paper hat White (1980) gezeigt, dass die k× k Matrix

1

nX ′ diagσ2

i X

konsistent durch1

n

n∑

i=1

ε2ixix′i

geschatzt werden kann, wobei xi ein k × 1 Spaltenvektor mit der i-ten Zeile derX Matrix ist (d.h. die Transponierte der i-ten Zeile), und εi das Residuum i derOLS-Regression ist.3

Die entsprechende heteroskedastiekonsistente Varianzkovarianzmatrix ist

varw(β) = (X ′X)−1X ′diag[ε2i ]X(X ′X)−1

Die darauf beruhenden Standardfehler werden haufig robuste Standardfehler ge-nannt, oder auch nach ihren Entdeckern White Standardfehler oder Eicker – HuberStandardfehler (bzw. irgendeine Kombination dieser Namen).

3Der Statistiker Eicker (1963) hat ein ahnliches Resultat bereits weit fruher bewiesen.

Page 12: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 12

Robuste Standardfehler sind in der Regel zwar nur asymptotisch gultig, aber sie sindim Gegensatz zu den OLS Standardfehlern auch bei heteroskedastischen Stortermenkonsistente Schatzer fur die wahren Standardfehler.

Deshalb sind darauf beruhende Teststatistiken und Konfidenzintervalle zumindestasymptotisch gultig. Die geschatzten Koeffizienten β werden durch die White-Korrektur nicht verandert, d.h. es werden weiterhin die OLS Koeffizienten ausgege-ben.

Schatzer fur robuste Standardfehler sind – wie alle Schatzer – selbst Zufallsvaria-blen und haben in der Regel eine großere Varianz als die konventionellen OLS Stan-dardfehler. Angrist and Pischke (2008) empfehlen sowohl OLS- als auch robusteStandardfehler zu berechnen, und besonders vorsichtig zu sein, wenn die robustenStandardfehler kleiner sind als die herkommlichen OLS Standardfehler

“[ . . . ] robust standard errors are no panacea. They can be smaller thanconventional standard errors for two reasons: the small sample bias [ . . . ]and their higher sampling variance. We therefore take empirical resultswhere the robust standard errors fall below the conventional standarderrors as a red flag.” (Angrist and Pischke, 2008, p. 307).

Da fur robuste Standardfehler nur asymptotische Eigenschaften bekannt sind, sindsie fur kleine Stichproben weniger geeignet. Was eine kleine Stichprobe ist hangtvon den konkreten Daten und den Umstanden ab, aber mit weniger als 100 Beob-achtungen sollte man generell vorsichtig sein.

In EViews konnen die heteroskedastie-robusten Standardfehler nach White mittelsder Option h im ls Befehl (oder durch Anklicken des entsprechenden Feldes unterOptionen im Quick-Estimation Menu) berechnet werden. Stata kennt die Optionrob fur den regress Befehl, und in R muss ein entsprechendes Package geladenwerden (z.B. sandwich).

Es gibt alternative robuste Schatzer fur die Standardfehler, die v.a. in kleinerenStichproben bessere Eigenschaften haben sollen.

11.3.2 Alternative Schatzer fur Robuste Standardfehler

Eine Reihe weiterer robuster Schatzer fur die Varianz-Kovarianzmatrix, denen v.a.bessere ‘Kleine Stichproben Eigenschaften’ nachgesagte werden, wurden u.a. vonMacKinnon and White (1985) vorgeschlagen.

Die bekanntesten dieser alternativen Schatzer sind

HC1 =n

n− kHC0

oder

HC2 = (X ′X)−1X ′diag

[ε2i

1− hii

]X(X ′X)−1

wobei hii das i-te Diagonalelement der Projektionsmatrix PX = X(X ′X)−1X ′ ist.

Page 13: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 13

bzw.

HC3 = (X ′X)−1X′diag

[ε2i

(1− hii)2

]X(X ′X)−1

Long and Ervin (2000) testeten diese alternativen Schatzer fur die Varianzkovari-anzmatrix und fassen ihre Ergebnisse folgendermassen zusammen:

“In the presence of heteroscedasticity, ordinary least squares (OLS) esti-mates are unbiased, but the usual tests of significance are generally in-appropriate and their use can lead to incorrect inferences. Tests basedon a heteroscedasticity consistent covariance matrix (HCCM), however,are consistent even in the presence of heteroscedasticity of an unknownform. Most applications that use a HCCM appear to rely on the asym-ptotic version known as HC0. Our Monte Carlo simulations show thatHC0 often results in incorrect inferences when n ≤ 250, while three re-latively unknown, small sample versions of the HCCM, and especially aversion known as HC3, work well even for N’s as small as 25.

We recommend that: (1) data analysts should correct for heteroscedasti-city using a HCCM whenever there is reason to suspect heteroscedastici-ty; (2) the decision to use HCCM-based tests should not be determinedby a screening test for heteroscedasticity; and (3) when n ≤ 250, theHCCM known as HC3 should be used. Since HC3 is simple to compute,we encourage authors of statistical software to add this estimator to theirprograms.”

Alle diese Alternativen sind sowohl in EViews4, Stata und R5 verfugbar. R verwendetHC3 als ‘default’ fur robuste Standardfehler.

Beispiel mit R Das folgende Beispiel schatzt fur osterreichische Mietpreise einModell, fuhrt einen Breusch-Pagan und einen White-Test auf Heteroskedastitatdurch, schatzt die OLS und die robusten Standardfehler und gibt die Ergebnissemit Hilfe des stargazer Packets formatiert aus.

Hinweis: Die Varianz-Kovarianzmatrix der Koeffizienten erhalt man mit vcov, dieWurzel der Hauptdiagonalelemente sind die Standardfehler; diese erhalt man fur einGleichungsobjekt eq1 also mit sqrt(diag(vcov(eq1))).

Mit Hilfe des AER (bzw. sandwich) Paketes von A. Zeileis kann man mit vcovHC

auf die robuste Varianz-Kovarianzmatrix der Koeffizienten zugreifen.

# Beispiel Mietpreise Osterreich

rm(list=ls())

library(foreign)

df <- read.dta("http://www.hsto.info/econometrics/projekte/mieten/mieten1.dta")

colnames(df) <- c("Fl", "Zi", "Miete", "Laut")

4in EViews muss dazu das Add-in HCCM installiert werden.5z.B. im Package sandwich.

Page 14: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 14

df <- na.omit(subset(df,Fl > 0 & Zi > 0 & Miete >0 & Laut > 0))

df$Laut = df$Laut - 2 # Dummy

library(stargazer)

stargazer(df, type="text")

attach(df)

eq1 <- lm(Miete ~ Fl + Zi + Laut)

stargazer(eq1, type="text", intercept.bottom=FALSE)

library(AER)

# Breusch-Pagan Test auf Heteroskedastizitat

bptest(eq1)

# BP = 110.1919, df = 3, p-value < 2.2e-16

# White Test auf Heteroskedastizitat

bptest(eq1, ~ Fl + Zi + Laut + I(Fl)^2 + I(Zi)^2 + I(Fl*Zi) + I(Fl*Laut) + I(Zi*Laut))

# BP = 114.3496, df = 8, p-value < 2.2e-16

# nach beiden Test wird H_0: homoskedast. verworfen!

# OLS Standardfehler

OLS.se <- sqrt(diag(vcov(eq1)))

# Robuste Standardfehler (AER package)

rob.se <- sqrt(diag(vcovHC(eq1)))

# Ausgabe

stargazer(eq1,eq1, se=list(OLS.se, rob.se),

title="Mietpreise in Osterreich",

no.space=TRUE,

omit.stat=c("LL","ser","f", "rsq"),

column.labels=c("OLS SE", "Robust SE"),

dep.var.caption="",

type="text",

intercept.bottom=FALSE,

model.numbers=FALSE

)

Tabelle 11.1 zeigt das Ergebnis.

Schatzer fur robuste Standardfehler sind – wie alle Schatzer – selbst Zufallsvaria-blen und haben in der Regel eine großere Varianz als die konventionellen OLS Stan-dardfehler. Angrist and Pischke (2008) empfehlen sowohl OLS- als auch robusteStandardfehler zu berechnen, und besonders vorsichtig zu sein, wenn die robustenStandardfehler kleiner sind als die herkommlichen OLS Standardfehler

“[ . . . ] robust standard errors are no panacea. They can be smaller thanconventional standard errors for two reasons: the small sample bias [ . . . ]

Page 15: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 15

Tabelle 11.1: Mietpreise in Osterreich

MieteOLS SE Robust SE

Constant 32.623 32.623(25.362) (31.122)

Fl 7.341∗∗∗ 7.341∗∗∗

(0.430) (0.836)Zi −37.587∗∗∗ −37.587∗∗∗

(10.300) (13.895)Laut 19.994 19.994

(17.197) (16.131)

Observations 501 501Adjusted R2 0.503 0.503

Note: ∗p<0.1; ∗∗p<0.05; ∗∗∗p<0.01

and their higher sampling variance. We therefore take empirical resultswhere the robust standard errors fall below the conventional standarderrors as a red flag.” (Angrist and Pischke, 2008, p. 307).

Eine Monte Carlo Simulation

PRF: yi = 5 + 5xi + εi mit

1. Keine Heteroskedastizitat (h0): var(εi|x) = σ2

2. Mittlere Heteroskedastizitat (h1): var(εi|x) = σ21x

3. Starke Heteroskedastizitat (h2): var(εi|x) = σ22x

2

mit n = 60, se(ε) = 100, 10 000 Replikationen.

Die Koeffizienten sind auch bei starker Heteroskedastizitat erwartungstreu, sieheAbbildung 11.3.

Hingegen sind die OLS Standardfehler bei Heteroskedastizitat verzerrt, vgl. Abbil-dung 11.4 fur n = 60 und Abbildung 11.5 fur n = 600. Wahrend v.a. bei kleinenStichproben ein trade-off zwischen Verzerrung und Varianz der Standardfehler eineRolle spielen kann sind die entsprechenden heteroskedastiekonsistenten (robusten)Standardfehler in großen Stichproben selbst bei maßiger Heteroskedastizitat oft vor-teilshaft.

11.3.3 Weighted Least Squares (WLS)

Welche Maßnahmen beim Vorliegen von Heteroskedastizitat ergriffen werden konnenoder sollen, hangt sehr stark davon ab, was man uber die Art der Heteroskedastizitatweiß. Wenn man sehr wenig uber die Ursachen der Heteroskedastizitat weiß empfiehlt

Page 16: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 16

b_h0 b_h1 b_h2

3.5

5.0

6.5

Coefficients

Abbildung 11.3: Monte Carlo Simulation, Boxplots fur 10 000 Schatzungen desSteigungskoeffizienten β2 fur β2 = 5 bei Homoskedastizitat(b h0), mittlerer Heteroskedastizitat (b h1) und starker Heteros-kedastizitat (b h2)

es sich haufig fur die Koeffizientenschatzung bei der OLS Methode zu bleiben, dadie Koeffizienten mit OLS bekanntlich erwartungstreu (aber nicht effizient) geschatztwerden, aber anstelle der OLS Standardfehler robuste Standardfehler zu berechnen,wie sie im vorhergehenden Abschnitt beschrieben wurden.

Wenn man hingegen eine einigermaßen klare Vorstellung uber die Art und Ursa-chen der Heteroskedastizitat hat ist es manchmal empfehlenswert, die im Folgendenvorgestellten Methoden weighted least squares (WLS) oder feasible generalized leastsquares (FGLS) anzuwenden.

OLS gewichtet alle Beobachtungen gleich. Im Falle von Heteroskedastizitat fuhrtdies dazu, dass die Beobachtungen mit den großten Stortermen – also gewissermaßendie ‘ungenauesten’ Beobachtungen – den großten Einfluss auf die Schatzung haben.Wie die Bezeichnung ‘Weighted Least Squares’ schon nahe legt, erfolgt bei WLSeine Gewichtung der Daten nach der Varianz.

‘Weighted Least Squares’ (WLS) Schatzer sind ein Spezialfall von ‘Generalized LeastSquares’ (GLS) Schatzern, die in einem spateren Kapitel vorgestellt werden. Im we-sentlichen werden bei der WLS Methode durch eine geeignete Datentransformationdie Eigenschaften des Storterms derart geandert, dass zumindest eine konsistenteSchatzung ermoglicht wird.

Bekannte Varianzen

Obwohl die ‘wahren’ Varianzen σ2i in der Realitat kaum jemals bekannt sein werden

wollen wir aus didaktischen Grunden mit diesem einfachsten Fall zu beginnen.

Wenn die Varianzen σ2i bekannt waren konnte man die Gleichung

yi = β1 + β2xi2 + · · ·+ βkxik + εi

durch σi dividieren und erhalt

yiσi

=β1

σi+ β2

xi2

σi+ · · ·+ βk

xik

σi+

εiσi

Page 17: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 17

seOLS HC0 HC1 HC2 HC3 HC4

0.30

0.45

Homoskedastizität

seOLS HC0 HC1 HC2 HC3 HC4

0.3

0.5

Mittlere Heteroskedastizität

seOLS HC0 HC1 HC2 HC3 HC4

0.35

0.50

0.65

Starke Heteroskedastizität

Abbildung 11.4: Monte Carlo Simulation von OLS und robusten Standardfeh-lern; Boxplots fur 10 000 Schatzungen verschiedener Standard-fehler des Steigungskoeffizienten β2 (d.h. se(β2)) bei Homoske-dastizitat (var(εi|x) = σ2) sowie mittlerer Heteroskedastizitat(var(εi|x) = σ2

1x) und starker Heteroskedastizitat (var(εi|x) =σ22x

2) fur n = 60.Blaue Linie: Standardabweichung der 10 000 geschatzten Koeffi-zienten (‘wahrer’ Standardfehler).

Page 18: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 18

seOLS HC0 HC1 HC2 HC3 HC4

0.13

00.

145

0.16

0

Homoskedastizität

seOLS HC0 HC1 HC2 HC3 HC4

0.14

0.16

Mittlere Heteroskedastizität

seOLS HC0 HC1 HC2 HC3 HC4

0.15

0.18

Starke Heteroskedastizität

Abbildung 11.5: Monte Carlo Simulation von Standardfehlern; wie Abbildung11.4, aber fur n = 600.

Page 19: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 19

bzw.y∗i = β∗

1i + β2x∗i2 + · · ·+ βkx

∗ik + ε∗i

mit y∗i = yi/σi, x∗i2 = xi2/σi, ε

∗i = εi/σi etc. Man beachte den Index i bei β∗

1i = β1/σi.

Diese transformierte Gleichung kann mit OLS geschatzt werden, da unter den ge-troffenen Annahmen gilt

E[(ε∗i )2] = E

(εiσi

)2

=1

σ2i

E(ε2i )

=1

σ2i

σ2i

= 1

d.h. die Storterme dieser transformierten Variable sind homoskedastisch und erfullenalle Gauss-Markov Annahmen, deshalb ist die OLS-Schatzung mit diesen transfor-mierten Variablen erwartungstreu und varianzminimal (BLUE).

Allerdings wird die Varianz der Storterme der Grundgesamtheit kaum jemals be-kannt sein, muss man in der Realitat meist auf ‘Proxies’ zuruckgreifen (WeightedLeast Squares), oder die Varianz aus den Daten schatzen (Feasible Generalized LeastSquares).

Unbekannte Varianzen

Nehmen wir mal an wir wussten, dass die Varianz der Storterme εi in der folgendenForm von einer (erklarenden) Variable z abhangt

E(εi)2 = σ2

i = σ2zi

In diesem Fall konnen wir alle Variablen durch√zi dividieren und folgende Glei-

chung schatzen:yi√zi

= β11√zi

+ β2xi√zi

+εi√zi

Der Erwartungswert der Varianz des transformierten Storterms ist:

E

(εi√zi

)2

=1

ziE(ε2i ) =

1

ziziσ

2 = σ2

Der Storterm dieser transformierten Gleichung ist homoskedastisch, also kann dietransformierte Gleichung mit OLS unverzerrt geschatzt werden.

Wahrend im ursprunglichen Modell mit OLS die Quadratsumme∑

i(yi− β1− β2xi)2

minimiert wird, erfolgt im transformierten Modell eine Minimierung von

i

(yi√zi

− β11√zi

− β2xi√zi

)2

=∑

i

1

zi

(yi − β1 − β2xi

)2=∑

i

wi

(yi − β1 − β2xi

)2

mit den Gewichten wi = 1/zi.

Page 20: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 20

Naturlich kann z auch eine der erklarenden x Variablen sein (wie sieht die transfor-mierte Gleichung in diesem Fall aus?).

Im Falle einer Gewichtung (WLS) ist das Bestimmtheitsmaß R2 nicht mehr mit derOLS-Schatzung vergleichbar, da auch die abhangige Variable transformiert wurde.6

Ubung: Angenommen, yi = β1+β2xi2+β3xi3+εi und σ2i = σ2x2

i3. Welche Funktionist mittels WLS zu schatzen? Welche Interpretation hat in diesem Fall das Interzeptund der Anstiegs-Koeffizient?

Hinweis: Die Gleichung ist durch xi3 zu dividieren, also

yixi3

= β11

xi3+ β2

xi2

xi3+ β3

xi3

xi3+

εixi3

Welches β ist das Interzept der transformierten Gleichung? Ist der Storterm homos-kedastisch?

11.3.4 Feasible Generalized Least Squares (FGLS)

Wenn die ‘wahren’ Gewichte w der Grundgesamtheit bekannt waren (wie im vorher-gehenden Fall angenommen), ware die mittels WLS geschatzte Regression BLUE.Tatsachlich mussen die Gewichte aber meist aus den Daten geschatzt werden. Diemittels geschatzter Gewichte w ermittelten Schatzer heißen ‘FGLS–Estimators’(Feasible Generalized Least Squares Estimators ; manchmal auch EGLS fur ‘Estima-ted Generalized Least Squares’ ). Leider haben FGLS Schatzer nicht mehr die gleichenkleine Stichproben Eigenschaften wie die GLS Schatzer, d.h. FGLS Schatzer sindnicht mehr BLUE, aber immerhin sind sie konsistent und asymptotisch effizi-enter als OLS-Schatzer.

Allerdings mussen auch fur FGLS-Schatzungen Annahmen uber die Art der Hete-roskedastizitat getroffen werden, und die Qualitat einer FGLS-Schatzung hangt sehrstark davon ab, inwieweit diese Annahme erfullt ist.

Wenn wir zum Beispiel annehmen wurden, dass

var(εi) = σ2xhi

wobei h eine unbekannte Konstante ist, konnten wir fur diese Art von Heteros-kedastizitat einen einfachen FGLS Schatzer herleiten. Durch logarithmieren obigerAnnahme erhalt man

ln(E(ε2i )) = ln(σ2) + h ln(xi)

Wenn wir ln(E(ε2i )) durch das Stichproben-Analogon ln(ε2i ) ersetzen und einenStorterm hinzufugen konnen wir h mit OLS schatzen

ln(ε2i ) = ln(σ2) + h ln(xi) + vi

Diese Schatzung h wird fur die Datentransformation verwendet, d.h. jede Beobach-

tung wird durch

√xhi = x

h/2i dividiert.

In diesem Fall erfolgt die FGLS-Schatzung also in vier Schritten:

6Manchmal wird in solchen Fallen vorgeschlagen, anstelle des R2 das Quadrat des Korrelati-onskoeffizienten zwischen y und y anzugeben.

Page 21: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 21

1. Schatze das interessierende (nicht transformierte) Modell mit OLS und be-rechne daraus die Residuen εi.

2. Schatze h aus der Regression

ln(ε2i ) = ln(σ2)︸ ︷︷ ︸β1

+h ln(xi) + εi

3. Dividiere alle Beobachtungen durch

√xhi = x

h/2i .

4. Wende OLS auf diese transformierten Daten an.

Dies ist nur eine Moglichkeit, viele andere Arten von FGLS-Schatzungen sindmoglich, je nach den Annahmen uber die Art der Heteroskedastizitat.

Wooldridge (2005, p. 290) schlagt einen ziemlich flexiblen Ansatz fur FGLS-Schatzungen vor.

Dieser Ansatz zur Berechnung der Gewichte beruht auf der Annahme

var(ε|X) = σ2 exp(δ1 + δ1x2 + δ3x3 + · · ·+ δkxk)

wobei die x die erklarenden Variablen des Regressionsmodells und die δ die zuschatzenden Parameter sind.

Die Exponentialfunktion wird verwendet um sicherzustellen, dass die berechnetenGewichte tatsachlich positiv sind (Varianzen konnen nicht negativ sein!).

Ein FGLS-Schatzer kann fur diesen Fall in folgenden Schritten berechnet werden:

1. Schatze die Regression y = β1 + β2x2 + β3x3 + · · ·+ βkxk + ε mittels OLS undberechne daraus die Residuen ε.

2. Erzeuge die Datenreihe ln(ε2) (Achtung: die Residuen εi zuerst quadrieren undanschließend logarithmieren).

3. Schatze ln(ε2) = δ1 + δ2x2 + δ3x3 + · · · + δkxk + ν und berechne daraus die

gefitteten Werte f = ln(ε2).

4. Berechne die Gewichte w = exp(f)

5. Schatze die Regression y = β1+ β2x2+ β3x3+ · · ·+ βkxk + ε mittels WLS undden Gewichten 1/

√w.

[Eine Alternative zu Schritt 3 von oben ist die Schatzung von ln(ε2) = α1 + α2y +α3y

2 + ε, die anderen Schritte sind davon nicht betroffen.]

Ein generelles Problem mit FGLS Schatzern ist, dass es mehr als eine Moglichkeitgibt die Gewichte zu schatzen, und die Ergebnisse in der Regel sehr stark von derkonkreten Spezifikation abhangen. Deshalb konnen verschiedene Forscherinnen mitden gleichen Daten zu sehr verschiedenen Ergebnissen kommen. Dies ist vermutlichein Grund, warum in der neueren Literatur seltener von FGLS Gebrauch gemachtwird.

Page 22: Kapitel 11 Heteroskedastizit¨at · PDF fileKapitel 11 Heteroskedastizit¨at “You and I know that truly consistent estimators are imagined, not real.” (Leamer, 2010) 11.1 Das Problem

Empirische Wirtschaftsforschung 22

11.3.5 Logarithmieren

In log-linearen Modellen ist das Problem der Heteroskedastiziat haufig weniger gra-vierend, weil durch das Logarithmieren große Abweichungen gewissermaßen ‘ge-staucht’ werden. Allerdings sollte die logarithmische Funktionsform begrundbar sein,und eigentlich sollte vorher ein geeigneter Test auf die Funktionsform durchgefuhrtwerden, wobei dabei eine mogliche Heteroskedastizitat zu berucksichtigen ist.7

Literaturverzeichnis

Angrist, J. D. and Pischke, J.-S. (2008), Mostly Harmless Econometrics: An Empi-ricist’s Companion, Princeton University Press.

Eicker, F. (1963), ‘Asymptotic normality and consistency of the least squares esti-mators for families of linear regressions’, The Annals of Mathematical Statistics34(2), 447–456.

Leamer, E. E. (2010), ‘Tantalus on the road to asymptopia’, Journal of EconomicPerspectives 24(2), 31–46.URL: http://www.aeaweb.org/articles.php?doi=10.1257/jep.24.2.31

Long, J. S. and Ervin, L. H. (2000), ‘Using heteroscedasticity consistent standarderrors in the linear regression model’, The American Statistician 54(3), 217–224.URL: http://www.jstor.org/stable/2685594

MacKinnon, J. G. and White, H. (1985), ‘Some heteroskedasticity-consistent co-variance matrix estimators with improved finite sample properties’, Journal ofEconometrics 29(3), 305–325.

White, H. (1980), ‘A heteroskedasticity-consistent covariance matrix estimator anda direct test for heteroskedasticity’, Econometrica 48(4), 817–838.

Wooldridge, J. (2005), Introductory Econometrics: A Modern Approach, 3 edn,South-Western College Pub.

7Ein solcher Test wird im Kapitel uber Spezifikationsfehler vorgestellt.