1
1 Lineare Paneldatenmodelle
1.1 Quellen und Arten von Paneldaten
1.1.1 Haushaltspanels
In der Bundesrepublik gibt es inzwischen eine Reihe bedeutender Paneldatensätze, von
denen das Sozio-ökonomische Panel privater Haushalte (SOEP) der bekannteste ist.
Im SOEP werden insbesondere die Lebensbedingungen, d.h. die Erwerbs- und Ein-
kommenssituation, im Längsschnitt erfaßt. Einmal im Jahr werden dieselben Haushalte-
und Haushaltsmitglieder befragt. Haushalte werden neu in das SOEP aufgenommen,
wenn bestehende Haushaltsmitglieder den Haushalt wechseln oder einen neuen Haus-
halt gründen. Das SOEP ist 1984 im Rahmen des Sonderforschungsbereichs 3 „Mikro-
analytische Grundlagen der Gesellschaftspolitik“ der Universitäten Frankfurt und Mann-
heim entstanden und wird inzwischen am Deutschen Institut für Wirtschaftsforschung
(DIW) in Berlin im Rahmen einer eigenständigen Projektgruppe weitergeführt. Die Be-
fragung selbst wird von infratest Sozialforschung in München durchgeführt. Seit 1990 ist
das SOEP auf das Gebiet der neuen Bundesländer erweitert.
Das SOEP-West begann 1984 mit 12.290 Personen in 5.921 Haushalten. 1998 waren
es noch 8.145 Personen in 4.366 Haushalten. Das SOEP-Ost startete 1990 mit 4.453
Personen in 2.179 Haushalten und führt nun 3.730 Personen in 1.816 Haushalten Im
Rahmen des SOEP sind also für einen Querschnitt von ca. 8.000WN = bzw.
11.700DN = Personen über einen Zeitraum 15WT = bzw. 9DT = Wellen Beobach-
tungen verfügbar. Typischerweise ist in Paneldaten also die Querschnittsdimension
N relativ groß und die Zeitdimension T relativ klein.
Die anonymisierten Mikrodatensätzen werden wissenschaftlichen Forschungsein-
richtungen gegen Abschluß eines Nutzungsvertrages und eine geringe Nutzungsgebühr
im SPSS-, STATA-, SAS-, TDA- und ASCII-Format zur Verfügung gestellt. Über 400
Forschergruppen im In- und Ausland nutzen bisher das SOEP. Die wesentlichen
Informationen sind auch direkt auf der SOEP-Homepage unter http://www.diw.de/soep
erhältlich.
2
1.1.2 Unternehmens- und Betriebspanels
Andere als Panel konzipierte Erhebungen beziehen sich auf die Befragung von Unter-
nehmen bzw. Betrieben als Teil von Unternehmen. Obwohl Unternehmensbefragungen
in Deutschland insbesondere Dank des ifo Instituts für Wirtschaftsforschung in München
eine lange Tradition haben (vgl. Oppenländer und Poser, 1989), sind sie zu wissen-
schaftlichen Zwecken weitaus weniger genutzt worden als das SOEP.
Das ifo führt im wesentlichen drei als Panel konzipierte Unternehmensbefragungen
durch: seit 1949 den ifo-Konjunkturtest (vgl. Lindlbauer, 1989), seit 1955 den ifo-
Investitionstest (vgl. Neumann, 1989) und seit 1979 den ifo-Innovationstest (vgl.
Scholz, 1989). Am Investitionstest nehmen durchschnittlich ca. 3.000 Unternehmen teil.
Die Erhebung des Konjunktur- und des Innovationstests erfolgt auf der Ebene von Pro-
duktgruppen bzw. Geschäftsbereichen von Unternehmen. Am Konjunkturtest partizipie-
ren ca. 5.400 und am Innovationstest ca. 1.600 so definierte Einheiten. An der Univer-
sität Konstanz ist aus den 3 getrennten Unternehmensbefragungen das ifo-
Unternehmenspanel entstanden (vgl. Schneeweis und Smolny, 1996), in dem für
knapp 2.000 Unternehmen Beobachtungen von 1980 bis 1992 vorliegen. Das ifo-
Unternehmenspanel ist bisher nicht öffentlich zugänglich. Die Daten des ifo-
Konjunkturtests sind in Einzelfällen zu wissenschaftlichen Zwecken an universitäre For-
schungseinrichtungen weitergegeben worden.
Über umfangreiche Unternehmensdatensätze verfügt auch das Zentrum für Europäische
Wirtschaftsforschung (ZEW) in Mannheim. Zu nennen sind insbesondere das Mannhei-
mer Innovationspanel und das ZEW-Gründungspanel. Im Rahmen des Mannheimer
Innovationspanel (MIP) werden seit 1993 im Verarbeitenden Gewerbe und seit 1995
auch im Dienstleistungssektor Unternehmen zu ihren Innovationsaktivitäten befragt (vgl.
Harhoff und Licht, 1993; Licht et al., 1997 sowie Janz und Licht, 1999). An beiden Erhe-
bungen nehmen jeweils knapp 2.500 Unternehmen teil. Die anonymisierten Mikrodaten
werden wissenschaftlichen Forschungseinrichtungen gegen Abschluß eines Datennut-
zungsvertrages kostenlos zu wissenschaftlichen Zwecken zur Verfügung gestellt (Kon-
takt: Sandra Gottschalk, Email: [email protected]). Darüber hinaus besteht die Mög-
lichkeit, am ZEW mit den nicht anonymisierten Originaldaten zu arbeiten. Etwa 30 For-
schergruppen im In- und Ausland nutzen bisher das MIP. Das ZEW-Gründungspanel
3
ist in Zusammenarbeit mit der Kreditauskunftei CREDITREFORM entstanden und ent-
hält die wesentlichen Strukturgrößen aller seit 1990 in Deutschland neu gegründeten
Unternehmen (vgl. Harhoff und Steil, 1997). Das Gründungspanel-West enthält Informa-
tionen zu ungefähr 1,6 Millionen Unternehmen. Das Gründungspanel-Ost umfaßt ca.
760.000 Unternehmen und entspricht dem Bestand aller seit der Wiedervereinigung
jemals in Ostdeutschland existierenden Unternehmen, sofern sie von CREDITREFORM
recherchiert worden sind. Eine anonymisierte Version des ZEW-Gründungspanels ist in
Planung.
Am Institut für Arbeitsmarkt- und Berufsforschung (IAB) der Bundesanstalt für Arbeit in
Nürnberg ist in jüngster Zeit das IAB-Betriebspanel entstanden (vgl. Bellmann, 1997).
Das IAB-Betriebspanel hat als Grundgesamtheit alle Betriebe mit mindestens einem
sozialversicherungspflichtigen Beschäftigten und enthielt in der ersten Welle 1993
knapp 4.500 Betriebe aus dem Westen Deutschlands. Seit der 4. Welle im Jahr 1996
sind zusätzlich ostdeutsche Betriebe enthalten. Momentan wird am IAB an einem ano-
nymisierten public use file gearbeitet, der kürzlich zu Testzwecken im SPSS-Format an
verschieden Wissenschaftler versandt worden ist. Für Auswertungen des IAB-Panels ist
eine sogenannte Schalterstelle (Kontakt: Dr. Arnd Kölling, Email: [email protected])
eingerichtet worden, an die Programme in SPSS, STATA, TSP oder GAUSS geschickt
werden können, die vorher mit dem public use file getestet worden sind.
Weiter zu nennen ist das eher sozialwissenschaftlich-technisch orientierte NIFA-Panel
(NIFA = Neue Informationstechnologien und flexible Arbeitssysteme) an der Ruhr-
Universität Bochum, in dem von 1991 bis 1997 durchschnittlich 2.500 kleinere und mitt-
lere Maschinenbaubetriebe zur Entwicklung von Produktionstechnologien befragt wer-
den (vgl. Widmaier und Hauptmann, 1997). Auch das NIFA-Panel wird in anonymisierter
Form gegen Abschluß eines Nutzungsvertrages an externe Wissenschaftler weiterge-
geben. Der Überlassungsvertrag kann direkt über das Internet beantragt werden
(http://www.pw2.ruhr-uni-bochum.de/projekte/nifa/vertrag.htm).
In der Regel verbietet es sich für einen einzelnen Forscher aus Geldmangel, solche auf-
wendigen Datenerhebungen über längere Zeit selbst durchzuführen. Die Verfügbarkeit
dieser Daten hat aber in den letzten Jahren die Bedeutung der Panelmodelle deutlich
4
erhöht. Zudem lassen sich aus bestehenden Bilanz- bzw. Jahresabschlußdatenbanken
Paneldatensätze konstruieren.
Über die bedeutendste Jahresabschlußdatenbank verfügt zweifelsohne die Deutsche
Bundesbank in Frankfurt. Die Bundesbank verfügt über die Jahresabschlüsse von allen
Unternehmen, die jemals einen Wechsel zum Rediskont eingereicht haben (vgl. Fride-
richs und Sauvé, 1999). Verwertbar sind die Jahresabschlüsse von jährlich etwa 60.000
Unternehmen. An einer möglichen wissenschaftlichen Nutzung wird momentan gear-
beitet. Weiter zu nennen ist die im Rahmen der Deutschen Finanzdatenbank entstande-
ne Jahresabschlußdatenbank Aachen (vgl. Bühler et. al., 1993), die in Einzelfällen und
nur in Auszügen für wissenschaftliche Zwecke zur Verfügung gestellt worden ist.
1.1.3 Weitere Paneldatensätze
Gegenstand von Panelanalysen können aber auch Regionaldaten sein, die sowohl eine
Analyse der Entwicklung verschiedener Regionen der Bundesrepublik als auch eine
Analyse über verschiedene Staaten hinweg ermöglichen. Man kann zum Beispiel die
volkswirtschaftliche Gesamtrechnung der wichtigsten Europäischen Länder als ein Pa-
nel verstehen, bei dem allerdings die Anzahl der Länder eher gering und die Anzahl der
Beobachtungszeitpunkte, zumindest bei vierteljährlichen Beobachtungen, relativ groß
ist. Dies wäre ein Gegenbeispiel zur obigen Aussage über die relative Größe von N
und T .
1.2 Das einfache lineare Modell
In den folgenden Abschnitten werden Schätzverfahren für lineare Paneldatenmodelle
diskutiert. Inzwischen behandeln auch eine Reihe von Lehrbücher und Monographien
Schätzverfahren für Paneldatenmodelle. Als erstes zu nennen sind die Monographie von
Hsiao (1986) und das etwas neuere Lehrbuch von Baltagi (1995). Der aktuelle Stunde
der Wissenschaft ist am umfassendsten im Sammelband von Mátyás und Sevestre
(1996) dokumentiert. Eine Einführung bieten aber die meisten neueren Lehrbücher zur
Ökonometrie wie beispielsweise Greene (1993) in Kapitel 14.
Paneldaten sind wiederholte Beobachtungen identischer statistischer Einheiten wie
Unternehmen, Haushalte oder Personen über die Zeit. Mit ity bezeichnen wir die ab-
5
hängige Variable und mit kitX die k-te unabhängige Variable der Einheit i zum Zeit-
punkt t mit Ni ,,1 …= , Tt ,,1 …= und 1, ,k K= … .
Die Diskussion der Methoden bezieht sich zunächst auf balancierte Panel, d.h. für jedes
Individuum liegt die gleiche Anzahl von Beobachtungen über den gleichen Zeitraum vor,
so daß die Gesamtzahl der Beobachtungen TN ⋅ ist. Wenn 1=N und 1T > ist, haben
wir die üblichen Zeitreihendaten. Alternativ haben wir für 1=T und 1N > einen Quer-
schnitt. Paneldatenmethoden behandeln daher den Fall 1>N und 1>T . In der Regel
wird angenommen, daß N groß ist während T relativ klein ist. Die asymptotische The-
orie wird daher über die beobachteten Individuen N gehen und T wird als endlich und
gegeben betrachten. Wir können diese Daten für jedes Individuum wie folgt in Vektor-
und Matrixform darstellen:
(1.1)
1 21 11 1 1
1 22 22 2 2
1 2
; ;
Ki ii i i
Ki ii i i
i i i
KiT iTiT iT iT
y X X Xy X X X
y X
y X X X
εε
ε
ε
= = =
LL
M MM M O ML
Ni ,,2,1 L=
itε sind die Störgrößen des Modells. Wenn wir die einzelnen Vektoren und Matrizen der
Individuen wiederum in Vektoren gemäß Gleichung (1.2) zusammenfassen,
(1.2)
1 1 1
2 2 2; ;
N N N
y Xy X
y X
y X
εε
ε
ε
= = =
M M M
so läßt sich das Panelmodell in der üblichen Weise als lineares Regressionsmodell mit
K Regressoren gemäß (1.3) darstellen:
(1.3) y X= +β ε mit ′ =β β β( , )1 L K .
Für den Fall zweier Individuen läßt sich dieses Modell wie in (1.4) schreiben:
6
(1.4)
111 1111 11
111 11 1
2
121 2121 21
12 22 2
K
KT TT T
K
K
KT TT T
y X X
y X X
y X X
y X X
ε
βε
β
εβ
ε
= +− − − −− − − − − −
LM MM M
L
MLM MM M
L
.
Man erkennt hier den entscheidenden Unterschied zu den in Ökonometrie II behan-
delten Modell mit scheinbar unkorrelierten Gleichungen (SURE), nämlich die An-
nahme gleicher Koeffizienten für alle Individuen. Im Vergleich dazu lautete das
SUR-Modell wie folgt:
(1.5) 1 1 1 1
2 2 2 2
00
y Xy X
β εβ ε
= +
bzw.
111 1111 11
11
11 11 1
1
21121 2121 21
212 22 2
| 0 0
| 0 0
0 0 |
0 0 |
K
KT TT T
K
K
KKT TT T
y X X
y X X
y X X
y X X
εβ
εββ
ε
βε
= +− − − −− − − − − − − −
L LM MM M M M M
L L
L L MM MM M M ML L
Im Rahmen des einfachen lineare Paneldatenmodells geht es zunächst um eine Schät-
zung des Modells (1.3). Dabei werden insbesondere unterschiedliche Annahmen bzgl.
der Parameter getroffen. Wir unterscheiden Modelle mit gleichen Parametern für alle
Individuen und Modelle, und Modelle deren Parameter über die Zeit oder über Individu-
en variieren.
Die einfachste Methode der Schätzung von Gleichung (1.3) ignoriert den Panelcharakter
der Daten vollständig und schätzt (1.3) gepoolt nach der Kleinstquadratmethode:
(1.6) $ ( )β = ′ ′−X X X y1
Dem liegt die Annahme zu Grunde, daß die Störgrößen unabhängig und identisch ver-
teilt sind mit Mittelwert 0 und konstanter Varianz 2σ für alle Individuen i und Zeitpunkte
t . Das heißt, es besteht weder eine zeitliche Korrelation noch eine Korrelation über
7
Individuen und die Störgrößen sind sowohl über die Zeit als auch über die Individuen
homoskedastisch.
1.3 Das lineare Modell mit festen individuellen Effekten
Das allgemeine lineare Panelmodell mit individuellen Effekten lautet:
(1.7) itiitit ZXy εδβ ++= mit ε α ηit i it= +
mit itX als Matrix erklärender Variablen, die sowohl über die Individuen als auch über
die Zeit variieren und iZ als Matrix erklärender Variablen, die ausschließlich über die
Individuen variieren, aber über die Zeit konstant sind, wie beispielsweise das Ge-
schlecht oder die Größe einer Person oder der Wirtschaftszweig eines Unternehmens.
Die Störgrößen bestehen nun aus zwei Komponenten: einer allgemeinen Komponente
itη und einer individuellen Komponente iα , die ebenfalls über die Zeit konstant ist. Die
Annahmen bzgl. dieser Störgrößen lauten:
(1.8)
[ ]
[ ]
[ ]
2
2
für ,E 0 E
0 sonst
fürE 0 E
0 sonst
E 0 E 0
it it js
i i j
i it it js
i j t s
i j
x
η
α
ση η η
σα α α
α η η
= = = =
=
= =
= =
Dabei ist es durchaus zulässig, daß die Individualeffekte iα mit den unabhängigen Va-
riablen itX korrelieren, d.h. im allgemeinen gilt:
(1.9) .0)E( ≠′ iitX α
Wir wollen zunächst annehmen, daß in Modell (1.7) 0δ = ist, d.h. individuelle Effekte nur
in der Störgröße iα enthalten sind. Im einfachsten Fall des Modells werden die Individu-
aleffekte iα als über die Zeit für jedes Individuum konstant angesehen. Sie sind also
keine Zufallsvariablen. Die Annahme des Modells lautet, daß zwei Beobachtungen des
gleichen Individuums zu verschiedenen Zeitpunkten einander ähnlicher sind als zwei
Beobachtungen unterschiedlicher Individuen zum gleichen Zeitpunkt. Die Individualef-
fekte werden dann als feste Effekte (fixed effects) modelliert (vgl. Hsiao, 1986, Kapitel
8
3.2). Wir schreiben dieses Modell mit Hilfe der 0,1-Variablen itD als Spalten einer Mat-
rix D . Diese NNT × -Matrix D hat in der Spalte i für das jeweils i-te Individuum den
Wert 1 und für alle anderen Individuen den Wert 0 .
(1.10)
1 0 0
1 0 00 1 0
0 1 0
0 0 1
0 0 1
D
=
LM M O M
LL
M M O ML
M M M ML
M M O ML
Das lineare Modell mit festen Effekten lautet dann
(1.11) y X D= + +β α η .
Der Kleinstquadratschätzer der Koeffizienten (ohne konstantes Glied) β der Gleichung
(1.11) läßt sich als KQ-Schätzer des transformierten Modells
(1.12) M y M XD D= +β η
darstellen, d.h.
(1.13) [ ] DDDDIMyMXMXMXM NTDDDDDW ′′−=′′= −− 11 )(mit)()()()(β
DM ist eine (idempotente) Projektionsmatrix, die alle Beobachtungen um den indivi-
duellen Mittelwert über die Zeit bereinigt. Man bezeichnet diesen Schätzer auch als
Within-Schätzer. Für gegebenen Schätzer $βw lassen sich dann die Individualeffekte
wie üblich als $ $α βi i i wy X= − schätzen, wobei iy und iX arithmetische Mittel über die T
Beobachtungen des Individuums i sind.
Gleichung (1.13) ergibt sich auf Grund des Frisch-Waugh-Theorems (vgl. Davidson und
MacKinnon, 1993, Kapitel 1.4) als zweistufiger Schätzer, nämlich zunächst werden die
Variablen y und X auf die Dummy-Variablen D regressiert:
9
(1.14) XBDXybDy ˆˆundˆˆ +=+= .
In einem zweiten Schritt werden die Residuen dieser beiden Gleichungen, die hier mit
Xy ˆundˆ bezeichnet sind, aufeinander regressiert:
(1.15) $ $y X= +β ε .
*Beweis:
Man erhält dieses Ergebnis wie folgt aus dem Frisch-Waugh-Theorem: Zunächst
werden die Normalgleichungen für $α durch Multiplikation von (1.11) mit ′D gebildet
(1.16) ′ = ′ + ′ + ′=
D y D X D D Dβ α ε$ $.0
Danach wird der Schätzer von $α aus diesen Gleichungen
( ) ( ) βα XDDDyDDD ′′−′′= −− 11ˆ in das Modell (1.11) eingesetzt. Es ergibt sich dann:
(1.17) y D D D D y X D D D D X− ′ ′ = − ′ ′ +− −( ) ( )1 1β β ε
mit 1 1ˆ ( ) ( )NTy y D D D D y I D D D D y− −′ ′ ′ ′ = − = −
yT
IIyT
III TNNTN
′−⊗=
′⊗−⊗= ιιιι
11,
wobei ι ein Eins-Vektor der Länge T ist, d.h. )1,,1,1( L=′ι .
Gleichung (1.16) entspricht einem lineare Modell mit Variablen, die in Abweichung von
dem individuellen Mittel gemessen sind:
(1.18) . .( )it i it iy y X X β η− = − +
Ende des Beweises
Es ist offensichtlich, daß die Parameter iα nur für sehr großes T ( )T → ∞ konsistent
geschätzt werden können. Geht man hingegen von einem gegebenen kleinen T und
großer Anzahl der Individuen ( )N → ∞ aus, so nimmt mit N auch die Anzahl der Para-
meter iα zu. Sind die stochastischen Fehler ηit nicht mit den unabhängigen Variablen
10
itX korreliert, d.h. gilt 0)E( =′ ititX η , so sind die Schätzer für β wie im klassischen Reg-
ressionsmodell unverzerrte und beste lineare Schätzer (BLUE).
1.4 Das lineare Modell mit zufälligen individuellen Effekten
Das lineare Modell mit zufälligen Effekten (Random-Effects-Model) der Gleichungen
(1.19) und (1.20)
(1.19) y Xit it it= +β ε
(1.20) ε α ηit i it= +
unterstellt im Gegensatz zum Modell mit festen Effekte, daß die Individualeffekte iα
zwar stochastisch, jedoch mit den erklärenden Variablen itX unkorreliert sind, d.h. es
gilt:
(1.21) 0)E( =′ iitX α
Die beiden Zufallsvariablen iα und itη genügen außerdem den bereits oben in (1.8)
aufgezählten Bedingungen. Zusätzlich nimmt man häufig die Normalverteilung der bei-
den Störgrößen an:
(1.22) 2 2~ (0, ) und ~ (0, )i NTNV NV Iα ηα σ η σ ⋅
Die Gleichungen (1.8) und (1.21) implizieren, daß die Individualeffekte iα eine kon-
stante Verteilung über die Individuen mit Mittelwert 0 und Varianz σα2 besitzen und daß
diese stochastischen iα weder mit den allgemeinen Modellfehlern itη noch mit den er-
klärenden Variablen itX korrelieren. Die Modellfehler η sind, wie gewohnt, weißes
Rauschen. Aus diesen beiden Annahmen läßt sich die Kovarianz-Matrix Σ der Fehler
iε gemäß Gleichung (1.23) ermitteln
(1.23) [ ]
2 2 2 2
2 2 2 22 2
2 2 2 2
E i i TI
η α α α
α η α αη α
α α η α
σ σ σ σσ σ σ σ
ε ε σ σ ιι
σ σ σ σ
+
+ ′ ′∑ = = + =
+
LL
M M O ML
.
11
Dabei ist ι wieder ein T -dimensionaler Eins-Vektor, d.h. ( )′= 1,,1 …ι . In Matrix-
schreibweise läßt sich das Modell (1.23) als
(1.24) y X= +β ε
mit Kovarianzstruktur gemäß (1.25) schreiben:
(1.25) [ ]Ω = ′ = ⊗ ∑ =
∑∑
∑
E I Nεε
0 00 0
0 0 0
LL
M M O M
Dabei ist [ ]∑ = ′E i iε ε die TT × -Matrix der Gleichung (1.23). Man erkennt an (1.25) die
blockdiagonale Struktur von Ω , die es erleichtert die Inverse Ω − −= ⊗ ∑1 1I N zu be-
rechnen. Nach einigen Umformungen findet man für die Cholesky-Zerlegung von 1−Σ ,
d.h. für 21−Σ die Gleichung:
(1.26)
′−
−=∑ − ιιθ
ση TIT
112/1 mit θσ
σ ση
α η=
+
2
2 2T
In (1.26) ist der Parameter θ , der die Anteile von ση2 an der Streuung der individuellen
und allgemeinen Fehler angibt, zu bestimmen. Für gegebene Schätzer von θ erhalten
wir mittels der verallgemeinerten Kleinstquadratmethode eine effiziente Schätzung
des Random-Effekt-Modells:
(1.27) $ ( )β = ′ ′− − −X X X yΩ Ω1 1 1
bzw. die Kleinstquadrateschätzung des mit 21−
∑ transformierten Modells :
(1.28)1 1 1
2 2 2i i iy X β ε
− − −∑ = ∑ + ∑
Eine andere Darstellung geht auf Wansbeek und Kapteyn (1982, 1983) zurück. Dabei
wird Ω wie folgt zerlegt (vgl. Baltagi, 1995):
(1.29)2 2 2
2 2 2 2 21 1
1 1( ) ' '
mit
N N T
D D
T I I IT T
P M T
α η η
η α η
σ σ ιι σ ιι
σ σ σ σ σ
Ω = + ⊗ + ⊗ −
= + = +
12
( ) DDDDIM NTD ′′−= −1 bezeichnet die bereits oben eingeführte Projektionsmatrix, die
um die individuellen Mittelwerte über die Zeit bereinigt, und
( ) DDDDMIP DNTD ′′=−= −1 , die dazu orthogonale Projektionsmatrix, die die indivi-
duellen Mittelwerte erzeugt. Daraus folgt wegen der Idempotenz von DP und DM (d.h.
z.B. ′ =P P PD D D ): Ω − = +1
12 2
1 1σ ση
P MD D bzw. 1/2
1
1 1D DP M
ησ σ−Ω = + .
Der verallgemeinerte KQ-Schätzer ergibt sich durch Transformation des Modells mit
σ σ ση ηΩ− = +1 21
/ ( / )M PD D und anschließender KQ-Schätzung (Fuller and Battese,
1973). Dies läuft auf folgende Datentransformation hinaus: y y* /= −σηΩ 1 2 enthält die
Elemente y yit i− −( )1 θ .
Eine alternative Darstellung (Baltagi, 1995) geht von den folgenden alternativen Trans-
formationen des Modells aus, die als eine Gleichung zusammengefaßt werden:
(1.30)M y
PyM X
PXMP
D D D
=
+
β
εε
mit 1 1 1
N DP I PT NT NT
ιι ιι ιι′ ′ ′= ⊗ − = −%% %%
und ι% als NT-dimensionalem Einsvektor.
Die transformierte Störgröße hat Mittelwert null und Kovarianzmatrix
Ω =
σσ
η2
12
00M
PD .
Der verallgemeinerte KQ-Schätzer läßt sich dann als
(1.31)
′+′
′+′=
−
PyXyMXPXXXMX DD 21
2
1
21
2
1111ˆσσσσ
βηη
bzw. als gewogener Durchschnitt des Within- und des Between-Schätzers schreiben:
(1.32) ( ) ( )1 12 2ˆ ˆ ˆD D D w D D D BX M X XP X X M X X M X X P X X P Xβ θ β θ β
− −′ ′ ′ ′ ′= + ⋅ + + ⋅
Dabei ist das Streuungsverhältnis 2 2 21/ηθ σ σ= . Der GLS-Schätzer enthält für 0θ = den
Within-Schätzer und für θ → ∞ den Between-Schätzer als Spezialfall. Der Within-
Schätzer bereinigt um die individuellen Mittelwerte, d.h. berücksichtigt wird nur die Vari-
13
ation innerhalb eines Individuums über die Zeit, nicht aber die Variation zwischen den
Individuen. Der Between-Schätzer hingegen basiert nur auf der Variation der individu-
ellen Mittelwerte zwischen den Individuen.
Wir betrachten im folgenden zunächst den Schätzer des über alle Perioden t gemittel-
ten Modells der Gleichung (1.19):
(1.33) . .i iy X β= mit . .1 1
1 1und
T T
i it i itt t
y y X XT T= =
= =∑ ∑
In Matrixschreibweise können wir diese Mittlung mit Hilfe der oben beim Fixed-Effekt-
Modell definierten Dummy-Variablen-Matrix D wie folgt schreiben:
(1.34) 1 1mit ( )D D D D NP y P X P P D D D D I
Tε ιι−′ ′ ′= + = = ⊗
Da DP idempotent ist, d.h. es gilt ′ =P P PD D D , ist der Kleinstquadratschätzer dieser
Gleichung (1.34) der Between-Schätzer:
(1.35) 1ˆ ( )B D DX P X X P yβ −′ ′=
Man erkennt an der Struktur des Between-Schätzers, daß es sich um einen zweistufigen
Kleinstquadratschätzer mit den Dummy-Variablen für die Individuen als Instrument-
variablen handelt. Für großes T ist dieser Schätzer relativ robust gegenüber Meßfeh-
lern in den X - Variablen, solange für die Instrumentvariablen die Orthogonalitätsbedin-
gungen erfüllt sind. Während der Between-Schätzer dieses über alle Perioden gemit-
telte Modell schätzt, schätzt der Within-Schätzer des Fixed-Effekt-Modells gerade das
Modell der Abweichung der einzelnen Beobachtungen von diesen Mittelwerten. Insofern
vernachlässigt der Between-Schätzer gerade die Information der Daten, die der
Within-Schätzer benutzt. Dies kommt formal in den Transformationsmatrizen DP und
DM zum Ausdruck, denn es gilt D D NTM P I+ = .
Der KQ-Schätzer (1.6) läßt sich ebenfalls als gewogene Summe des Between- und
des Within-Schätzers darstellen:
(1.36)
1
1
1 1
ˆ ( )
( ) ( )ˆ ˆ( ) ( )
D D
D w D B
X X X y
X X X M y X P y
X X X M X X X X P X
β
β β
−
−
− −
= ′ ′
= ′ ′ + ′
= ′ ′ ⋅ + ′ ′ ⋅
14
mit yPXXPXyMXXMX DDBDDw ′′=′′= −− 11 )(ˆund)(ˆ ββ
Dieser Schätzer wird in der Paneldatenökonometrie als gepoolter Kleinstquadrat-
schätzer bezeichnet. Das Problem dieses gepoolten Kleinstquadratschätzers ist, daß
alle Beobachtungen das gleiche Gewicht erhalten. Dieses Verfahren ist nicht ge-
nerell optimal, weil eine zusätzliche Beobachtung für eine Person, die bereits in der
Stichprobe enthalten ist, vermutlich weniger Information hinzufügt als eine zusätzliche
Person. Um einen optimalen Schätzer im Sinne des Aitken-Schätzers zu erhalten,
muß man daher die unterschiedliche Gewichtung (Heteroskedastie) der Beobachtungen
gemäß der verallgemeinerten Kleinstquadrateschätzung berücksichtigen.
Bezeichnen wir mit $uw die Residuen der Within-Schätzung und mit Bu die Residuen der
Between-Schätzung, so ergeben sich folgende (ineffizienten) Schätzer für die Residuen-
Varianzen 22Bσση und , die für die zweistufige verallgemeinerte KQ-Schätzung benötigt
werden (vgl. Hsiao, 1986):
(1.37) 2 ˆ ˆˆ w wu u
NT K Nησ′
=− −
undKN
uuˆ BB
−
′=2
Bσ sowie $ $$
σ σσ
αη2 22
= −B T
Hinweis:
In der Schätzung der Residuen-Varianz $ση2 wird berücksichtigt, daß die Anzahl der ge-
schätzten Parameter nicht nur die Anzahl der Spalten in der Matrix der erklärenden Va-
riablen X ist, sondern daß ebenfalls die N Individualeffekte als feste Parameter ge-
schätzt wurden. Das Programm einer Kleinstquadrateschätzung weist demgegenüber
einen Schätzfehler aus, der die Schätzung der Individualeffekte in der Berechnung der
Freiheitsgrade nicht berücksichtigt wie in folgender Formel $ $ $σ computer
w wu uNT K
2 =′
−
Man muß daher um die korrekte Anzahl der Freiheitsgrade zu berücksichtigen, die fol-
gende Transformation verwenden: $ $σ ση2 2=
−− −
⋅NT K
NT N K computer
Mit Hilfe der drei Schätzungen der Residuen-Varianzen gemäß (1.37) kann θ gemäß
Gleichung (1.26) geschätzt und dann die verallgemeinerte Kleinstquadrateschätzung
durchgeführt werden.
15
Ende des Hinweises.
Diese verallgemeinerte Kleinstquadrateschätzung läuft darauf hinaus, daß man die Be-
obachtungen von ity und itX jeweils mit dem Gewicht $θ mal Mittelwert der Variablen
für das jeweilige Individuum transformiert gemäß den Gleichungen
(1.38) ~ $. .y y y yit it i i= − + θ
(1.39) ~ $. .X X X Xit it i i= − + θ .
Das so transformierte Modell kann mit Hilfe der Kleinstquadratmethode geschätzt wer-
den. Weitere Schätzverfahren für Modelle mit zufälligen Effekten findet man in Hsiao
(1986), Kapitel 3.3.
1.5 Das allgemeine Modell mit festen Effekten
Wir betrachten nochmals das Modell (1.7), in dem neben dem individuellen Effekt iα
andere individuelle Effekte δiZ auftreten. Bezeichnen wir mit itW die Matrix der
Regressoren in Gleichung (1.7) [ ]W X Zit it i= , so wird die Annahme
(1.40) [ ]E Wit it′ ≠ε 0
getroffen. Insbesondere wird angenommen, daß die individuellen unabhängigen Vari-
ablen iZ mit iα korrelieren. Die Verletzung dieser Orthogonalitätsbedingung hat wichti-
ge Konsequenzen. Hätten wir nur eine Beobachtungsperiode, daß heißt eine Quer-
schnittsregression gemäß Gleichung
(1.41) y X Zi i i i1 1 1= + +β δ ε ,
so folgt aus der Annahme(1.40), daß die Kleinstquadrateschätzung verzerrt ist. Die Hö-
he der Verzerrung hängt im wesentlichen davon ab, wie hoch die α i mit den Regressso-
ren itW gemäß Gleichung (1.42) korrelieren
(1.42) α πi iW error= +1 .
Man kann zeigen, daß der Probability-Limit der Koeffizienten $β um den ent-
sprechenden Koeffizienten des Vektors π verzerrt ist d.h.
16
(1.43) 222ˆplim πββ +=
Man kann diese Korrelation der Residuen mit den erklärenden Variablen dadurch elimi-
nieren, daß man erste Differenzen für alle Variablen bildet:
(1.44) y y X X Z Zi i i i i i i i2 1 2 1 2 1− = − + − + −( ) ( ) ( )β δ ε ε
∆ ∆ ∆ ∆y X Z= + +β δ ε
Durch diese zeitlichen Differenzen entfallen die individuellen Effekte iZ und iα , so daß
das Modell der Gleichung (1.45) gilt:
(1.45) ∆ ∆ ∆y X= +β η
Für diese Gleichung sind die Orthogonalitätsbedingungen der Kleinstquadratmethode
gemäß Gleichung (1.46)
(1.46) [ ] 0E =∆′∆ ηX
erfüllt.
1.6 Feste versus zufällige Effekte
Zu ähnlichen Resultaten kommt man, wenn man im allgemeine Random-Effekt-Modell
eine Korrelation der erklärenden Variablen mit den individuellen Effekten zuläßt, d.h.
wenn die Annahme
(1.47) E( ) 0it iX α′ ≠
gilt. Mundlak (1978) hat gezeigt, daß in diesem Fall der Random-Effekt-Schätzer inkon-
sistent wird, während der Fixed-Effekt-Schätzer weiterhin seine Konsistenz behält. Da-
her wird in der neueren Paneldatenliteratur eine Modell mit zufälligen Effekten und Kor-
relation zwischen den Effekte und den erklärenden Variablen gemäß Gleichung (1.47)
auch als Modell mit fixen Effekten bezeichnet.
Der wesentliche Unterschied zwischen dem Fixed- und dem Random-Effekt-Modell er-
gibt sich daher aus den unterschiedlichen Annahmen bzgl. der Korrelation zwischen den
zeitinvarianten Individualeffekten und den Residuen bzw. den erklärenden Variablen und
den Individualeffekten. Wenn man davon ausgeht, daß das Random-Effekt-Modell rich-
tig ist, so wird der Fixed-Effekt-Schätzer für die Parameter der zeitvariablen Regresso-
17
ren trotzdem konsistente Schätzer liefern. Insofern scheint es, als ob der Fixed-Effekt-
Schätzer vorzuziehen sei. Viele empirische Forscher finden die Fixed-Effekt-Schätzer
überzeugender als die Random-Effekt-Schätzer. Diese Differenz scheint die Konse-
quenz der vernünftigen Überzeugung zu sein, daß es unwahrscheinlich ist, daß die Indi-
vidualeffekte nicht mit den Regressoren itX korrelieren. Während vermutlich die Ran-
dom-Effekt-Schätzer positiv verzerrt sind, gibt es gewisse Argumente dafür, daß die
Fixed-Effekt-Schätzer negativ verzerrt sind. Dies ergibt sich insbesondere dann, wenn
geringe Meßfehler in einer der individuellen Statusvariablen iZ einen großen Einfluß auf
das Varianz-Verhältnis θ haben. Da der Random-Effekt-Schätzer für β ein Maximum-
Likelihood-Schätzer ist, ist er konsistent und effizient, wenn die individuellen Effekte
nicht mit den unabhängigen Variablen itX korrelieren. Der Fixed-Effekt-Schätzer für β
ist in diesem Fall zwar konsistent, aber nicht effizient, da er die Information des Bet-
ween-Schätzers vernachlässigt. Korrelieren die individuellen Effekte mit den unabhän-
gigen Variablen, ist der Fixed-Effekt-Schätzer konsistent und effizient und der Random-
Effekt-Schätzer inkonsistent.
1.6.1 Der Hausman-Wu-Test auf Random versus Fixed Effects
Eine Frage, die sich aus der bisherigen Analyse ergibt, lautet: Sind die beiden Schätz-
verfahren signifikant verschieden für eine gegebene Anwendung? Eine einfache Mög-
lichkeit dies zu testen, ist der Hausman-Wu-Test, der auf der Differenz der beiden
Schätzer gemäß Gleichung (1.48) beruht:
(1.48) )ˆˆ()()ˆˆ( 1FEREREFEFEREH ββββ −Σ−Σ′−= −
REFE Σ−Σ bezeichnet dabei die Differenzmatrix der Kovarianzmatrizen des Fixed-Effect-
und des Random-Effect-Schätzers. Asymptotisch ist diese Statistik χ2 verteilt mit K
Freiheitsgraden ( =K Anzahl der Spalten in der Matrix itX ), wenn die Nullhypothese
lautet, daß das Random-Effekt-Modell korrekt ist, d.h. daß die individuellen Effekte nicht
mit den unabhängigen Variablen korrelieren. Der Hausman-Wu-Test beruht auf dem
Vergleich eines unter der Nullhypothese konsistenten und effizienten, aber unter der
Gegenhypothese inkonsistenten Schätzers, mit einem unter der Null- und Gegenhypo-
18
these konsistenten Schätzer. Man kann diesen Hausman-Test numerisch durch eine
einfache Regression gemäß Gleichung
(1.49) y X X errorβ γ= + +%% %%
und einen F-Test auf Signifikanz der Parameter γ in Gleichung (1.49) durchführen. Da-
bei bezeichnen ~y und ~X die transformierten Variablen des Random-Effekt-Modells
gemäß Gleichung (1.38) und (1.39) und ~~X die transformierten Variablen des Fixed-
Effect-Modells mit ~~X X Xit it i= − .
Es wird also die Hypothese getestet, ob die Vernachlässigung der Fixed-Effects ( 0=γ )
in dem Random-Effekt-Modell einen Einfluß auf die Konsistenz der Random-Effekt-
Schätzer hat. Die Annahme der Nullhypothese 0=γ bedeutet aber nicht, daß das Ran-
dom-Effekt-Modell vorzuziehen ist, sondern lediglich, daß beide Verfahren sich nicht
signifikant unterscheiden. Dies mag daran liegen, daß nicht genug Variationen in den X-
Variablen vorliegen, um zwischen beiden Modellen zu diskriminieren. Praktische Prob-
leme treten auf, wenn die Mittelwerte von zwei Individuen sich über die Zeit nicht unter-
scheiden. In diesem Fall ist die Differenzmatrix der Kovarianzmatrizen REFE Σ−Σ singu-
lär. Der Hausman-Test läßt sich jedoch ohne weiteres anwenden, wenn man in der
Teststatistik statt der inversen Matrix die Verallgemeinerte Inverse verwendet. Die An-
zahl der Freiheitsgrade K entspricht in diesem Fall dem Rang der Differenzmatrix.
1.6.2 Test auf fixe Effekte
Wie im klassischen Regressionsmodell kann man auf Signifikanz aller Fixed Effekte,
d.h. H N0 1 2 1 0:α α α= = = =−L mit Hilfe eines F-Tests testen. Die Statistik
(1.50) Fu u u u Nu u N T N K
R R=′ − ′ −′ ⋅ − −
( $ $ $ $) / ( )$ $ / ( )
1
ist unter der Nullhypothese, daß keine Effekte vorhanden sind, F(N-1, N.T-N-K)-verteilt.
Dabei sind $ $′u uR R die Residuen einer OLS-Schätzung unter H0 : α i = 0 für alle i und $ $′u u
die Residuen der Within-Schätzung (mit α i ≠ 0).
19
1.7 Heteroskedastie-konsistente Schätzer der Standardfehler im Fixed-
Effekt-Modell
Arellano (1987) hat in Anlehnung an White (1980) empfohlen, die Standardfehler des
Fixed-Effect-Schätzers mit einer geschätzten Kovarianzmatrix zu berechnen, die
auch konsistent ist, wenn die Fehlergrößen heteroskedastisch sind, um die strenge An-
nahme der Homoskedastizität aufzuweichen.
Wenn ii Xy~
und~ die transformierten Daten des Within-Schätzers und ~ui die zugehö-
rigen geschätzten Residuen sind, ~ ~ ~ $u y Xi i i w= − β mit i N= 1 2, ,L , so ist
(1.51) ~ ~ ~ ~ ~VN
X u u Xi
N
i i i i= ′ ′=∑1
1
eine konsistente Schätzung der Kovarianzmatrix der Momente, die die Orthogona-
litätsrestriktionen bilden, ohne daß die Kovarianzmatrix der Störgrößen ~ηi der Within-
Regression selbst geschätzt wird. In Anlehnung an den KQ-Schätzer des linearen
Within-Modells gilt
(1.52) ~ ~y Xi i i= +β η
(1.53) $ ( ~ ~) ~ ~β β η− = ′ ′−X X X i1
und
(1.54) 1 1ˆ ˆ( )( ) ( ) ( )( )i iE X X E X X X Xβ β β β ηη− −′ ′ ′− − = % % % % % %% % mit ~ ~ ~ ~ .′ = ′=∑X X
NX Xi i
i
N1
1
Statt E Ii i( ~ ~ )η η σ′ = 2 anzunehmen, wird E X Xi i( ~ ~ ~ ~)′η η durch ~V geschätzt.
Die heteroskedastie-konsistenten Schätzfehler, die in der Literatur häufig fälschli-
cherweise als robuste Schätzfehler bezeichnet werden, lauten dann
(1.55) E X XN
X u u X X Xi i i ii
N
( $ )( $ ) ( ~ ~) ~ ~ ~ ~ ( ~ ~)β β β β− − ′ = ′ ′ ′
′−
=
−∑1
1
11
20
1.8 Beispiel zur Schätzung von Modellen mit festen und zufällige Effekten
Wir verwenden das aus der SUR-Schätzung (siehe Ökonometrie II) bekannte Beispiel
der Investitionsfunktion jetzt aber für insgesamt 20 Firmen:
(1.56) 1 2
1, ,20;
1935, ,1954it it it it
iI F C u
tα β β
== + + +
=L
L
Ii t = reale Bruttoinvestition der Firma i in Periode t
Fi t = realer Börsenwert der Firma i in Periode t
Ci t = realer Kapitalstock der Firma i in Periode t
Es ergeben sich folgende Schätzungen (Standardfehler in Klammern):
Tabelle 1.1: Vergleich der Schätzer für das einfache lineare Modell
Methode $β1$β2
θ
OLS 0.11556
(0.00584)
0.23068
(0.02548)
0
Between 0.13465
(0.02875)
0.03203
(0.19084)
∞
Within 0.11012
(0.01186)
0.31007
(0.01735)
1
GLS 0.01049
(0.01049)
0.30811
(0.01718)
0.861224
Man sieht, daß die Schätzung von θ näher an 1θ = als an 0θ = liegt, d.h. der GLS-
Schätzer liegt näher am Within-Schätzer. Dies wirkt sich hier insbesondere auf den
Schätzer des Parameters 2β aus.
1.9 Das Modell mit individuellen und zeitlichen Effekten
Wallace und Hussain (1969), sowie Nerlove (1971) haben die Störgrößenstruktur des
obige Modells wie folgt verallgemeinert:
(1.57) u i N t Tit i t it= + + = =α λ η ; , , , , , .1 1L L
21
Dabei ist tλ eine über die Individuen invariante Fehlerkomponente, die nur über die
Zeit variiert. tλ könnte z.B. zeitliche Besonderheiten wie Streiks, Ölembargos etc. er-
fassen. In Matrixschreibweise lauten die Störgrößen:
(1.58) u D Z= + +α λ η mit undN T N TD J i Z i I= ⊗ = ⊗ .
Es gilt: TNTN IJZZZZIJZZ ⊗=′′⊗=′ −1)(und .
Die Projektionsmatrix ( )J IN T⊗ mittelt zu jedem Zeitpunkt über die Individuen, d.h.
( )
/
/
.
.
.
J I u
uu
u
u N
u N
N T
T
iti
N
iTi
N⊗ =
=
=
=
∑
∑
1
2 1
1
M M
1.9.1 Fixed-Effect-Schätzung
Das Fixed-Effekt-Modell betrachtet iα und tλ als zu schätzende Parameter. Wallace
und Hussain (1969) haben gezeigt, daß folgende „Within“-Transformation sowohl iα als
auch tλ eliminiert.
Mittlung zu einem Zeitpunkt über die Individuen ergibt
(1.59) . . .1
mit 0N
t t t t ii
y X β λ η α=
= + + =∑ .
Mittlung für ein Individuum über die Perioden ergibt
(1.60) . . . mit 0i i i i tt
y X β α η λ= + + =∑ .
Beide Mittlungen zusammen ergeben
(1.61) ( ) ( ) ( )............ ηηηηβ +−−++−−=+−− tiittiittiit XXXXyyyy
Eine KQ-Schätzung von (1.61) gibt den Within-Schätzer dieses zweifachen Fehler-
komponenten-Modells, wobei sich $αi und tλ wie folgt ergeben:
(1.62) $ ( ) $. .. . ..α βi i iy y X X= − − −
22
(1.63) βλ ˆ)(ˆ...... XXyy ttt −−−=
Der Nachteil dieses Fixed-Effect-Modells liegt in der großen Zahl von ( 1) ( 1)N T− + −
Dummy-Variablen, die die Zahl der Freiheitsgrade drastisch reduzieren.
1.9.2 Test auf feste Effekte
Ähnlich wie in dem einfachen Fehlerkomponenten-Modell läßt sich die Hypothese
H N0 1 1 0:α α= = =−L und λ λ1 1 0= = =−L T
testen. Man muß lediglich die Freiheitsgrade der F-Statistik anpassen. Man kann aber
auch die bedingten Hypothesen
H N2 1 1 0:α α= = =−L gegeben λt ≠ 0 bzw.
H T3 1 1 0:λ λ= = =−L gegeben α i ≠ 0 testen.
Die $ $′u uR R der F-Statistik für den Test von H2 basiert auf der Regression
(1.64) y y X X u uit t it t it t− = − + −. . .( ) ( ).β
Für den Test von H3 ergibt sich $ $′u uR R aus der Within-Regression
(1.65) . . .( ) ( ).it i it i it iy y X X u uβ β− = − + −
1.10 Dynamische Paneldatenmodelle
Paneldaten sind besonders geeignet, die dynamischen Anpassungsprozesse im öko-
nomischen Verhalten der Wirtschaftssubjekte zu analysieren. Auf der anderen Seite
bereiten die Individualeffekte des Panel-Modells besondere Probleme bei der Schät-
zung dynamischer Gleichungen. Dieses Problem wird dadurch gelöst, daß man die Indi-
vidualeffekte durch Filterung der Gleichung eliminiert. Das typische dynamische Panel-
Modell ist in Gleichung gegeben
(1.66) 21 ; ~ (0, )it it it i it ity y x N εδ β α ε ε σ− ′= + + + mit 1, ,i N= … und 1, ,t T= … .
Dabei sind die Individualeffekte iα Zufallsvariablen, die entweder mit den unab-
hängigen Variablen itx korrelieren (Fixed-Effekt-Modell) oder nicht (Random-Effekt-Mo-
23
dell). Sie haben eine konstante Varianz σα2 , d.h. iα ist i.d.R. normalverteilt mit Mittelwert
0 und Varianz σα2 . Die Vektoren itx enthalten zunächst die exogenen Variablen, so daß
0)E( =′ ititx ε ist. Aufgrund der Annahme eines weißes Rauschens für die Störgröße itε
gilt dann entsprechend die Unabhängigkeit zwischen den verzögerten endogenen Vari-
ablen und ε i t, d.h. E yit it( )− =1 0ε .
Als Fixed-Effekt-Modell können wir Gleichung (1.66) wiederum in Form einer Matrixdar-
stellung gemäß Gleichung (1.67) schreiben, wobei die Individualeffekte über Dummy-
Variablen in der Matrix D dargestellt werden.
(1.67) y y X D= + + +−1δ β α ε
mit
1 1
2 2und
i
ii
N iT
y yy y
y y
y y
= =
M M ;
1 1
2 2mit
i
ii
N iT
X xX x
X X
X x
′ ′ = = ′
M M
1, 1 0
2, 1 11 , 1
, 1 , 1
und
i
ii
N i T
y yy y
y y
y y
−
−− −
− −
= =
M M
1
2
11
mit und
1
N
N
D I i i
αα
α
α
= ⊗ = =
MM .
1.10.1 Differenzenfilterung und Instrumentvariablen-Schätzer
Anderson und Hsiao (1981,1982) haben vorgeschlagen, in Modell (1.66) bzw. (1.67)die
individuellen Effekte αD durch Bildung erster Differenzen zu eliminieren. Diese Filte-
rung der Individualeffekte läßt sich mit Hilfe von Gleichung (1.68) darstellen wobei F die
Differenzenfiltermatrix bezeichnet.
(1.68) Fy Fy FX F= + +−1δ β ε
24
mit
−
−−
=⊗=
1100
0011000011
und
LLMM
LL
TTN FFIF
Dabei ist TF eine ( )TT ×−1 -dimensionale Matrix. Für diese Definition von F gilt die
Beziehung 0FD = , d.h. die Individualeffekte werden durch die Filtermatrix eliminiert.
Allerdings muß für die Eliminierung der Individualeffekte ein Preis in Form einer Moving
Average-Struktur der Störgrößen εF gezahlt werden. Eine konsistente und effiziente
Schätzung muß daher diese Fehlerstruktur berücksichtigen. Wir bezeichnen die Schät-
zer der Gleichung (3) mit F als Differenzenoperator als Differenzenschätzer. Eine
weitere Konsequenz der Filterung ergibt sich daraus, daß F y y yT i it i t, ,− − −= −1 1 2 mit
FT it it itε ε ε= − −1 korreliert, weil 1−ity von 1−itε abhängt. Anderson und Hsiao (1981)
empfehlen daher 2−ity als Instrumentvariable bei der Schätzung von Gleichung (1.68) zu
verwenden. Arellano und Bond (1991) empfehlen verallgemeinernd die Verwendung der
folgenden blockdiagonalen Instrumentvariablen Matrix iW , die alle Orthogonalitäts-
restriktionen nutzt:
(1.69)
0 1
0 1, 1
0 2 1
[ , , , ] 0 00 [ , , ]
0 [ , , , ]
i i iT
i i i iTi
i iT i iT
y x xy y x x
W
y y x x−
′ ′ ′ ′ = ′ ′
L LL
M ML L L
Um eine effiziente Schätzung von Gleichung (1.67) zu gewährleisten, wird Gleichung
(1.68) zunächst mit der Matrix W gemäß Gleichung (1.70) multipliziert
(1.70) ′ = ′ + ′W Fy W FX W Fε
mit ).,(und)(,],[ 11 βδγ =′=′′′= − XyXWWW NL
Die Struktur der Störgrößen in Gleichung (1.70) wird jetzt über einen verallgemeinerten
Instrumentvariablenschätzer gemäß Gleichung (6) berücksichtigt
(1.71) [ ]( ) [ ]11 1ˆ ( ) ( )N T T N T TX F W W I F F W WFX X F W W I F F W W Fyγ
−− −′ ′ ′ ′ ′ ′ ′ ′ ′ ′= ⊗ ⋅ ⊗ .
25
Die verallgemeinerte Instrumentvariablenschätzung gemäß Gleichung (1.71) ist nicht
eindeutig, da die Wahl der Instrumentvariablen gemäß Gleichung (1.69) nicht eindeutig
ist. Wählt man andere Instrumente verändert sich der Schätzer.
Wenn man bei der Schätzung der Gleichung (1.67) auf die Verwendung von Instrumen-
ten verzichtet, d.h. W durch eine TN ⋅ -dimensionale Einheitsmatrix ersetzt NTIW = , so
ist der verallgemeinerte Instrumentvariablenschätzer identisch mit einem Aitkenschätzer
der Gleichung (1.67) und damit auch identisch mit einer Kleinstquadrateschätzung der
Gleichung:
(1.72) [ ]y y X=
+−1
δβ
ε
weil [ ]′ ⊗ ′ =−
F I F F F IN T T NxT( )1
gilt.
Mit anderen Worten: Die Berücksichtigung der inversen Kovarianzstruktur in Gleichung
(1.71) macht gerade die Moving-Average-Struktur der Störgrößen in Gleichung (1.70)
rückgängig, die dort durch Anwendung der Filtermatrix F entstanden ist. Gleichung
(1.72) und Gleichung (1.67) unterscheiden sich nun aber dadurch, daß in Gleichung
(1.72) die Individualeffekte eliminiert sind. Die Gleichung (1.72) ist in diesem Sinne fehl-
spezifiziert, d.h. man filtert zunächst die Individualeffekte heraus und verwendet dann
eine Variablentransformation, die die Effekte der Filterung auf die Störgröße eliminiert,
ohne daß die Individualeffekte in dieser neuen Gleichung wieder auftauchen. Es ist die
Frage, ob dieses ein vernünftiges Vorgehen für die Schätzung von Gleichung (1.67) ist.
Eine Alternative zu der Instrumentvariablenschätzung (1.71) besteht darin, daß man nicht
von weißem Rauschen ausgeht, sondern die Kovarianzstruktur der Störgröße itε in
Gleichung (1.67) offenläßt. Man muß dann in Gleichung (1.71) die mit den Instrumentva-
riablen gewichtete Kovarianzstruktur in anderer Weise bestimmen. Ein gängiges Ver-
fahren geht auf White zurück, der den Ausdruck in eckigen Klammern in Gleichung
(1.71) durch folgenden Term ersetzt:
(1.73) ∑=
′′N
iiTiiTi WFFW
1
'ˆˆ εε
26
ε sind dabei die Residuen der ersten Stufe der Schätzung, in der wie vorher beschrie-
ben vorgegangen wurde.
Ein verallgemeinerter Instrumentvariablenschätzer der die Fehlergrößenstruktur berück-
sichtigt entspricht den linearen Fall eines Verallgemeinerten Momentenschätzers bzw.
GMM-Schätzers von Hansen (1982) der von Arellano und Bond (1991) auf Paneldaten-
modelle übertragen worden ist. Der Schätzer (1.71) ist nach Arellano und Bond (1991)
ein einstufiger GMM-Schätzer und der Schätzer, der allgemeinere Strukturen der Feh-
lergrößen gemäß (1.73) zuläßt ein zweistufiger GMM-Schätzer. Wichtig ist, daß die
Schätzfehler des zweistufigen GMM-Schätzers die wahren Schätzfehler unterschätzen.
Daher sollten immer zusätzlich die Schätzfehler des einstufigen GMM-Schätzers aus-
gewiesen werden. Die Berechnung der Schätzfehler kann man leicht in Arellano und
Bond (1991) oder Janz (1997) nachlesen.
1.10.2 Differenzenschätzer versus Within-Schätzer
Differenzen- und Within-Schätzer unterscheiden sich im wesentlichen darin, wie die Indi-
vidualeffekte iα geschätzt werden. Der Within-Schätzer schätzt in Gleichung (1.67) die
Individualeffekte durch Mittlung über alle T Beobachtungen für das Individuum i gemäß
Gleichung (1.74) und substituiert $αi in Gleichung (1.66) bzw. (1.67). Breitung und Meyer
(1994) haben einen Differenzenschätzer gemäß Gleichung (1.75) vorgeschlagen, der
die erste Beobachtung benutzt, um iα zu schätzen:
(1.74) y y Xi i i i i= + ′ + +−, $1δ β α ε
(1.75) y y Xi i i i, , , $1 0 1 1= + ′ + +δ β α ε
Hierbei handelt es sich um eine Einpunktschätzung der Individualeffekte. Glei-
chung (1.67) läßt sich dann mit Hilfe der Filtermatrix BF wie in Gleichung (1.68) schrei-
ben:
(1.76) 1
1 1 0 ...01 0 1 ...0
mit
1 0 0 ...1
B B B B BF y F y F X F Fβ ε−
− − = + ′ + = −
M .
27
Die Differenzierung in Gleichung (1.68) gemäß Anderson und Hsiao (1981, 1982) ergibt
sich in einfacher Weise aus Gleichung (1.76), indem wir in Gleichung (1.76) erste Diffe-
renzen bilden. Dadurch wird deutlich, daß die implizite Schätzung der Individualeffekte in
Gleichung (1.68) ebenfalls eine Einpunktschätzung ist, d.h. es werden bei der Schätzung
der Individualeffekte nicht alle T Beobachtungen wie beim Within-Schätzer, sondern nur
jeweils eine Beobachtung verwendet. Dies ist der Preis, den man dafür zu zahlen hat,
daß es genügend Instrumente bei der Schätzung der übrigen Parameter des Modells
gibt. Der Within-Schätzer wirft demgegenüber ein anderes Problem auf, nämlich die
Inkonsistenz der Schätzung von β .
Zur Illustration sei ein einfaches autoregressives Modell ohne exogene Variablen be-
trachtet:
(1.77) , 1 mit 1, ,it i t i ity y t Tβ α ε−= + + = L
Als KQ-Schätzer ergibt sich
(1.78) $ ( )( )
( ),
,β =
∑ ∑ − −
∑ ∑ −= = −
= = −
iN
tT
it i i t i
iN
tT
i t i
y y y y
y y1 1
11
0
1 1 10 2 .
Der Term y yit i− 1 ist mit y yi t i, − −10 auch dann korreliert, wenn 0β = gilt, da beide Ter-
me mit T ytT
it−
=−∑111 eine gemeinsame Komponente enthalten. Für 0β = und N → ∞
konvergiert der um 1N erweiterte Zähler in (1.78) gegen
(1.79) 2
1
1
01,
1
)1(11E εσεεεε
TT
TT
T
t
T
jijti
T
jijit
−−=
−
−∑ ∑∑
=
−
=−
=
und der Nenner gegen
(1.80) 2
1
2
01, )1(
1E εσεε −=
−∑ ∑
= =− T
T
T
t
T
jijti .
Daraus ergibt sich die asymptotische Verzerrung von 1T− .
Für beliebige Werte von β hat Nickel (1981) gezeigt, daß für die asymptotische Verzer-
rung der KQ-Schätzung gilt
28
(1.81)1
)1(1
1)1)(1(
21
)1(1
11
1)ˆ(plim
−
∞→
−
−−
−−−
−
−−
−+
−=−β
ββ
ββ
ββββ
TTTT
TT
N.
Man bezeichnet die asymptotische Verzerrung gemäß (1.81) in der Literatur auch als
Nickel-Bias. Der autoregressive Parameter wird systematisch mit der Ordnung )( 1−TO
unterschätzt. Für große Werte von T kann die Verzerrung mit ( )β+−− − 1)1( 1T appro-
ximiert werden (vgl. Nickell 1981). Ridder und Wansbeck (1990) leiten die Verzerrung
auf eine andere Weise her und geben auch die Formel für die asymptotische Verzer-
rung in einem dynamischen Modell mit exogenen Variablen an. Diese Ergebnisse sind
jedoch nur anwendbar, wenn die Störgrößen itε stationär sind. Dies impliziert, daß der
Prozeß bereits unendlich lange unter unveränderten Bedingungen läuft. Sevestre und
Trognon (1985) leiten die asymptotischen Verzerrungen darüber hinaus für nicht-
stationäre Initialbedingungen ab.
In Tabelle 1.3 sind für ausgewählte Werte von T und β die Grenzwerte wiedergegeben,
gegen die die Schätzung gemäß (1.81) für ∞→N konvergiert. Demnach weisen die
Schätzungen für β eine erhebliche negative Verzerrung auf, die für kleine und mittlere
Werte von T nicht vernachlässigt werden darf. So wird z.B. in einer Studie von Hübler
(1990) mit Hilfe der Schätzfunktion (1.78) der Autokorrelationskoeffizient der Residuen
mit -0.1353 geschätzt. In diesem Beispiel ist T = 3, so daß zu dieser Schätzung ein Wert
von etwa 3.0=β zugeordnet werden kann, der weitaus plausibler ist als eine negative
Korrelation (vgl. Hübler (1990, S. 90). In einer weiteren Arbeit (Hübler 1991, S.286) wur-
de für T = 3 ein Autokorrelationskoeffizient von 0.07 gefunden, womit ein Wert von etwa
β = 0.7 korrespondiert. Daraus wird deutlich, daß die Schätzung der Autokorrelation für
wenige Zeitpunkte so stark verzerrt sein kann, daß eine verhältnismäßig große Korrela-
tion der Störgrößen nahezu vollständig verdeckt wird.
29
Tabelle 1.3 Asymptotische Werte für $β nach dem Nickel-Bias
β T=3 T=4 T=6 T=10 T=15 T=20
-0.9 -0.926 -0.924 -0.916 -0.909 -0.906 -0.905
-0.6 -0.717 -0.695 -0.663 -0.639 -0.626 -0.620
-0.4 -0.585 -0.543 -0.496 -0.458 -0.439 -0.430
-0.2 -0.457 -0.394 -0.330 -0.279 -0.253 -0.240
0.0 -0.333 -0.250 -0.167 -0.100 -0.067 -0.050
0.2 -0.213 -0.111 -0.006 0.077 0.119 0.139
0.4 -0.094 0.023 0.149 0.252 0.303 0.328
0.6 0.022 0.153 0.298 0.422 0.484 0.515
0.9 0.194 0.340 0.506 0.657 0.738 0.780
Im Ergebnis läßt sich festhalten, daß beide Verfahren der Eliminierung der Individualef-
fekte besondere Probleme im dynamischen Panelmodell erzeugen.
1.10.3 Test auf Spezifikationsfehler im dynamischen Panelmodell
Im allgemeinen verfährt man in der Ökonometrie so, daß man das Modell nach der
Schätzung mehreren Spezifikationstests unterzieht. Dabei überprüft man insbesondere
die Annahmen über die Fehlergrößen, d.h. Autokorrelations-, Homoskedastizitäts- und
Verteilungseigenschaften. Einer der wesentlichen Vorteile des Verallgemeinerten
Momentenschätzers (GMM) gegenüber alternativen Schätzverfahren, insbesondere
dem Maximum-Likelihood-Verfahren, besteht darin, daß er mit sehr wenigen Annahmen
über die Fehlergrößen auskommt. Mögliche Verteilungseigenschaften manifestieren
sich im Rahmen der GMM-Schätzung einzig und allein in der Wahl einer effizienten Ge-
wichtungsmatrix und haben keinen Einfluß auf Konsistenz und Verteilungseigenschaften
des Schätzers. Allerdings stehen und fallen die Eigenschaften des GMM-Schätzers mit
der Gültigkeit der bei der Bildung der Instrumentmatrizen unterstellten Orthogonalitäts-
bedingungen. Eine Interpretation der Schätzergebnisse sollte daher nie erfolgen, ohne
die Validität (d.h. die Orthogonalität) der Instrumente zu testen.
Im folgenden werden daher zwei Tests vorgestellt, die die Gültigkeit der theoretischen
Momentrestriktionen überprüfen. Beide wurden bereits von Arellano, Bond (1991) in
ihrer grundlegenden Arbeit zur GMM-Schätzung im Panel diskutiert. Der erste Test, der
30
sogenannte J-Test von Hansen (1982), testet gegen allgemeine Verletzungen der Mo-
mentbedingungen und wird bisweilen auch als Test der Hypothese rationaler Erwartun-
gen verwendet (Hansen und Singleton, 1992). Der zweite Test, von Arellano und Bond
(1991), testet Verletzungen der Momentrestriktionen, die durch Autokorrelation in den
allgemeinen Fehlergrößen itε entstehen.
1.10.3.1 Test auf überidentifizierende Restriktionen
Die stochastischen Eigenschaften des GMM-Schätzers hängen entscheidend von der
Gültigkeit der Momentrestriktionen E W Fi T i′ =ε 0 ab. Die Momentrestriktionen sind
verletzt, wenn die gewählten Instrumente Wi in irgendeiner Form mit den gefilterten
Fehlergrößen FTε i korrelieren. Ein Test auf Validität der Instrumente ist im Rahmen des
GMM-Ansatzes daher unerläßlich (vgl. auch Davidson und MacKinnon (1993), Kap. 17).
Die Vielzahl der Gründe, die zu einer Korrelation zwischen Instrumenten und Fehlergrö-
ßen führen kann, erfordert einen Test, der gegen eine allgemeine Verletzung der Mo-
mentrestriktionen testet. Dies leistet der von Sargan (1958) für den verallgemeinerten
IV-Schätzer (GIVE) entwickelte und von Hansen (1982) für den GMM-Schätzer erwei-
terte J-Test. Die zu testenden Hypothesen lauten
(1.82) H E W F vs H E W Fi T i i T i0 10 0: . :′ = ′ ≠ε ε .
Unter der Hypothese H0 und asymptotisch normalverteilter $ *β ′ ist
(1.83)1 12
1
σβ β
Ny X F W
NW I F F W W F y X F I FN T T N T( $*) [ ( ( )) ] ( $*)− ′ ′ ⊗ ′ ′ − = ⊗− mit
mit dem GMM-Schätzer $ *β , asymptotisch 2( )M Kχ − -verteilt (Hansen, 1982, Arellano
und Bond, 1991). M K− bezeichnet die Differenz zwischen der Anzahl der verwendeten
Instrumentvariablen, die unter der Null-Hypothese asymptotisch die Nullrestriktion erfül-
len, und der Anzahl der zu schätzenden Parameter. Zur Identifikation der K Koeffizien-
ten genügen K Momentrestriktionen, so daß die restlichen M K− Restriktionen über-
identifizierend sind, d.h. es existieren M K− linear unabhängige Momente, die durch
das Schätzverfahren nicht Null gesetzt werden. Der Test prüft daher, ob die M K− ü-
beridentifizierenden Nullrestriktionen erfüllt sind.
31
Für den einstufigen GMM-Schätzer ergibt sich als Teststatistik (Arellano und Bond,
1991)
(1.84) J y X F W W I F F W W F y X F I FN T T N T1 2 11
11
= − ′ ′ ′ ⊗ ′ ′ − = ⊗−
$ ( $ ) ( ( ( )) ) ( $ ) .* *
σβ β
ε
mit .
Bei Gültigkeit der unabhängigen Normalverteilung von 2N(0, )ε σ= bezeichnet $σε2 den
konsistenten Schätzer der Varianz des allgemeinen Fehlerterms.
(1.85) $( )
$ $σ ε εε2
1
11
=−
′ ′=∑N T
F FT i i Ti
N
.
Im Rahmen des einstufigen GMM-Schätzers ist der J-Test nur vorsichtig anzuwenden,
da er nur gültig ist, wenn die strengen Verteilungsannahmen über die Fehlergrößen er-
füllt sind.
Die Teststatistik für den zweistufigen GMM-Schätzer mit allgemeiner Kovarianz-
matrix $∑ε lautet analog (Arellano und Bond, 1991)
(1.86) JN
y X F WA W F y X2 2 2 21
= − ′ ′ ′ −( $ ) ( $ )* * *β β
mit
(1.87) AN
W F F W F I FN T211* ( $ ) ;= ′ ∑ ′ = ⊗−
ε
und hängt über die Schätzung der optimalen Gewichtungsmatrix der zweiten Stufe A2*
von den Annahmen über die Fehlergrößen ab. Läßt man Autokorrelation und intertem-
porale Heteroskedastizität zu, lautet die Gewichtungsmatrix
(1.88) AN
W I F F WKN T T2
11* ( ( $ ) )= ′ ⊗ ∑ ′ −ε .
Erlaubt man zusätzlich interindividuelle Heteroskedastizität lautet A2*
(1.89) AN
W WAi i i i
i
N
21
1
1* ( $ $ )= ′ ′ −
=∑ ε ε .
A A2
* liefert eine konsistente Schätzung von 'W WΣ ohne Σ selbst konsistent zu schät-
zen. Die Null-Hypothese wird verworfen, wenn der Wert der Teststatistik 1J oder 2J den
32
gewählten Prozentpunkt der χ2-Verteilung mit M K− Freiheitsgraden bei vorgegebener
Fehlerwahrscheinlichkeit übersteigt.
1.10.3.2 Autokorrelationstests
Fehlende Validität der Instrumente kann auf falschen Annahmen über die stochastischen
Eigenschaften der Fehlergrößen beruhen. Der Differenzenfilter F impliziert, daß die ge-
filterten Fehlergrößen einem MA(1)-Prozeß folgen. Arellano und Bond (1991) haben
daher einen Test entwickelt, der die Hypothese des MA(1)-Prozesses der gefilterten
Fehlergrößen gegen allgemeinere Formen der Autokorrelation, insbesondere MA-
Prozessen höherer Ordnung testet. Folgen die gefilterten Fehlergrößen einem MA(1)-
Prozeß, so korrelieren sie mit ihren eigenen Verzögerungen 1tFε − , sind aber unkorreliert
mit 2tFε − , d.h. ε ε ε εt t t t− −− − −1 1 2und korrelieren, aber ε ε ε εt t t t− −− − −1 2 3und korrelieren
nicht, so daß dieser Test bei MA(1)-Störgrößen aufgrund des Differenzenfilters keine
Autokorrelation anzeigen sollte. Arellano und Bond (1991) testen daher die Hypothese,
daß die gefilterten Fehlergrößen im Mittel über die Individuen mit ihren zweifachen Ver-
zögerungen , 2iε − unkorreliert sind:
(1.90) H E F F vs H E F FT i T i T i T i0 2 1 20 0: ( ) ( ) . : ( ) ( ), ,ε ε ε ε′ = ′ ≠− − .
Bezeichnet man zur Vereinfachung die Elemente des Vektors der differenzierten Resi-
duen mit $εitD , so lautet die Teststatistik
(1.91) mm
D D
22 2
2= −
′+$ $ε ε
.
2 1, 2 , 2 , 2 ,1 , 3ˆ ˆ ˆ ˆ ˆ ˆ( , , ) mit ( , , )D D D D D DN i i i Tε ε ε ε ε ε′ ′
− − − − −′ ′= =L L bezeichnet den Vektor der zweifach verzö-
gerten differenzierten Residuen, d.h. der jeweils ersten 3T − Realisationen für jedes
Individuum, und 2 1, 2 , 2 , 2 ,3 , 1ˆ ˆ ˆ ˆ ˆ ˆ( , , ) mit ( , , )D D D D D DN i i i Tε ε ε ε ε ε′ ′
+ + + + −′ ′= =L L den Vektor der differen-
zierten Residuen mit zweifachem Vorlauf (Lead), d.h. den Vektor der jeweils letzten
3T − Realisationen für jedes Unternehmen.
Unter der Null-Hypothese ist die Teststatistik 2m asymptotisch N(0,1)-verteilt.
33
* Hinweis: m2 setzt sich kompliziert aus den Kreuzmomenten der zweifach verzögerten
Residuen und der gewichteten GMM-Momente zusammen.
Für den einstufigen GMM-Schätzer gilt
(1.92) m F Ft iD
T T iD
i
N
22
2 2 21
= ′−′
+ −=∑$ $ ( ) $, ,σ ε ε
− ′ ′ ′ ⊗ ′ ′−′
+− −2 2
2 21 1$ $ ( ) ( ( ( ) ) )σ εε
DN T TFX X F W W I F F W W FX
′ ′ ′ ⊗ ′ ′−++ −
=∑X F W W I F F W W HN T T i i
D
i
N
( ( ) ) $,
12
1ε
+ ′−′
+ + −$ ( ) $( $ )( ) $*ε β ε2 2 1 2 2D DFX V FX
und für den zweistufigen GMM-Schätzer
(1.93) m iD
iD
iD
iD
i
N
2 2 2 2 21
= −′
+ +′
−=∑ $ $ $ $, , , ,ε ε ε ε
− ′ ′ ′ ′ ′ ′−′
+−
=+′
−∑2 2 2 21
21
2 2$ ( ) ( ) $ $ $* *, ,ε ε ε εD
ii
N
iD
iD
iDFX X F WA W FX X F WA W
+ ′−′
+ + −$ ( ) $( $ )( ) $*ε β ε2 2 2 2 2D DFX V FX .
2( )FX + bezeichnet analog zu $ε+2D die Matrix der jeweils letzten 3T − der 1T − Beo-
bachtungen der gefilterten erklärenden Variablen, H++ eine nicht symmetrische Matrix
( )T TF F ++′ , die vom (T-1)-dimensionalen Spaltenvektor (0, 1,2, 1,0, ,0)′− − L beginnt (statt
wie eine symmetrische Matrix mit (2, 1,0, 0) '− L ) wie F FT T′ . $( $ )*V β1 und $( $ )*V β2 bezeich-
nen jeweils die konsistent geschätzte Kovarianzmatrix des einstufigen bzw. zweistufigen
GMM-Schätzers.
Ende des Hinweises.
Analog haben Arellano und Bond (1991) auch einen Test vorgeschlagen, der die Hypo-
these der Freiheit von Autokorrelation der gefilterten Fehlergrößen gegen allgemeine
Formen der Autokorrelation, insbesondere MA(1)-Prozessen, testet. Da die gefilterten
Fehlergrößen bei Anwendung des Differenzenfilters im Fall normalverteilter ε i einem
34
MA(1)-Prozeß folgen, sollte der Test die Hypothese der Freiheit von Autokorrelation bei
Anwendung des Differenzenfilters verwerfen. Die Hypothesen des Tests lauten analog
(1.94) H E F F vs H E F FT i T i T i T i0 1 1 10 0: ( ) ( ) . : ( ) ( ), ,ε ε ε ε′ = ′ ≠− − .
Die Teststatistik m1 ist unter der Hypothese H0 ebenfalls asymptotisch N(0,1)-verteilt
und lautet analog zu (1.91)
(1.95) mm
D D
11 1
1= −
′+$ $ε ε
mit 1 1, 1 , 1 , 1 ,1 , 2ˆ ˆ ˆ ˆ ˆ ˆ( , , ) und ( , , )D D D D D DN i i i Tε ε ε ε ε ε′ ′
− − − − −′ ′= =L L sowie
1 1, 1 , 12 , 1 ,2 , 1ˆ ˆ ˆ ˆ ˆ ˆ( , , ) und ( , , )D D D D D DN i i i Tε ε ε ε ε ε′ ′
+ − + + −′ ′= =L L .
Bei MA(1)-Residuen sollte dieser Test aufgrund der Filterung Autokorrelation anzeigen.
* Hinweis: m1 bildet sich analog zu m2 . Für den einstufigen GMM-Schätzer gilt für m11
die Formel (1.92) und für den zweistufigen GMM-Schätzer für m12 die Formel (1.93) ent-
sprechend, wenn man $ε−2D durch $ , $ε ε− +
′1 2D D durch $ , ( )ε+ +1 2
D FX durch ( )FX +1 , entsprechend
definiert und ( )F FT T′ +2 durch eine 2T − -dimensionale Einheitsmatrix sowie H++ durch
eine ( 1) ( 2)T T− × − -dimensionale Matrix, die aus einer ( 1)T − -dimensionalen Einheits-
matrix besteht, die von oben durch einen ( 2)T − -dimensionalen Zeilenvektor von Nullen
gerändert ist, ersetzt.
Ende des Hinweises.
1.10.4 Test linearer Hypothesen
Neben den im vorigen Abschnitt erörterten Tests der Instrumentvalidität sind Tests der
Signifikanz von Parametern und Parametergruppen von Interesse, die sich als Spezial-
fälle von allgemeinen Tests linearer Hypothesen darstellen lassen. Lineare Hypothesen
über die Parameter des ökonometrischen Modells lassen sich im allgemeinen als
(1.96) 0 1: 0 vs. : 0H R r H R rβ β− = − ≠
35
formulieren, wobei R eine ( )L K× -Restriktionsmatrix mit L K≤ vom Rang L ist und r
ein korrespondierender L -dimensionaler Spaltenvektor. Wir schreiben z.B. die Restrik-
tionen β β2 3= und β β4 5= als
0 1 1 0 0 00 0 0 1 1 0
0−
−
=
L LL L β .
Die Hypothese H0 formuliert L linear unabhängige Hypothesen über die K zu schätzen-
den Parameter, die gemeinsam zu testen sind.
Analog zum linearen Regressionsmodell lassen sich im GMM-Ansatz Hypothesentests
nach drei Testprinzipien unterscheiden: dem Lagrange-Multiplikator-Testprinzip (LM-
Prinzip), dem Wald-Testprinzip bzw. dem Likelihood-Verhältnis-Testprinzip (LR) (vgl.
auch Davidson und MacKinnon, 1993, Kap. 17.6).
Diese Testprinzipien unterscheiden sich dadurch, ob die Testprozedur eine restringierte
Schätzung unter der Hypothese H0 oder eine freie Schätzung unter der Hypothese H1
erfordert. Dem LM-Prinzip liegt ausschließlich die Schätzung des Modells unter der
Hypothese H0 zugrunde und dem Waldprinzip ausschließlich die Schätzung des Modells
unter der Hypothese H1. Dem LR-Prinzip liegt die Differenz der log-Likelihoodfunktion
unter H0 und H1 zugrunde.
Für Tests linearer Hypothesen anhand des linearen GMM-Schätzers sind die drei Test-
statistiken sowohl für den einstufigen als auch für den zweistufigen effizienten GMM-
Schätzer identisch, wenn der gleiche Schätzer für die optimale Gewichtungsmatrix ver-
wendet wird (Newey und West, 1987). Die numerische Berechenbarkeit ist in diesem
Fall für den Wald-Test am einfachsten, so daß dieser in entsprechenden Softwarepa-
keten standardmäßig durchgeführt wird (vgl. Arellano und Bond, 1988).
Der Wald-Test mißt die Verletzung der Restriktion durch den unrestringierten Schät-
zer $β . Für den effizienten einstufigen GMM-Schätzer lautet die Teststatistik
(1.97) WN
R r R X F W W HW W FX R R r1 21 1 1= − ′ ′ ′ ′ ′ ′ −− − −
$ ( $ ) ( ( ( ) ) ) ( $ )σ
β βε
mit H I F FN T T= ⊗ ′
und für den effizienten zweistufigen GMM-Schätzer
36
(1.98) W R r R X F WA W FX R R r2 21 1= − ′ ′ ′ ′ ′ −− −( $ ) ( ( ) ) ( $ )( )
*β β
wobei A( )*2 ein konsistenter Schätzer der optimalen Gewichtungsmatrix ist. W1 und W2
sind unter der Hypothese H0 asymptotisch χ2(L)-verteilt.
1.10.5 Empirisches Beispiel
Janz (1997) hat das Investitionsverhalten deutscher Aktiengesellschaft mit Hilfe des
Panelansatzes untersucht. Er geht dabei im einfachsten Fall von folgender Eulerglei-
chung als Investitionsgleichung aus, die sich aus der Bedingung 1. Ordnung für einen
optimalen Kapitalstock ergibt:
(1.99)I
KIK
IK
YK
i t
i t
it
it
it
it
it
iti t
,
,,
+
++= + +
+ +1
10 1 2
2
3 1β β β β ε .
Die empirische Analyse dieses Modells basiert auf Jahresabschlüssen von deutschen
Industrie-, Handels-, Verkehrs- und Dienstleistungsaktiengesellschaften nach neuer
Rechnungslegung der Jahresabschlußdatenbank Aachen (vgl. Bühler et. al., 1993). Um
einen Überblick über die vorhandenen Daten zu erlangen, werden die einzelnen Positi-
onen der Bilanz und der Gewinn- und Verlustrechnung (G+V) geeignet zusammenge-
faßt. Tabelle 1.5 stellt ein solches vereinfachtes Bilanzschema dar.
Tabelle 1.5 Vereinfachtes Bilanzschema
Aktiva Passiva
immaterielles Vermögen Eigenkapital
Grundstücke und Gebäude Genußscheinkapital
maschinelle Anlagen Sonderposten mit Rücklageanteil
Beteiligungen Pensionsrückstellungen
sonstige Finanzanlagen sonstige Rückstellungen
Vorräte Bankverbindlichkeiten
sonstiges Umlaufvermögen sonstige Verbindlichkeiten
sonstige Aktiva sonstige Passiva
Bilanzverlust Bilanzgewinn
Da die Unternehmen die Aufstellung der G+V wahlweise nach dem Gesamtkostenver-
37
fahren oder dem Umsatzkostenverfahren vornehmen können, werden in Tabelle 1.7 ver-
einfachte G+V-Schemata nach dem Gesamtkosten- und dem Umsatzkostenverfahren
einander gegenübergestellt. Der Inhalt der einzelnen Positionen ist den Tabellen A.3 bis
A.6 des Anhangs der Arbeit von Janz (1997) zu entnehmen.
Da sowohl die Bilanz als auch die Gewinn- und Verlustrechnung nominale und keine
realen Größen enthalten, wird zunächst die Eulerinvestitionsgleichung (1.99) durch Er-
weiterung der Quotienten in nominale Größen überführt:
(1.100)( )( )
( )( )
( )( )
( )( )
,
,,
cIcK
cIcK
cIcK
pYpK
i t
i t
it
it
it
it
it
iti t
+
++= + +
+ +1
10 1 2
2
3 1β β β β ε .
( ) ( ( , ) ( , )) *pY p F K L G K I w L c Kit t it it it it t it t it= − − − bezeichnet den Unternehmensgewinn,
korrigiert um die Nutzungskosten des Sachvermögens, ( )pKpc
c Kitt
tt it= das Sachver-
mögen, bewertet zu laufenden Absatzpreisen und ( ) , ( )cI c I cK c Kit t it it t it= = die Investi-
tionen bzw. das Sachvermögen, bewertet zu laufenden Investitionsgüterpreisen, d.h.
Wiederbeschaffungspreisen.
38
Tabelle 1.7 Vereinfachtes G+V-Schema
Gesamtkostenverfahren Umsatzkostenverfahren
Umsatzerlöse Umsatzerlöse
+ andere betriebliche Erträgea
+ sonstige betriebliche Erträge + sonstige betriebliche Erträge
- betrieb. Gesamtaufwendungenb - betriebl. Umsatzaufwendungenc
- sonstige betriebl. Aufwendungen - sonstige betriebl. Aufwendun-gend
- Abschreibungen Abschreibungen (nachrichtlich)
= Betriebsergebnis = Betriebsergebnis
+ Finanzergebnis + Finanzergebnis
+ außergewöhnliches Ergebnis + außergewöhnliches Ergebnis
+ sonstiges Ergebnis + sonstiges Ergebnis
= Jahresüberschuß/-fehlbetrag = Jahresüberschuß/-fehlbetraga Bestandsveränderungen und andere aktivierte Eigenleistungenb ohne Abschreibungenc mit Abschreibungend einschließlich außerplanmäßiger und nur steuerlicher Abschreibungen
Die Ermittlung des Wertes des Sachvermögens zu Wiederbeschaffungspreisen ist je-
doch ohne weiteres nicht möglich. Zwar ist sie in der internen Kostenrechnung verbrei-
tet, in der externen Rechnungslegung allgemein jedoch nicht zulässig. Obwohl über die
Bilanzrichtlinie das anglo-amerikanische Prinzip des true and fair view, demzufolge der
Jahresabschluß ein den tatsächlichen Verhältnissen entsprechendes Bild der Vermö-
gens-, Finanz- und Ertragslage der Gesellschaft vermitteln sollte, in deutsche Rech-
nungslegungsvorschriften Einzug erhalten hat, erfolgt die Bewertung des Sachvermö-
gens mit historischen Anschaffungs- bzw. Herstellungskosten, vermindert um planmäßi-
ge und außerplanmäßige Abschreibungen. Die Bewertung mit aktuellen Anschaffungs-
oder Herstellungskosten erfolgt nur, wenn sie gegenüber den historischen zu einem
niedrigeren Wertansatz führt. Für das Umlaufvermögen ist der niedrigere Wertansatz
zwingend vorzunehmen (strenges Niederstwertprinzip), für das Anlagevermögen jedoch
nur, wenn dieser voraussichtlich dauerhaft ist (gemildertes Niederstwertprinzip). Für das
Wertaufholungsgebot, demzufolge bei Wegfall des Grundes für außerplanmäßige Ab-
39
schreibungen diese durch entsprechende Zuschreibungen zu korrigieren sind, bilden
die historischen Anschaffungs- bzw. Herstellungskosten, vermindert um planmäßige
Abschreibungen, weiterhin die Obergrenze. Da die außerplanmäßigen Abschreibungen
zudem Abschreibungen enthalten, die allein steuerlich bedingt sind, sofern der steuer-
rechtliche Ansatz einen handelsrechtlichen voraussetzt (umgekehrtes Maßgeblichkeits-
prinzip), sind die Wiederbeschaffungskosten nicht direkt aus den Buchwerten ablesbar,
sondern müssen in geeigneter Weise berechnet werden.
Wenn die Investitionen der laufenden Periode mit ihren Wiederbeschaffungspreisen
bewertet sind, so lassen sich zumindest diese direkt aus den Buchwerten rekonstruie-
ren:
(1.101) ( ) ( ) ( ) ~ ( , )~ ~
,cI cK cK D jjit jit ji t jit= − + =−1 1 2
cK jit~
bezeichnet die Buchwerte des Sachanlagevermögens und ~D jit die bilanziellen
Abschreibungen. Die Berechnung erfolgt für Grundstücke und Gebäude (j=1) und ma-
schinelle Anlagen (j=2) getrennt. Da die Abschreibungen in der G+V für Grundstücke
und Gebäude sowie maschinelle Anlagen nicht getrennt ausgewiesen werden, erfolgt
aus Vereinfachungsgründen eine Aufteilung nach Buchwertanteilen der entsprechenden
Bilanzpositionen der gleichen Periode. Die Ermittlung des Betrages für die gesamten
Investitionen erfolgt additiv:
(1.102) ( ) ( ) ( )cI cI cIit it it= +1 2 .
Die Wiederbeschaffungskosten des Sachvermögens lassen sich aus den Investitionen
(cI)jit der einzelnen Perioden mittels der Perpetual-Inventory-Methode rekursiv ermitteln,
indem deren Vorjahreswerte um Preisänderungen und physische Abschreibungen kor-
rigiert und die Investitionen der laufenden Periode hinzu addiert werden:
(1.103) ( ) ( ) ( ) ( ) ( , ),
,cKc
ccK cI jjit j
jt
j tji t jit= − + =
−−1 1 2
11δ
Der rekursive Algorithmus erfordert die Vorgabe von Startwerten (cK)ji,0. Üblicherweise
werden die Buchwerte als Startwerte verwendet. Dem Approximationsfehler wird durch
einen mehrperiodigen Vorlauf Rechnung getragen. Der dadurch bedingte Verlust von
Analyseperioden läßt sich umgehen, wenn man transformierte Buchwerte als Startwerte
40
verwendet (Schaller, 1990). Hierzu eignen sich die von der Bundesbank veröffentlichten
Zeitreihen für das reproduzierbare gesamtwirtschaftliche Nettoanlagevermögen zu An-
schaffungs- bzw. Wiederbeschaffungspreisen AV jtA bzw. AV jt
W . Für die Wiederbe-
schaffungswerte der Grundstücke und Gebäude wird die Zeitreihe für Bauten, für die
maschinellen Anlagen die entsprechende für Ausrüstungen verwendet:
(1.104) ( ) ( )~
,cKAV
AVcKji
jW
jA ji00
00=
Als Abschreibungsparameter dienen die von King und Fullerton (1984) geschätzten Ab-
schreibungsraten für Bauten ( 1 0,0456δ = ) und für Ausrüstungen ( 2 0,1566δ = ). Die Kor-
rektur um Preisänderungen , 1
jt
j t
cc −
erfolgt unter Verwendung der Zeitreihen des Statisti-
schen Bundesamtes zu Investitionsgüterpreisen für Bauten und für Ausrüstungen. Die
Ermittlung des Wertes für das gesamte Sachvermögen erfolgt additiv:
(1.105) ( ) ( ) ( )cK cK cKit it it= +1 2
Die Berechnung des Sachvermögens zu laufenden Absatzpreisen erfolgt durch Umbe-
wertung des Sachvermögens zu Wiederbeschaffungskosten mittels
(1.106) ( ) ( )pKpc
cKjitt
jtjit= .
Als Absatzpreis tp dient die Zeitreihe für die Erzeugerpreise des Verarbeitenden Ge-
werbes des Statistischen Bundesamtes. Die Ermittlung des Wertes für das gesamte
Sachvermögen erfolgt ebenfalls additiv:
(1.107) ( ) ( ) ( )pK pK pKit it it= +1 2
Da das einfache Modell von allen Finanzierungsaspekten abstrahiert, dient als Gewinn-
größe ausschließlich der Gewinn aus der betrieblichen Tätigkeit. Zu diesem Zweck
werden zum Betriebsergebnis ±( )itBE die bilanziellen Abschreibungen ~Dit addiert und
das Ergebnis um ermittelte Nutzungskosten ( )itcK des Sachvermögens gekürzt:
(1.108) ±( ) ( ) ( )it it it itpY BE D cK= + −% .
41
In bisherigen empirischen Analysen wird keine Korrektur des Gewinnes um die Nut-
zungskosten vorgenommen. Dies wird damit begründet, daß diese zwar zeitvariabel,
aber nicht firmenspezifisch seien und deren Effekt daher durch Zeitdummyvariablen
aufgenommen werden könne. Im folgenden wird ein recht einfacher Weg aufgezeigt,
aus den Jahresabschlußdaten unternehmensspezifische Nutzungskosten zu ermitteln.
Die Berechnung der Nutzungskosten erfolgt dabei ebenfalls getrennt für Grundstücke
und Gebäude sowie maschinelle Anlagen aus:
(1.109), 1
1
1( ) ( ) ( 1,2)
jjt j t
jit jitjt
c crcK cK j
c
δ−
−−
+= =
Der Zähler des Bruches sind die Kapitalnutzungskosten. Als Zinssatz r wird die von der
Bundesbank veröffentlichte Umlaufrendite für festverzinsliche Wertpapiere verwendet.
Als Preiszeitreihen dienen die bereits oben erwähnten Zeitreihen für Investitionsgüter-
preise und als Abschreibungssätze die ebenfalls erwähnten Werte von King und Fuller-
ton (1984). Die Berechnung für die gesamten Nutzungskosten des Sachvermögens er-
folgt additiv:
(1.110) * * *1 2( ) ( ) ( )it it itc K c K c K= +
Aus der unterschiedlichen Zusammensetzung des Sachvermögens aus Grundstücken
und Gebäuden sowie maschinellen Anlagen folgt daher indirekt eine unternehmensspe-
zifische Nutzungskostengröße pro Einheit des Sachvermögensbestandes.
42
Tabelle 1.9 Ergebnisse der GMM-Schätzung
Verfahren GMM2B GMM2A GMM1 GIVE
Gewichte Ab A A2 AK
2 A1* A S
1
IK t
−1 0.2956 0.3165 0.3360 0.2968
(-)
[0.4526]
(0.4768)
[0.4437]
(0.7264)
[0.7722]
(0.4564)
[0.8272]
IK t
−1
2
0.3454 0.2677 0.2813 0.0954
(-)
[0.7316]
(0.7483)
[0.7100]
(1.1300)
[1.2478]
(0.6979)
[1.3801]
pK t
−1 0.0897 0.0929 0.0853 0.0555
(-)
[0.0302]
(0.0368)
[0.0309]
(0.0504)
[0.0518]
(0.0494)
[0.0676]
J-Teststatistik 9.869 17.964 9.370 --
Freiheitsgrade 9 9 9 --
p-Werte 0.3612 0.0356 0.4039 --
m1-Testc 0.0001 0.0000 0.0000 0.0003
m2-Testc 0.2725 0.2747 0.5114 0.4660
W-Modellc 0.0000 0.0000 0.0000 --
W-Dynamikc 0.0000 0.0000 0.0002 --
a () gewöhnliche Schätzfehler
[] Schätzfehler bei White-Kovarianz-Schätzung
b AN
W W AN
W HW H I F FSN T T1
11
11 1= ′ = ′ = ⊗ ′− −( ) ; ( )* mit
AN
W I F F AN
W WKN T T
AiD
iD
i2 2 11 11 1
= ′ ⊗ ∑ ′ = ′ −( ( ) ( $ $ )ε ε ε
c p-Werte (marginale Signifikanzniveaus)
Tabelle 1.9. zeigt, daß die Ergebnisse gegenüber Variationen der Gewichtungsmatrixen
relativ unempfindlich sind. Stärkere Veränderungen ergeben sich lediglich bei AS1 , d.h.
43
beim einstufigen GMM-Schätzer. Der J-Test auf überidentifizierende Restriktionen lehnt
H0 nur in einem Fall mit α = 0.05 ab, d.h. die Orthogonalität der Instrumente wird ange-
nommen.
Der m1 Test zeigt Autokorrelation (wegen des Differenzenfilters) an. Der m2-Test lehnt
die Hypothese, eines MA(1)-Prozesses nicht zugunsten eines MA-Prozesses höherer
Ordnung ab. Die Wald-Tests (W-Tests) zeigen sowohl eine Signifikanz des gesamten
Modells, als auch der Modelldynamik an. Allerdings entsprechen sämtliche Koeffizienten
nicht den erwarteten Größen: Der Koeffizienten von 1( )tI
K − sollte ungefähr 1, derjenige
von 21( )t
IK − kleiner als 1− sowie der von 1( )t
YK − negativ sein.