Download - 1 Lineare Paneldatenmodelleftp.zew.de/incoming/open/nja/panel.pdf · Das SOEP ist 19 84 im Rahmen des Sonderforschungsbereichs 3 „Mikro- ... (Kon-takt: Sandra Gottschalk ... und

1

1 Lineare Paneldatenmodelle

1.1 Quellen und Arten von Paneldaten

1.1.1 Haushaltspanels

In der Bundesrepublik gibt es inzwischen eine Reihe bedeutender Paneldatensätze, von

denen das Sozio-ökonomische Panel privater Haushalte (SOEP) der bekannteste ist.

Im SOEP werden insbesondere die Lebensbedingungen, d.h. die Erwerbs- und Ein-

kommenssituation, im Längsschnitt erfaßt. Einmal im Jahr werden dieselben Haushalte-

und Haushaltsmitglieder befragt. Haushalte werden neu in das SOEP aufgenommen,

wenn bestehende Haushaltsmitglieder den Haushalt wechseln oder einen neuen Haus-

halt gründen. Das SOEP ist 1984 im Rahmen des Sonderforschungsbereichs 3 „Mikro-

analytische Grundlagen der Gesellschaftspolitik“ der Universitäten Frankfurt und Mann-

heim entstanden und wird inzwischen am Deutschen Institut für Wirtschaftsforschung

(DIW) in Berlin im Rahmen einer eigenständigen Projektgruppe weitergeführt. Die Be-

fragung selbst wird von infratest Sozialforschung in München durchgeführt. Seit 1990 ist

das SOEP auf das Gebiet der neuen Bundesländer erweitert.

Das SOEP-West begann 1984 mit 12.290 Personen in 5.921 Haushalten. 1998 waren

es noch 8.145 Personen in 4.366 Haushalten. Das SOEP-Ost startete 1990 mit 4.453

Personen in 2.179 Haushalten und führt nun 3.730 Personen in 1.816 Haushalten Im

Rahmen des SOEP sind also für einen Querschnitt von ca. 8.000WN = bzw.

11.700DN = Personen über einen Zeitraum 15WT = bzw. 9DT = Wellen Beobach-

tungen verfügbar. Typischerweise ist in Paneldaten also die Querschnittsdimension

N relativ groß und die Zeitdimension T relativ klein.

Die anonymisierten Mikrodatensätzen werden wissenschaftlichen Forschungsein-

richtungen gegen Abschluß eines Nutzungsvertrages und eine geringe Nutzungsgebühr

im SPSS-, STATA-, SAS-, TDA- und ASCII-Format zur Verfügung gestellt. Über 400

Forschergruppen im In- und Ausland nutzen bisher das SOEP. Die wesentlichen

Informationen sind auch direkt auf der SOEP-Homepage unter http://www.diw.de/soep

erhältlich.

2

1.1.2 Unternehmens- und Betriebspanels

Andere als Panel konzipierte Erhebungen beziehen sich auf die Befragung von Unter-

nehmen bzw. Betrieben als Teil von Unternehmen. Obwohl Unternehmensbefragungen

in Deutschland insbesondere Dank des ifo Instituts für Wirtschaftsforschung in München

eine lange Tradition haben (vgl. Oppenländer und Poser, 1989), sind sie zu wissen-

schaftlichen Zwecken weitaus weniger genutzt worden als das SOEP.

Das ifo führt im wesentlichen drei als Panel konzipierte Unternehmensbefragungen

durch: seit 1949 den ifo-Konjunkturtest (vgl. Lindlbauer, 1989), seit 1955 den ifo-

Investitionstest (vgl. Neumann, 1989) und seit 1979 den ifo-Innovationstest (vgl.

Scholz, 1989). Am Investitionstest nehmen durchschnittlich ca. 3.000 Unternehmen teil.

Die Erhebung des Konjunktur- und des Innovationstests erfolgt auf der Ebene von Pro-

duktgruppen bzw. Geschäftsbereichen von Unternehmen. Am Konjunkturtest partizipie-

ren ca. 5.400 und am Innovationstest ca. 1.600 so definierte Einheiten. An der Univer-

sität Konstanz ist aus den 3 getrennten Unternehmensbefragungen das ifo-

Unternehmenspanel entstanden (vgl. Schneeweis und Smolny, 1996), in dem für

knapp 2.000 Unternehmen Beobachtungen von 1980 bis 1992 vorliegen. Das ifo-

Unternehmenspanel ist bisher nicht öffentlich zugänglich. Die Daten des ifo-

Konjunkturtests sind in Einzelfällen zu wissenschaftlichen Zwecken an universitäre For-

schungseinrichtungen weitergegeben worden.

Über umfangreiche Unternehmensdatensätze verfügt auch das Zentrum für Europäische

Wirtschaftsforschung (ZEW) in Mannheim. Zu nennen sind insbesondere das Mannhei-

mer Innovationspanel und das ZEW-Gründungspanel. Im Rahmen des Mannheimer

Innovationspanel (MIP) werden seit 1993 im Verarbeitenden Gewerbe und seit 1995

auch im Dienstleistungssektor Unternehmen zu ihren Innovationsaktivitäten befragt (vgl.

Harhoff und Licht, 1993; Licht et al., 1997 sowie Janz und Licht, 1999). An beiden Erhe-

bungen nehmen jeweils knapp 2.500 Unternehmen teil. Die anonymisierten Mikrodaten

werden wissenschaftlichen Forschungseinrichtungen gegen Abschluß eines Datennut-

zungsvertrages kostenlos zu wissenschaftlichen Zwecken zur Verfügung gestellt (Kon-

takt: Sandra Gottschalk, Email: [email protected]). Darüber hinaus besteht die Mög-

lichkeit, am ZEW mit den nicht anonymisierten Originaldaten zu arbeiten. Etwa 30 For-

schergruppen im In- und Ausland nutzen bisher das MIP. Das ZEW-Gründungspanel

3

ist in Zusammenarbeit mit der Kreditauskunftei CREDITREFORM entstanden und ent-

hält die wesentlichen Strukturgrößen aller seit 1990 in Deutschland neu gegründeten

Unternehmen (vgl. Harhoff und Steil, 1997). Das Gründungspanel-West enthält Informa-

tionen zu ungefähr 1,6 Millionen Unternehmen. Das Gründungspanel-Ost umfaßt ca.

760.000 Unternehmen und entspricht dem Bestand aller seit der Wiedervereinigung

jemals in Ostdeutschland existierenden Unternehmen, sofern sie von CREDITREFORM

recherchiert worden sind. Eine anonymisierte Version des ZEW-Gründungspanels ist in

Planung.

Am Institut für Arbeitsmarkt- und Berufsforschung (IAB) der Bundesanstalt für Arbeit in

Nürnberg ist in jüngster Zeit das IAB-Betriebspanel entstanden (vgl. Bellmann, 1997).

Das IAB-Betriebspanel hat als Grundgesamtheit alle Betriebe mit mindestens einem

sozialversicherungspflichtigen Beschäftigten und enthielt in der ersten Welle 1993

knapp 4.500 Betriebe aus dem Westen Deutschlands. Seit der 4. Welle im Jahr 1996

sind zusätzlich ostdeutsche Betriebe enthalten. Momentan wird am IAB an einem ano-

nymisierten public use file gearbeitet, der kürzlich zu Testzwecken im SPSS-Format an

verschieden Wissenschaftler versandt worden ist. Für Auswertungen des IAB-Panels ist

eine sogenannte Schalterstelle (Kontakt: Dr. Arnd Kölling, Email: [email protected])

eingerichtet worden, an die Programme in SPSS, STATA, TSP oder GAUSS geschickt

werden können, die vorher mit dem public use file getestet worden sind.

Weiter zu nennen ist das eher sozialwissenschaftlich-technisch orientierte NIFA-Panel

(NIFA = Neue Informationstechnologien und flexible Arbeitssysteme) an der Ruhr-

Universität Bochum, in dem von 1991 bis 1997 durchschnittlich 2.500 kleinere und mitt-

lere Maschinenbaubetriebe zur Entwicklung von Produktionstechnologien befragt wer-

den (vgl. Widmaier und Hauptmann, 1997). Auch das NIFA-Panel wird in anonymisierter

Form gegen Abschluß eines Nutzungsvertrages an externe Wissenschaftler weiterge-

geben. Der Überlassungsvertrag kann direkt über das Internet beantragt werden

(http://www.pw2.ruhr-uni-bochum.de/projekte/nifa/vertrag.htm).

In der Regel verbietet es sich für einen einzelnen Forscher aus Geldmangel, solche auf-

wendigen Datenerhebungen über längere Zeit selbst durchzuführen. Die Verfügbarkeit

dieser Daten hat aber in den letzten Jahren die Bedeutung der Panelmodelle deutlich

4

erhöht. Zudem lassen sich aus bestehenden Bilanz- bzw. Jahresabschlußdatenbanken

Paneldatensätze konstruieren.

Über die bedeutendste Jahresabschlußdatenbank verfügt zweifelsohne die Deutsche

Bundesbank in Frankfurt. Die Bundesbank verfügt über die Jahresabschlüsse von allen

Unternehmen, die jemals einen Wechsel zum Rediskont eingereicht haben (vgl. Fride-

richs und Sauvé, 1999). Verwertbar sind die Jahresabschlüsse von jährlich etwa 60.000

Unternehmen. An einer möglichen wissenschaftlichen Nutzung wird momentan gear-

beitet. Weiter zu nennen ist die im Rahmen der Deutschen Finanzdatenbank entstande-

ne Jahresabschlußdatenbank Aachen (vgl. Bühler et. al., 1993), die in Einzelfällen und

nur in Auszügen für wissenschaftliche Zwecke zur Verfügung gestellt worden ist.

1.1.3 Weitere Paneldatensätze

Gegenstand von Panelanalysen können aber auch Regionaldaten sein, die sowohl eine

Analyse der Entwicklung verschiedener Regionen der Bundesrepublik als auch eine

Analyse über verschiedene Staaten hinweg ermöglichen. Man kann zum Beispiel die

volkswirtschaftliche Gesamtrechnung der wichtigsten Europäischen Länder als ein Pa-

nel verstehen, bei dem allerdings die Anzahl der Länder eher gering und die Anzahl der

Beobachtungszeitpunkte, zumindest bei vierteljährlichen Beobachtungen, relativ groß

ist. Dies wäre ein Gegenbeispiel zur obigen Aussage über die relative Größe von N

und T .

1.2 Das einfache lineare Modell

In den folgenden Abschnitten werden Schätzverfahren für lineare Paneldatenmodelle

diskutiert. Inzwischen behandeln auch eine Reihe von Lehrbücher und Monographien

Schätzverfahren für Paneldatenmodelle. Als erstes zu nennen sind die Monographie von

Hsiao (1986) und das etwas neuere Lehrbuch von Baltagi (1995). Der aktuelle Stunde

der Wissenschaft ist am umfassendsten im Sammelband von Mátyás und Sevestre

(1996) dokumentiert. Eine Einführung bieten aber die meisten neueren Lehrbücher zur

Ökonometrie wie beispielsweise Greene (1993) in Kapitel 14.

Paneldaten sind wiederholte Beobachtungen identischer statistischer Einheiten wie

Unternehmen, Haushalte oder Personen über die Zeit. Mit ity bezeichnen wir die ab-

5

hängige Variable und mit kitX die k-te unabhängige Variable der Einheit i zum Zeit-

punkt t mit Ni ,,1 …= , Tt ,,1 …= und 1, ,k K= … .

Die Diskussion der Methoden bezieht sich zunächst auf balancierte Panel, d.h. für jedes

Individuum liegt die gleiche Anzahl von Beobachtungen über den gleichen Zeitraum vor,

so daß die Gesamtzahl der Beobachtungen TN ⋅ ist. Wenn 1=N und 1T > ist, haben

wir die üblichen Zeitreihendaten. Alternativ haben wir für 1=T und 1N > einen Quer-

schnitt. Paneldatenmethoden behandeln daher den Fall 1>N und 1>T . In der Regel

wird angenommen, daß N groß ist während T relativ klein ist. Die asymptotische The-

orie wird daher über die beobachteten Individuen N gehen und T wird als endlich und

gegeben betrachten. Wir können diese Daten für jedes Individuum wie folgt in Vektor-

und Matrixform darstellen:

(1.1)

1 21 11 1 1

1 22 22 2 2

1 2

; ;

Ki ii i i

Ki ii i i

i i i

KiT iTiT iT iT

y X X Xy X X X

y X

y X X X

εε

ε

ε

= = =

LL

M MM M O ML

Ni ,,2,1 L=

itε sind die Störgrößen des Modells. Wenn wir die einzelnen Vektoren und Matrizen der

Individuen wiederum in Vektoren gemäß Gleichung (1.2) zusammenfassen,

(1.2)

1 1 1

2 2 2; ;

N N N

y Xy X

y X

y X

εε

ε

ε

= = =

M M M

so läßt sich das Panelmodell in der üblichen Weise als lineares Regressionsmodell mit

K Regressoren gemäß (1.3) darstellen:

(1.3) y X= +β ε mit ′ =β β β( , )1 L K .

Für den Fall zweier Individuen läßt sich dieses Modell wie in (1.4) schreiben:

6

(1.4)

111 1111 11

111 11 1

2

121 2121 21

12 22 2

K

KT TT T

K

K

KT TT T

y X X

y X X

y X X

y X X

ε

βε

β

εβ

ε

= +− − − −− − − − − −

LM MM M

L

MLM MM M

L

.

Man erkennt hier den entscheidenden Unterschied zu den in Ökonometrie II behan-

delten Modell mit scheinbar unkorrelierten Gleichungen (SURE), nämlich die An-

nahme gleicher Koeffizienten für alle Individuen. Im Vergleich dazu lautete das

SUR-Modell wie folgt:

(1.5) 1 1 1 1

2 2 2 2

00

y Xy X

β εβ ε

= +

bzw.

111 1111 11

11

11 11 1

1

21121 2121 21

212 22 2

| 0 0

| 0 0

0 0 |

0 0 |

K

KT TT T

K

K

KKT TT T

y X X

y X X

y X X

y X X

εβ

εββ

ε

βε

= +− − − −− − − − − − − −

L LM MM M M M M

L L

L L MM MM M M ML L

Im Rahmen des einfachen lineare Paneldatenmodells geht es zunächst um eine Schät-

zung des Modells (1.3). Dabei werden insbesondere unterschiedliche Annahmen bzgl.

der Parameter getroffen. Wir unterscheiden Modelle mit gleichen Parametern für alle

Individuen und Modelle, und Modelle deren Parameter über die Zeit oder über Individu-

en variieren.

Die einfachste Methode der Schätzung von Gleichung (1.3) ignoriert den Panelcharakter

der Daten vollständig und schätzt (1.3) gepoolt nach der Kleinstquadratmethode:

(1.6) $ ( )β = ′ ′−X X X y1

Dem liegt die Annahme zu Grunde, daß die Störgrößen unabhängig und identisch ver-

teilt sind mit Mittelwert 0 und konstanter Varianz 2σ für alle Individuen i und Zeitpunkte

t . Das heißt, es besteht weder eine zeitliche Korrelation noch eine Korrelation über

7

Individuen und die Störgrößen sind sowohl über die Zeit als auch über die Individuen

homoskedastisch.

1.3 Das lineare Modell mit festen individuellen Effekten

Das allgemeine lineare Panelmodell mit individuellen Effekten lautet:

(1.7) itiitit ZXy εδβ ++= mit ε α ηit i it= +

mit itX als Matrix erklärender Variablen, die sowohl über die Individuen als auch über

die Zeit variieren und iZ als Matrix erklärender Variablen, die ausschließlich über die

Individuen variieren, aber über die Zeit konstant sind, wie beispielsweise das Ge-

schlecht oder die Größe einer Person oder der Wirtschaftszweig eines Unternehmens.

Die Störgrößen bestehen nun aus zwei Komponenten: einer allgemeinen Komponente

itη und einer individuellen Komponente iα , die ebenfalls über die Zeit konstant ist. Die

Annahmen bzgl. dieser Störgrößen lauten:

(1.8)

[ ]

[ ]

[ ]

2

2

für ,E 0 E

0 sonst

fürE 0 E

0 sonst

E 0 E 0

it it js

i i j

i it it js

i j t s

i j

x

η

α

ση η η

σα α α

α η η

= = = =

=

= =

= =

Dabei ist es durchaus zulässig, daß die Individualeffekte iα mit den unabhängigen Va-

riablen itX korrelieren, d.h. im allgemeinen gilt:

(1.9) .0)E( ≠′ iitX α

Wir wollen zunächst annehmen, daß in Modell (1.7) 0δ = ist, d.h. individuelle Effekte nur

in der Störgröße iα enthalten sind. Im einfachsten Fall des Modells werden die Individu-

aleffekte iα als über die Zeit für jedes Individuum konstant angesehen. Sie sind also

keine Zufallsvariablen. Die Annahme des Modells lautet, daß zwei Beobachtungen des

gleichen Individuums zu verschiedenen Zeitpunkten einander ähnlicher sind als zwei

Beobachtungen unterschiedlicher Individuen zum gleichen Zeitpunkt. Die Individualef-

fekte werden dann als feste Effekte (fixed effects) modelliert (vgl. Hsiao, 1986, Kapitel

8

3.2). Wir schreiben dieses Modell mit Hilfe der 0,1-Variablen itD als Spalten einer Mat-

rix D . Diese NNT × -Matrix D hat in der Spalte i für das jeweils i-te Individuum den

Wert 1 und für alle anderen Individuen den Wert 0 .

(1.10)

1 0 0

1 0 00 1 0

0 1 0

0 0 1

0 0 1

D

=

LM M O M

LL

M M O ML

M M M ML

M M O ML

Das lineare Modell mit festen Effekten lautet dann

(1.11) y X D= + +β α η .

Der Kleinstquadratschätzer der Koeffizienten (ohne konstantes Glied) β der Gleichung

(1.11) läßt sich als KQ-Schätzer des transformierten Modells

(1.12) M y M XD D= +β η

darstellen, d.h.

(1.13) [ ] DDDDIMyMXMXMXM NTDDDDDW ′′−=′′= −− 11 )(mit)()()()(β

DM ist eine (idempotente) Projektionsmatrix, die alle Beobachtungen um den indivi-

duellen Mittelwert über die Zeit bereinigt. Man bezeichnet diesen Schätzer auch als

Within-Schätzer. Für gegebenen Schätzer $βw lassen sich dann die Individualeffekte

wie üblich als $ $α βi i i wy X= − schätzen, wobei iy und iX arithmetische Mittel über die T

Beobachtungen des Individuums i sind.

Gleichung (1.13) ergibt sich auf Grund des Frisch-Waugh-Theorems (vgl. Davidson und

MacKinnon, 1993, Kapitel 1.4) als zweistufiger Schätzer, nämlich zunächst werden die

Variablen y und X auf die Dummy-Variablen D regressiert:

9

(1.14) XBDXybDy ˆˆundˆˆ +=+= .

In einem zweiten Schritt werden die Residuen dieser beiden Gleichungen, die hier mit

Xy ˆundˆ bezeichnet sind, aufeinander regressiert:

(1.15) $ $y X= +β ε .

*Beweis:

Man erhält dieses Ergebnis wie folgt aus dem Frisch-Waugh-Theorem: Zunächst

werden die Normalgleichungen für $α durch Multiplikation von (1.11) mit ′D gebildet

(1.16) ′ = ′ + ′ + ′=

D y D X D D Dβ α ε$ $.0

Danach wird der Schätzer von $α aus diesen Gleichungen

( ) ( ) βα XDDDyDDD ′′−′′= −− 11ˆ in das Modell (1.11) eingesetzt. Es ergibt sich dann:

(1.17) y D D D D y X D D D D X− ′ ′ = − ′ ′ +− −( ) ( )1 1β β ε

mit 1 1ˆ ( ) ( )NTy y D D D D y I D D D D y− −′ ′ ′ ′ = − = −

yT

IIyT

III TNNTN

′−⊗=

′⊗−⊗= ιιιι

11,

wobei ι ein Eins-Vektor der Länge T ist, d.h. )1,,1,1( L=′ι .

Gleichung (1.16) entspricht einem lineare Modell mit Variablen, die in Abweichung von

dem individuellen Mittel gemessen sind:

(1.18) . .( )it i it iy y X X β η− = − +

Ende des Beweises

Es ist offensichtlich, daß die Parameter iα nur für sehr großes T ( )T → ∞ konsistent

geschätzt werden können. Geht man hingegen von einem gegebenen kleinen T und

großer Anzahl der Individuen ( )N → ∞ aus, so nimmt mit N auch die Anzahl der Para-

meter iα zu. Sind die stochastischen Fehler ηit nicht mit den unabhängigen Variablen

10

itX korreliert, d.h. gilt 0)E( =′ ititX η , so sind die Schätzer für β wie im klassischen Reg-

ressionsmodell unverzerrte und beste lineare Schätzer (BLUE).

1.4 Das lineare Modell mit zufälligen individuellen Effekten

Das lineare Modell mit zufälligen Effekten (Random-Effects-Model) der Gleichungen

(1.19) und (1.20)

(1.19) y Xit it it= +β ε

(1.20) ε α ηit i it= +

unterstellt im Gegensatz zum Modell mit festen Effekte, daß die Individualeffekte iα

zwar stochastisch, jedoch mit den erklärenden Variablen itX unkorreliert sind, d.h. es

gilt:

(1.21) 0)E( =′ iitX α

Die beiden Zufallsvariablen iα und itη genügen außerdem den bereits oben in (1.8)

aufgezählten Bedingungen. Zusätzlich nimmt man häufig die Normalverteilung der bei-

den Störgrößen an:

(1.22) 2 2~ (0, ) und ~ (0, )i NTNV NV Iα ηα σ η σ ⋅

Die Gleichungen (1.8) und (1.21) implizieren, daß die Individualeffekte iα eine kon-

stante Verteilung über die Individuen mit Mittelwert 0 und Varianz σα2 besitzen und daß

diese stochastischen iα weder mit den allgemeinen Modellfehlern itη noch mit den er-

klärenden Variablen itX korrelieren. Die Modellfehler η sind, wie gewohnt, weißes

Rauschen. Aus diesen beiden Annahmen läßt sich die Kovarianz-Matrix Σ der Fehler

iε gemäß Gleichung (1.23) ermitteln

(1.23) [ ]

2 2 2 2

2 2 2 22 2

2 2 2 2

E i i TI

η α α α

α η α αη α

α α η α

σ σ σ σσ σ σ σ

ε ε σ σ ιι

σ σ σ σ

+

+ ′ ′∑ = = + =

+

LL

M M O ML

.

11

Dabei ist ι wieder ein T -dimensionaler Eins-Vektor, d.h. ( )′= 1,,1 …ι . In Matrix-

schreibweise läßt sich das Modell (1.23) als

(1.24) y X= +β ε

mit Kovarianzstruktur gemäß (1.25) schreiben:

(1.25) [ ]Ω = ′ = ⊗ ∑ =

∑∑

∑

E I Nεε

0 00 0

0 0 0

LL

M M O M

Dabei ist [ ]∑ = ′E i iε ε die TT × -Matrix der Gleichung (1.23). Man erkennt an (1.25) die

blockdiagonale Struktur von Ω , die es erleichtert die Inverse Ω − −= ⊗ ∑1 1I N zu be-

rechnen. Nach einigen Umformungen findet man für die Cholesky-Zerlegung von 1−Σ ,

d.h. für 21−Σ die Gleichung:

(1.26)

′−

−=∑ − ιιθ

ση TIT

112/1 mit θσ

σ ση

α η=

+

2

2 2T

In (1.26) ist der Parameter θ , der die Anteile von ση2 an der Streuung der individuellen

und allgemeinen Fehler angibt, zu bestimmen. Für gegebene Schätzer von θ erhalten

wir mittels der verallgemeinerten Kleinstquadratmethode eine effiziente Schätzung

des Random-Effekt-Modells:

(1.27) $ ( )β = ′ ′− − −X X X yΩ Ω1 1 1

bzw. die Kleinstquadrateschätzung des mit 21−

∑ transformierten Modells :

(1.28)1 1 1

2 2 2i i iy X β ε

− − −∑ = ∑ + ∑

Eine andere Darstellung geht auf Wansbeek und Kapteyn (1982, 1983) zurück. Dabei

wird Ω wie folgt zerlegt (vgl. Baltagi, 1995):

(1.29)2 2 2

2 2 2 2 21 1

1 1( ) ' '

mit

N N T

D D

T I I IT T

P M T

α η η

η α η

σ σ ιι σ ιι

σ σ σ σ σ

Ω = + ⊗ + ⊗ −

= + = +

12

( ) DDDDIM NTD ′′−= −1 bezeichnet die bereits oben eingeführte Projektionsmatrix, die

um die individuellen Mittelwerte über die Zeit bereinigt, und

( ) DDDDMIP DNTD ′′=−= −1 , die dazu orthogonale Projektionsmatrix, die die indivi-

duellen Mittelwerte erzeugt. Daraus folgt wegen der Idempotenz von DP und DM (d.h.

z.B. ′ =P P PD D D ): Ω − = +1

12 2

1 1σ ση

P MD D bzw. 1/2

1

1 1D DP M

ησ σ−Ω = + .

Der verallgemeinerte KQ-Schätzer ergibt sich durch Transformation des Modells mit

σ σ ση ηΩ− = +1 21

/ ( / )M PD D und anschließender KQ-Schätzung (Fuller and Battese,

1973). Dies läuft auf folgende Datentransformation hinaus: y y* /= −σηΩ 1 2 enthält die

Elemente y yit i− −( )1 θ .

Eine alternative Darstellung (Baltagi, 1995) geht von den folgenden alternativen Trans-

formationen des Modells aus, die als eine Gleichung zusammengefaßt werden:

(1.30)M y

PyM X

PXMP

D D D

=

+

β

εε

mit 1 1 1

N DP I PT NT NT

ιι ιι ιι′ ′ ′= ⊗ − = −%% %%

und ι% als NT-dimensionalem Einsvektor.

Die transformierte Störgröße hat Mittelwert null und Kovarianzmatrix

Ω =

σσ

η2

12

00M

PD .

Der verallgemeinerte KQ-Schätzer läßt sich dann als

(1.31)

′+′

′+′=

−

PyXyMXPXXXMX DD 21

2

1

21

2

1111ˆσσσσ

βηη

bzw. als gewogener Durchschnitt des Within- und des Between-Schätzers schreiben:

(1.32) ( ) ( )1 12 2ˆ ˆ ˆD D D w D D D BX M X XP X X M X X M X X P X X P Xβ θ β θ β

− −′ ′ ′ ′ ′= + ⋅ + + ⋅

Dabei ist das Streuungsverhältnis 2 2 21/ηθ σ σ= . Der GLS-Schätzer enthält für 0θ = den

Within-Schätzer und für θ → ∞ den Between-Schätzer als Spezialfall. Der Within-

Schätzer bereinigt um die individuellen Mittelwerte, d.h. berücksichtigt wird nur die Vari-

13

ation innerhalb eines Individuums über die Zeit, nicht aber die Variation zwischen den

Individuen. Der Between-Schätzer hingegen basiert nur auf der Variation der individu-

ellen Mittelwerte zwischen den Individuen.

Wir betrachten im folgenden zunächst den Schätzer des über alle Perioden t gemittel-

ten Modells der Gleichung (1.19):

(1.33) . .i iy X β= mit . .1 1

1 1und

T T

i it i itt t

y y X XT T= =

= =∑ ∑

In Matrixschreibweise können wir diese Mittlung mit Hilfe der oben beim Fixed-Effekt-

Modell definierten Dummy-Variablen-Matrix D wie folgt schreiben:

(1.34) 1 1mit ( )D D D D NP y P X P P D D D D I

Tε ιι−′ ′ ′= + = = ⊗

Da DP idempotent ist, d.h. es gilt ′ =P P PD D D , ist der Kleinstquadratschätzer dieser

Gleichung (1.34) der Between-Schätzer:

(1.35) 1ˆ ( )B D DX P X X P yβ −′ ′=

Man erkennt an der Struktur des Between-Schätzers, daß es sich um einen zweistufigen

Kleinstquadratschätzer mit den Dummy-Variablen für die Individuen als Instrument-

variablen handelt. Für großes T ist dieser Schätzer relativ robust gegenüber Meßfeh-

lern in den X - Variablen, solange für die Instrumentvariablen die Orthogonalitätsbedin-

gungen erfüllt sind. Während der Between-Schätzer dieses über alle Perioden gemit-

telte Modell schätzt, schätzt der Within-Schätzer des Fixed-Effekt-Modells gerade das

Modell der Abweichung der einzelnen Beobachtungen von diesen Mittelwerten. Insofern

vernachlässigt der Between-Schätzer gerade die Information der Daten, die der

Within-Schätzer benutzt. Dies kommt formal in den Transformationsmatrizen DP und

DM zum Ausdruck, denn es gilt D D NTM P I+ = .

Der KQ-Schätzer (1.6) läßt sich ebenfalls als gewogene Summe des Between- und

des Within-Schätzers darstellen:

(1.36)

1

1

1 1

ˆ ( )

( ) ( )ˆ ˆ( ) ( )

D D

D w D B

X X X y

X X X M y X P y

X X X M X X X X P X

β

β β

−

−

− −

= ′ ′

= ′ ′ + ′

= ′ ′ ⋅ + ′ ′ ⋅

14

mit yPXXPXyMXXMX DDBDDw ′′=′′= −− 11 )(ˆund)(ˆ ββ

Dieser Schätzer wird in der Paneldatenökonometrie als gepoolter Kleinstquadrat-

schätzer bezeichnet. Das Problem dieses gepoolten Kleinstquadratschätzers ist, daß

alle Beobachtungen das gleiche Gewicht erhalten. Dieses Verfahren ist nicht ge-

nerell optimal, weil eine zusätzliche Beobachtung für eine Person, die bereits in der

Stichprobe enthalten ist, vermutlich weniger Information hinzufügt als eine zusätzliche

Person. Um einen optimalen Schätzer im Sinne des Aitken-Schätzers zu erhalten,

muß man daher die unterschiedliche Gewichtung (Heteroskedastie) der Beobachtungen

gemäß der verallgemeinerten Kleinstquadrateschätzung berücksichtigen.

Bezeichnen wir mit $uw die Residuen der Within-Schätzung und mit Bu die Residuen der

Between-Schätzung, so ergeben sich folgende (ineffizienten) Schätzer für die Residuen-

Varianzen 22Bσση und , die für die zweistufige verallgemeinerte KQ-Schätzung benötigt

werden (vgl. Hsiao, 1986):

(1.37) 2 ˆ ˆˆ w wu u

NT K Nησ′

=− −

undKN

uuˆ BB

−

′=2

Bσ sowie $ $$

σ σσ

αη2 22

= −B T

Hinweis:

In der Schätzung der Residuen-Varianz $ση2 wird berücksichtigt, daß die Anzahl der ge-

schätzten Parameter nicht nur die Anzahl der Spalten in der Matrix der erklärenden Va-

riablen X ist, sondern daß ebenfalls die N Individualeffekte als feste Parameter ge-

schätzt wurden. Das Programm einer Kleinstquadrateschätzung weist demgegenüber

einen Schätzfehler aus, der die Schätzung der Individualeffekte in der Berechnung der

Freiheitsgrade nicht berücksichtigt wie in folgender Formel $ $ $σ computer

w wu uNT K

2 =′

−

Man muß daher um die korrekte Anzahl der Freiheitsgrade zu berücksichtigen, die fol-

gende Transformation verwenden: $ $σ ση2 2=

−− −

⋅NT K

NT N K computer

Mit Hilfe der drei Schätzungen der Residuen-Varianzen gemäß (1.37) kann θ gemäß

Gleichung (1.26) geschätzt und dann die verallgemeinerte Kleinstquadrateschätzung

durchgeführt werden.

15

Ende des Hinweises.

Diese verallgemeinerte Kleinstquadrateschätzung läuft darauf hinaus, daß man die Be-

obachtungen von ity und itX jeweils mit dem Gewicht $θ mal Mittelwert der Variablen

für das jeweilige Individuum transformiert gemäß den Gleichungen

(1.38) ~ $. .y y y yit it i i= − + θ

(1.39) ~ $. .X X X Xit it i i= − + θ .

Das so transformierte Modell kann mit Hilfe der Kleinstquadratmethode geschätzt wer-

den. Weitere Schätzverfahren für Modelle mit zufälligen Effekten findet man in Hsiao

(1986), Kapitel 3.3.

1.5 Das allgemeine Modell mit festen Effekten

Wir betrachten nochmals das Modell (1.7), in dem neben dem individuellen Effekt iα

andere individuelle Effekte δiZ auftreten. Bezeichnen wir mit itW die Matrix der

Regressoren in Gleichung (1.7) [ ]W X Zit it i= , so wird die Annahme

(1.40) [ ]E Wit it′ ≠ε 0

getroffen. Insbesondere wird angenommen, daß die individuellen unabhängigen Vari-

ablen iZ mit iα korrelieren. Die Verletzung dieser Orthogonalitätsbedingung hat wichti-

ge Konsequenzen. Hätten wir nur eine Beobachtungsperiode, daß heißt eine Quer-

schnittsregression gemäß Gleichung

(1.41) y X Zi i i i1 1 1= + +β δ ε ,

so folgt aus der Annahme(1.40), daß die Kleinstquadrateschätzung verzerrt ist. Die Hö-

he der Verzerrung hängt im wesentlichen davon ab, wie hoch die α i mit den Regressso-

ren itW gemäß Gleichung (1.42) korrelieren

(1.42) α πi iW error= +1 .

Man kann zeigen, daß der Probability-Limit der Koeffizienten $β um den ent-

sprechenden Koeffizienten des Vektors π verzerrt ist d.h.

16

(1.43) 222ˆplim πββ +=

Man kann diese Korrelation der Residuen mit den erklärenden Variablen dadurch elimi-

nieren, daß man erste Differenzen für alle Variablen bildet:

(1.44) y y X X Z Zi i i i i i i i2 1 2 1 2 1− = − + − + −( ) ( ) ( )β δ ε ε

∆ ∆ ∆ ∆y X Z= + +β δ ε

Durch diese zeitlichen Differenzen entfallen die individuellen Effekte iZ und iα , so daß

das Modell der Gleichung (1.45) gilt:

(1.45) ∆ ∆ ∆y X= +β η

Für diese Gleichung sind die Orthogonalitätsbedingungen der Kleinstquadratmethode

gemäß Gleichung (1.46)

(1.46) [ ] 0E =∆′∆ ηX

erfüllt.

1.6 Feste versus zufällige Effekte

Zu ähnlichen Resultaten kommt man, wenn man im allgemeine Random-Effekt-Modell

eine Korrelation der erklärenden Variablen mit den individuellen Effekten zuläßt, d.h.

wenn die Annahme

(1.47) E( ) 0it iX α′ ≠

gilt. Mundlak (1978) hat gezeigt, daß in diesem Fall der Random-Effekt-Schätzer inkon-

sistent wird, während der Fixed-Effekt-Schätzer weiterhin seine Konsistenz behält. Da-

her wird in der neueren Paneldatenliteratur eine Modell mit zufälligen Effekten und Kor-

relation zwischen den Effekte und den erklärenden Variablen gemäß Gleichung (1.47)

auch als Modell mit fixen Effekten bezeichnet.

Der wesentliche Unterschied zwischen dem Fixed- und dem Random-Effekt-Modell er-

gibt sich daher aus den unterschiedlichen Annahmen bzgl. der Korrelation zwischen den

zeitinvarianten Individualeffekten und den Residuen bzw. den erklärenden Variablen und

den Individualeffekten. Wenn man davon ausgeht, daß das Random-Effekt-Modell rich-

tig ist, so wird der Fixed-Effekt-Schätzer für die Parameter der zeitvariablen Regresso-

17

ren trotzdem konsistente Schätzer liefern. Insofern scheint es, als ob der Fixed-Effekt-

Schätzer vorzuziehen sei. Viele empirische Forscher finden die Fixed-Effekt-Schätzer

überzeugender als die Random-Effekt-Schätzer. Diese Differenz scheint die Konse-

quenz der vernünftigen Überzeugung zu sein, daß es unwahrscheinlich ist, daß die Indi-

vidualeffekte nicht mit den Regressoren itX korrelieren. Während vermutlich die Ran-

dom-Effekt-Schätzer positiv verzerrt sind, gibt es gewisse Argumente dafür, daß die

Fixed-Effekt-Schätzer negativ verzerrt sind. Dies ergibt sich insbesondere dann, wenn

geringe Meßfehler in einer der individuellen Statusvariablen iZ einen großen Einfluß auf

das Varianz-Verhältnis θ haben. Da der Random-Effekt-Schätzer für β ein Maximum-

Likelihood-Schätzer ist, ist er konsistent und effizient, wenn die individuellen Effekte

nicht mit den unabhängigen Variablen itX korrelieren. Der Fixed-Effekt-Schätzer für β

ist in diesem Fall zwar konsistent, aber nicht effizient, da er die Information des Bet-

ween-Schätzers vernachlässigt. Korrelieren die individuellen Effekte mit den unabhän-

gigen Variablen, ist der Fixed-Effekt-Schätzer konsistent und effizient und der Random-

Effekt-Schätzer inkonsistent.

1.6.1 Der Hausman-Wu-Test auf Random versus Fixed Effects

Eine Frage, die sich aus der bisherigen Analyse ergibt, lautet: Sind die beiden Schätz-

verfahren signifikant verschieden für eine gegebene Anwendung? Eine einfache Mög-

lichkeit dies zu testen, ist der Hausman-Wu-Test, der auf der Differenz der beiden

Schätzer gemäß Gleichung (1.48) beruht:

(1.48) )ˆˆ()()ˆˆ( 1FEREREFEFEREH ββββ −Σ−Σ′−= −

REFE Σ−Σ bezeichnet dabei die Differenzmatrix der Kovarianzmatrizen des Fixed-Effect-

und des Random-Effect-Schätzers. Asymptotisch ist diese Statistik χ2 verteilt mit K

Freiheitsgraden ( =K Anzahl der Spalten in der Matrix itX ), wenn die Nullhypothese

lautet, daß das Random-Effekt-Modell korrekt ist, d.h. daß die individuellen Effekte nicht

mit den unabhängigen Variablen korrelieren. Der Hausman-Wu-Test beruht auf dem

Vergleich eines unter der Nullhypothese konsistenten und effizienten, aber unter der

Gegenhypothese inkonsistenten Schätzers, mit einem unter der Null- und Gegenhypo-

18

these konsistenten Schätzer. Man kann diesen Hausman-Test numerisch durch eine

einfache Regression gemäß Gleichung

(1.49) y X X errorβ γ= + +%% %%

und einen F-Test auf Signifikanz der Parameter γ in Gleichung (1.49) durchführen. Da-

bei bezeichnen ~y und ~X die transformierten Variablen des Random-Effekt-Modells

gemäß Gleichung (1.38) und (1.39) und ~~X die transformierten Variablen des Fixed-

Effect-Modells mit ~~X X Xit it i= − .

Es wird also die Hypothese getestet, ob die Vernachlässigung der Fixed-Effects ( 0=γ )

in dem Random-Effekt-Modell einen Einfluß auf die Konsistenz der Random-Effekt-

Schätzer hat. Die Annahme der Nullhypothese 0=γ bedeutet aber nicht, daß das Ran-

dom-Effekt-Modell vorzuziehen ist, sondern lediglich, daß beide Verfahren sich nicht

signifikant unterscheiden. Dies mag daran liegen, daß nicht genug Variationen in den X-

Variablen vorliegen, um zwischen beiden Modellen zu diskriminieren. Praktische Prob-

leme treten auf, wenn die Mittelwerte von zwei Individuen sich über die Zeit nicht unter-

scheiden. In diesem Fall ist die Differenzmatrix der Kovarianzmatrizen REFE Σ−Σ singu-

lär. Der Hausman-Test läßt sich jedoch ohne weiteres anwenden, wenn man in der

Teststatistik statt der inversen Matrix die Verallgemeinerte Inverse verwendet. Die An-

zahl der Freiheitsgrade K entspricht in diesem Fall dem Rang der Differenzmatrix.

1.6.2 Test auf fixe Effekte

Wie im klassischen Regressionsmodell kann man auf Signifikanz aller Fixed Effekte,

d.h. H N0 1 2 1 0:α α α= = = =−L mit Hilfe eines F-Tests testen. Die Statistik

(1.50) Fu u u u Nu u N T N K

R R=′ − ′ −′ ⋅ − −

( $ $ $ $) / ( )$ $ / ( )

1

ist unter der Nullhypothese, daß keine Effekte vorhanden sind, F(N-1, N.T-N-K)-verteilt.

Dabei sind $ $′u uR R die Residuen einer OLS-Schätzung unter H0 : α i = 0 für alle i und $ $′u u

die Residuen der Within-Schätzung (mit α i ≠ 0).

19

1.7 Heteroskedastie-konsistente Schätzer der Standardfehler im Fixed-

Effekt-Modell

Arellano (1987) hat in Anlehnung an White (1980) empfohlen, die Standardfehler des

Fixed-Effect-Schätzers mit einer geschätzten Kovarianzmatrix zu berechnen, die

auch konsistent ist, wenn die Fehlergrößen heteroskedastisch sind, um die strenge An-

nahme der Homoskedastizität aufzuweichen.

Wenn ii Xy~

und~ die transformierten Daten des Within-Schätzers und ~ui die zugehö-

rigen geschätzten Residuen sind, ~ ~ ~ $u y Xi i i w= − β mit i N= 1 2, ,L , so ist

(1.51) ~ ~ ~ ~ ~VN

X u u Xi

N

i i i i= ′ ′=∑1

1

eine konsistente Schätzung der Kovarianzmatrix der Momente, die die Orthogona-

litätsrestriktionen bilden, ohne daß die Kovarianzmatrix der Störgrößen ~ηi der Within-

Regression selbst geschätzt wird. In Anlehnung an den KQ-Schätzer des linearen

Within-Modells gilt

(1.52) ~ ~y Xi i i= +β η

(1.53) $ ( ~ ~) ~ ~β β η− = ′ ′−X X X i1

und

(1.54) 1 1ˆ ˆ( )( ) ( ) ( )( )i iE X X E X X X Xβ β β β ηη− −′ ′ ′− − = % % % % % %% % mit ~ ~ ~ ~ .′ = ′=∑X X

NX Xi i

i

N1

1

Statt E Ii i( ~ ~ )η η σ′ = 2 anzunehmen, wird E X Xi i( ~ ~ ~ ~)′η η durch ~V geschätzt.

Die heteroskedastie-konsistenten Schätzfehler, die in der Literatur häufig fälschli-

cherweise als robuste Schätzfehler bezeichnet werden, lauten dann

(1.55) E X XN

X u u X X Xi i i ii

N

( $ )( $ ) ( ~ ~) ~ ~ ~ ~ ( ~ ~)β β β β− − ′ = ′ ′ ′

′−

=

−∑1

1

11

20

1.8 Beispiel zur Schätzung von Modellen mit festen und zufällige Effekten

Wir verwenden das aus der SUR-Schätzung (siehe Ökonometrie II) bekannte Beispiel

der Investitionsfunktion jetzt aber für insgesamt 20 Firmen:

(1.56) 1 2

1, ,20;

1935, ,1954it it it it

iI F C u

tα β β

== + + +

=L

L

Ii t = reale Bruttoinvestition der Firma i in Periode t

Fi t = realer Börsenwert der Firma i in Periode t

Ci t = realer Kapitalstock der Firma i in Periode t

Es ergeben sich folgende Schätzungen (Standardfehler in Klammern):

Tabelle 1.1: Vergleich der Schätzer für das einfache lineare Modell

Methode $β1$β2

θ

OLS 0.11556

(0.00584)

0.23068

(0.02548)

0

Between 0.13465

(0.02875)

0.03203

(0.19084)

∞

Within 0.11012

(0.01186)

0.31007

(0.01735)

1

GLS 0.01049

(0.01049)

0.30811

(0.01718)

0.861224

Man sieht, daß die Schätzung von θ näher an 1θ = als an 0θ = liegt, d.h. der GLS-

Schätzer liegt näher am Within-Schätzer. Dies wirkt sich hier insbesondere auf den

Schätzer des Parameters 2β aus.

1.9 Das Modell mit individuellen und zeitlichen Effekten

Wallace und Hussain (1969), sowie Nerlove (1971) haben die Störgrößenstruktur des

obige Modells wie folgt verallgemeinert:

(1.57) u i N t Tit i t it= + + = =α λ η ; , , , , , .1 1L L

21

Dabei ist tλ eine über die Individuen invariante Fehlerkomponente, die nur über die

Zeit variiert. tλ könnte z.B. zeitliche Besonderheiten wie Streiks, Ölembargos etc. er-

fassen. In Matrixschreibweise lauten die Störgrößen:

(1.58) u D Z= + +α λ η mit undN T N TD J i Z i I= ⊗ = ⊗ .

Es gilt: TNTN IJZZZZIJZZ ⊗=′′⊗=′ −1)(und .

Die Projektionsmatrix ( )J IN T⊗ mittelt zu jedem Zeitpunkt über die Individuen, d.h.

( )

/

/

.

.

.

J I u

uu

u

u N

u N

N T

T

iti

N

iTi

N⊗ =

=

=

=

∑

∑

1

2 1

1

M M

1.9.1 Fixed-Effect-Schätzung

Das Fixed-Effekt-Modell betrachtet iα und tλ als zu schätzende Parameter. Wallace

und Hussain (1969) haben gezeigt, daß folgende „Within“-Transformation sowohl iα als

auch tλ eliminiert.

Mittlung zu einem Zeitpunkt über die Individuen ergibt

(1.59) . . .1

mit 0N

t t t t ii

y X β λ η α=

= + + =∑ .

Mittlung für ein Individuum über die Perioden ergibt

(1.60) . . . mit 0i i i i tt

y X β α η λ= + + =∑ .

Beide Mittlungen zusammen ergeben

(1.61) ( ) ( ) ( )............ ηηηηβ +−−++−−=+−− tiittiittiit XXXXyyyy

Eine KQ-Schätzung von (1.61) gibt den Within-Schätzer dieses zweifachen Fehler-

komponenten-Modells, wobei sich $αi und tλ wie folgt ergeben:

(1.62) $ ( ) $. .. . ..α βi i iy y X X= − − −

22

(1.63) βλ ˆ)(ˆ...... XXyy ttt −−−=

Der Nachteil dieses Fixed-Effect-Modells liegt in der großen Zahl von ( 1) ( 1)N T− + −

Dummy-Variablen, die die Zahl der Freiheitsgrade drastisch reduzieren.

1.9.2 Test auf feste Effekte

Ähnlich wie in dem einfachen Fehlerkomponenten-Modell läßt sich die Hypothese

H N0 1 1 0:α α= = =−L und λ λ1 1 0= = =−L T

testen. Man muß lediglich die Freiheitsgrade der F-Statistik anpassen. Man kann aber

auch die bedingten Hypothesen

H N2 1 1 0:α α= = =−L gegeben λt ≠ 0 bzw.

H T3 1 1 0:λ λ= = =−L gegeben α i ≠ 0 testen.

Die $ $′u uR R der F-Statistik für den Test von H2 basiert auf der Regression

(1.64) y y X X u uit t it t it t− = − + −. . .( ) ( ).β

Für den Test von H3 ergibt sich $ $′u uR R aus der Within-Regression

(1.65) . . .( ) ( ).it i it i it iy y X X u uβ β− = − + −

1.10 Dynamische Paneldatenmodelle

Paneldaten sind besonders geeignet, die dynamischen Anpassungsprozesse im öko-

nomischen Verhalten der Wirtschaftssubjekte zu analysieren. Auf der anderen Seite

bereiten die Individualeffekte des Panel-Modells besondere Probleme bei der Schät-

zung dynamischer Gleichungen. Dieses Problem wird dadurch gelöst, daß man die Indi-

vidualeffekte durch Filterung der Gleichung eliminiert. Das typische dynamische Panel-

Modell ist in Gleichung gegeben

(1.66) 21 ; ~ (0, )it it it i it ity y x N εδ β α ε ε σ− ′= + + + mit 1, ,i N= … und 1, ,t T= … .

Dabei sind die Individualeffekte iα Zufallsvariablen, die entweder mit den unab-

hängigen Variablen itx korrelieren (Fixed-Effekt-Modell) oder nicht (Random-Effekt-Mo-

23

dell). Sie haben eine konstante Varianz σα2 , d.h. iα ist i.d.R. normalverteilt mit Mittelwert

0 und Varianz σα2 . Die Vektoren itx enthalten zunächst die exogenen Variablen, so daß

0)E( =′ ititx ε ist. Aufgrund der Annahme eines weißes Rauschens für die Störgröße itε

gilt dann entsprechend die Unabhängigkeit zwischen den verzögerten endogenen Vari-

ablen und ε i t, d.h. E yit it( )− =1 0ε .

Als Fixed-Effekt-Modell können wir Gleichung (1.66) wiederum in Form einer Matrixdar-

stellung gemäß Gleichung (1.67) schreiben, wobei die Individualeffekte über Dummy-

Variablen in der Matrix D dargestellt werden.

(1.67) y y X D= + + +−1δ β α ε

mit

1 1

2 2und

i

ii

N iT

y yy y

y y

y y

= =

M M ;

1 1

2 2mit

i

ii

N iT

X xX x

X X

X x

′ ′ = = ′

M M

1, 1 0

2, 1 11 , 1

, 1 , 1

und

i

ii

N i T

y yy y

y y

y y

−

−− −

− −

= =

M M

1

2

11

mit und

1

N

N

D I i i

αα

α

α

= ⊗ = =

MM .

1.10.1 Differenzenfilterung und Instrumentvariablen-Schätzer

Anderson und Hsiao (1981,1982) haben vorgeschlagen, in Modell (1.66) bzw. (1.67)die

individuellen Effekte αD durch Bildung erster Differenzen zu eliminieren. Diese Filte-

rung der Individualeffekte läßt sich mit Hilfe von Gleichung (1.68) darstellen wobei F die

Differenzenfiltermatrix bezeichnet.

(1.68) Fy Fy FX F= + +−1δ β ε

24

mit

−

−−

=⊗=

1100

0011000011

und

LLMM

LL

TTN FFIF

Dabei ist TF eine ( )TT ×−1 -dimensionale Matrix. Für diese Definition von F gilt die

Beziehung 0FD = , d.h. die Individualeffekte werden durch die Filtermatrix eliminiert.

Allerdings muß für die Eliminierung der Individualeffekte ein Preis in Form einer Moving

Average-Struktur der Störgrößen εF gezahlt werden. Eine konsistente und effiziente

Schätzung muß daher diese Fehlerstruktur berücksichtigen. Wir bezeichnen die Schät-

zer der Gleichung (3) mit F als Differenzenoperator als Differenzenschätzer. Eine

weitere Konsequenz der Filterung ergibt sich daraus, daß F y y yT i it i t, ,− − −= −1 1 2 mit

FT it it itε ε ε= − −1 korreliert, weil 1−ity von 1−itε abhängt. Anderson und Hsiao (1981)

empfehlen daher 2−ity als Instrumentvariable bei der Schätzung von Gleichung (1.68) zu

verwenden. Arellano und Bond (1991) empfehlen verallgemeinernd die Verwendung der

folgenden blockdiagonalen Instrumentvariablen Matrix iW , die alle Orthogonalitäts-

restriktionen nutzt:

(1.69)

0 1

0 1, 1

0 2 1

[ , , , ] 0 00 [ , , ]

0 [ , , , ]

i i iT

i i i iTi

i iT i iT

y x xy y x x

W

y y x x−

′ ′ ′ ′ = ′ ′

L LL

M ML L L

Um eine effiziente Schätzung von Gleichung (1.67) zu gewährleisten, wird Gleichung

(1.68) zunächst mit der Matrix W gemäß Gleichung (1.70) multipliziert

(1.70) ′ = ′ + ′W Fy W FX W Fε

mit ).,(und)(,],[ 11 βδγ =′=′′′= − XyXWWW NL

Die Struktur der Störgrößen in Gleichung (1.70) wird jetzt über einen verallgemeinerten

Instrumentvariablenschätzer gemäß Gleichung (6) berücksichtigt

(1.71) [ ]( ) [ ]11 1ˆ ( ) ( )N T T N T TX F W W I F F W WFX X F W W I F F W W Fyγ

−− −′ ′ ′ ′ ′ ′ ′ ′ ′ ′= ⊗ ⋅ ⊗ .

25

Die verallgemeinerte Instrumentvariablenschätzung gemäß Gleichung (1.71) ist nicht

eindeutig, da die Wahl der Instrumentvariablen gemäß Gleichung (1.69) nicht eindeutig

ist. Wählt man andere Instrumente verändert sich der Schätzer.

Wenn man bei der Schätzung der Gleichung (1.67) auf die Verwendung von Instrumen-

ten verzichtet, d.h. W durch eine TN ⋅ -dimensionale Einheitsmatrix ersetzt NTIW = , so

ist der verallgemeinerte Instrumentvariablenschätzer identisch mit einem Aitkenschätzer

der Gleichung (1.67) und damit auch identisch mit einer Kleinstquadrateschätzung der

Gleichung:

(1.72) [ ]y y X=

+−1

δβ

ε

weil [ ]′ ⊗ ′ =−

F I F F F IN T T NxT( )1

gilt.

Mit anderen Worten: Die Berücksichtigung der inversen Kovarianzstruktur in Gleichung

(1.71) macht gerade die Moving-Average-Struktur der Störgrößen in Gleichung (1.70)

rückgängig, die dort durch Anwendung der Filtermatrix F entstanden ist. Gleichung

(1.72) und Gleichung (1.67) unterscheiden sich nun aber dadurch, daß in Gleichung

(1.72) die Individualeffekte eliminiert sind. Die Gleichung (1.72) ist in diesem Sinne fehl-

spezifiziert, d.h. man filtert zunächst die Individualeffekte heraus und verwendet dann

eine Variablentransformation, die die Effekte der Filterung auf die Störgröße eliminiert,

ohne daß die Individualeffekte in dieser neuen Gleichung wieder auftauchen. Es ist die

Frage, ob dieses ein vernünftiges Vorgehen für die Schätzung von Gleichung (1.67) ist.

Eine Alternative zu der Instrumentvariablenschätzung (1.71) besteht darin, daß man nicht

von weißem Rauschen ausgeht, sondern die Kovarianzstruktur der Störgröße itε in

Gleichung (1.67) offenläßt. Man muß dann in Gleichung (1.71) die mit den Instrumentva-

riablen gewichtete Kovarianzstruktur in anderer Weise bestimmen. Ein gängiges Ver-

fahren geht auf White zurück, der den Ausdruck in eckigen Klammern in Gleichung

(1.71) durch folgenden Term ersetzt:

(1.73) ∑=

′′N

iiTiiTi WFFW

1

'ˆˆ εε

26

ε sind dabei die Residuen der ersten Stufe der Schätzung, in der wie vorher beschrie-

ben vorgegangen wurde.

Ein verallgemeinerter Instrumentvariablenschätzer der die Fehlergrößenstruktur berück-

sichtigt entspricht den linearen Fall eines Verallgemeinerten Momentenschätzers bzw.

GMM-Schätzers von Hansen (1982) der von Arellano und Bond (1991) auf Paneldaten-

modelle übertragen worden ist. Der Schätzer (1.71) ist nach Arellano und Bond (1991)

ein einstufiger GMM-Schätzer und der Schätzer, der allgemeinere Strukturen der Feh-

lergrößen gemäß (1.73) zuläßt ein zweistufiger GMM-Schätzer. Wichtig ist, daß die

Schätzfehler des zweistufigen GMM-Schätzers die wahren Schätzfehler unterschätzen.

Daher sollten immer zusätzlich die Schätzfehler des einstufigen GMM-Schätzers aus-

gewiesen werden. Die Berechnung der Schätzfehler kann man leicht in Arellano und

Bond (1991) oder Janz (1997) nachlesen.

1.10.2 Differenzenschätzer versus Within-Schätzer

Differenzen- und Within-Schätzer unterscheiden sich im wesentlichen darin, wie die Indi-

vidualeffekte iα geschätzt werden. Der Within-Schätzer schätzt in Gleichung (1.67) die

Individualeffekte durch Mittlung über alle T Beobachtungen für das Individuum i gemäß

Gleichung (1.74) und substituiert $αi in Gleichung (1.66) bzw. (1.67). Breitung und Meyer

(1994) haben einen Differenzenschätzer gemäß Gleichung (1.75) vorgeschlagen, der

die erste Beobachtung benutzt, um iα zu schätzen:

(1.74) y y Xi i i i i= + ′ + +−, $1δ β α ε

(1.75) y y Xi i i i, , , $1 0 1 1= + ′ + +δ β α ε

Hierbei handelt es sich um eine Einpunktschätzung der Individualeffekte. Glei-

chung (1.67) läßt sich dann mit Hilfe der Filtermatrix BF wie in Gleichung (1.68) schrei-

ben:

(1.76) 1

1 1 0 ...01 0 1 ...0

mit

1 0 0 ...1

B B B B BF y F y F X F Fβ ε−

− − = + ′ + = −

M .

27

Die Differenzierung in Gleichung (1.68) gemäß Anderson und Hsiao (1981, 1982) ergibt

sich in einfacher Weise aus Gleichung (1.76), indem wir in Gleichung (1.76) erste Diffe-

renzen bilden. Dadurch wird deutlich, daß die implizite Schätzung der Individualeffekte in

Gleichung (1.68) ebenfalls eine Einpunktschätzung ist, d.h. es werden bei der Schätzung

der Individualeffekte nicht alle T Beobachtungen wie beim Within-Schätzer, sondern nur

jeweils eine Beobachtung verwendet. Dies ist der Preis, den man dafür zu zahlen hat,

daß es genügend Instrumente bei der Schätzung der übrigen Parameter des Modells

gibt. Der Within-Schätzer wirft demgegenüber ein anderes Problem auf, nämlich die

Inkonsistenz der Schätzung von β .

Zur Illustration sei ein einfaches autoregressives Modell ohne exogene Variablen be-

trachtet:

(1.77) , 1 mit 1, ,it i t i ity y t Tβ α ε−= + + = L

Als KQ-Schätzer ergibt sich

(1.78) $ ( )( )

( ),

,β =

∑ ∑ − −

∑ ∑ −= = −

= = −

iN

tT

it i i t i

iN

tT

i t i

y y y y

y y1 1

11

0

1 1 10 2 .

Der Term y yit i− 1 ist mit y yi t i, − −10 auch dann korreliert, wenn 0β = gilt, da beide Ter-

me mit T ytT

it−

=−∑111 eine gemeinsame Komponente enthalten. Für 0β = und N → ∞

konvergiert der um 1N erweiterte Zähler in (1.78) gegen

(1.79) 2

1

1

01,

1

)1(11E εσεεεε

TT

TT

T

t

T

jijti

T

jijit

−−=

−

−∑ ∑∑

=

−

=−

=

und der Nenner gegen

(1.80) 2

1

2

01, )1(

1E εσεε −=

−∑ ∑

= =− T

T

T

t

T

jijti .

Daraus ergibt sich die asymptotische Verzerrung von 1T− .

Für beliebige Werte von β hat Nickel (1981) gezeigt, daß für die asymptotische Verzer-

rung der KQ-Schätzung gilt

28

(1.81)1

)1(1

1)1)(1(

21

)1(1

11

1)ˆ(plim

−

∞→

−

−−

−−−

−

−−

−+

−=−β

ββ

ββ

ββββ

TTTT

TT

N.

Man bezeichnet die asymptotische Verzerrung gemäß (1.81) in der Literatur auch als

Nickel-Bias. Der autoregressive Parameter wird systematisch mit der Ordnung )( 1−TO

unterschätzt. Für große Werte von T kann die Verzerrung mit ( )β+−− − 1)1( 1T appro-

ximiert werden (vgl. Nickell 1981). Ridder und Wansbeck (1990) leiten die Verzerrung

auf eine andere Weise her und geben auch die Formel für die asymptotische Verzer-

rung in einem dynamischen Modell mit exogenen Variablen an. Diese Ergebnisse sind

jedoch nur anwendbar, wenn die Störgrößen itε stationär sind. Dies impliziert, daß der

Prozeß bereits unendlich lange unter unveränderten Bedingungen läuft. Sevestre und

Trognon (1985) leiten die asymptotischen Verzerrungen darüber hinaus für nicht-

stationäre Initialbedingungen ab.

In Tabelle 1.3 sind für ausgewählte Werte von T und β die Grenzwerte wiedergegeben,

gegen die die Schätzung gemäß (1.81) für ∞→N konvergiert. Demnach weisen die

Schätzungen für β eine erhebliche negative Verzerrung auf, die für kleine und mittlere

Werte von T nicht vernachlässigt werden darf. So wird z.B. in einer Studie von Hübler

(1990) mit Hilfe der Schätzfunktion (1.78) der Autokorrelationskoeffizient der Residuen

mit -0.1353 geschätzt. In diesem Beispiel ist T = 3, so daß zu dieser Schätzung ein Wert

von etwa 3.0=β zugeordnet werden kann, der weitaus plausibler ist als eine negative

Korrelation (vgl. Hübler (1990, S. 90). In einer weiteren Arbeit (Hübler 1991, S.286) wur-

de für T = 3 ein Autokorrelationskoeffizient von 0.07 gefunden, womit ein Wert von etwa

β = 0.7 korrespondiert. Daraus wird deutlich, daß die Schätzung der Autokorrelation für

wenige Zeitpunkte so stark verzerrt sein kann, daß eine verhältnismäßig große Korrela-

tion der Störgrößen nahezu vollständig verdeckt wird.

29

Tabelle 1.3 Asymptotische Werte für $β nach dem Nickel-Bias

β T=3 T=4 T=6 T=10 T=15 T=20

-0.9 -0.926 -0.924 -0.916 -0.909 -0.906 -0.905

-0.6 -0.717 -0.695 -0.663 -0.639 -0.626 -0.620

-0.4 -0.585 -0.543 -0.496 -0.458 -0.439 -0.430

-0.2 -0.457 -0.394 -0.330 -0.279 -0.253 -0.240

0.0 -0.333 -0.250 -0.167 -0.100 -0.067 -0.050

0.2 -0.213 -0.111 -0.006 0.077 0.119 0.139

0.4 -0.094 0.023 0.149 0.252 0.303 0.328

0.6 0.022 0.153 0.298 0.422 0.484 0.515

0.9 0.194 0.340 0.506 0.657 0.738 0.780

Im Ergebnis läßt sich festhalten, daß beide Verfahren der Eliminierung der Individualef-

fekte besondere Probleme im dynamischen Panelmodell erzeugen.

1.10.3 Test auf Spezifikationsfehler im dynamischen Panelmodell

Im allgemeinen verfährt man in der Ökonometrie so, daß man das Modell nach der

Schätzung mehreren Spezifikationstests unterzieht. Dabei überprüft man insbesondere

die Annahmen über die Fehlergrößen, d.h. Autokorrelations-, Homoskedastizitäts- und

Verteilungseigenschaften. Einer der wesentlichen Vorteile des Verallgemeinerten

Momentenschätzers (GMM) gegenüber alternativen Schätzverfahren, insbesondere

dem Maximum-Likelihood-Verfahren, besteht darin, daß er mit sehr wenigen Annahmen

über die Fehlergrößen auskommt. Mögliche Verteilungseigenschaften manifestieren

sich im Rahmen der GMM-Schätzung einzig und allein in der Wahl einer effizienten Ge-

wichtungsmatrix und haben keinen Einfluß auf Konsistenz und Verteilungseigenschaften

des Schätzers. Allerdings stehen und fallen die Eigenschaften des GMM-Schätzers mit

der Gültigkeit der bei der Bildung der Instrumentmatrizen unterstellten Orthogonalitäts-

bedingungen. Eine Interpretation der Schätzergebnisse sollte daher nie erfolgen, ohne

die Validität (d.h. die Orthogonalität) der Instrumente zu testen.

Im folgenden werden daher zwei Tests vorgestellt, die die Gültigkeit der theoretischen

Momentrestriktionen überprüfen. Beide wurden bereits von Arellano, Bond (1991) in

ihrer grundlegenden Arbeit zur GMM-Schätzung im Panel diskutiert. Der erste Test, der

30

sogenannte J-Test von Hansen (1982), testet gegen allgemeine Verletzungen der Mo-

mentbedingungen und wird bisweilen auch als Test der Hypothese rationaler Erwartun-

gen verwendet (Hansen und Singleton, 1992). Der zweite Test, von Arellano und Bond

(1991), testet Verletzungen der Momentrestriktionen, die durch Autokorrelation in den

allgemeinen Fehlergrößen itε entstehen.

1.10.3.1 Test auf überidentifizierende Restriktionen

Die stochastischen Eigenschaften des GMM-Schätzers hängen entscheidend von der

Gültigkeit der Momentrestriktionen E W Fi T i′ =ε 0 ab. Die Momentrestriktionen sind

verletzt, wenn die gewählten Instrumente Wi in irgendeiner Form mit den gefilterten

Fehlergrößen FTε i korrelieren. Ein Test auf Validität der Instrumente ist im Rahmen des

GMM-Ansatzes daher unerläßlich (vgl. auch Davidson und MacKinnon (1993), Kap. 17).

Die Vielzahl der Gründe, die zu einer Korrelation zwischen Instrumenten und Fehlergrö-

ßen führen kann, erfordert einen Test, der gegen eine allgemeine Verletzung der Mo-

mentrestriktionen testet. Dies leistet der von Sargan (1958) für den verallgemeinerten

IV-Schätzer (GIVE) entwickelte und von Hansen (1982) für den GMM-Schätzer erwei-

terte J-Test. Die zu testenden Hypothesen lauten

(1.82) H E W F vs H E W Fi T i i T i0 10 0: . :′ = ′ ≠ε ε .

Unter der Hypothese H0 und asymptotisch normalverteilter $ *β ′ ist

(1.83)1 12

1

σβ β

Ny X F W

NW I F F W W F y X F I FN T T N T( $*) [ ( ( )) ] ( $*)− ′ ′ ⊗ ′ ′ − = ⊗− mit

mit dem GMM-Schätzer $ *β , asymptotisch 2( )M Kχ − -verteilt (Hansen, 1982, Arellano

und Bond, 1991). M K− bezeichnet die Differenz zwischen der Anzahl der verwendeten

Instrumentvariablen, die unter der Null-Hypothese asymptotisch die Nullrestriktion erfül-

len, und der Anzahl der zu schätzenden Parameter. Zur Identifikation der K Koeffizien-

ten genügen K Momentrestriktionen, so daß die restlichen M K− Restriktionen über-

identifizierend sind, d.h. es existieren M K− linear unabhängige Momente, die durch

das Schätzverfahren nicht Null gesetzt werden. Der Test prüft daher, ob die M K− ü-

beridentifizierenden Nullrestriktionen erfüllt sind.

31

Für den einstufigen GMM-Schätzer ergibt sich als Teststatistik (Arellano und Bond,

1991)

(1.84) J y X F W W I F F W W F y X F I FN T T N T1 2 11

11

= − ′ ′ ′ ⊗ ′ ′ − = ⊗−

$ ( $ ) ( ( ( )) ) ( $ ) .* *

σβ β

ε

mit .

Bei Gültigkeit der unabhängigen Normalverteilung von 2N(0, )ε σ= bezeichnet $σε2 den

konsistenten Schätzer der Varianz des allgemeinen Fehlerterms.

(1.85) $( )

$ $σ ε εε2

1

11

=−

′ ′=∑N T

F FT i i Ti

N

.

Im Rahmen des einstufigen GMM-Schätzers ist der J-Test nur vorsichtig anzuwenden,

da er nur gültig ist, wenn die strengen Verteilungsannahmen über die Fehlergrößen er-

füllt sind.

Die Teststatistik für den zweistufigen GMM-Schätzer mit allgemeiner Kovarianz-

matrix $∑ε lautet analog (Arellano und Bond, 1991)

(1.86) JN

y X F WA W F y X2 2 2 21

= − ′ ′ ′ −( $ ) ( $ )* * *β β

mit

(1.87) AN

W F F W F I FN T211* ( $ ) ;= ′ ∑ ′ = ⊗−

ε

und hängt über die Schätzung der optimalen Gewichtungsmatrix der zweiten Stufe A2*

von den Annahmen über die Fehlergrößen ab. Läßt man Autokorrelation und intertem-

porale Heteroskedastizität zu, lautet die Gewichtungsmatrix

(1.88) AN

W I F F WKN T T2

11* ( ( $ ) )= ′ ⊗ ∑ ′ −ε .

Erlaubt man zusätzlich interindividuelle Heteroskedastizität lautet A2*

(1.89) AN

W WAi i i i

i

N

21

1

1* ( $ $ )= ′ ′ −

=∑ ε ε .

A A2

* liefert eine konsistente Schätzung von 'W WΣ ohne Σ selbst konsistent zu schät-

zen. Die Null-Hypothese wird verworfen, wenn der Wert der Teststatistik 1J oder 2J den

32

gewählten Prozentpunkt der χ2-Verteilung mit M K− Freiheitsgraden bei vorgegebener

Fehlerwahrscheinlichkeit übersteigt.

1.10.3.2 Autokorrelationstests

Fehlende Validität der Instrumente kann auf falschen Annahmen über die stochastischen

Eigenschaften der Fehlergrößen beruhen. Der Differenzenfilter F impliziert, daß die ge-

filterten Fehlergrößen einem MA(1)-Prozeß folgen. Arellano und Bond (1991) haben

daher einen Test entwickelt, der die Hypothese des MA(1)-Prozesses der gefilterten

Fehlergrößen gegen allgemeinere Formen der Autokorrelation, insbesondere MA-

Prozessen höherer Ordnung testet. Folgen die gefilterten Fehlergrößen einem MA(1)-

Prozeß, so korrelieren sie mit ihren eigenen Verzögerungen 1tFε − , sind aber unkorreliert

mit 2tFε − , d.h. ε ε ε εt t t t− −− − −1 1 2und korrelieren, aber ε ε ε εt t t t− −− − −1 2 3und korrelieren

nicht, so daß dieser Test bei MA(1)-Störgrößen aufgrund des Differenzenfilters keine

Autokorrelation anzeigen sollte. Arellano und Bond (1991) testen daher die Hypothese,

daß die gefilterten Fehlergrößen im Mittel über die Individuen mit ihren zweifachen Ver-

zögerungen , 2iε − unkorreliert sind:

(1.90) H E F F vs H E F FT i T i T i T i0 2 1 20 0: ( ) ( ) . : ( ) ( ), ,ε ε ε ε′ = ′ ≠− − .

Bezeichnet man zur Vereinfachung die Elemente des Vektors der differenzierten Resi-

duen mit $εitD , so lautet die Teststatistik

(1.91) mm

D D

22 2

2= −

′+$ $ε ε

.

2 1, 2 , 2 , 2 ,1 , 3ˆ ˆ ˆ ˆ ˆ ˆ( , , ) mit ( , , )D D D D D DN i i i Tε ε ε ε ε ε′ ′

− − − − −′ ′= =L L bezeichnet den Vektor der zweifach verzö-

gerten differenzierten Residuen, d.h. der jeweils ersten 3T − Realisationen für jedes

Individuum, und 2 1, 2 , 2 , 2 ,3 , 1ˆ ˆ ˆ ˆ ˆ ˆ( , , ) mit ( , , )D D D D D DN i i i Tε ε ε ε ε ε′ ′

+ + + + −′ ′= =L L den Vektor der differen-

zierten Residuen mit zweifachem Vorlauf (Lead), d.h. den Vektor der jeweils letzten

3T − Realisationen für jedes Unternehmen.

Unter der Null-Hypothese ist die Teststatistik 2m asymptotisch N(0,1)-verteilt.

33

* Hinweis: m2 setzt sich kompliziert aus den Kreuzmomenten der zweifach verzögerten

Residuen und der gewichteten GMM-Momente zusammen.

Für den einstufigen GMM-Schätzer gilt

(1.92) m F Ft iD

T T iD

i

N

22

2 2 21

= ′−′

+ −=∑$ $ ( ) $, ,σ ε ε

− ′ ′ ′ ⊗ ′ ′−′

+− −2 2

2 21 1$ $ ( ) ( ( ( ) ) )σ εε

DN T TFX X F W W I F F W W FX

′ ′ ′ ⊗ ′ ′−++ −

=∑X F W W I F F W W HN T T i i

D

i

N

( ( ) ) $,

12

1ε

+ ′−′

+ + −$ ( ) $( $ )( ) $*ε β ε2 2 1 2 2D DFX V FX

und für den zweistufigen GMM-Schätzer

(1.93) m iD

iD

iD

iD

i

N

2 2 2 2 21

= −′

+ +′

−=∑ $ $ $ $, , , ,ε ε ε ε

− ′ ′ ′ ′ ′ ′−′

+−

=+′

−∑2 2 2 21

21

2 2$ ( ) ( ) $ $ $* *, ,ε ε ε εD

ii

N

iD

iD

iDFX X F WA W FX X F WA W

+ ′−′

+ + −$ ( ) $( $ )( ) $*ε β ε2 2 2 2 2D DFX V FX .

2( )FX + bezeichnet analog zu $ε+2D die Matrix der jeweils letzten 3T − der 1T − Beo-

bachtungen der gefilterten erklärenden Variablen, H++ eine nicht symmetrische Matrix

( )T TF F ++′ , die vom (T-1)-dimensionalen Spaltenvektor (0, 1,2, 1,0, ,0)′− − L beginnt (statt

wie eine symmetrische Matrix mit (2, 1,0, 0) '− L ) wie F FT T′ . $( $ )*V β1 und $( $ )*V β2 bezeich-

nen jeweils die konsistent geschätzte Kovarianzmatrix des einstufigen bzw. zweistufigen

GMM-Schätzers.

Ende des Hinweises.

Analog haben Arellano und Bond (1991) auch einen Test vorgeschlagen, der die Hypo-

these der Freiheit von Autokorrelation der gefilterten Fehlergrößen gegen allgemeine

Formen der Autokorrelation, insbesondere MA(1)-Prozessen, testet. Da die gefilterten

Fehlergrößen bei Anwendung des Differenzenfilters im Fall normalverteilter ε i einem

34

MA(1)-Prozeß folgen, sollte der Test die Hypothese der Freiheit von Autokorrelation bei

Anwendung des Differenzenfilters verwerfen. Die Hypothesen des Tests lauten analog

(1.94) H E F F vs H E F FT i T i T i T i0 1 1 10 0: ( ) ( ) . : ( ) ( ), ,ε ε ε ε′ = ′ ≠− − .

Die Teststatistik m1 ist unter der Hypothese H0 ebenfalls asymptotisch N(0,1)-verteilt

und lautet analog zu (1.91)

(1.95) mm

D D

11 1

1= −

′+$ $ε ε

mit 1 1, 1 , 1 , 1 ,1 , 2ˆ ˆ ˆ ˆ ˆ ˆ( , , ) und ( , , )D D D D D DN i i i Tε ε ε ε ε ε′ ′

− − − − −′ ′= =L L sowie

1 1, 1 , 12 , 1 ,2 , 1ˆ ˆ ˆ ˆ ˆ ˆ( , , ) und ( , , )D D D D D DN i i i Tε ε ε ε ε ε′ ′

+ − + + −′ ′= =L L .

Bei MA(1)-Residuen sollte dieser Test aufgrund der Filterung Autokorrelation anzeigen.

* Hinweis: m1 bildet sich analog zu m2 . Für den einstufigen GMM-Schätzer gilt für m11

die Formel (1.92) und für den zweistufigen GMM-Schätzer für m12 die Formel (1.93) ent-

sprechend, wenn man $ε−2D durch $ , $ε ε− +

′1 2D D durch $ , ( )ε+ +1 2

D FX durch ( )FX +1 , entsprechend

definiert und ( )F FT T′ +2 durch eine 2T − -dimensionale Einheitsmatrix sowie H++ durch

eine ( 1) ( 2)T T− × − -dimensionale Matrix, die aus einer ( 1)T − -dimensionalen Einheits-

matrix besteht, die von oben durch einen ( 2)T − -dimensionalen Zeilenvektor von Nullen

gerändert ist, ersetzt.

Ende des Hinweises.

1.10.4 Test linearer Hypothesen

Neben den im vorigen Abschnitt erörterten Tests der Instrumentvalidität sind Tests der

Signifikanz von Parametern und Parametergruppen von Interesse, die sich als Spezial-

fälle von allgemeinen Tests linearer Hypothesen darstellen lassen. Lineare Hypothesen

über die Parameter des ökonometrischen Modells lassen sich im allgemeinen als

(1.96) 0 1: 0 vs. : 0H R r H R rβ β− = − ≠

35

formulieren, wobei R eine ( )L K× -Restriktionsmatrix mit L K≤ vom Rang L ist und r

ein korrespondierender L -dimensionaler Spaltenvektor. Wir schreiben z.B. die Restrik-

tionen β β2 3= und β β4 5= als

0 1 1 0 0 00 0 0 1 1 0

0−

−

=

L LL L β .

Die Hypothese H0 formuliert L linear unabhängige Hypothesen über die K zu schätzen-

den Parameter, die gemeinsam zu testen sind.

Analog zum linearen Regressionsmodell lassen sich im GMM-Ansatz Hypothesentests

nach drei Testprinzipien unterscheiden: dem Lagrange-Multiplikator-Testprinzip (LM-

Prinzip), dem Wald-Testprinzip bzw. dem Likelihood-Verhältnis-Testprinzip (LR) (vgl.

auch Davidson und MacKinnon, 1993, Kap. 17.6).

Diese Testprinzipien unterscheiden sich dadurch, ob die Testprozedur eine restringierte

Schätzung unter der Hypothese H0 oder eine freie Schätzung unter der Hypothese H1

erfordert. Dem LM-Prinzip liegt ausschließlich die Schätzung des Modells unter der

Hypothese H0 zugrunde und dem Waldprinzip ausschließlich die Schätzung des Modells

unter der Hypothese H1. Dem LR-Prinzip liegt die Differenz der log-Likelihoodfunktion

unter H0 und H1 zugrunde.

Für Tests linearer Hypothesen anhand des linearen GMM-Schätzers sind die drei Test-

statistiken sowohl für den einstufigen als auch für den zweistufigen effizienten GMM-

Schätzer identisch, wenn der gleiche Schätzer für die optimale Gewichtungsmatrix ver-

wendet wird (Newey und West, 1987). Die numerische Berechenbarkeit ist in diesem

Fall für den Wald-Test am einfachsten, so daß dieser in entsprechenden Softwarepa-

keten standardmäßig durchgeführt wird (vgl. Arellano und Bond, 1988).

Der Wald-Test mißt die Verletzung der Restriktion durch den unrestringierten Schät-

zer $β . Für den effizienten einstufigen GMM-Schätzer lautet die Teststatistik

(1.97) WN

R r R X F W W HW W FX R R r1 21 1 1= − ′ ′ ′ ′ ′ ′ −− − −

$ ( $ ) ( ( ( ) ) ) ( $ )σ

β βε

mit H I F FN T T= ⊗ ′

und für den effizienten zweistufigen GMM-Schätzer

36

(1.98) W R r R X F WA W FX R R r2 21 1= − ′ ′ ′ ′ ′ −− −( $ ) ( ( ) ) ( $ )( )

*β β

wobei A( )*2 ein konsistenter Schätzer der optimalen Gewichtungsmatrix ist. W1 und W2

sind unter der Hypothese H0 asymptotisch χ2(L)-verteilt.

1.10.5 Empirisches Beispiel

Janz (1997) hat das Investitionsverhalten deutscher Aktiengesellschaft mit Hilfe des

Panelansatzes untersucht. Er geht dabei im einfachsten Fall von folgender Eulerglei-

chung als Investitionsgleichung aus, die sich aus der Bedingung 1. Ordnung für einen

optimalen Kapitalstock ergibt:

(1.99)I

KIK

IK

YK

i t

i t

it

it

it

it

it

iti t

,

,,

+

++= + +

+ +1

10 1 2

2

3 1β β β β ε .

Die empirische Analyse dieses Modells basiert auf Jahresabschlüssen von deutschen

Industrie-, Handels-, Verkehrs- und Dienstleistungsaktiengesellschaften nach neuer

Rechnungslegung der Jahresabschlußdatenbank Aachen (vgl. Bühler et. al., 1993). Um

einen Überblick über die vorhandenen Daten zu erlangen, werden die einzelnen Positi-

onen der Bilanz und der Gewinn- und Verlustrechnung (G+V) geeignet zusammenge-

faßt. Tabelle 1.5 stellt ein solches vereinfachtes Bilanzschema dar.

Tabelle 1.5 Vereinfachtes Bilanzschema

Aktiva Passiva

immaterielles Vermögen Eigenkapital

Grundstücke und Gebäude Genußscheinkapital

maschinelle Anlagen Sonderposten mit Rücklageanteil

Beteiligungen Pensionsrückstellungen

sonstige Finanzanlagen sonstige Rückstellungen

Vorräte Bankverbindlichkeiten

sonstiges Umlaufvermögen sonstige Verbindlichkeiten

sonstige Aktiva sonstige Passiva

Bilanzverlust Bilanzgewinn

Da die Unternehmen die Aufstellung der G+V wahlweise nach dem Gesamtkostenver-

37

fahren oder dem Umsatzkostenverfahren vornehmen können, werden in Tabelle 1.7 ver-

einfachte G+V-Schemata nach dem Gesamtkosten- und dem Umsatzkostenverfahren

einander gegenübergestellt. Der Inhalt der einzelnen Positionen ist den Tabellen A.3 bis

A.6 des Anhangs der Arbeit von Janz (1997) zu entnehmen.

Da sowohl die Bilanz als auch die Gewinn- und Verlustrechnung nominale und keine

realen Größen enthalten, wird zunächst die Eulerinvestitionsgleichung (1.99) durch Er-

weiterung der Quotienten in nominale Größen überführt:

(1.100)( )( )

( )( )

( )( )

( )( )

,

,,

cIcK

cIcK

cIcK

pYpK

i t

i t

it

it

it

it

it

iti t

+

++= + +

+ +1

10 1 2

2

3 1β β β β ε .

( ) ( ( , ) ( , )) *pY p F K L G K I w L c Kit t it it it it t it t it= − − − bezeichnet den Unternehmensgewinn,

korrigiert um die Nutzungskosten des Sachvermögens, ( )pKpc

c Kitt

tt it= das Sachver-

mögen, bewertet zu laufenden Absatzpreisen und ( ) , ( )cI c I cK c Kit t it it t it= = die Investi-

tionen bzw. das Sachvermögen, bewertet zu laufenden Investitionsgüterpreisen, d.h.

Wiederbeschaffungspreisen.

38

Tabelle 1.7 Vereinfachtes G+V-Schema

Gesamtkostenverfahren Umsatzkostenverfahren

Umsatzerlöse Umsatzerlöse

+ andere betriebliche Erträgea

+ sonstige betriebliche Erträge + sonstige betriebliche Erträge

- betrieb. Gesamtaufwendungenb - betriebl. Umsatzaufwendungenc

- sonstige betriebl. Aufwendungen - sonstige betriebl. Aufwendun-gend

- Abschreibungen Abschreibungen (nachrichtlich)

= Betriebsergebnis = Betriebsergebnis

+ Finanzergebnis + Finanzergebnis

+ außergewöhnliches Ergebnis + außergewöhnliches Ergebnis

+ sonstiges Ergebnis + sonstiges Ergebnis

= Jahresüberschuß/-fehlbetrag = Jahresüberschuß/-fehlbetraga Bestandsveränderungen und andere aktivierte Eigenleistungenb ohne Abschreibungenc mit Abschreibungend einschließlich außerplanmäßiger und nur steuerlicher Abschreibungen

Die Ermittlung des Wertes des Sachvermögens zu Wiederbeschaffungspreisen ist je-

doch ohne weiteres nicht möglich. Zwar ist sie in der internen Kostenrechnung verbrei-

tet, in der externen Rechnungslegung allgemein jedoch nicht zulässig. Obwohl über die

Bilanzrichtlinie das anglo-amerikanische Prinzip des true and fair view, demzufolge der

Jahresabschluß ein den tatsächlichen Verhältnissen entsprechendes Bild der Vermö-

gens-, Finanz- und Ertragslage der Gesellschaft vermitteln sollte, in deutsche Rech-

nungslegungsvorschriften Einzug erhalten hat, erfolgt die Bewertung des Sachvermö-

gens mit historischen Anschaffungs- bzw. Herstellungskosten, vermindert um planmäßi-

ge und außerplanmäßige Abschreibungen. Die Bewertung mit aktuellen Anschaffungs-

oder Herstellungskosten erfolgt nur, wenn sie gegenüber den historischen zu einem

niedrigeren Wertansatz führt. Für das Umlaufvermögen ist der niedrigere Wertansatz

zwingend vorzunehmen (strenges Niederstwertprinzip), für das Anlagevermögen jedoch

nur, wenn dieser voraussichtlich dauerhaft ist (gemildertes Niederstwertprinzip). Für das

Wertaufholungsgebot, demzufolge bei Wegfall des Grundes für außerplanmäßige Ab-

39

schreibungen diese durch entsprechende Zuschreibungen zu korrigieren sind, bilden

die historischen Anschaffungs- bzw. Herstellungskosten, vermindert um planmäßige

Abschreibungen, weiterhin die Obergrenze. Da die außerplanmäßigen Abschreibungen

zudem Abschreibungen enthalten, die allein steuerlich bedingt sind, sofern der steuer-

rechtliche Ansatz einen handelsrechtlichen voraussetzt (umgekehrtes Maßgeblichkeits-

prinzip), sind die Wiederbeschaffungskosten nicht direkt aus den Buchwerten ablesbar,

sondern müssen in geeigneter Weise berechnet werden.

Wenn die Investitionen der laufenden Periode mit ihren Wiederbeschaffungspreisen

bewertet sind, so lassen sich zumindest diese direkt aus den Buchwerten rekonstruie-

ren:

(1.101) ( ) ( ) ( ) ~ ( , )~ ~

,cI cK cK D jjit jit ji t jit= − + =−1 1 2

cK jit~

bezeichnet die Buchwerte des Sachanlagevermögens und ~D jit die bilanziellen

Abschreibungen. Die Berechnung erfolgt für Grundstücke und Gebäude (j=1) und ma-

schinelle Anlagen (j=2) getrennt. Da die Abschreibungen in der G+V für Grundstücke

und Gebäude sowie maschinelle Anlagen nicht getrennt ausgewiesen werden, erfolgt

aus Vereinfachungsgründen eine Aufteilung nach Buchwertanteilen der entsprechenden

Bilanzpositionen der gleichen Periode. Die Ermittlung des Betrages für die gesamten

Investitionen erfolgt additiv:

(1.102) ( ) ( ) ( )cI cI cIit it it= +1 2 .

Die Wiederbeschaffungskosten des Sachvermögens lassen sich aus den Investitionen

(cI)jit der einzelnen Perioden mittels der Perpetual-Inventory-Methode rekursiv ermitteln,

indem deren Vorjahreswerte um Preisänderungen und physische Abschreibungen kor-

rigiert und die Investitionen der laufenden Periode hinzu addiert werden:

(1.103) ( ) ( ) ( ) ( ) ( , ),

,cKc

ccK cI jjit j

jt

j tji t jit= − + =

−−1 1 2

11δ

Der rekursive Algorithmus erfordert die Vorgabe von Startwerten (cK)ji,0. Üblicherweise

werden die Buchwerte als Startwerte verwendet. Dem Approximationsfehler wird durch

einen mehrperiodigen Vorlauf Rechnung getragen. Der dadurch bedingte Verlust von

Analyseperioden läßt sich umgehen, wenn man transformierte Buchwerte als Startwerte

40

verwendet (Schaller, 1990). Hierzu eignen sich die von der Bundesbank veröffentlichten

Zeitreihen für das reproduzierbare gesamtwirtschaftliche Nettoanlagevermögen zu An-

schaffungs- bzw. Wiederbeschaffungspreisen AV jtA bzw. AV jt

W . Für die Wiederbe-

schaffungswerte der Grundstücke und Gebäude wird die Zeitreihe für Bauten, für die

maschinellen Anlagen die entsprechende für Ausrüstungen verwendet:

(1.104) ( ) ( )~

,cKAV

AVcKji

jW

jA ji00

00=

Als Abschreibungsparameter dienen die von King und Fullerton (1984) geschätzten Ab-

schreibungsraten für Bauten ( 1 0,0456δ = ) und für Ausrüstungen ( 2 0,1566δ = ). Die Kor-

rektur um Preisänderungen , 1

jt

j t

cc −

erfolgt unter Verwendung der Zeitreihen des Statisti-

schen Bundesamtes zu Investitionsgüterpreisen für Bauten und für Ausrüstungen. Die

Ermittlung des Wertes für das gesamte Sachvermögen erfolgt additiv:

(1.105) ( ) ( ) ( )cK cK cKit it it= +1 2

Die Berechnung des Sachvermögens zu laufenden Absatzpreisen erfolgt durch Umbe-

wertung des Sachvermögens zu Wiederbeschaffungskosten mittels

(1.106) ( ) ( )pKpc

cKjitt

jtjit= .

Als Absatzpreis tp dient die Zeitreihe für die Erzeugerpreise des Verarbeitenden Ge-

werbes des Statistischen Bundesamtes. Die Ermittlung des Wertes für das gesamte

Sachvermögen erfolgt ebenfalls additiv:

(1.107) ( ) ( ) ( )pK pK pKit it it= +1 2

Da das einfache Modell von allen Finanzierungsaspekten abstrahiert, dient als Gewinn-

größe ausschließlich der Gewinn aus der betrieblichen Tätigkeit. Zu diesem Zweck

werden zum Betriebsergebnis ±( )itBE die bilanziellen Abschreibungen ~Dit addiert und

das Ergebnis um ermittelte Nutzungskosten ( )itcK des Sachvermögens gekürzt:

(1.108) ±( ) ( ) ( )it it it itpY BE D cK= + −% .

41

In bisherigen empirischen Analysen wird keine Korrektur des Gewinnes um die Nut-

zungskosten vorgenommen. Dies wird damit begründet, daß diese zwar zeitvariabel,

aber nicht firmenspezifisch seien und deren Effekt daher durch Zeitdummyvariablen

aufgenommen werden könne. Im folgenden wird ein recht einfacher Weg aufgezeigt,

aus den Jahresabschlußdaten unternehmensspezifische Nutzungskosten zu ermitteln.

Die Berechnung der Nutzungskosten erfolgt dabei ebenfalls getrennt für Grundstücke

und Gebäude sowie maschinelle Anlagen aus:

(1.109), 1

1

1( ) ( ) ( 1,2)

jjt j t

jit jitjt

c crcK cK j

c

δ−

−−

+= =

Der Zähler des Bruches sind die Kapitalnutzungskosten. Als Zinssatz r wird die von der

Bundesbank veröffentlichte Umlaufrendite für festverzinsliche Wertpapiere verwendet.

Als Preiszeitreihen dienen die bereits oben erwähnten Zeitreihen für Investitionsgüter-

preise und als Abschreibungssätze die ebenfalls erwähnten Werte von King und Fuller-

ton (1984). Die Berechnung für die gesamten Nutzungskosten des Sachvermögens er-

folgt additiv:

(1.110) * * *1 2( ) ( ) ( )it it itc K c K c K= +

Aus der unterschiedlichen Zusammensetzung des Sachvermögens aus Grundstücken

und Gebäuden sowie maschinellen Anlagen folgt daher indirekt eine unternehmensspe-

zifische Nutzungskostengröße pro Einheit des Sachvermögensbestandes.

42

Tabelle 1.9 Ergebnisse der GMM-Schätzung

Verfahren GMM2B GMM2A GMM1 GIVE

Gewichte Ab A A2 AK

2 A1* A S

1

IK t

−1 0.2956 0.3165 0.3360 0.2968

(-)

[0.4526]

(0.4768)

[0.4437]

(0.7264)

[0.7722]

(0.4564)

[0.8272]

IK t

−1

2

0.3454 0.2677 0.2813 0.0954

(-)

[0.7316]

(0.7483)

[0.7100]

(1.1300)

[1.2478]

(0.6979)

[1.3801]

pK t

−1 0.0897 0.0929 0.0853 0.0555

(-)

[0.0302]

(0.0368)

[0.0309]

(0.0504)

[0.0518]

(0.0494)

[0.0676]

J-Teststatistik 9.869 17.964 9.370 --

Freiheitsgrade 9 9 9 --

p-Werte 0.3612 0.0356 0.4039 --

m1-Testc 0.0001 0.0000 0.0000 0.0003

m2-Testc 0.2725 0.2747 0.5114 0.4660

W-Modellc 0.0000 0.0000 0.0000 --

W-Dynamikc 0.0000 0.0000 0.0002 --

a () gewöhnliche Schätzfehler

[] Schätzfehler bei White-Kovarianz-Schätzung

b AN

W W AN

W HW H I F FSN T T1

11

11 1= ′ = ′ = ⊗ ′− −( ) ; ( )* mit

AN

W I F F AN

W WKN T T

AiD

iD

i2 2 11 11 1

= ′ ⊗ ∑ ′ = ′ −( ( ) ( $ $ )ε ε ε

c p-Werte (marginale Signifikanzniveaus)

Tabelle 1.9. zeigt, daß die Ergebnisse gegenüber Variationen der Gewichtungsmatrixen

relativ unempfindlich sind. Stärkere Veränderungen ergeben sich lediglich bei AS1 , d.h.

43

beim einstufigen GMM-Schätzer. Der J-Test auf überidentifizierende Restriktionen lehnt

H0 nur in einem Fall mit α = 0.05 ab, d.h. die Orthogonalität der Instrumente wird ange-

nommen.

Der m1 Test zeigt Autokorrelation (wegen des Differenzenfilters) an. Der m2-Test lehnt

die Hypothese, eines MA(1)-Prozesses nicht zugunsten eines MA-Prozesses höherer

Ordnung ab. Die Wald-Tests (W-Tests) zeigen sowohl eine Signifikanz des gesamten

Modells, als auch der Modelldynamik an. Allerdings entsprechen sämtliche Koeffizienten

nicht den erwarteten Größen: Der Koeffizienten von 1( )tI

K − sollte ungefähr 1, derjenige

von 21( )t

IK − kleiner als 1− sowie der von 1( )t

YK − negativ sein.

Download - 1 Lineare Paneldatenmodelleftp.zew.de/incoming/open/nja/panel.pdf · Das SOEP ist 19 84 im Rahmen des Sonderforschungsbereichs 3 „Mikro- ... (Kon-takt: Sandra Gottschalk ... und

Top Related