4. einfache nichtlineare panelmodelle · die inverse der informationsmatrix ist die cramer rao...
TRANSCRIPT
1
4. Einfache nichtlineare Panelmodelle
4.1 Binäre Probit- und Logitmodelle mit Querschnittsdaten
Binäre abhängige Variablen in der Ökonometrie:
Diese qualitativen Variablen haben genau zwei Ausprägungen und nehmen
entweder den Wert eins oder den Wert null an.
Beispiele für Modelle mit binären abhängigen Variablen in der (Mikro-) Ökono-
metrie:
• Analyse der Determinanten für den Beschäftigungsstatus (d.h. beschäftigt
oder nicht beschäftigt) einer Person
• Analyse der Determinanten für die Wahl einer Person für ein spezifisches
Transportmittel (auf Basis einer multinomialen Variablen)
• Analyse der Determinanten für die starke Zustimmung einer Person zu ei-
nem Programm (basierend auf einer Ordinalskalierung)
• Analyse der Determinanten für den Besitz einer spezifischen Versicherung
bei Haushalten
• Analyse der Determinanten für das Überschreiten einer bestimmten Ge-
winnschranke eines Unternehmens
• Analyse der Determinanten für die Innovationstätigkeit eines Unternehmens
in den letzten drei Jahren
2
Wahrscheinlichkeiten bei binären Probit- und Logitmodellen mit einer binären
abhängigen Variablen yi sowie einem Vektor von k erklärenden Variablen xi =
(xi1,…, xik)‘ und dem dazugehörigen Parametervektor β = (β1,…, βk)‘:
Marginale Wahrscheinlichkeitseffekte in binären Probit- und Logitmodellen:
• Marginaler Effekt einer erklärenden Variablen xih (h = 2,…, k) auf die Wahr-
scheinlichkeit pi(xi, β) = P(yi = 1|xi, β), ceteris paribus:
Es folgt für die Veränderung von pi(xi, β) bei einer Veränderung von xih um
den Betrag ∆xih:
Je kleiner ∆xih, desto besser ist diese lineare Approximation.
• Das Vorzeichen des Parameters βh gibt somit lediglich die Richtung des
marginalen Wahrscheinlichkeitseffektes von xih an
2iβ'x t
-2
i i i i i i i i
-
1F (β'x ) = Φ (β'x ) = p (x , β) = P(y = 1|x , β) = e dt
2π
i
i
β'x
i i i i i i i i β'x
eF (β'x ) = Λ (β'x ) = p (x , β) = P(y = 1|x , β) =
1 + e
i i i i i i ii i h
ih ih i ih
p (x , β) F (β‘x ) dF (β‘x ) β‘x = = = f (β‘x )β
x x d(β‘x ) x
i i i h ihΔp (x , β) f(β‘x )β Δx
3
Oft interessiert der marginale Effekt einer erklärenden Variablen xih für eine ty-
pische Beobachtung i = 1,…, n. Der durchschnittliche marginale Wahrschein-
lichkeitseffekt von xih kann mit fi(β‘xi)βh für jedes i berechnet werden:
Eine andere Möglichkeit besteht in der Berechnung des marginalen Wahr-
scheinlichkeitseffektes von xih an den arithmetischen Mitteln x = 1/n xni=1 i der
erklärenden Variablen über alle Beobachtungen i = 1,…, n:
Aufgrund der Nichtlinearitäten der Ansätze sind die beiden Effekte in der Regel
nicht identisch, können jedoch sehr ähnliche Werte annehmen.
Falls die erklärenden Variablen diskret sind, sollte eine diskrete Veränderung
von pi(xi, β) aufgrund einer diskreten Veränderung von ∆xih berechnet werden:
Auch hier ist es möglich, durchschnittliche (diskrete) Effekte und (diskrete) Ef-
fekte an den arithmetischen Mitteln x = 1/n xni=1 i zu bestimmen.
→ Die unbekannten Parameter in binären Probit- und Logitmodellen werden in
der Regel mit der Maximum Likelihood Methode (ML) geschätzt, obwohl die
Anwendung anderer Schätzmethoden wie GMM auch möglich ist. ML weist
jedoch im Vergleich wünschenswertere Eigenschaften auf (siehe später).
n
h i i h
i=1
1AMPE = f (β‘x )β
n
ih i hMPEM = f (β‘x)β
i i i i h ih i iΔp (x , β) = F (β‘x + β Δx ) - F (β‘x )
4
Ansatz mit latenten Variablen:
Binäre Probit- und Logitmodelle mit Querschnittsdaten können auch durch eine
zugrunde liegende latente stetige Variable yi* (diese kann als Nutzen interpre-
tiert werden) motiviert werden, die durch β‘xi erklärt wird und einen Störterm εi
(für i = 1,…, n) gekennzeichnet ist:
Latente Variablen können nicht beobachtet werden, aber auf die beobachteten
Ausprägungen der binären abhängigen Variablen bezogen werden (i = 1,…, n):
Es folgt für die Wahrscheinlichkeit pi(xi, β), dass yi den Wert eins annimmt:
Falls εi standardnormalverteilt ist (mit Erwartungswert null und Varianz eins),
erhält man das binäre Probitmodell. Falls εi standardlogistischverteilt ist (mit Er-
wartungswert null und Varianz π2/3), erhält man das binäre Logitmodell. Die
Annahme einer (bekannten) Varianz von εi ist hier kein Problem, da sie in bei-
den Modellen nicht identifiziert ist. Die Annahme von null als Schrankenwert
dieses Ansatzes mit latenten Variablen ist auch unproblematisch, falls eine (ge-
nerell zu betrachtende) Konstante in β‘xi einbezogen wird.
*
i i iy = β'x + ε
*
i
i *
i
1 if y 0y =
0 if y < 0
*
i i i i i i i i i ip (x , β) = P(y = 1|x , β) = P(y 0|x , β) = P(β'x + ε 0) = P(ε -β'x )
5
4.2 Maximum Likelihood Methode und statistische Testverfahren
Ausgangspunkt:
Mit einer Zufallsstichprobe y1,…, yn aus der Verteilung von yi sollen die unbe-
kannten Parameter im Vektor θ = (θ1, θ2,…, θm)‘ gesucht werden. Im Gegen-
satz zur GMM muss nun die gesamte Verteilung und damit die Dichte- oder
Wahrscheinlichkeitsfunktion von yi (z.B. Bernoulliverteilung, Poissonverteilung,
Normalverteilung) bekannt sein.
Aufgrund der Unabhängigkeit der yi ist die gemeinsame Wahrscheinlichkeits-
funktion (für diskrete Zufallsvariablen) oder die gemeinsame Dichtefunktion (für
stetige Zufallsvariablen) der y1,…, yn das Produkt der einzelnen Wahrschein-
lichkeits- bzw. Dichtefunktionen:
Falls diese Funktion nicht als Funktion der Zufallsstichprobe y1,…, yn (gegeben
die Parameter in θ) interpretiert wird, sondern als Funktion von θ für eine gege-
bene Zufallsstichprobe y1,…, yn, kann sie als eine Likelihood Funktion formu-
liert werden:
n
1 n 1 1 n n i i
i=1
f (y ,..., y ; θ) = f (y ; θ) f (y ; θ) = f (y ; θ)
n
i i
i=1
L(θ) = f (y ; θ)
6
Die Idee der ML besteht darin, einen Wert θ für θ zu finden, der die Likelihood
Funktion auf der Grundlage der Zufallsstichprobe y1,…, yn maximiert. Die Maxi-
mierung erfolgt dabei in der Regel nicht auf der Basis der Likelihood Funktion
L(θ), sondern anhand der Loglikelihood Funktion (wobei sich log wieder auf
den natürlichen Logarithmus bezieht):
Die Maximierung von logL(θ) führt zum gleichen Schätzer θ wie die Maximie-
rung von L(θ). Vorteile der Verwendung der Loglikelihood Funktion:
• Die Nutzung von logL(θ) vermeidet extrem kleine Werte im Fall von diskre-
ten Zufallsvariablen (aufgrund der Multiplikation der Wahrscheinlichkeiten
und damit von Werten kleiner eins) und extrem hohen Werten im Fall von
stetigen Zufallsvariablen (falls Werte größer eins in den Dichtefunktionen
multipliziert werden)
• Im Allgemeinen ist auch der Maximierungsprozess mit der Loglikelihood
Funktion zur Ableitung von θ viel einfacher als mit der Likelihood Funktion
Maximierungsansatz:
n
1 1 n n i i
i=1
logL(θ) = logf (y ; θ) + + logf (y ; θ) = logf (y ; θ)
n'
1 2 m i iθ θ
i=1
ˆ ˆ ˆ ˆθ = θ , θ ,…, θ = arg max logL θ = arg max logf (y ; θ)
7
Eine notwendige Bedingung für den ML-Schätzer θ ist, dass die erste Ableitung
der Loglikelihood Funktion (d.h. der Score) für diesen Wert von θ null ist:
Damit kann der Maximierungsprozess des ML-Schätzers folgendermaßen cha-
rakterisiert werden:
→ Alle zuvor betrachteten Konzepte für unbedingte Modelle mit einer Zufalls-
variablen yi können analog für ökonometrische Modelle mit der abhängigen
Variablen yi = (yi1,…, yiT)’ und den erklärenden Variablen in xi = (xi1‘,…, xiT
‘)‘
(bei Paneldaten) mit xit = (xit1,…, xitk)‘ (t = 1,…, T) übertragen werden
Mit der bedingten Wahrscheinlichkeits- oder Dichtefunktion fi(yi; xi, θ) von yi
und einer Zufallsstichprobe (yi, xi) (i = 1,…, n) ergeben sich für die Loglikeli-
hood Funktion und den Maximierungsansatz:
θ̂
logL(θ) = 0
θ
ni i
θi=1
logf (y ; θ)θ̂ = argsolves = 0
θ
n
i i i
i=1
logL(θ) = logf (y ; x , θ)n
i i iθ
i=1
θ̂ = arg max logf (y ; x , θ)
8
Eigenschaften des ML-Schätzers θ von θ bei endlichen Stichprobenumfängen:
• θ ist meist ein verzerrter Schätzer für θ (z.B. ist der Erwartungswert von σ 2
im klassischen linearen Regressionsmodell nicht gleich σ2, wohingegen die
Erwartungstreue von β eine Ausnahme darstellt)
• θ ist typischerweise nicht normalverteilt (die Normalverteilung von β im klas-
sischen linearen Regressionsmodell ist wiederum eine Ausnahme)
• Die in der Regel unbekannten Eigenschaften von ML-Schätzern bei endli-
chen Stichprobenumfängen können mit Hilfe von Monte Carlo Experimenten
für spezifische ökonometrische Modelle und spezifische Parameterwerte un-
tersucht werden
Asymptotische Eigenschaften des ML-Schätzers θ von θ (unter verschiedenen
Regularitätsannahmen und unter der Annahme, dass das zugrundeliegende
Modell korrekt spezifiziert ist):
• Konsistenz: plim(θ ) = θ
• Asymptotische Normalverteilung für Funktionen von θ :
• Asymptotische Effizienz
a d
-1 -1ˆ ˆn(θ - θ) ~ N 0; I(θ) bzw. n (θ - θ) N 0; I(θ)
9
Die Eigenschaft der asymptotischen Normalverteilung bedeutet, dass n(θ -θ) asymptotisch normalverteilt ist mit einem Erwartungswertvektor null und einer
Varianz-Kovarianzmatrix I(θ)-1. Die Matrix I(θ) wird als Informationsmatrix be-
zeichnet und weist die folgende Form auf:
Die Inverse der Informationsmatrix ist die Cramer Rao Schranke, die impliziert,
dass die Differenz zwischen dieser Matrix und der Varianz-Kovarianzmatrix für
einen beliebigen anderen konsistenten Schätzer für θ, bei dem n(θ -θ) eben-
falls asymptotisch normalverteilt ist, negativ definit ist. Da n(θ -θ) diese untere
Grenze erreicht, ist der ML-Schätzer asymptotisch effizient.
Es folgt, dass θ bei großen, aber endlichen Stichprobenumfängen mit n Beo-
bachtungen näherungsweise normalverteilt ist:
Jedoch ist die Informationsmatrix und damit Var(θ ) in der Praxis unbekannt, da
sie von θ abhängt. Daher muss sie z.B. für die Durchführung von statistischen
Tests und für die Konstruktion von Konfidenzintervallen (konsistent) geschätzt
werden. Var(θ ) kann geschätzt werden, indem man auf den ML-Schätzer θ an-
statt auf den wahren Parametervektor zurückgreift. In der Praxis werden ver-
schiedene Schätzer für die Varianz-Kovarianzmatrix genutzt.
2
i ilogf (y ;θ)I(θ) = -E
θ θ'
appr
-1θ̂ ~ N θ; nI(θ)
10
Statistische (klassische) Testverfahren:
Die ML-Schätzung ökonometrischer Modelle führt zu einem entsprechenden
Punktschätzer, berücksichtigt aber nicht die Stichprobenvariation, die die Basis
für die Konstruktion von Konfidenzintervallen und für statistische Tests ist.
Mögliche Hypothesen beziehen sich auf Restriktionen im Parameterraum. Die
folgenden Null- und Alternativhypothesen beziehen sich auf q Restriktionen:
Im einfachsten Fall ist die Dimension der Funktion c(θ) q = 1 und c(θ) bezieht
sich auf spezifische Werte eines Parameters θl des Vektors θ, wodurch sich
folgende Nullhypothese ergibt (a ist hierbei eine beliebige Konstante):
Auf Basis der ML-Schätzung von ökonometrischen Modellen können diese
Nullhypothesen mit dem Wald, dem Score oder dem Likelihood-Quotienten
Test statistisch überprüft werden, die alle asymptotisch äquivalent sind.
1
0
q
1
c (θ) = 0
H : c(θ) = 0
c (θ) = 0
H : c(θ) 0
0 lH : θ = a
11
Die Wald Teststatistik basiert auf dem unrestringierten ML-Schätzer θ :
I (θ ) ist eine konsistente Schätzung der Informationsmatrix und kann mit ver-
schiedenen Ansätzen zur Schätzung der Varianz-Kovarianzmatrix von θ be-
stimmt werden. Falls H0: c(θ) = 0, ist die Wald Teststatistik asymptotisch χ2-ver-
teilt mit q Freiheitsgraden, d.h.:
Somit wird die Nullhypothese (bei großen Stichprobenumfängen) zugunsten
der Alternativhypothese zum Signifikanzniveau α abgelehnt, falls:
Im Fall der spezifischen einfachen Nullhypothese H0: θl = a ist die entsprechen-
de Wald Teststatistik asymptotisch χ2-verteilt mit einem Freiheitsgrad. Daraus
ergibt sich die einfachste und wichtigste Version einer Wald Teststatistik, näm-
lich die z-Statistik (bzw. t-Statistik), die asymptotisch standardnormalverteilt ist:
-1ˆ ˆc(θ) c(θ)'ˆ ˆ ˆˆWT = nc(θ)' I(θ) c(θ)
θ' θ
d2
qWT χ
2
q;1-αWT > χ
dl
l
θ̂ -aWT = z = N(0; 1)
ˆˆVar(θ )
12
Die geschätzte Varianz von θ l ist das entsprechende l-te Element auf der
Hauptdiagonalen der geschätzten Varianz-Kovarianzmatrix von θ . Die Nullhy-
pothese wird somit (bei großen Stichprobenumfängen) zum Signifikanzniveau
von α abgelehnt, falls:
Restringierte ML-Schätzung:
Ein ML-Schätzer θ r wird als restringierter ML-Schätzer bezeichnet, wenn die
zugrunde liegende ML-Schätzung auf spezifischen Restriktionen für die unbe-
kannten Parameter beruht. Im einfachsten Fall bezieht sich die Restriktion auf
spezifische Werte für unbekannte Parameter. Falls z.B. θ = (α, β)‘, kann α = 1
eine mögliche Restriktion sein, so dass für den restringierten ML-Schätzer θ r =
(1, β r)‘ gilt, wohingegen der unrestringierte Parameter θ u = (α u, β u)‘ ist.
Die Likelihood-Quotienten Teststatistik basiert auf dem Wert logL(θ r) der Log-
likelihood Funktion am (durch H0) restringierten ML-Schätzer und dem Wert
logL(θ u) am unrestringierten ML-Schätzer, wobei logL(θ r) ≤ logL(θ u):
Falls H0: c(θ) = 0, ist die Likelihood-Quotienten Teststatistik asymptotisch χ2-
verteilt mit q Freiheitsgraden, d.h.:
1-α/2z > z
u rˆ ˆLRT = 2 logL(θ ) - logL(θ )
d2
qLRT χ
13
Somit wird die Nullhypothese (bei großen Stichprobenumfängen) zugunsten
der Alternativhypothese zum Signifikanzniveau α abgelehnt, falls:
Der wesentliche Vorteil dieses Tests ist dessen einfache Durchführung. Der
praktische Nachteil ist, dass zwei ökonometrische Modelle geschätzt werden
müssen.
Die Score Teststatistik basiert nur auf dem restringierten ML-Schätzer θ r:
Falls H0: c(θ) = 0, ist I (θ r) ein konsistenter Schätzer der Informationsmatrix und
kann mit verschiedenen Ansätzen geschätzt werden. Falls H0 korrekt ist, ist die
Score Teststatistik asymptotisch χ2-verteilt mit q Freiheitsgraden, d.h.:
Somit wird die Nullhypothese (bei großen Stichprobenumfängen) zugunsten
der Alternativhypothese zum Signifikanzniveau α abgelehnt, falls:
2
q;1-αLRT > χ
-1r rr
ˆ ˆlogL(θ ) logL(θ )1 ˆˆST = I(θ )n θ' θ
d2
qST χ
2
q;1-αST > χ
14
4.3 ML-Schätzung in binären Probit- und Logitmodellen mit Quer-
schnittsdaten
Die binären abhängigen Variablen yi in entsprechenden ökonometrischen Mo-
dellen mit Querschnittsdaten sind Dummy-Variablen und damit generell Ber-
noulli verteilt mit der Wahrscheinlichkeit pi(xi, β). Basierend auf einer Zufalls-
stichprobe (xi, yi) mit i = 1,…, n Beobachtungen ergibt sich somit folgende spe-
zifische Loglikelihood Funktion:
In binären Probit- und Logitmodellen mit Querschnittsdaten folgt:
1 1 1 1 1 1
n n n n n n
n
i i i i i i
i=1
i i
logL(β) = y logp (x , β) + (1-y )log 1-p (x , β) + +
y logp (x , β) + (1-y )log 1-p (x , β)
= y logp (x , β) + (1-y )log 1-p (x , β)
= y logF (β‘x
n
i i i i
i=1
) + (1-y )log 1-F (β‘x )
n
i i i i i i
i=1
n
i i i i i i
i=1
logL(β) = y logΦ (β‘x ) + (1-y )log 1-Φ (β‘x )
logL(β) = y logΛ (β‘x ) + (1-y )log 1-Λ (β‘x )
15
Die erste Ableitung der Loglikelihood Funktion hat folgendes Aussehen:
Der ML-Schätzer β löst die Bedingungen erster Ordnung bei der Maximierung
der Loglikelihood Funktion. Generell ist für β keine Lösung in geschlossener
Form verfügbar, so dass iterative numerische Optimierungsalgorithmen ange-
wendet werden müssen.
Der ML-Schätzer β ist in ökonometrischen Modellen mit binären abhängigen
Variablen bei großen, aber endlichen Stichprobenumfängen mit n Beobachtun-
gen näherungsweise normalverteilt mit folgender Varianz-Kovarianzmatrix:
Es folgt also:
Der Standardansatz für die Schätzung der Varianz-Kovarianzmatrix von β lau-
tet:
ni i i
i i i
i=1 i i i i
logL(β) y - F (β‘x ) = f (β‘x )x
β F (β‘x ) 1-F (β‘x )
-12n
-1i i i i
i=1 i i i i
f (β‘x ) x x 'ˆVar(β) = nI β = F (β‘x ) 1-F (β‘x )
-12nappr
i i i i
i=1 i i i i
f (β‘x ) x x 'β̂ ~ N β;
F (β‘x ) 1-F (β‘x )
16
Für die Schätzung der Varianz-Kovarianzmatrix von β können aber auch alter-
native Ansätze betrachtet werden.
Auf Basis von β folgt für die Schätzer der marginalen Wahrscheinlichkeitseffek-
te einer erklärenden Variablen xih in binären Probit- und Logitmodellen:
Daraus ergeben sich über alle Beobachtungen i = 1,…, n die folgenden Schät-
zer des durchschnittlichen marginalen Wahrscheinlichkeitseffektes von xih so-
wie des marginalen Wahrscheinlichkeitseffektes an den arithmetischen Mitteln
x = 1/n xni=1 i der erklärenden Variablen:
Schließlich lassen sich Schätzer für die diskrete Veränderung von pi(xi, β) auf-
grund einer diskreten Veränderung ∆xih, für den durchschnittlichen diskreten
Wahrscheinlichkeitseffekt sowie für die diskrete Veränderung von pi(xi, β) an
den arithmetischen Mitteln der anderen erklärenden Variablen ableiten.
-1
2ni i i i
i=1 i i i i
ˆf (β‘x ) x x 'ˆˆVar(β) = ˆ ˆF (β‘x ) 1-F (β‘x )
i ii i h
ih
ˆp̂ (x , β) ˆ ˆ = f (β‘x )βx
n
h i i h
i=1
ih i h
1 ˆ ˆˆAMPE = f (β‘x )β n
ˆ ˆˆMPEM = f (β‘x)β
17
4.4 Binäre Probit- und Logitmodelle mit Paneldaten
Für Panelmodelle mit binären abhängigen Variablen folgt aus dem Ansatz mit
latenten Variablen für eine Beobachtungseinheit i in Periode t:
Für die beobachteten binären abhängigen Variablen yit ergibt sich:
Erneut gelangt man bei entsprechenden Verteilungsannahmen für den Stör-
term εit (d.h. Standardnormal- bzw. standardlogistische Verteilung) zu binären
Probit- und Logitmodellen (hier mit Paneldaten) (siehe später).
Genauso wie bei linearen Panelmodellen liegt dabei häufig unbeobachtete He-
terogenität vor. Für die latenten Variablen ergibt sich:
Auch in diesem einfachen Fall nichtlinearer Panelmodelle kann zwischen ran-
dom und fixed effects Schätzungen unterschieden werden. Während binäre
fixed effects Schätzungen auf der Annahme basieren, dass die αi und xit korre-
liert sind, gehen binäre random effects Schätzungen davon aus, dass die αi
und xit unkorreliert sind, so dass die bedingte Verteilung fi(αi|xit) nicht von xit ab-
hängt.
*
it it ity = β'x + ε für i = 1,..., n; t = 1,..., T
*
it
it *
it
1 if y 0y =
0 if y < 0
*
it it i ity = β'x + α + v für i = 1,..., n ; t = 1,..., T
18
Zudem ist es erneut möglich, die unbeobachtete Heterogenität zu ignorieren
und gepoolte binäre Probit- und Logitmodelle zu betrachten. Diese Ansätze un-
terstellen Unabhängigkeit über die Beobachtungseinheiten i = 1,…, n und die
Perioden t = 1,…, T und werden wie in Querschnittsanalysen behandelt. Je-
doch sind diese Schätzer bei unbeobachteter Heterogenität meist inkonsistent.
Für die Wahrscheinlichkeit, dass yit den Wert eins annimmt, ergibt sich bei ei-
ner spezifischen Verteilung des Störterms εit (der auch unbeobachtete Hetero-
genität mit εit = αi+vit aufweisen kann):
Über die Zeit hinweg folgt daraus für die spezifische Wahrscheinlichkeit, dass
die yi1,…, yiT jeweils den Wert eins annehmen:
Falls dagegen ein oder mehrere yi1,…, yiT über die Zeit den Wert null anneh-
men, ergeben sich bei der Berechnung der Wahrscheinlichkeiten entsprechend
abweichende Integrationsgrenzen.
it
*
it it it it it it it it
it it i it it
-β'x
p (x , β) = P(y = 1|x , β) = P(y 0|x , β) = P(β'x + ε 0)
= P(ε -β'x ) = f (ε )dε
i1 iT
i1 iT i i1 i1 iT iT
i1 i1 iT iT i i1 iT it iT
-β'x -β'x
P(y = 1;...; y = 1|x , β) = P(β'x + ε 0;...; β'x + ε 0) =
P(ε -β'x ;...; ε -β'x ) = f (ε ,..., ε )dε dε
19
Diese Wahrscheinlichkeiten werden im Hinblick auf die ML-Schätzung für jede
Beobachtungseinheit i = 1,…, n in die Loglikelihood Funktion einbezogen. Im
flexibelsten Fall, dass die εit beliebig über die Zeit korreliert sind, ergibt sich für
diese gemeinsamen Wahrscheinlichkeiten ein T-dimensionales Integral. Bei
großen T ist die Berechnung dieses Mehrfachintegrals im iterativen Maximie-
rungsprozess der ML-Schätzung nicht einfach durchführbar. Eine Möglichkeit
dieser Berechnung besteht in der Approximation der Wahrscheinlichkeiten
durch Simulatoren (siehe Artikel in Ecological Economics).
Eine alternative Möglichkeit der Vereinfachung bietet die binäre random effects
Schätzung. Dabei kann die gemeinsame Dichtefunktion fi(εi1,…, εiT, αi) folgen-
dermaßen formuliert werden:
Daraus folgt:
Die untere Gleichung kann abgeleitet werden, da die εit unter der Bedingung
von αi unabhängig sind. Bei der Einbeziehung dieser Gleichung in die spezifi-
sche Wahrscheinlichkeit, dass die yi1,…, yiT jeweils den Wert eins annehmen,
ergibt sich nach einigen Umformungen:
i i1 iT i i i1 iT i i if (ε ,..., ε , α ) = f (ε ,..., ε |α )f (α )
i i1 iT i i1 iT i i i i
-
T
i it i i i i
t=1-
f (ε ,..., ε ) = f (ε ,..., ε |α )f (α )dα
= f (ε |α )f (α )dα
20
Durch das Herausintegrieren von αi sind die Wahrscheinlichkeiten jetzt nur
noch durch ein eindimensionales und nicht mehr durch ein T-dimensionales In-
tegral gekennzeichnet. In der Regel wird dabei angenommen, dass die αi nor-
malverteilt sind (andere Verteilungsannahmen sind möglich, aber meist proble-
matisch, da dann keine geschlossene Form des Integrals oder einfache Metho-
de zur Approximation des Integrals vorliegen). Die auf der Normalverteilungs-
annahme basierende Approximation des äußeren Einfachintegrals erfolgt übli-
cherweise (z.B. in STATA) mit der Gauss-Hermite Quadraturmethode.
Bei den random effects Schätzungen im binären Probitmodell und im binären
Logitmodell (mit unbeobachteter Heterogenität) folgt:
Die Wahrscheinlichkeiten P(yit = 1|xit, β, αi), dass yit den Wert eins annimmt,
sind also nicht mehr identisch mit den entsprechenden Wahrscheinlichkeiten
Φi(β‘xit) und Λi(β‘xit) in gepoolten binären Probit- und Logitmodellen.
T
i1 iT i it it i i i i
t=1
P(y = 1;...; y = 1|x , β) = P(y = 1|x , β, α ) f (α )dα
T
i1 iT i i it i i i i
t=1
T
i1 iT i i it i i i i
t=1
P(y = 1;...; y = 1|x , β) = Φ (β'x +α ) f (α )dα
P(y = 1;...; y = 1|x , β) = (β'x +α ) f (α )dα
21
Damit sind die entsprechenden Parameter nicht mehr mit den Parametern in
gepoolten Probit- und Logitmodellen zu vergleichen. Im allgemeinen Fall ergibt
sich bei den random effects Schätzungen im binären Probitmodell und im binä-
ren Logitmodell unter Einbeziehung der Wahrscheinlichkeitsfunktion der Ber-
noulli verteilten yit für die Wahrscheinlichkeit, dass die yi1,…, yiT über die Zeit
variierend die Werte null oder eins annehmen:
Anmerkungen:
• Bei diesen Ansätzen wird in STATA die geschätzte Standardabweichung σ α
der αi sowie der Schätzwert co rr(εit, εis) = ρ = σ α2/(1+ σ α
2) der Korrelation der
Störterme für zwei beliebige Perioden t und s ausgewiesen
• Marginale Wahrscheinlichkeitseffekte hängen von den unbekannten αi ab,
die bei den random effects Schätzungen herausintegriert werden. Deshalb
können diese (ebenso wie bei fixed effects Schätzungen in binären Logitmo-
dellen, siehe später) nicht zuverlässig geschätzt werden (eine entsprechen-
de Anweisung in STATA schätzt diese Effekte für αi = 0). Allerdings ergibt
sich aus dem Vorzeichen der geschätzten Parameter weiterhin das Vorzei-
chen des geschätzten marginalen Wahrscheinlichkeitseffektes.
itit
itit
T1-yy
i it i i it i i i i
t=1
T1-yy
i it i i it i i i i
t=1
Φ (β'x +α ) 1-Φ (β'x +α ) f (α )dα
(β'x +α ) 1- (β'x +α ) f (α )dα
22
Fixed effects Schätzung im binären Logitmodell:
• Im Gegensatz zur Dummy-Variablen Schätzung in linearen Panelmodellen
mit unbeobachteter Heterogtenität, die bei kleinen T konsistent ist, ist die ge-
meinsame fixed effects Schätzung der einzelnen αi und der anderen Para-
meter in β in binären Panelmodellen generell inkonsistent, falls nicht T → ∞
• Der Grund hierfür ist das incidental Parameterproblem, wonach die n inci-
dental (beiläufigen) Parameter αi bei kleinen T nicht konsistent geschätzt
werden können, da nur T Beobachtungen für die Schätzung jedes αi vorlie-
gen. Da aber die Schätzung von β eine Funktion der Schätzung der αi ist,
wird auch β bei kleinen T inkonsistent geschätzt.
• Um dennoch konsistente Schätzer in binären Panelmodellen zu erhalten,
müssen die αi eliminiert werden. Jedoch ist es für viele nichtlineare Panel-
modelle mit unbeobachteter Heterogenität und insbesondere für binäre Pro-
bitmodelle nicht möglich, diese Eliminierung durchzuführen.
• Dagegen ist eine fixed effects Schätzung in binären Logitmodellen möglich,
indem ein konditionaler ML-Schätzer genutzt wird. Dabei bleiben (ohne Ef-
fekt auf die Konsistenz des Schätzers) jene Beobachtungseinheiten unbe-
rücksichtigt, bei denen die yi1,…, yiT über die Zeit entweder durchweg null
oder durchweg eins sind, da sie nicht zur bedingten Likelihood Funktion bei-
tragen.
• Auch bei fixed effects Schätzungen in binären Panelmodellen sind die Para-
meter zeitinvarianter erklärender Variablen nicht identifiziert
23
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (I)
Für die Analyse der Determinanten der Gewerkschaftszugehörigkeit (union)
werden die bereits mehrfach untersuchten Paneldaten für 545 dauerhaft be-
rufstätige Männer für die Jahre von 1980 bis 1987 betrachtet. Dabei werden
neben den Dummy-Variablen für die Jahre 1981 bis 1987 die Anzahl der Ar-
beitsstunden (hours), Bildungsstand (educ), Erfahrung (exper) sowie Dummy-
Variablen für Hautfarbe (black) und Familienstand (married) als erklärende Va-
riablen einbezogen. Es werden folgende Schätzungen betrachtet:
• ML-Schätzung im gepoolten binären Probitmodell
• Random effects Schätzung im binären Probitmodell
• Random effects Schätzung im binären Logitmodell
• Fixed effects Schätzung im binären Logitmodell
Zudem wird mit Wald Tests die Nullhypothese überprüft, dass black und
married gemeinsam keinen Effekt auf union haben. Darüber hinaus werden
Schätzungen der durchschnittlichen Wahrscheinlichkeit für verheiratete Perso-
nen, der durchschnittlichen marginalen Wahrscheinlichkeitseffekte sowie der
marginalen Wahrscheinlichkeitseffekte an den arithmetischen Mitteln aller er-
klärenden Variablen betrachtet.
Bei den Schätzungen mit STATA haben sich folgende Ergebnisse gezeigt:
---------------------------------------------------------------------------------------------------------
24
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (II)
probit union hours educ exper black married d81 d82 d83 d84 d85 d86 d87
Probit regression Number of obs = 4360
LR chi2(12) = 88.58
Prob > chi2 = 0.0000
Log likelihood = -2378.5103 Pseudo R2 = 0.0183
------------------------------------------------------------------------------
union | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hours | -.0001562 .0000396 -3.95 0.000 -.0002339 -.0000786
educ | .0136287 .0150325 0.91 0.365 -.0158345 .0430919
exper | .0290401 .0157643 1.84 0.065 -.0018572 .0599375
black | .4504348 .0624693 7.21 0.000 .3279972 .5728724
married | .2002097 .0455021 4.40 0.000 .1110271 .2893922
d81 | -.0379511 .0845171 -0.45 0.653 -.2036016 .1276995
d82 | -.0527078 .088485 -0.60 0.551 -.2261352 .1207197
d83 | -.1184943 .0955448 -1.24 0.215 -.3057587 .0687701
d84 | -.1338274 .1040118 -1.29 0.198 -.3376868 .070032
d85 | -.2582136 .1147486 -2.25 0.024 -.4831167 -.0333106
d86 | -.3337077 .1262056 -2.64 0.008 -.581066 -.0863493
d87 | -.193904 .1366117 -1.42 0.156 -.4616579 .07385
_cons | -.7119195 .2253402 -3.16 0.002 -1.153578 -.2702607
------------------------------------------------------------------------------
test black married
( 1) [union]black = 0
( 2) [union]married = 0
chi2( 2) = 62.41
Prob > chi2 = 0.0000
---------------------------------------------------------------------------------------------------------
25
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (III)
margins, at (married=1)
Predictive margins Number of obs = 4360
Model VCE : OIM
Expression : Pr(union), predict()
at : married = 1
------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .2795636 .0107562 25.99 0.000 .2584818 .3006455
------------------------------------------------------------------------------
margins, dydx(hours educ exper black married)
Average marginal effects Number of obs = 4360
Model VCE : OIM
Expression : Pr(union), predict()
dy/dx w.r.t. : hours educ exper black married
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hours | -.0000481 .0000121 -3.96 0.000 -.0000718 -.0000243
educ | .0041928 .0046238 0.91 0.365 -.0048697 .0132553
exper | .008934 .0048453 1.84 0.065 -.0005626 .0184305
black | .1385727 .0189159 7.33 0.000 .1014984 .1756471
married | .0615929 .0139243 4.42 0.000 .0343018 .088884
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
26
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (IV)
margins, dydx(*) atmeans
Conditional marginal effects Number of obs = 4360
Model VCE : OIM
Expression : Pr(union), predict()
dy/dx w.r.t. : hours educ exper black married d81 d82 d83 d84 d85 d86 d87
at : hours = 2191.257 (mean)
educ = 11.76697 (mean)
exper = 6.514679 (mean)
black = .1155963 (mean)
married = .4389908 (mean)
d81 = .125 (mean)
⋮ ⋮ ⋮ d87 = .125 (mean)
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hours | -.0000486 .0000123 -3.95 0.000 -.0000727 -.0000245
educ | .004238 .0046745 0.91 0.365 -.0049237 .0133998
exper | .0090305 .0049012 1.84 0.065 -.0005758 .0186367
black | .1400693 .0194139 7.21 0.000 .1020187 .1781199
married | .0622581 .0141336 4.40 0.000 .0345568 .0899594
d81 | -.0118014 .0262817 -0.45 0.653 -.0633126 .0397097
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | -.0602973 .0424765 -1.42 0.156 -.1435497 .0229551
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
27
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (V)
Interpretation:
• Der ausgewiesene Wert von 88,58 der Likelihood-Quotienten Teststatistik
impliziert, dass die 12 erklärenden Variablen gemeinsam einen hochsignifi-
kanten Effekt auf die (Wahrscheinlichkeit der) Gewerkschaftszugehörigkeit
haben
• Die Anzahl der Arbeitsstunden hat einen signifikant negativen Effekt und
Erfahrung, Hautfarbe und Familienstand haben einen signifikant positiven
Effekt auf die Gewerkschaftszugehörigkeit, wohingegen Bildungsstand kei-
nen signifikanten Effekt hat
• Die Stärke der Effekte ist allerdings nicht anhand der geschätzten Parame-
ter zu erkennen
• Die Wald Teststatistik von 62,41 in Bezug auf black und married impliziert,
dass diese beiden Variablen gemeinsam einen hochsignifikanten Effekt auf
union haben
• Die geschätzte durchschnittliche Wahrscheinlichkeit der Gewerkschaftszu-
gehörigkeit bei verheirateten Personen (also bei married=1) beträgt 0,2796
oder 27,96%
---------------------------------------------------------------------------------------------------------
28
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (VI)
Weitere Anmerkungen:
• Es zeigen sich sehr ähnliche Schätzwerte bei den durchschnittlichen margi-
nalen Wahrscheinlichkeitseffekten im Vergleich zu den marginalen Wahr-
scheinlichkeitseffekten an den arithmetischen Mitteln aller erklärenden Vari-
ablen
• Der Schätzwert des durchschnittlichen marginalen Wahrscheinlichkeitseffek-
tes von hours impliziert, dass eine zusätzliche Arbeitsstunde zu einer ge-
schätzten Verminderung der Wahrscheinlichkeit der Gewerkschaftszugehö-
rigkeit um 0,0000481 bzw. 0,005 Prozentpunkte führt (die Interpretation ei-
ner geschätzten Verminderung um 5 Prozentpunkte bei einer Erhöhung um
1000 Arbeitsstunden kann aufgrund der marginalen Betrachtung der Wahr-
scheinlichkeitseffekte starke Ungenauigkeiten aufweisen)
• Die Betrachtung von marginalen Wahrscheinlichkeitseffekten für black und
married machen aufgrund des diskreten Charakters dieser erklärenden Va-
riablen keinen großen Sinn: Der diskrete Wahrscheinlichkeitseffekt von
married kann mit der zusätzlichen Betrachtung der durchschnittlichen Wahr-
scheinlichkeit der Gewerkschaftszugehörigkeit bei married=0 geschätzt wer-
den.
---------------------------------------------------------------------------------------------------------
29
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (VII)
xtprobit union hours educ exper black married d81 d82 d83 d84 d85 d86 d87, re
Random-effects probit regression Number of obs = 4360
Group variable: nr Number of groups = 545
Random effects u_i ~ Gaussian Obs per group: min = 8
avg = 8.0
max = 8
Wald chi2(12) = 36.44
Log likelihood = -1654.7858 Prob > chi2 = 0.0003
------------------------------------------------------------------------------
union | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hours | -.0001465 .000068 -2.16 0.031 -.0002797 -.0000133
educ | -.0218644 .0594262 -0.37 0.713 -.1383377 .0946089
exper | .0390217 .0620561 0.63 0.529 -.082606 .1606494
black | .8830474 .2561121 3.45 0.001 .3810769 1.385018
married | .2079123 .0900752 2.31 0.021 .0313682 .3844563
d81 | -.0632666 .1288576 -0.49 0.623 -.3158229 .1892897
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | -.244501 .4474486 -0.55 0.585 -1.121484 .6324821
_cons | -1.049039 .8320243 -1.26 0.207 -2.679777 .5816985
-------------+----------------------------------------------------------------
/lnsig2u | 1.072764 .1140511 .8492275 1.2963
-------------+----------------------------------------------------------------
sigma_u | 1.709809 .0975029 1.529 1.912
rho | .7451221 .02166 .7004051 .7852116
------------------------------------------------------------------------------
Likelihood-ratio test of rho=0: chibar2(01) = 1447.45 Prob >= chibar2 = 0.000
---------------------------------------------------------------------------------------------------------
30
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (VIII)
test black married
( 1) [union]black = 0
( 2) [union]married = 0
chi2( 2) = 16.07
Prob > chi2 = 0.0003
margins, predict(pu0) dydx(hours educ exper black married) atmeans
Conditional marginal effects Number of obs = 4360
Model VCE : OIM
Expression : Pr(union=1 assuming u_i=0), predict(pu0)
dy/dx w.r.t. : hours educ exper black married
at : hours = 2191.257 (mean)
educ = 11.76697 (mean)
exper = 6.514679 (mean)
black = .1155963 (mean)
married = .4389908 (mean)
d81 = .125 (mean)
⋮ ⋮ ⋮ ------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hours | -.0000219 .0000105 -2.08 0.037 -.0000426 -1.29e-06
educ | -.0032754 .008897 -0.37 0.713 -.0207133 .0141625
exper | .0058457 .009328 0.63 0.531 -.0124368 .0241282
black | .1322865 .0409942 3.23 0.001 .0519393 .2126338
married | .0311467 .014028 2.22 0.026 .0036523 .0586411
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
31
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (IX)
margins, predict(pu0) dydx(hours educ exper black married)
Average marginal effects Number of obs = 4360
Model VCE : OIM
Expression : Pr(union=1 assuming u_i=0), predict(pu0)
dy/dx w.r.t. : hours educ exper black married
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hours | -.0000226 .0000108 -2.09 0.037 -.0000439 -1.39e-06
educ | -.0033776 .0091799 -0.37 0.713 -.0213698 .0146146
exper | .006028 .0096293 0.63 0.531 -.012845 .0249011
black | .1364127 .041729 3.27 0.001 .0546254 .2182
married | .0321182 .0144282 2.23 0.026 .0038394 .060397
------------------------------------------------------------------------------
margins, predict(pu0) at (married=1)
Predictive margins Number of obs = 4360
Model VCE : OIM
Expression : Pr(union=1 assuming u_i=0), predict(pu0)
at : married = 1
------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
_cons | .1127145 .0193129 5.84 0.000 .074862 .1505671
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
32
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (X)
xtlogit union hours educ exper black married d81 d82 d83 d84 d85 d86 d87, re
Random-effects logistic regression Number of obs = 4360
Group variable: nr Number of groups = 545
Random effects u_i ~ Gaussian Obs per group: min = 8
avg = 8.0
max = 8
Wald chi2(12) = 36.72
Log likelihood = -1652.7964 Prob > chi2 = 0.0002
------------------------------------------------------------------------------
union | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hours | -.0002876 .0001217 -2.36 0.018 -.0005262 -.000049
educ | -.0322533 .1023927 -0.31 0.753 -.2329394 .1684327
exper | .0717738 .1075846 0.67 0.505 -.1390882 .2826358
black | 1.584896 .4453701 3.56 0.000 .7119866 2.457805
married | .3784846 .1590169 2.38 0.017 .0668172 .6901519
d81 | -.1066676 .2308675 -0.46 0.644 -.5591597 .3458244
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | -.4290466 .7775902 -0.55 0.581 -1.953095 1.095002
_cons | -1.920652 1.439615 -1.33 0.182 -4.742245 .9009418
-------------+----------------------------------------------------------------
/lnsig2u | 2.221506 .1159724 1.994204 2.448808
-------------+----------------------------------------------------------------
sigma_u | 3.036644 .1760834 2.710416 3.402137
rho | .7370435 .0224767 .690692 .7786747
------------------------------------------------------------------------------
Likelihood-ratio test of rho=0: chibar2(01) = 1451.84 Prob >= chibar2 = 0.000
---------------------------------------------------------------------------------------------------------
33
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (XI)
Interpretation:
• Die random effects Schätzungen im binären Logitmodell sind erwartungsge-
mäß qualitativ sehr ähnlich zu den random effects Schätzungen im binären
Probitmodell. Die unterschiedlichen Schätzwerte ergeben sich durch die un-
terschiedlichen implizit einbezogenen Varianzen bei standardnormalverteil-
ten und standardlogistischverteilten Zufallsvariablen.
• Die ML-Schätzwerte implizieren, dass die Anzahl der Arbeitsstunden einen
signifikant negativen Effekt und Hautfarbe und Familienstand einen signifi-
kant positiven Effekt auf die Gewerkschaftszugehörigkeit haben, wohinge-
gen der Effekt der Erfahrung insignifikant wird
• Die ausgewiesenen Werte von 36,44 und 36,72 der Wald Teststatistiken im-
plizieren, dass die 12 erklärenden Variablen gemeinsam weiterhin einen
hochsignifikanten Effekt auf die Gewerkschaftszugehörigkeit haben (wenn
auch mit einer etwas geringeren Signifikanz)
• Die Werte von 1,709809 und 1,072764 [= log(1,7098092)] bei der random
effects Schätzung im binären Probitmodell stellen die geschätzte Standard-
abweichung der αi sowie den (natürlichen) Logarithmus der geschätzten Va-
rianz der αi dar. Der Wert von 0,7451221 [= 1,7098092/(1+1,7098092)] ist die
geschätzte Korrelation der Störterme für zwei beliebige Perioden.
---------------------------------------------------------------------------------------------------------
34
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (XII)
Weitere Anmerkungen:
• Der ausgewiesene Wert von 1447,45 der Likelihood-Quotienten Teststatistik
bei der random effects Schätzung im binären Probitmodell impliziert, dass
die Hypothese, dass keine unbeobachtete Heterogenität vorliegt (d.h. dass
die Korrelation der Störterme für zwei beliebige Perioden null ist), bei einem
sehr geringen Signifikanzniveau verworfen werden kann
• Die Wald Teststatistik von 16,07 in Bezug auf black und married auf Basis
der random effects Schätzung im binären Probitmodell impliziert, dass diese
beiden Variablen gemeinsam einen etwas weniger signifikanten, aber noch
immer hochsignifikanten Effekt auf union haben
• Bei den Schätzwerten der durchschnittlichen marginalen Wahrscheinlich-
keitseffekte, der marginalen Wahrscheinlichkeitseffekte an den arithmeti-
schen Mitteln aller erklärenden Variablen sowie der durchschnittlichen Wahr-
scheinlichkeit der Gewerkschaftszugehörigkeit bei verheirateten Personen
ist zu beachten, dass sie auf der Annahme αi = 0 beruhen. Aus diesem
Grund sind diese Schätzungen nicht sehr aussagekräftig.
---------------------------------------------------------------------------------------------------------
35
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (XIII)
xtlogit union hours educ exper black married d82 d83 d84 d85 d86 d87, fe
note: multiple positive outcomes within groups encountered.
note: 299 groups (2392 obs) dropped because of all positive or
all negative outcomes.
note: educ omitted because of no within-group variance.
note: black omitted because of no within-group variance.
Iteration 0: log likelihood = -730.74184
Iteration 1: log likelihood = -730.38833
Iteration 2: log likelihood = -730.38832
Conditional fixed-effects logistic regression Number of obs = 1968
Group variable: nr Number of groups = 246
Obs per group: min = 8
avg = 8.0
max = 8
LR chi2(9) = 20.79
Log likelihood = -730.38832 Prob > chi2 = 0.0136
------------------------------------------------------------------------------
union | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
hours | -.0002521 .0001245 -2.03 0.043 -.000496 -8.13e-06
educ | 0 (omitted)
exper | -.0307687 .2066957 -0.15 0.882 -.4358848 .3743474
black | 0 (omitted)
married | .3024055 .1705954 1.77 0.076 -.0319554 .6367664
d82 | .1048254 .3552208 0.30 0.768 -.5913945 .8010453
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .3072396 1.346993 0.23 0.820 -2.332818 2.947297
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
36
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Gewerkschaftszugehörigkeit (XIV)
Anmerkungen:
• Bei der fixed effects Schätzung im binären Logitmodell werden 299 Beob-
achtungseinheiten eliminiert, bei denen die yi1,…, yiT über die Zeit entweder
durchweg null oder durchweg eins sind. Zudem können die zeitinvarianten
erklärenden Variablen educ und black nicht in die Schätzung einbezogen
werden.
• Die fixed effects Schätzungen im binären Logitmodell implizieren, dass die
Anzahl der Arbeitsstunden weiterhin einen signifikant negativen Effekt hat,
wohingegen married nur noch auf einem Signifikanzniveau von 10% einen
Effekt hat
• Generell hat die fixed effects Schätzung von binären Logitmodellen gegen-
über der random effects Schätzung von binären Probit- und Logitmodellen
den Vorteil, dass sie auch bei einer Korrelation von αi und xit konsistent ist.
Diesem Vorteil stehen aber einige praktische Nachteile (z.B. keine Einbe-
ziehung von zeitinvarianten erklärenden Variablen, noch größere Probleme
bei der Schätzung von marginalen Wahrscheinlichkeitseffekten) gegenüber.
---------------------------------------------------------------------------------------------------------