-
Économétrie II
Économétrie IIL3 Économétrie – L3 MASS
Prof. Philippe Polomé, U. Lyon 2
Année 2013-2014
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : Endogénéité
Rappel
1. E (ei ) = 0 8i : Espérance nulle2. X var (ei ) = s2 8i : Homoscédasticité3. X cov (et ,es) = 0 8t 6= s : Pas d’autocorrélation4. E (eixi ) = 0 8i : Exogénéité5. X La matrice X est de plein rang : Pas de multicolinéarité6. Le modèle est correctement spécifié7. La variable dépendante Y est continue
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : Endogénéité
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences
Définition
I Exogénéité :I Coupe transv. E (eiXi ) = 0
I Pas de corrélation entre l’erreur et chaque régresseur pour unmême i
I On écrit aussi E (ei |Xi ) = 0 : espérance conditionnelle nulle
I Série temp : E (etxt) = 0 8t 8x pas de corrélationcontemporaine
I Lorsque E (et |xs) = 0s = 1, . . . ,T , x est strictement exogène
I Rupture de cette hypothèse = endogénéitéI Interprétation : Un choc aléatoire e induit un choc sur Y et sur X
pour un même iI Donc difficile de séparer les effets “confondants”
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences
Conséquence : Inconsistance de l’estimateur MCOI Corrélation positive : à des valeurs élevées (basses) de e
correspondent des valeurs élevées (basses) de XI e grand : Y > Xb et e petit : Y < XbI Donc : droite estimée par MCO pente plus forte que la réalité
I Monte Carlo : fichier tableur en ligne Endogeneite.ods
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences
Pourquoi l’endogénéité est-elle un problème ?
I Ne vaut-il pas mieux prédire Y le mieux possible ?I Trois cas
I Prédiction : on veut prédire Y conditionnellement à XI Si on connait X “e inclus”, x (e), ce qui n’est pas évident,I Dans ce cas, l’effet de l’erreur sur X est inclus, donc prédiction
MCO Ŷ correcte
I Contrôle : on choisit X , quel sera Y ? [p.e. effet d’une politique]I Si on choisit X , l’erreur n’y est pas, donc prédiction MCO
incorrecte
I Si l’on souhaite comprendre la relation entre Y et X il faut traiterl’endogénéité
I Dans les 2 derniers cas : ce n’est pas une bonne idée “d’ajusterune droite au mieux” dans le nuage de points
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences
5 sources de l’endogénéité
1. Hétérogénéité inobservée2. Erreur de mesure3. Simultanéité4. Échantillonnage endogène5. Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée
2 cas d’hétérogénéité inobservée
I Variable omiseI Coefficients aléatoires
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée
Variable omise
I Le modèle correctement spécifié est Y = b0+b1x1+b2x2+ eI Mais le modèle estimé est Y = b0+b1x1+n
I L’effet du régresseur manquant se retrouve dans l’erreur dumodèle estimée : n = b2x2+ e
I = hétérogénéité inoberservée : Des facteurs inobservés affectent àla fois la variable expliquée et un régresseur
I Si le régresseur manquant est corrélé à un régresseur présentI Alors le terme d’erreur du modèle estimé est corrélé avec au
moins un régresseur présentI De plus vraisemblablement :
I Hétéroscédasticité si var (x2t) 6= var (x2s) ,t 6= sI Autocorrélation si corr (x2t ,x2s) 6= 0,t 6= sI
E (n) 6= 0 l’intercept du modèle est biaisé
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée
Que faire en cas de variable omise ?
1. Ignorer le problème : inconsistance des estimateurs2. Essayer de trouver un proxy acceptable pour la variable
inobservéeI Proxy = mesure approximative de la variable inoberservée
(ci-dessous)
3. Si données de panel et si la variable inobservée ne change pasdans le temps (mais seulement entre les agents)
I Modèle “à effets fixes” (programme de M2)
4. Laisser la variable inobservée dans le terme d’erreur mais utiliserun estimateur qui reconnait sa présence
I Estimateur Variable Instrumentale ci-dessous
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée
Proxy
I Variable inobservée : on sait que le modèle devrait inclure unrégresseur, mais on n’a pas de donnée
I Modèle Y = b0+b1x1+b2x2+ eI
x2 pas observée
I Proxy z pour x2 :I
z observée mais pas explicative dans le modèleI
z corrélée à x2 : x2 = d0+d1z+µI On ne peut tester cette corrélation puisque x2 pas observée
I P.e. éducation x2 et nombre d’années d’étude z
I La proxy n’est pas une erreur de mesureI Ni un instrument (plus loin)
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée
Utilisation d’une proxy
I La variable proxy est substituée à la variable inobservée dansY = b0+b1x1+b2x2+ e
I On peut estimer Y = p0+p1x1+p2z+xI Que dit ce modèle sur le précédent ?
Y = b0+b1x1+b2 (d0+d1z+µ)+ e= b0+b2d0+b1x1+b2d1z+b2µ + e= p0 +p1x1+p2z +x
I Donc si µ n’est pas corrélé avec x1, estimerY = p0+p1x1+p2z+x par MCO
I Sans bias et consistant pour b1 = p1I Les autres coef. p0 et p2 n’ont pas d’interprétation directe
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée
Coefficients aléatoires
I Autre forme d’hétérogénéité inobservéeI Modèle vrai Yi = b0+x1ix1i +hi avec x1i aléatoire t.q.
Ix1i = g1+µ1i
Ig1 pas aléatoire (pourrait dépendre de régresseurs)
Iµ1i est un bruit blanc
I On estime Yi = b0+b1x1i + ei doncI
ei = µ1ix1i +hiI
b1 = g1
I SolutionI Variable instrumentale (ci-dessous)I Modélisation explicite par Maximum de Vraisemblance (on ne
voit pas)
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 2. Erreurs de mesure
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 2. Erreurs de mesure
Définition & traitementI Modèle y = b0+b1x⇤1 + e
I On n’observe pas x⇤1 mais bien x1 = x⇤1 +nI
n est une erreur de mesure
I “Classical Error-in-Variables” (CEV)
I Équation estimée : avec x1I
y = b0+b1 (x⇤1 +n)+(e �b1n) = b0+b1x1+µI Donc, cov (x1,µ) = cov (x⇤1 +n ,e �b1n) =�b1s2n 6= 0
I Pour autant que erreur de mesure n pas corrélée avec x⇤1I Les erreurs de mesure sont la norme
I Endogénéité pas toujours préoccupante
I Solution : variable instrumentale ci-dessousI Une erreur de mesure sur y accroît la variance des erreurs mais
ne cause pas d’endogénéité
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité
Définition & exemples
I 2 variables sont causales l’une de l’autreI
y = b0+b1x+ e (x cause y ) et x = g0+ g1y +µ (y cause x)I Donc : x (y) mais y (e) donc x (e)
I d’où corrélation entre x et l’erreur dans y = b0+b1x+ e
I ExemplesI Publicité et vente :
I La publicité accroît/soutient les ventesI Le budget publicité est calculé en proportion aux ventes
I Fonction de coût C (Q,W ), Q = production, W vecteur des prixd’intrants
I Lemme de Sheppard ∂C/∂W = d (Q,W ) : demande d’intrantsest fonction de la production mais production est fonction desintrants utilisés
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité
Exemple de simultanéité : modèle keynésien
I Deux équations : forme structurelle = forme économiqueI Consommation Ct = b0+b1Yt + et avec Y le PIBI Identité comptable Yt = Ct + It avec I l’investissement, ici
exogèneI Économie fermée sans état
I La consommation et le revenu sont donc déterminéssimultanément
IC et Y sont deux endogènes
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité
Forme réduite
I Forme réduite = toutes les endogènes à gauche
ICt =
11�b1
[b0+b1It + et ] = d0+d1It +µt
IYt =
11�b1
[b0+ It + et ] = g0+ g1It +nt
I Clairement, Y est corrélé à eI DONC : Endogénéité dans le modèle structurel en estimant
l’équation de consommation, même seule
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité
Moindres Carrés Indirects
I MCO toujours consistant pour forme réduiteI Identification : coef. forme structurelle peuvent-ils être
récupérés de la forme réduite ?I Ici, en estimant chaque équation de la FR : d̂0, d̂1, ĝ0, ĝ1I On calcule les coef. structurels par b1 =
d1
1+d1ect
I Si une seule manière de récupérer tous les coef. structurels :système exactement identifié
I Moindres Carrés Indirects MCI = appliquer MCO à la formeréduite & résoudre pour obtenir les coef. structurels
I Si certains coef. ne peuvent être ainsi retrouvés : sous-identifiéI Si certains coef. retrouvés de plus d’une manière : sur-identifié
I “Bonne” manière ? Variable Instrumentale
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Méthode des Moments MM
I Interprétation d’inversion de MCO dite “méthode des moments”I Soit A un estimateur de b , alors on peut écrire Y �XA= êI Hypothèse exogénéité E (X e) = 0I Stratégie “méthode des moments”
I Cette condition sur les moments de la population est imposéeaux moments de l’échantillon
I C’est-à-dire on veut A tel que X 0 ê = 0I Donc : X 0 (Y �XA) = 0 : ce sont les CPO de moindres carrés
A= (X0X )�1X
0Y = b̂
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Variables instrumentales
I Hypothèse exogénéité E (X e) = 0 ne tient plusI Supposons qu’on puisse trouver un ensemble de variables Z ou
“instruments”telles queI
Z et X soient de mêmes dimensionsI
E (e|Z ) = 0I
Corr (Z ,X ) soit élevée
I Donc Z permet d’inverser la relation Y = Xb + e viaZ
0Y = Z
0XA+Z
0e
I Si on a PlimZ 0e = 0 (à la limite Z et e ne sont pas corrélés)I Alors : Estimateur Méthodes des Moments (⌘ Variables
Instrumentales VI) : A t.q. Z 0 (Y �XA) = 0I
A= (Z 0X )�1Z0Y = b̂VI
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Propriétés de b̂VI
I Il s’agit d’un estimateur alternatif à MCOI En général biaiséI consistant (si les instruments sont valides, voir ci-dessous)
I On peut démontrer que ⌃b̂VI
= s2e
⇣Z
0X
⌘�1⇣Z
0Z
⌘⇣Z
0X
⌘�1
I Cette variance est d’autant plus faible que la corrélation entre Zet X est forte
I À la limite si Z et X non-corrélés, alors Z 0X ! 0 et ⌃b̂VI
! •I MCO peut être vu comme VI avec Z = X
ICorr (Z ,X ) = 1
I Donc : si pas endogénéité, MCO plus efficient que VI
I 6= remplacer X par Z dans Y = Xb + e [cfr. proxy]I Si on le faisait, le modèle serait Y = Zg +µI Et l’estimateur MCO serait ĝMCO =
⇣Z
0Z
⌘�1Z
0Y
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Instruments & Tests
I La difficulté fondamentale est de trouver des instrumentsI On verra quelques casI En séries temporelles & panels : valeurs passées (retards)I En systèmes d’équations : régresseurs dans d’autres équations
I Il faut exactement un instrument par variable de X (identificationexacte)
I Les variables non-endogènes sont leurs propres instrumentsI Lorsqu’on dispose de plus d’un instrument pour une variable, il
faut généraliser la méthode
I Les tests d’inférence n’ont plus de valeur qu’asymptotiquementI Le bootstrap reste valideI Le R2 n’a plus de sens
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Validité des instruments
I Difficile de tester l’exogénéité des instruments cov (Z ,e) = 0I Si Z n’est pas exogène, VI sera inconsistant (par construction)I ) VI ne s’applique pas en cas d’échantillonnage endogène
I On peut mesurer la corrélation entre Z et XI Soit Y = b0+b1x+ e
Ix est endogène, on a un instrument z
I Si cov (z ,e) 6= 0 on peut montrer que Plim b̂1VI = b1+cov (z ,e)
cov (z ,x)
I Donc que si cov (z ,e) 6= 0 alors b̂VI est inconsistant
I De plus Plim b̂1VI = b1+s
e
corr (z ,e)
sxcorr (z ,x)
I Donc, si corr (z ,e) 6= 0 même faible, alors si corr (z ,x) est faible(mauvais instrument), Plim b̂1VI ne sera pas proche de b1
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Devoir #6 : VI
I Reprenez de ma feuille Tableur l’exemple avec un régresseurendogène
I Générez un instrumentI Valide (= non-corrélé avec le terme d’erreur)I Bon (= corrélation élevée avec le régresseur endogène)I Basez-vous directement sur la façon dont le régresseur a été
généré
I Estimez les coefficients du modèle par VII Examinez comment les coefficients estimés varient en fonction
de la corrélation de l’instrument avec le régresseurI Illustrez qu’un instrument non-valide amène à l’inconsistance
I Examinez le degré d’inconsistance en fonction de la corrélationde l’instrument avec le régresseur
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Doubles moindres carrés MC2E (2SLS)
I Application particulière de VII Soit l’équation structurelle Y = Xb + e
I Supposons que dans X , xk soit endogène et qu’on dispose d’uninstrument z pour xk
I La matrice d’instruments serait Z , identique à X sauf pour ladernière colonne dans laquelle on a remplacé xk par z
I Équation d’instrumentationxk = d0+d1x1+ . . .+dk�1xk�1+dkz+µ = Zd +µ
I Estimation MCO, valeurs ajustées de xk sontx̂k = d̂0+ d̂1x1+ . . .+ d̂k�1xk�1+ d̂kz = Z d̂
I On voit que x̂k est un instrument valide pour xk si z est uninstrument valide pour xk
IX̂ la matrice X dans laquelle on a remplacé xk par x̂k
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
MC2E (2)
I Estimateur VI est b̂VI =⇣X̂
0X
⌘�1X̂
0Y
I Meilleur que (Z 0X )�1Z 0Y car la corrélation entre x̂k et xkdevrait être plus élevée que entre z et xk
I L’estimateur VI est équivalent à une estimation MCO en deuxétapes (MC2E) :
1. Estimation de l’équation d’instrumentation xk = Zd +µ2. Remplace X par X̂ dans l’équation structurelle : Y = pX̂ +n
(régression de 2nde étape) et on estime par MCO
Ip̂MC2E =
⇣X̂
0X̂
⌘�1X̂
0Y : c’est
⇣X̂
0X̂
⌘�1et pas
⇣X̂
0X
⌘�1
comme dans b̂VII On peut montrer que p̂MC2E = b̂VI =
⇣X̂
0X
⌘�1X̂
0Y
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Preuve
I On note qu’on peut écrire X̂ = Z⇣Z
0Z
⌘�1Z
0X
I Pour la dernière colonne de X̂ , c’est Z d̂I Pour les autres, ce sont les colonnes de X (exogènes)
p̂MC2E =⇣X̂
0X̂
⌘�1X̂
0Y
=
✓X
0Z
⇣Z
0Z
⌘�1Z
0✓Z
⇣Z
0Z
⌘�1Z
0X
◆◆�1X̂
0Y
=
✓X
0Z
⇣Z
0Z
⌘�1Z
0X
◆�1X̂
0Y
=⇣X̂
0X
⌘�1X̂
0Y = b̂VI
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Plusieurs instruments
I Il faut au moins un instrument par variable explicativeI Les exogènes sont leurs propres instruments
I Dans certains cas, on dispose de plus d’un instrument pourcertains régresseurs
I MC2E : on voit tout de suite comment intégrer ces instrumentssupplémentaires via la (ou les) équations d’instrumentation
I On peut démontrer que parmi toutes les manièresd’utiliser/combiner ces différents instruments, MC2E est la plusefficiente
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Notes MC2E
I Ne pas faire la régression en 2 étapes explicitementI utiliser la commande MC2E (2SLS)I sinon à la 2ème étape le logiciel va calculer une matrice de var
cov selon la formule MCO et pas VI
I Des estimations robustes à l’hétéroscédasticité sontgénéralement disponibles pour MC2E et VI
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité
Résumé
I Identification Exacte : 1 ! instrument par régresseur endogèneI Utiliser Variable Instrumentale ⌘ MMI MC2E = + efficient des estimateurs VI
I Sous-identification : manque au moins un instrumentI Estimation consistante impossible
I Sur-identificaiton : plus d’un instrument pour au moins unrégresseur endogène
I MC2E avec eq d’instrumentation à pls instrumentsI = un cas de MM Généralisée : GMM
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests
Test 1. Hausman : EndogénéitéMCO MC2E
Aucun régresseur endogène consistant consistantefficient inefficientAu moins 1 régresseur endogène inconsistant consistant
I Donc : si endogénéité : MC2E – mais sinon : MCOI Idée du test de Hausman : tester l’égalité des deux estimateurs
I Si égaux, alors pas endogénéité : on préfère MCOI Sinon, on prend MC2E
I Test disponible sur tous les logiciels économétriquesI Valable entre n’importe quelle paire d’estimateurs avec un
consistantI VI contre MCGF par exemple
I Aussi une bonne idée de comparer directement b̂MCO et b̂MC2E
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests
2 autres tests : Définitions
Equation structurelle : y1 = b0+b1y2+b2x1+b3x2+µ1I
x1 et x2 sont exogènesI On a aussi 2 autres exogènes x3 et x4
I Qui ne sont pas dans l’équation structurelleI Qui sont corrélés à y2
I On veut tester l’endogénéité de y2Forme réduite pour y2 : y2 = p0+p1x1+p2x2+p3x3+p4x4+n2
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests
Test 2. Test de régression / de corrélation des erreurs /Durbin–Wu–Hausman
I On veut tester l’endogénéité de y2I Chaque xj est non-corrélé avec µ1
Iy2 non-corrélé avec µ1 ssi n2 non-corrélé avec µ1
I Estimer y2 = p0+p1x1+p2x2+p3x3+p4x4+n2 par MCO(consistant)
I On obtient n̂2 : une approximation à n2
I Estimer y1 = b0+b1y2+b2x1+b3x2+d1n̂2+ erreur par MCOI
n̂2 significatif (t-stat) =) n2 et µ1 corrélés, donc y2 endogèneI
n̂2 non-significatif n’implique rien
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests
Test de régression : remarque
I On peut montrer queI
b̂MCO de y1 = b0+b1y2+b2x1+b3x2+d1n̂2+ erreur estidentique à
Ib̂MC2E de y1 = b0+b1y2+b2x1+b3x2+µ1
I C’est une 2ème interprétation de MC2EI inclure n̂2 dans la régression MCO “nettoie” l’endogénéité de y2
I Test sur plusieurs variables endogènesI tester conjointement (test F) la significativité des résidus de
chaque équation d’instrumentation
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests
Test 3. “OverID” Restrictions sur-identifiées : Exogénéitéde l’instrument
I Si l’on a un seul instrument pour un régresseur endogèneI Impossible de tester l’absence de corrélation entre l’instrument et
le terme d’erreur : corr (z ,e) = 0I Modèle “juste / exactement” identifié
I Si l’on dispose de plusieurs instruments,I Possible de tester l’exogénéité d’un instrumentI Le modèle est “sur-identifié”
I Dans notre exemple : x3 et x4 peuvent servir d’instruments poury2 dans l’équation structurelle y1 = b0+b1y2+b2x1+b3x2+µ1
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests
Étapes du test OverID
1. Estimer l’équation structurelle par VI en utilisant seulement x3comme instrument1.1 Construire résidu empirique
µ̂1MC2E = y1� b̂0+ b̂1y2+ b̂2x1+ b̂3x22. Régresser résidu µ̂1MC2E sur toutes les variables exogènes du
modèle (explicatives + instruments)2.1 µ̂1MC2E = g0+ g1x1+ g2x2+ g3x3+ g4x4+x2.2 Calculer le R2 de cette régression
3. Sous l’hypothèse nulle (exogénéité de x4) : nR2a⇠ c2q
Iq : nombre d’instruments en excès (nombre d’instruments totaldans le modèle moins nombre de régresseurs endogènes)
I “Over-identification”, ici q = 1 car 2 instruments x3 et x4 et unrégresseur endogène y2
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests
OverID : remarques
I Il faut faire l’hypothèse que x3 est exogène : on ne peut la testerI Si nR2 > c2q;0.95 on rejette que x4 est exogène OU que x3 est
exogèneI Hypothèse de un instrument valide par régresseur endogène
I Test implémenté directement dans beaucoup de logiciels
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéApplications
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéApplications
Equation de salaire 1
I Fonction mincérienne de salaire :lnw = b0+b1educ+b2exper +b3exper2+ e
Iw le salaire ; educ nbr années d’études ; exper nbr annéesexpérience
I Les Capacités Intellectuelles Intrinsèques (CII) de l’individu(“ability”) sont
I Inobservées / inobservablesI Positivement corrélées avec le niveau d’éducation atteint :
educ = a0+a1CII +nI Positivement corrélées avec le niveau de salaire :
ln(w) = d0+d1CII +µ
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéApplications
Equation de salaire 2
I Le rendement de l’éducation estimé parlnw = b0+b1educ+b2exper + e
I Est-il sur- ou sous-estimé ?
I Données card.gdt de WooldridgeI Instruments : Education de la mère et du pèreI Equation d’instrumentation
educ =�cst,exper ,exper2,Meduc ,Feduc
�
I 2SLS : automatisé et “à la main” en mettant [educ commerégresseur dans l’équation de salaire
I Mêmes coefficients, pas les mêmes t-tests
I Test d’endogénéité : résidu de l’équation de d’instrumentationdans MCO sur équation de salaire
I Autre instrument possible proximité à un “college4”
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéApplications
Poids à la naissance
I Illustration d’un mauvais instrumentI Données bwght.gdt Wooldridge
I Poids de l’enfant à la naissance (bwght) en log en fonction deI consommation de tabac (packs)I revenu familial (faminc) prix comme mesure d’autres facteurs
(accès aux soins, ...)I On peut rajouter d’autres régresseurs
I La consommation de tabac pourrait être endogèneI P.e. stress (pas observé)
I Instrument : cigprice prix des cigarettesI Équation d’instrumentation : on voit que c’est un mauvais
instrument
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage
4º source d’endogénéité : Échantillonnage
I Si on n’observe pas un échantillon “purement” aléatoire(“simple”)
I mais plutôt un échantillon sélectionné dans lequel seuls certainsindividus sont admis
I ou bien avec des données manquantes
I 3 casI Sélection – ou attrition – purement aléatoire, ou basée sur des
variables aléatoires exogènesI Pas de problème
I Sélection basée sur un régresseur xj corrélé à la dépendante yI Sélection basée sur dépendante y
I Un problème d’échantillon sélectionné ou troncature se pose
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage
Sélection basée sur un régresseur xj
corrélé à y
I Exemple : On estime des fonctions de salaires, mais on observeplus d’attrition pour les niveaux d’éducation faibles
I Sans que cette attrition soit corrélée au revenu (salaire) par classed’éducation
I Les statistiques descriptives sont biaiséesI par exemple, le salaire moyen sera plus élevé que dans la réalité
I Les MCO restent sans biais et consistantsI Les estimations “contrôlent” les dimensions des variables
explicatives
I Pas de problème tant qu’il y a assez de variabilité dans lesvariables explicatives pour identifier les effets mesurés
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage
Sélection sur y cas 1. Troncature (Truncation)
I Inclusion dans l’échantillon est yi ci (sélection de troncature)I Alors ei ci �Xib : la sélection de troncature introduit une
corrélation contemporaine entre l’erreur et les régresseur(s)I Notes
I On n’observe aucun yi > ci ni aucun Xi correspondantI La sélection peut aussi être yi � ci
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage
Sélection sur y cas 2. Troncature accidentelle
I Modèle bivarié de sélection de l’échantillon (MBSE)
I Équation de participation Y1 =
(1 si Y ⇤1 > 00 sinon
I Équation de résultat Y2 =
(Y
⇤2 si Y
⇤1 > 0
� sinonI Donc : On n’observe Y ⇤2 que si Y ⇤1 > 0, c’est-à-dire que si on
observe Y1 = 1
I On suppose que la réalité est Y⇤1 = X1b1+ e1
Y
⇤2 = X2b2+ e2
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage
Troncature accidentelle : origine du biais
I Il semble raisonnableI de supposer que le terme d’erreur e1 de l’équation de
participation peut être corrélé au terme d’erreur e2 de l’équationde résultat : e1 (e2)
I que certains régresseurs au moins soient communs entre X1 et X2I
X1\X2 = X21I Le reste X22 et X11
I On peut écrire l’équation de participation commeX11b11+X21b12 > e1 (e2)
I Donc, la troncature accidentelle provoque une corrélation entreX2 et e2 : endogénéité dans l’équation de résultat
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage
Autre interprétation : moyenne conditionnelle de Y2
I La moyenne de Y2 conditionnellement à X2 dépend de Y ⇤1 car siY
⇤1 0, on n’observe pas Y2I On suppose pour simplifier que X2 est non-endogène
E (X2|e1) = E (X2|e2) = X2I
E (Y2|X2,Y ⇤1 > 0) = E (X2b + e2|X1b1+ e1 > 0)= X2b2+E (e2|e1 >�X1b1)
I DoncI Si e2 et e1 sont indépendants, le dernier terme est nulI Sinon, il faut corriger la moyenne conditionnelle pour le biais de
sélection (ou troncature accidentelle)I Et en particulier MCO de Y2 sur X2 sera biaisé et inconsistant
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage
Exemple : Equation de salaire
I Le salaire dépend de caractéristiques comme le niveau d’étude,l’age, le sexe, le nombre d’enfants...
I On n’observe un salaire que pout ceux/celles qui participent aumarché du travail
I La décision de participer au marché du travail dépendcertainement de facteurs similaires à ceux expliquant le salaire
I Donc équation de sélection : participationI Équation de résultat : salaireI Corrélation entre les deuxI MCO équation de salaire : biaisé et inconsistant
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage
Estimation
I Rappel : Sources 1 (hétérogénéité inobservée), 2 (erreurs demesure) et 3 (simultanéité) peuvent être adressées par VariableInstrumentale / MC2E
I Source 4 Sélection d’échantillonnageI VI inutile car VI a le même problème d’échantillonnageI La solution passe par une modélisation du processus de sélection :
I Plusieurs estimateurs alternatifs – on regardera en M1
I En résuméI Toujours se poser la question de l’échantillonnageI Pourquoi certaines données sont manquantes
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 5 : Autocorrélation en séries temporelles
Table des matières
Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 5 : Autocorrélation en séries temporelles
5º source : Autocorrélation en séries temporelles
I Exogénéité en série temp : E (etxt) = 0 8t 8x pas decorrélation contemporaine
I On écrit aussi E (et |xt) = 08t 8x : espérance conditionnellenulle
I Ce qui est la même chose
I Lorsque E (et |xs) = 0s = 1, . . . ,T on dit que x est strictementexogène
Iet n’est corrélé à aucun régresseur à aucune période
I En série temp., on ne fait pas l’hypothèse d’absenced’autocorrélation
I L’absence de corrélation contemporaine suffit à ce que MCO soitconsistant
I Pour que MCO soit non-biaisé il faut l’exogénéité stricte
-
Économétrie II
Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 5 : Autocorrélation en séries temporelles
Implication de l’exogénéité stricte
Soit le modèle statique du taux de meurtre en fonction du nombre depoliciers / habitant
TxMeurtret = b0+b1Pol/ht + et
1. Pol/h ne peut avoir aucun effet retardé sur TxMeurtre1.1 Sinon, Pol/ht�1 serait dans et ce qui romperait l’exogénéité
stricte
2. et ne peut causer aucun changement futur de Pol/h2.1 Supposons que la ville ajuste Pol/h sur base des valeurs passées
de TxMeurtre, alors Pol/ht+1 est corrélée avec et
I Facile que l’exogénéité sricte ne tienne pas
Ch. 5. i:E(ixi)=0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d'endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5: Autocorrélation en séries temporelles