exo8600 exo2bq2 sol v161 exo 2b q2 2020-02-10 attention aux coquilles… pistes de solutions...
TRANSCRIPT
1
Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0
Q2- Nous avons le modèle suivant : & 5001 2 3
S Pt tt tr r Dα β β ε= + + + pour 1,...,t T= sur des données annuelles
avec les variables suivantes :
tr : Le rendement du titre de Abble au temps t
& 500S Ptr : Le rendement de l’indice Standard&Poor500 au temps t
Et la variable dichotomique
1 si l'économie est en expansion au temps:
0 si l'économie est en récession au tempst
tD
t
=
Nous avons les matrices de données suivantes basées sur n = 4 observations:
1 6 0
1 4 1
1 2 0
1 6 1
X
=
2
1
3
3
2
6β
β β
α
= =
0
1
0
1
ε
−
=
La matrice X a comme vecteurs dans l’ordre: un vecteur de constante (de 1), le rendement du marché & 500S Ptr
et une
variable dichotomique tD pour tenir compte du statut de l’économie (1 pour une expansion et 0 pour une récession).
a) Calculez les valeurs des paramètres estimés ( 1α , 2β et 3β ) à partir de l’estimateur OLS pour le modèle ci-haut.
b) Donnez en détails la matrice de variance-covariance estimée de l’estimateur β et donnez sa version numérique.
c) Calculez y et représentez le graphiquement, et puis comparez-le au vecteur y de données.
d) Calculez les USS (la somme des carrés des résidus), les XSS (la somme des carrés expliqués), les TSS (la somme des
carrés totaux), le 2R et le 2R ajusté associées à la régression du modèle. Interprétez les deux 2R . Qu’en pensez-vous?
Expliquez bien la différence entre les deux 2R . e) À partir de votre estimateur OLS, testez les hypothèses suivantes et concluez sur les résultats des tests adéquats effectués à un niveau de signification de 5% (ici on ne sait pas si des aléas sont normaux a priori):
e0) 0 : 0kH β = contre l’alternative 1 : 0kH β ≠
Effectuez ces tests pour toutes les variables du modèle et interprétez bien les résultats. Quelles sont les problèmes associés à ces divers tests statistiques dans les divers cas?
e1) 10 : 0H α ≥ contre l’alternative 1 1: 0H α <
Interprétez bien les résultats. Quelles sont les problèmes associés à ce test statistique dans ce cas?
e2) 0 2: 1H β = contre l’alternative 21 : 1H β ≠
Interprétez bien les résultats. Quelles sont les problèmes associés à ce test statistique dans ce cas? e3) Effectuez le test joint ANOVA de signification de la régression effectué à un niveau de signification de 5%. Interprétez bien les résultats. Quelles sont les problèmes associés à ce test statistique dans ce cas?
f) Calculez 1 ˆ'x ε , 2 ˆ'x ε et 3 ˆ'x ε , et interprétez les résultats. Estimez aussi les ˆkβ en deux blocs avec α et 2 3ˆ ˆ 'β β en
utilisant les formules de FWL.
2
g) Estimez le modèle SIM (Single Index Model) suivant : & 5001 2
S Pt ttr rα β ε= + + par OLS et comparez les résultats et
l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients.
(Régression avec une variable omise : tD )
h) Estimez le modèle suivant : & 500 & 5001 2 3 4( )S P S P
t t t t t tr r D D rα β β β ε= + + + ⋅ + par OLS et comparez les
résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients.
(Régression avec variable superflue d’effet croisé : & 500S Pt tD r⋅ reflétant un changement structurel au niveau de l’effet
du rendement du marché sur le rendement du titre.)
i) Estimez le modèle suivant (où on a enlevé la constante): & 5002 3
S Pt t t tr r Dβ β ε= + + par OLS et comparez les
résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients. Expliquez ce qui se produit pour le vecteur de résidus et pour les paramètres.
j) Illustration de l’effet de la multicolinéarité. Estimez le modèle suivant : & 5031
02 3
S Pt t ttr r xβ εα β= + ++
où 2
3 2t t txx x υγ γ υ= + avec un choc tel que . . . (0,1)tv i i d N∼ en faisant varier υγ de 0,10 à 100. On comprend que la
variable que l’on construit pour chaque régression, 3tx , est très fortement corrélée avec 2tx lorsque υγ est faible, et
lorsque υγ augmente le bruit ajouté à 2tx pour construire 3tx augmente, ce qui fait que la corrélation entre les deux
variables diminue. Par ailleurs, ici on fixe 2
1xγ = .
Comparez les résultats des paramètres et des variances des paramètres. Illustrez le tout graphiquement et interprétez le
tout. Expliquez bien ce qui se produit. Donnez les valeurs pour les premiers paramètres estimés et la somme 2 3ˆ ˆβ β+ ,
notez ce qui se produit.
k) Estimez le modèle CAPM empirique suivant : & 5001 2( ) ( )F S F
t t t tP
tr r r rα β ε− = + − + par OLS et comparez les
résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients. Le vecteur de taux sans
risque est donné par:
2
2
0
2
Fr
=
L) Estimez le modèle SIM suivant : & 5001 2
S Pt ttr rα β ε= + + en prenant les variables en déviations par rapport à la
moyenne par OLS pour obtenir les estimés et comparer les résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients.
m) Estimez le modèle original suivant : & 5001 2 3
S Pt tt tr r Dα β β ε= + + + par l’estimateur GLS suivant :
1 1 1 1ˆ ( ' ) ' ( ' ) 'GLS X X X y X X X yβ − − − −= Σ Σ = Ω Ω avec l’aide de la matrice 2
4 0 0 0
0 9 0 0
0 0 4 0
0 0 0 9
σ
Σ = Ω =
. Comparez
les résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients.
3
n) Expérience de Monte Carlo sur les rejets d’un test de signification d’un régresseur. Ajoutez une variable aléatoire comme régresseur et compter le nombre de fois sur 1000 simulations de cette variable où
l’on ne rejette pas la nulle : 0 : 0randomH β = dans la régression suivante :
& 5001 2
S P randomt t t ran tdomr r xα β β ε= + + + avec (5,1)random
tx N∼ .
o) Estimez le modèle SIM suivant : 1 2M
t t tr rα β ε= + + avec une nouvelle variable comme proxy du rendement du
marché donnée par 2
& 500 & 500 & 500( )M S P S P S Pt t t txr r r rθ= − + , ainsi on estime le même modèle mais avec une variable
telle que 2
& 500var( ) var( )M S Pt txr rθ= . Ainsi en augmentant la variance (écart-type) de la variable avec un
paramètre2xθ on obtient des estimateurs différents.
Utilisez les paramètres 2xθ égaux à 0.5, 0.5 , 2 , 2 et 4 pour calculer les estimés.
Interprétez les résultats et les coefficients.
p) Estimez le modèle original suivant : & 5001 2 3
S Pt tt tr r Dα β β ε= + + + en ajoutant une observation telle que :
(5) ' 1 4 1x = et montrez la différence des estimés. Calculez aussi le tout avec la formule de mise-à-jour des
paramètres.
1 1( 1) 1 ( 1)
1( 1) ( 1)
1ˆ ˆ ˆ( ' ) ( ' )1 '( ' )
n n n n n
n n nn n
n n
X X x y xx X X x
β β β + −
+ + + − + +
= + − +
q) Premièrement générez un nouveau régresseur & 02
50Sendot
Pt trx εγ ε= + avec εγ qui est égal à diverses valeurs
de 0.5, 1, 2εγ = . Ainsi le régresseur stochastique est corrélé avec le choc, ce qui fait que l’assomption d’exogénéité
stricte1 ne tient plus.
Générez aussi un autre régressant qtr
avec ce régresseur qui est corrélé avec le terme d’aléa tel que :
1 2 3q endo
t tt tr x Dα β β ε= + + +
Estimez ce nouveau modèle par OLS et expliquez ce qui se produit comme problématique. Montrez la différence entre les estimés.
r) Générez un nouveau régresseur & 02
50S Perrort t error tx r γ η= + avec errorγ qui est égal à diverses valeurs
de 0.5, 1, 2εγ = et (0,1)t Nη ∼ . Ainsi le régresseur contient une erreur de mesure ajoutée via le tη .
Estimez le modèle 1 2 3errort tt tr x Dα β β ε= + + + par OLS et expliquez ce qui se produit comme problématique.
Montrez la différence entre les estimés. zzz) Posez-vous d’autres questions et tentez d’y répondre en prenant des extensions de cette question pour vous donner de l’intuition sur les problématiques de régression en validant le tout sur papier avec des matrices de tailles raisonnables et/ou sur Matlab. C’est la meilleure manière de comprendre comment se comporte l’estimateur OLS et ses particularités…
1 Exogénéité stricte: ( ) 0E Xε =∣
4
Pistes de solutions numériques (attention aux coquilles) a) Créons le vecteur y des données du régressand.
1 6 0 0 15 0 153
1 4 1 1 17 1 162
1 2 0 0 7 0 76
1 6 1 1 21 1 22
y Xβ ε
− − + = + =
=
= +
Ici on a utilisé ε pour générer y , mais on va travailler pas la suite comme si on ne connaissait pas β et ε , en ayant
seulement accès aux données comme on le fait dans la pratique.
1 6 01 1 1 1 4 18 2
1 4 16 4 2 6 18 92 10
1 2 00 1 0 1 2 10 2
1 6
'
1
X X
=
=
151 1 1 1 60
16' 6 4 2 6 300
70 1 0 1 38
22
X y
= =
( ) 1
21 2 1
10 5 102 1 1
5 10 101 1 11
10 10 1
'
0
X X−
− − − − =
− −
1
3 2 13 2
10 5 10 51 1 1 1
5 10 5 107 3 3 2
10 5 1
( ' )
0 5
'X X X−
− − − − − −
=
L’estimateur OLS est donné par:
1
1
1 6 0 151 1 1 1 1 1 1 1
1 4 1 166 4 2 6 6 4 2 6
1 2 0 70 1 0 1 0 1 0 1
1 6 1 22
4 18 2
18 92 10
2 10 2
ˆ ( ' ) 'X X X yβ
−
−
= =
=
121 2 1 11
10 5 10 560 60 2,22 1 1 11
300 300 25 10 10 5
38 381 1 11 29
10 10 10 5
− − − = − − = = − −
,2
5, 8
5
Voici les détails de l’inversion de 'X X et du calcul du déterminant det( ' )X X
Rappel: La formule du déterminant par l’expansion de Laplace pour une ligne i ou une colonne j quelconque :
( )
1
det( ) ( 1)n
i jn n ij ij
j
A a m+
×=
= −∑
ijm est le Mineur d’ordre i et j qui correspond au déterminant du bloc restant (que l’on nommera ijM ) de la matrice
A si on enlève la ligne i et la colonne j .
( ) ( )cof(A) ( 1) ( 1) det( )i j i jij ij ijm M
+ += − = − correspond au cofacteur d’ordre i et j .
( ) ( )adj(A) ( 1) ( 1) det( )ji
i jij i j
ij m M+ += − = − correspond à l’élément d’ordre i et j de la matrice adjointe adj(A) ,
notez l’ordre ji du mineur qui est inversé en rouge.
Ex. avec une 2x2
det( ) | |a b
cA A ad bc
d= = = −
Ex. avec une 3x3
det( ) | |
a b c
A A d e f a e f b d f c d e
g h i h i g i g h
e f d f d ea b c aei bfg cdh ceg bdi afhh i g i g h
= = − +
= − + = + + − −
=
−
Par la règle de Sarrus pour une 3x3 (ne s’applique pas pour les matrices plus grandes)
11 12 13
21 22 23 11 22 33 12 23 31 13 21 32 31 22 13 32 23 11 33 21 12
31 32 33
det( ) .
a a a
A a a a a a a a a a a a a a a a a a a a a a
a a a
= = + + − − −
6
Pour la question 2a) 3 3
( ) ( )
1 13
(1 ) (1 1) (1 2) (1 3)1 1 11 11 12 12 13 13
13
(1 ) (1 1) (1 2)1 1 11 11 1
1
det( ' ) det( ) ( 1) det( ) ( 1)
( 1) det( ) ( 1) det( ) ( 1) det( ) ( 1) det( )
( 1) ( 1) ( 1)
i j i jij ij ij ij
j j
jj j
j
jj j
j
X X A a M a m
a M a M a M a M
a m a m a
+ +
= =
+ + + +
=
+ + +
=
= = − = −
= − = − + − + −
= − = − + −
∑ ∑
∑
∑ (1 3)2 12 13 13
(1 1) (1 2) (1 3)11 12 13
(1 1) (1 2) (1 3)
( 1)
92 10 18 10 18 92( 1) det ( 1) det ( 1) det
10 2 2 2 2 10
( 1) 4(92 2 10 10) ( 1) 18(18 2 10 2) ( 1) 2(18 10 92 2)
4 8
m a m
a a a
+
+ + +
+ + +
+ −
= − + − + − = − ⋅ − ⋅ + − ⋅ − ⋅ + − ⋅ − ⋅
= ⋅ 4 ( 1)18 16 2( 6)
336 288 2( 4) 40
+ − ⋅ + −
= − + − =
det( ' ) 40X X =
Rappel de la formule de l’inverse par la méthode de l’adjointe : ( ) ( )
1 1 1adj( ) (cof( ))'
det detA A A
A A
− = =
Pour la question 2a)
( ) ( ) ( )1 1 1
' adj( ' ) (cof( ' )) 'det ' det '
92 10 18 10 18 92
10 2 2 2 2 1084 16 4
18 2 4 2 4 181 116 4 4
10 2 2 2 2 1040 404 4 44
18 2 4 2 4 18
92 10 18 10 1
21 2
10
'
8 92
X X X X X XX X X X
−
− =
= =
− − − = − − − − = − −
−
1
5 102 1 1
5 10 101 1 11
10 10 10
− − − − −
Rappel de la règle de Cramer Solution d’un système d’équation 2x2
1 1 1 2
2 1 2 2
1 1 1
2 2 2
1 1
2 22 1
1
2
1
2
1 1
1 21
1 1 1 2 1 2 1 1 1 2 1 2
2 2 2
2 2 2
2
1 12
2 ,
c
c
c
c
a x b x
a x b x
a b x
a b x
b a
b ab b a ax
a b a b b a a b a b b
c c
c cc
a
a b a b
cx
c c
+ = + = =
− −= = = =
− −
7
Solution d’un système d’équation 3x3
1 1 1 2 1 3
2 1 2 2 2 3
3 1 3 2 3 3
11 1 1
2 2 2 2
3 3 3 3
1 1 1 1
2 2 2 2
3 3 3 3
1 2
1 1 1
1
2
3
1
1 1
2 2
2
3
1 1
2 2
3 3
2
3 3 3
,
a x b x c x
a x b x c x
a x b x c x
xa b c
a b c x
a b c x
b c a c
b c a c
b c a cx x
a b c a b
a b c
d
d
d
d
d
d
d d
d d
d d
a b c
+ + = + + = + + = =
= =
1 1
2 2
3 3
3
1 1 1 1
2 2 2 2 2 2
3 3 3
2
3
3
3 3
1
, .
a b
a b
a bx
c a b c
a b c a b c
a b c a
d
b
d
c
d
=
77
51 6 0 15,4842,2
1 4 1 16,852,2
1 2 0 335,8
51 6 1 21,2106
5
ˆˆ6,6
y Xβ
= =
= =
2
515 15.4 0.44
16 16.8 0.85ˆ
7 2 0.4
522 21.2 0.84
ˆ6.6
5
y yε
− − − − = − − = =
=
( )
0.4
0.8ˆ ˆ' 0.4 0.8 0.4 0.8 1.6
0.4
0.8
USS ε ε
− − = = − − =
2 1
84 16 4
25 25 2516 4 4
var25 25 254 4 44
25 25 25
3.36 0.64 0.16ˆ ˆ( ) ( ' ) 0.64 0.16 0.16
0.16 0.16 1.76
X Xβ σ −
− − − − − = − − − − −
= = avec 2 ˆ ˆ' 1.6ˆ 1.6
4 3n K
ε εσ = = =
− −
8
2
1
( ) 114n
ii
TSS y y=
= − =∑
2[2] [2] [2] [2]
1
ˆ ˆ( ) ' '
114 1.6 112.4
ˆn
iiXSS X M X
TSS
y
USS
y ιβ β=
= =
= − = − =
−∑
2 ˆ ˆ' 112.41 1 0.98596
114'
USS XSSR
TSS TSSy M yι
ε ε= − = − = = =
2 ˆ ˆ' / ( ) 1.6 / (4 3)1 1 0.95789
114 / (4 1)' / ( 1)
n KR
y M y nι
ε ε − −= − = − =
−−
Tests Si on veut effectuez des tests il faut déterminer la distribution que l’on va utiliser sous la nulle. Si l’on a pas la normalité des chocs, alors on aura 3 alternatives: 1- Dériver la distribution exacte des tests à échantillon fini (si on connait la vraie distribution des chocs ex. si la distribution des chocs est une distribution de Pareto exponentielle); c’est souvent possible de dériver la distribution exacte, mais relativement complexe. 2- Reconstruire une distribution empirique à partir des données via une simulation de Monte Carlo effectuée avec le modèle sous la nulle en estimant le modèle sous l’alternative et en reconstruisant la distribution empirique EDF (empirical distribution function) de la statistique de test (pour faire cela la statistique de test doit être pivotale). C’est l’approche Bootstrap qui requiert de faire des simulations numériques. 3- Utiliser les distributions asymptotiques des statistiques de test comme approximation de la bonne distribution, ici il faut noter que si l’on a peu de données l’approximation asymptotique risque d’être moins applicable et plus loin de la vraie distribution d’échantillon fini dans le cas particulier en question. Dans la pratique avec des données on a généralement pas de certitude concernant la normalité, alors on effectuera des tests de ‘’normalité’’ afin d’inférer quant à savoir si les aléas sont issus d’une distribution normale ou s’ils sont issus d’une distribution non-normale. Malheureusement nous n’avons pas les vrais chocs en général, alors nous utiliserons les résidus pour construire les tests de ‘’normalité’’. Le test de ‘’normalité’’ Jarque-Bera Le test de Jarque-Bera est en fait un test de l’asymétrie et de l’aplatissement d’une distribution en comparaison avec la nulle des valeurs (du skewness et du kurtosis) qui correspondent aux valeurs espérées d’une variable aléatoire tirée d’une loi normale. J’utilise l’expression ‘’normalité’’ entre guillemets car le test de Jarque-Bera n’est pas un test de normalité proprement dit, mais plutôt un test des moments 3 (skewness) et 4 (kurtosis) qui sont comme ceux de la loi normale sous la
nulle. C’est un test qui suit une distribution 2(2)χ asymptotiquement.
0 22 2 2
2 2 23 4 3 4
3 4 2 3 2 2
ˆ ˆ ˆ ˆ1 1 1ˆ ˆ = 3 = 3 (2)6 4 6 4 6 4ˆ ˆ ˆ ˆ( ) ( )
H
an n n
JB S Kµ µ µ µ
χσ σ σ σ
= + + − + − ∼
Comme dans notre exercice on a pas de certitude concernant la normalité ou non, puisque nous disposons que des données sans connaître la distribution exacte des chocs (qui fait partie du DGP), on va tenter d’inférer avec les résidus sur la nulle de normalité, le tout afin de nous enligner sur les distributions des statistiques de test à utiliser pour les tests sur les paramètres que l’on veut conduire subséquemment. Bref les tests de normalité vont nous éclairer sur les distributions des autres tests statistiques à utiliser.
9
Règle de décision du test de Jarque-Bera
-Si la statistique calculée JB est plus petite que la valeur critique 2( 2) 0.05 5.99J αχ = = = ou égale, telle
que 2(2) 0.05 5.99JB αχ =≤ = alors on ne rejette pas la nulle 0H de ‘’normalité’’ .
-Si la statistique calculé JB est plus grande que la valeur critique 2( 2) 0.05 5.99J αχ = = = , telle
que 2(2) 0.05 5.99JB αχ => = alors on rejette la nulle 0H de ‘’normalité’’ en faveur de l’alternative 1H d’une
distribution autre que normale. Décision
Pour ce test unilatéral à droite, comme la statistique calculée 2(2) 0.050.4482667 5.99JB αχ == ≤ = , alors on ne rejette
pas la nulle 0H à un niveau nominal de signification de 0.05α = . Utilisant la P-value on trouve une valeur de
0.7992 0.05Pvalue = > , ce qui mène évidemment à la même décision de non-rejet de la nulle. Ainsi le test JB de ‘’normalité’’ de Jarque-Bera donne une statistique de test JB qui indique un non-rejet de la ‘’normalité’’ des chocs, par contre on a très peu de données pour conclure sur les résultats du test, ce qui ajoute un doute face à la représentativité des résultats. Si on avait plus de données on aurait théoriquement sous la nulle plus de ‘’chance’’ d’être près d’une distribution
asymptotique 2( 2)Jχ = .
Ici comme on a pas rejeté la nulle, nous travaillerons comme si la normalité est présente, même si on a aucune certitude à cet effet; la seule information dont on dispose est que l’on a pas rejeté la nulle du test de Jacque-Bera sur une base d’une
distribution asymptotique 2( 2)Jχ = .
Par ailleurs, on sait que si l’on a la normalité des chocs et que l’on doit utiliser l’estimateur 2σ puisque l’on ne connait pas
le vrai 2σ , alors les statistiques de tests de Student à utiliser
0ˆˆ( ) ( )
ˆvar( )
H
k kk
k
t t n Kβ β
β
β
−= −∼ suiveront une loi de
Student...
Prenons ici le résultat du test de Jarque-Bera avec un grain de sel, car le manque de données avec 4n = risque de donner des résultats peu fiables selon la représentativité de notre échantillon de 4 observations. Par ailleurs, le test de Jarque-Bera
est en lui-même un test qui suit une distribution 2(2)χ seulement de manière asymptotique (en échantillon fini on utilise la
loi asymptotique comme approximation, dans la pratique on pourrait utiliser l’approche bootstrap pour effectuer le test JB si on a accès à un ordinateur afin de simuler la distribution empirique EDF sous la nulle) et le seul résultat que l’on a obtenu ici en effectuant le test est un non-rejet de ‘’normalité’’. Ce non-rejet de la nulle de ‘’normalité’’ n’est pas une confirmation de la normalité, ce n’est pas non plus une évidence en faveur de la normalité, un non-rejet est un manque d’évidences qui seraient défavorables à la nulle de ‘’normalité’’. Dans les faits, le vecteur ε que j’ai créé pour cet exercice vient de mon réseaux neuronal personnel qui est plus complexe qu’une distribution normale, ainsi dans les fait on a pas la normalité, mais l’analyste de données n’a pas cette information à sa disposition a priori.
En somme, comme on doit estimer 2σ par 2 ˆ ˆ' 1.6ˆ 1.6
4 3n K
ε εσ = = =
− −, si on a vraiment la normalité des chocs on aura
des tests de Student avec une distribution de Student exacte en échantillon fini.
10
Rappel sur la p-value:
La p-value (probabilité critique, valeur p, valeur de probabilité ou la signification asymptotique) est la probabilité, sous 0H ,
qu'une statistique de test soit au moins aussi éloignée de son espérance que la valeur observée. En d'autres termes, c'est la probabilité sous la nulle d'observer quelque chose d'au moins aussi surprenant que ce que l'on observe. Pour un test unilatéral à droite, la p-value correspond à la probabilité, pour un modèle statistique donné sous la nulle, que la statistique de test soit supérieur ou égale au résultat de la statistique de test calculée (observée).
Ainsi si une statistique de test X suit une fonction de distribution cumulée (fonction de répartition) ()F ⋅ telle que
()X F ⋅∼ , alors la pvalue pour un test à droite peut être définie comme ( ) ( )test à droitepvalue t P X t= ≥
Si on a la fonction de répartition (fonction de distribution cumulée) ( )XF t évaluée à t pour une variable aléatoire X
(statistique de test) suivante : ( ) ( )
t
X XF t f t dt
−∞
= ∫
Alors on peut définir les pvalues selon 3 cas :
-Test à droite : ( ) ( )ˆ( )
ˆ ˆ ˆ( ) ( ( )) ( ) 1 ( )
k
test à droite k k X X k
t
pvalue t P X t f t dt F t
β
β β β
+∞
= ≥ = ≈ −∫
-Test à gauche : ( ) ( )ˆ( )
ˆ ˆ ˆ( ) ( ( )) ( ) ( )kt
test à gauche k k X X kpvalue t P X t f t dt F t
β
β β β
−∞
= ≤ = =∫
-Test bilatéral avec une distribution symétrique :
( )ˆ ˆ( ) ( )
ˆ ˆ( ) ( )
ˆ ˆ ˆ( ) ( ( ) ) ( ( ) )
( ) ( ) 1 ( )
k k
k k
test àbilatéral symétrique k k k
t t
X X X
t t
pvalue t P X t P X t
f t dt f t dt f t dt
β β
β β
β β β
− +∞
−∞ −
= ≤ − + ≥
= + ≈ −∫ ∫ ∫
Comme règle de décision pour le test à droite : Si la pvalue (l’intégrale) donne une valeur plus grande que le niveau nominal de signification α (c’est que la statistique calculée est plus petite que la valeur critique pour un test à droite) et on ne rejette pas. Si la pvalue (l’intégrale) donne exactement le niveau nominal de signification α (c’est que la statistique calculée est exactement sur la valeur critique) et on ne rejette pas car on est conservateur. Si la pvalue (l’intégrale) donne une valeur plus petite que le niveau nominal de signification α , c’est que la statistique calculée est dans la zone de rejet et on rejette au niveau nominal de signification α . Ainsi on peut voir la p-value comme le niveau de signification maximal possible qui ferait que l’on ne rejette pas la nulle, et au delà de cette valeur on rejetterait. Ou alternativement on peut voir la p-value comme la valeur du niveau de signification maximal qu’il ne faut pas dépasser pour ne pas rejeter la nulle. Intuitivement pour un test unilatéral c'est l'intégrale de la fonction de distribution sous la nulle à partir de la valeur de la statistique calculée avec l’intégration faite dans le sens de la zone de rejet. Si la pvalue est plus petite que le niveau nominal de signification α , alors le résultat du test est déclaré « statistiquement significatif ». Dans le cas contraire, si la pvalue est supérieure ou égale au niveau nominal de signification α , on ne rejette pas l’hypothèse nulle et on ne peut rien conclure quant aux hypothèses formulées.
11
e0)
i) Pour le test de signification de la constante avec le premier paramètre 1( )α β≡ , on teste la nulle 0 1: 0H β = vs
l’alternative 1 1: 0H β ≠
Ici on utilise une statistique de test de Student car on a dû estimer 2σ
1
1
1
ˆ 0 2.2 2.2ˆ( ) 1.20019841.833030ˆ 3.36var( )
tβ
β
β
−= = = = Pvalue = 0.442232364770613 0.05>
Règle de décisions Pour ce test bilatéral, la valeur critique dans la table de Student est
0.05 /2 0.025 /2 0.025 /2 0.025( ) ( ) (4 3) (1) 12.706t n K t n K t tα α α α= = = =− ≡ − = − = = (notation modifiée)
-Si la statistique calculée 1ˆ( )t β est à dans l’intervalle (incluant les bornes) suivant :
/2 0.025 1 /2 0.025ˆ(1) 12.706 ( ) (1) 12.706t t tα αβ= =− = − ≤ ≤ = , alors on ne rejette pas la nulle 0H ce qui donne le
modèle sans la constante & 5002 3
S Pt t t tr r Dβ β ε= + + .
-Si la statistique calculée 1ˆ( )t β est à l’extérieur de l’intervalle ci-haut (incluant les bornes), telle que
1 /2 0.025ˆ( ) (1) 12.706t tαβ =< − = − ou 1 /2 0.025
ˆ( ) (1) 12.706t tαβ => = , on rejette la nulle 0H en faveur de
l’alternative 1H ce qui donne le modèle & 5001 2 3
S Pt tt tr r Dα β β ε= + + + .
Décision
Pour ce test bilatéral 1ˆ12.706 ( ) 1.2001984 12.706t β− ≤ = ≤ , donc on ne rejette pas la nulle 0H à un niveau
nominal de signification de 0.05α = (inférant dans le sens où la variable 1tx , soit la constante, n’est pas significative).
Ainsi on ne rejette pas la nullité de ce paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de données, le test serait fort probablement plus
précis car la variance estimée de 1β aura normalement tendance à diminuer.
Ici le manque d’information nous a conduit à faire une erreur de type 2 (non-rejet de la nulle lorsque la nulle est fausse car
on sait que le vrai 1 3β = , car c’est à partir de ce paramètre que l’on a construit les ty ).
Par ailleurs, on garde généralement la constante dans un tel modèle afin de maintenir la moyenne empirique des résidus à zéro et pour laisser plus de flexibilité au modèle afin que les autres coefficients puissent mieux évaluer les pentes (les relations entre les autres variables explicatives et la variable dépendante). La question i) étudie le scénario d’estimation de la régression sans constante.
N.B. : Notez que si on utilisait la distribution limite asymptotique normale 1ˆ( ) (0,1)
a
t Nβ ∼ , avec les valeurs critiques
1.96− et 1.96 alors on aurait aussi pas rejeté la nulle car 1ˆ1.96 ( ) 1.2001984 1.96t β− ≤ = ≤ .
Par ailleurs, on sais qu’utiliser un résultat asymptotique avec seulement n =4 données a sa part d’incertitude quand à son applicabilité. Ici on avait pas rejeté la normalité des chocs et l’on a décidé de travailler comme si on avait la normalité ou comme si on ne s’éloigne pas trop de la normalité en approximant la loi d’échantillon fini des tests par la loi de Student.
12
e0) ii) Pour le test de signification de la variable & 02
50St
Ptx r≡ dans la régression via le paramètre 2β , on teste la
nulle 0 2: 0H β = vs l’alternative 1 2: 0H β ≠ .
Encore une fois on utilise une statistique de test de Student car on a dû estimer 2σ
2
2
2
ˆ 0 2.2 2.2ˆ( ) 5.50.4ˆ 0.16var( )
tβ
β
β
−= = = = Pvalue = 0.1144982940974 0.05>
Règle de décisions Pour ce test bilatéral, la valeur critique dans la table de Student est
/2 0.025 /2 0.025 /2 0.025( ) (4 3) (1) 12.706t n K t tα α α= = =− = − = =
-Si la statistique calculée 2ˆ( )t β est à dans l’intervalle (incluant les bornes) suivant :
/2 0.025 2 /2 0.025ˆ(1) 12.706 ( ) (1) 12.706t t tα αβ= =− = − ≤ ≤ = , alors on ne rejette pas la nulle 0H ce qui donne
1 3t t tr Dα β ε= + + .
-Si la statistique calculée 2ˆ( )t β est à l’extérieur de l’intervalle ci-haut (incluant les bornes), telle que
2 /2 0.025ˆ( ) (1) 12.706t tαβ =< − = − ou 2 /2 0.025
ˆ( ) (1) 12.706t tαβ => = , on rejette la nulle 0H en faveur de
l’alternative 1H ce qui donne & 5001 2 3
S Pt tt tr r Dα β β ε= + + + .
Décision
Pour ce test bilatéral 2ˆ12.706 ( ) 5.5 12.706t β− ≤ = ≤ , donc on ne rejette pas la nulle 0H à un niveau nominal de
signification de 0.05α = (inférant dans le sens où la variable & 02
50St
Ptx r≡ n’est pas significative). Ainsi on ne rejette
pas la nullité de ce paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de données, le test serait fort probablement plus précis car
la variance estimée de 2β aura normalement tendance à diminuer. Ici le manque d’information nous a conduit à faire une
erreur de type 2 (non-rejet de la nulle lorsque la nulle est fausse car on sait que le vrai 2 2β = , car c’est à partir de ce
paramètre que l’on a construit les ty ).
Si on considère que l’on a pas de variables & 02
50St
Ptx r≡ dans le modèle, la seule chose qui est modélisée est l’intercepte
qui peut varié selon la phase du cycle économique. L’intercepte serait donc 1α en temps de récession et 1 3α β+ en
temps d’expansion.
Par ailleurs, on sait que le paramètre 2β correspond à la pente 2& 500
t
S Pt
Er
rβ
∂=
∂, soit l’effet d’une hausse de 1 en point de
% du rendement du marché de & 500S Ptr sur le rendement du titre en espérance tEr . C’est la ‘’vraie’’ pente de la ligne PFR
(population regression function) de tEr par rapport au rendement du marché de & 500S Ptr .
Par ailleurs, on sait que le paramètre estimé 2β correspond à la pente 2& 500
ˆ ˆt
S Pt
r
rβ
∂=
∂, soit l’effet d’une hausse de 1 en
point de % du rendement du marché de & 500S Ptr sur le rendement du titre tr prévu par le fit (de manière conditionnelle
aux divers ( )ix ) . C’est la pente estimée de la ligne de relation SRF (sample regression function) de tr par rapport au
rendement du marché de & 500S Ptr .
13
N.B. : Notez que si on utilisait la distribution limite asymptotique normale 1ˆ( ) (0,1)
a
t Nβ ∼ , avec les valeurs critiques
1.96− et 1.96 alors on aurait rejeté la nulle, mais utiliser un résultat asymptotique avec seulement n =4 données a sa part d’incertitude quand à son applicabilité. Ici on avait pas rejeté la normalité des chocs et l’on a décidé de travailler comme si on avait la normalité ou comme si on ne s’éloigne pas trop de la normalité en approximant la loi d’échantillon fini des tests par la loi de Student.
e0) iii) Pour le test de signification de la variable dichotomique 3 ttx D≡ dans la régression via le paramètre 3β , on
teste la nulle 0 3: 0H β = vs l’alternative 1 3: 0H β ≠ . Ce test correspond à un test de changement structurel au
niveau de l’intercepte, c’est-à-dire que l’on a sous l’alternative la possibilité d’avoir un effet alpha financier qui diffère selon que l’on soit en expansion économique ou en récession. Afin de tester cette hypothèse on tente de ‘’récolter’’ de l’information (via le test) qui pourrait aller à l’encontre de la nulle qui dit que alpha financier est constant dans le temps.
Encore une fois on utilise une statistique de test de Student car on a dû estimer 2σ .
3
3
2
ˆ 0 5.8 5.8ˆ( ) 4.37191451.3266499ˆ 1.76var( )
tβ
β
β
−= = = = Pvalue = 0.143153167176287 0.05>
Règle de décisions Pour ce test bilatéral, la valeur critique dans la table de Student est
/2 0.025 /2 0.025 /2 0.025( ) (4 3) (1) 12.706t n K t tα α α= = =− = − = =
-Si la statistique calculée 3ˆ( )t β est à dans l’intervalle (incluant les bornes) suivant :
/2 0.025 3 /2 0.025ˆ(1) 12.706 ( ) (1) 12.706t t tα αβ= =− = − ≤ ≤ = , alors on ne rejette pas la nulle 0H ce qui donne le
modèle SIM classique & 5001 2
S Pt ttr rα β ε= + + où l’on a pas de changement structurel au niveau du alpha financier.
-Si la statistique calculée 3ˆ( )t β est à l’extérieur de l’intervalle ci-haut (incluant les bornes), telle que
3 /2 0.025ˆ( ) (1) 12.706t tαβ =< − = − ou 3 /2 0.025
ˆ( ) (1) 12.706t tαβ => = , on rejette la nulle 0H en faveur de
l’alternative 1H ce qui donne & 5001 2 3
S Pt tt tr r Dα β β ε= + + + où l’on a un changement structurel au niveau du
alpha financier. Dans ce cas, l’intercepte (le alpha financier) change selon la phase du cycle économique. En récession
l’intercepte (le alpha financier) est 1α et en expansion l’intercepte (le alpha financier) est 1 3α β+ .
Décision
Pour ce test bilatéral 3ˆ12.706 ( ) 4.3719145 12.706t β− ≤ = ≤ , donc on ne rejette pas la nulle 0H à un niveau
nominal de signification de 0.05α = . Ainsi on ne rejette pas la nullité de ce paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de
données, le test serait fort probablement plus précis car la variance estimée de 3β aura normalement tendance à
diminuer. Ici le manque d’information nous a conduit à faire une erreur de type 2 (non-rejet de la nulle lorsque la nulle est
fausse car on sait que le vrai 3 6β = , car c’est à partir de ce paramètre que l’on a construit les ty ). Si on prend les
résultats du test statistique pour la vérité, on considère que le alpha financier est stable dans le temps, qu’il ne change pas selon les dates correspondantes aux phases du cycle économique. Il est à noter que ce qui est testé est la possibilité qu’aux
dates 1,3t = versus les dates 2,4t = on ait un intercepte différent, on pourrait rejeter la nulle pour une autre raison
que celle implicite dans la causalité du cycle économique ou même ‘’par hasard’’ en fonction des données observées.
N.B. : Notez que si on utilisait la distribution limite asymptotique normale ˆ( ) (0,1)a
kt Nβ ∼ , avec les valeurs critiques
1.96− et 1.96 alors on aurait rejeté la nulle, mais utiliser un résultat asymptotique avec seulement n =4 données a sa part d’incertitude quand à son applicabilité. Ici on avait pas rejeté la normalité des chocs et l’on a décidé de travailler comme si on avait la normalité ou comme si on ne s’éloigne pas trop de la normalité en approximant la loi d’échantillon fini des tests par la loi de Student.
14
e1) 10 : 0H α ≥ contre l’alternative 1 1: 0H α < (test unilatéral à gauche)
Encore une fois on utilise une statistique de test de Student car on a dû estimer 2σ
1
1
1
ˆ 0 2.2 2.2ˆ( ) 1.20019841.833030ˆ 3.36var( )
tβ
β
β
−= = = = Pvalue = 0.778883817614694 0.05>
Règle de décisions pour ce test à gauche
-Si la statistique calculée 1ˆ( )t β est à plus grande ou égale à la valeur critique : 0.05 1
ˆ(1) 6.314 ( )t tα β=− = − ≤ , alors on
ne rejette pas la nulle 0H ce qui donne & 5001 2 3
S Pt tt tr r Dα β β ε= + + + avec un 1 0α ≥ sous la nulle.
-Si la statistique calculée 2ˆ( )t β est à plus petite que la valeur critique , telle que 1 0.05
ˆ( ) (1) 6.314t tαβ =< − = − , alors on
rejette la nulle 0H en faveur de l’alternative 1H ce qui donne & 5001 2 3
S Pt tt tr r Dα β β ε= + + + avec un 1 0α <
sous la nulle. Décision
Pour ce test unilatéral 0.05 1ˆ(1) 6.314 ( ) 1.2001984t tα β=− = − ≤ = , donc on ne rejette pas la nulle à un niveau
nominal de 0.05α = . En termes financiers, la nulle implique que le ‘’alpha financier’’ est positif ou nul, alors que l’alternative impliquerait qu’il soit négatif. Ainsi on ne rejette pas la positivité (ou nullité) de ce paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de données, le test serait fort
probablement plus précis car la variance estimée de 1β aura normalement tendance à diminuer. Ici on ne fait pas d’erreur
car on sait que le vrai 1 3β = , car c’est à partir de ce paramètre que l’on a construit les ty ).
N.B. : Ici comme la valeur de la statistique de test est positive et que l’on teste à gauche, on a même pas besoin de regarder
dans une table de distribution pour pouvoir conclure, car avec 1ˆ( ) 0t β > on est certain de ne pas rejeter ce test à gauche
même si on avait un niveau de signification de 0,5 (50%).
Notez par ailleurs, que si on utilisait la distribution limite asymptotique normale ˆ( ) (0,1)a
kt Nβ ∼ , avec la valeur critique
1.645− cela n’aurait pas changé notre décision.
15
e2) 0 2: 1H β = correspondant au modèle suivant & 5001 31S P
t t ttr r Dα β ε= + + + contre l’alternative
21 : 1H β ≠ correspondant au modèle originel & 5001 2 3
S Pt tt tr r Dα β β ε= + + +
Encore une fois on utilise une statistique de test de Student car on a dû estimer 2σ
2
2
2
ˆ 1 1.2 1.2ˆ( ) 30.4ˆ 0.16var( )
tβ
β
β
−= = = = Pvalue = 0.204832764699134 0.05>
Règle de décisions
-Si la statistique calculée 2ˆ( )t β est à dans l’intervalle (incluant les bornes) suivant :
/2 0.025 2 /2 0.025ˆ(1) 12.706 ( ) (1) 12.706t t tα αβ= =− = − ≤ ≤ = , alors on ne rejette pas la nulle 0H ce qui donne
& 5001 31S P
t t ttr r Dα β ε= + + + avec 2 1β = .
-Si la statistique calculée 2ˆ( )t β est à l’extérieur de l’intervalle ci-haut (incluant les bornes), telle que
2 /2 0.025ˆ( ) (1) 12.706t tαβ =< − = − ou 2 /2 0.025
ˆ( ) (1) 12.706t tαβ => = , on rejette la nulle 0H en faveur de
l’alternative 1H ce qui donne & 5001 2 3
S Pt tt tr r Dα β β ε= + + + avec 2 1β ≠ .
Décision
Pour ce test bilatéral 2ˆ12.706 ( ) 3 12.706t β− ≤ = ≤ , donc on ne rejette pas la nulle 0H à un niveau nominal de
signification de 0.05α = (inférant dans le sens où 2 1β = ). Ainsi on ne rejette pas la nulle de l’unité ( 2 1β = ) de ce
paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de données, le test serait fort probablement plus précis car la variance estimée de
2β aura normalement tendance à diminuer. Ici le manque d’information nous a conduit à faire une erreur de type 2 (non-
rejet de la nulle lorsque la nulle est fausse car on sait que le vrai 2 2β = , car c’est à partir de ce paramètre que l’on a
construit les ty ).
Par ailleurs, on sait que le vrai paramètre 2β correspond à la pente 2& 5002t
S Pt
Er
rβ
∂= =
∂, soit l’effet d’une hausse de 1
en point de % du rendement du marché de & 500S Ptr sur le rendement du titre en espérance tEr . C’est la ‘’vraie’’ pente de
la ligne PFR (population regression function) de tEr par rapport au rendement du marché de & 500S Ptr .
Par ailleurs, on sait que le paramètre estimé 2β correspond à la pente estimée 2& 500
ˆ ˆ 2.2t
S Pt
r
rβ
∂= =
∂, soit l’effet d’une
hausse de 1 en point de % du rendement du marché de & 500S Ptr sur le rendement du titre tr prévu par le fit (de manière
conditionnelle aux divers ( )ix ) . C’est la pente estimée de la ligne de relation SRF (sample regression function) de tr par
rapport au rendement du marché de & 500S Ptr .
Ici comme la variance de 2β est relativement forte, le test ne démontre pas beaucoup de puissance et dans la pratique on
arrive pas à rejeter la nulle (et on fait une erreur de type 2). Avec plus de données, cela tendrait à augmenter la puissance du test et à conduire plus fréquemment au rejet de la nulle.
Si on a pas rejeté la nulle ici, c’est que le test ne nous a pas donné d’évidences assez fortes allant à l’encontre d’un 2 1β = ,
en ce sens on a pas rejeté l’hypothèse d’avoir un effet 2& 5001t
S Pt
Er
rβ
∂= =
∂, soit qu’une hausse de 1 en point de % du
16
rendement du marché de & 500S Ptr aurait en moyenne un effet de 1 en point de pourcentage sur le rendement du titre en
espérance tEr . Bref, ici on aurait un effet un pour un sur tEr pour une hausse de & 500S Ptr si la nulle était vraie.
N.B. : Notez que si on utilisait la distribution limite asymptotique normale 2ˆ( ) (0,1)
a
t Nβ ∼ , avec les valeurs critiques
1.96− et 1.96 alors on aurait rejeté la nulle car 2 /2 0.025ˆ( ) 3 1.96t Zαβ == > = , mais utiliser un résultat
asymptotique avec seulement n =4 données a sa part d’incertitude quand à son applicabilité. Ici on avait pas rejeté la normalité des chocs et l’on a décidé de travailler comme si on avait la normalité ou comme si on ne s’éloigne pas trop de la normalité en approximant la loi d’échantillon fini des tests par la loi de Student. Cette différence de conclusion potentielle, met bien en lumière le problème du choix de la loi de la statistique de test appropriée à utiliser, bref il faut bien comprendre les enjeux.
e3) Test ANOVA : 0 2: 0H β = et 3 0β = contre l’alternative 21 : 0H β ≠ et/ou 3 0β ≠
C’est le test de signification de la régréssion, où l’on teste de manière jointe la nullité de tous les paramètres sauf la constante.
( / ( 1))
( / ( )35.125
)
XSS KF
USS n K
−= =
−
Pvalue = 0.118469775551819 0.05>
De manière alternative on aurait la même statistique de test la formule générale qui utilise 0 : 0H Rβ = vs
1 : 0H Rβ ≠ avec 0 1 0
0 0 1R
=
qui donne
12
23
3
0 1 0 0
0 0 1 0R r
ββ
β ββ
β
= = =
=
( ) ( )( ) ( )( )
( )
11
2
11 1
10 105.8 / 21 11 5.8
10 101.6
11 15.8 / 2
1 1 5.835.125
1.6
2.22.2
ˆ ˆ' ' ' /=
ˆ
2.22.2
56.2
1.6
R r R X X R R r J
F
β β
σ
−−
− − −
=
= =
− −=
Règle de décisions
-Si la statistique calculée F est plus petite que la valeur critique 0.05(2, 4 3)Fα= − ou égale, telle
que
21
0.05 0.05( , ) (2,4 3) 199.50vv
F F J n K Fα α= =≤ − = − = alors on ne rejette pas la nulle 0H .
-Si la statistique calculé F est plus grande que la valeur critique 0.05(2, 4 3)Fα= − , telle
que
21
0.05 0.05( , ) (2,4 3) 199.50vv
F F J n K Fα α= => − = − = alors on rejette la nulle 0H en faveur de l’alternative 1H .
Décision Pour ce test unilatéral, comme la statistique
calculée
21
0.05 0.0535.125 199.50 ( , ) (2, 4 3)vv
F F J n K Fα α= == ≤ = − = − , alors on ne rejette pas la nulle 0H à un
niveau nominal de signification de 0.05α =
Car on a peu de données la variance des β est importante, ce qui explique probablement une statistique de test
17
21
( , )vv
F F J n Kα< − et le non-rejet de la nulle à 10% de signification, mais à 12% on rejetterait la nulle.
Ici comme les variances des 2β et 3β sont relativement forte, ainsi le test ne démontre pas beaucoup de puissance et dans
la pratique on arrive pas à rejeter la nulle (et on fait une erreur de type 2). Avec plus de données, cela tendrait à augmenter la puissance du test et à conduire plus fréquemment au rejet de la nulle.
f) on a 1
ˆ ˆ' 1 0n
ii
ι ε ε=
= =∑ , 2 21
ˆ ˆ' 0n
i ii
x xε ε=
= =∑ et 3 31
ˆ ˆ' 0n
i ii
x xε ε=
= =∑ car 3 1ˆ' 0X ε ×=
Estimez la constante séparément 1β et 2
3
ˆ
ˆ
β
β
en bloc via les équations de FWL.
Avec [2] 2 3X x x = on a :
( ) ( )1 12[2] [2] [2] [2] [2] [2] 1 1
3
1 1
2 2 2 22 3 2 3 1 1
3 3 3 3
ˆˆ' ' ' '
ˆ
' ' ' 'ˆ
' ' ' '
6
6 4 2 6
0 1 0 1
X X X y X X X x
x x x xx x y x x x
x x x x
ββ
β
β
− −
− −
= −
= −
=
1 10 6 0
4 1 6 4 2 6 6 4 2 6 4 1 6 4 2 6
2 0 0 1 0 1 0 1 0 1 2 0 0 1 0 1
6 1
15
6
1
7
1
6
22
− −
−
1
1 2.22.2
1 5.8
1
2.61904761904762 0.190476190476191 2.61904761904762 0.419047619047622.2
5.90476190476191 0.0476190476190478 5.90476190476191 0.104
=
= − = − 761904761905
ou
( ) 12[2] [2] [2]
3
151 1 1 1
165 10 5 107 3 3
ˆ 2.2' '
ˆ 5.82 7
10 5 10 5 22
X M X X M yι ι
β
β
−
− −
− −
= = =
Pour la constante avec l’équation des projections on a:
( ) ( ) ( ) ( )1 1 1 1 21 [2] [2] [2]
3
22 3
3
ˆˆ ˆ' ' ' ' ' ' ' '
ˆ
ˆ 2.215 4.5 0.5 2.2
ˆ 5.8
y X y X
y x x
ββ ι ι ι ι ι ι β ι ι ι ι ι ι
β
β
β
− − − − = − = −
= − = − =
Pour la constante avec l’équation de FWL on a:
[2 ] [2]
1
1
15
163 2 13 22.2
710 5 10
22
' '5
ˆX X
M M yβ ι ι ι−
− − =
= =
18
On peut aussi regarder le paramètre 3β associé à la variable dichotomique :
( ) ( )1
3 3 3 3 3
1 13 3 2
2
1
ˆˆ ' ' ' '
ˆ
0 0
1 10 1 0 1 0 1 0 1 0 1 0 1
0 0
1
15
6
2 1
1
7
2
x x x x xy xxβ
β ιβ
− −
−
= −
= −
11 6
1 4 2.20 1 0 1
1 2 2.2
1 6
2.21 116 22 2 10 5.8
2.22 2
−
= + − =
On peut aussi trouvé l’estimateur OLS 1
2
ˆ
ˆ
β
β
estimé en un bloc avec 2xι
2
1 1
12 3 3
2 22
22
' ' ' 'ˆ
' ' ' '
ˆ
ˆ
1 6
6
1 1 1 1
6 4
4
2 6
1
1 2
1
y xx
xx x
xx
ι ι ι ιβι ι β
β
− −
−
=
=
1 115
1 1 1 1 16 1 1 1 1 1
62 6 2
4 1 1 1
6 4 7 6
1 6 0
1 1 2.25.8
1 2 0 2.
1
6 2
2
2
6
6
1
4 4
2
− − =
−
Errata corrigé en rouge
Évidemment on obtient toujours les mêmes valeurs numériques, c’est le premier résultat du théorème de FWL.
19
g) Modèle SIM avec 2 variables (variable dichotomique 3x omise)
1
2
1 6ˆ1 4
ˆˆ1
15
1
2
1 6
6
7
22
βε
β
= +
( ' 4e 4d t )X X =
1
1 1
2
1 6ˆ 1 4
ˆ 1
154 5 14 4
1 1 1 1 1 1 1 1 1611 11 11 1
6 4 6 4 7 3 1 5 3
22 22 22 2
( ' ) 'ˆ
2
1 2
1 6
2 6 2
22
6X X X y
ββ
β
−
−
− − =
− −
= = =
1( ' ) '
1
1
15
16
7
22
23 9 304 18 60 60
11 22 1118 92 300 9 1 300 30
2
'
2 11 1
'
1
( )
X X X
X X X y
−
−
=
−
− = = = −
=
1
2
3
2.7273
2.7273
ˆ2.2ˆ ˆ2.2 de l'estimation du bon modèle avec les 3 variables
ˆ5,8
vs
β
β β
β
≈ = =
2
19.0909
13.6364ˆˆ
8.1818
19.0909
-4.0909
2.3636ˆ
-1.1818
2.9091
ˆ ˆ' 32.1818 Le fit est moins bon
ˆ 16.0909
33.6446 -6.5826ˆ( )
-6.5826 1.4628var
y Xβ
ε
ε ε
σ
β
= =
= =
= =
2
2
0.7177
0.5766
R
R
=
=
20
h) Avec une variable superflue & 5004
S Pt t tx D r= ⋅
11
22
33
4
1 6 0 0
1 4 1 4
1 2 0 0
1 6 1 6
ˆ 3 ˆ2.2ˆ 2ˆ ˆ2.2
ˆ 1ˆ5, 8
ˆ 1
X
vs
ββ
ββ β
ββ
β
= = = =
2
2
2
15
16
7
22
0
0
ˆ de l'estimation du bon modèle
ˆ
1 fit parfait par construction car 4 4
non-calcul
ˆ0
0
ˆ ˆ' 0
?
ˆ ˆvar( ) ? (
able car 4 4
ML
y
X
y
R n K
R n K
ε
ε ε
β σ
β
= =
=
=
= =
= = = =
=
=
= = =
1 10' ) ( ' )
4X X X− −=
Ici le fit est parfait, il n’y a pas de variance estimée car ˆ ˆ' 0ε ε = .
21
i) Modèle Sans constante avec seulement 2 3x x
1
1
2 2 22 3
3 3 3
6 0ˆ ' ' 6 4 2 6 4 1 6 4 2 6
ˆ 0 1 0 1 2 0 0 1 0 1' '
15
16
7
226 1
x xx x y
x x
β
β
−
− = =
2.61904761904762
5.90476190476191
=
1
2 2tan
3 3
ˆ2.2ˆ ˆ ˆ 2.6190 2.2 de l'estimation du bon modèleˆˆ ˆ 5.9048 5,8
-0.7143
-0.3810ˆ
1.7619
0.3810
sanscons te
vs
β
β β ββ
β β
ε
= = = =
=
ˆ' 0.2619
4
ι ε=
2 1.2414 1R = > Les deux 2R sont incohérents car il n’y a plus de constante dans le modèle. 2 0.9486R =
j) Multicolinéarité - les 7 premiers vecteurs β avec 0.1, 0.2, ..., 0.7vγ =
1
2
3
0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7
ˆ -5.2277 -5.2277 -5.2277 -5.2277 -5.2277 -5.2277 -5.2277ˆ .......... 74.3134 39.4176 27.7857 21.9698 18.4802 16.1538 14.4921
ˆ -
vγ
β
β
β
=
69.7915 -34.8958 -23.2638 -17.4479 -13.9583 -11.6319 -9.9702
Le dernier estimé avec 100vγ =
1005.2277
ˆ 4.5917
0.0698
vγβ =
− = −
N.B. : Ici on va aussi rappeler que la variable dichotomique a été enlevée, ce qui implique un biais de l’estimateur OLS. k) Modèle CAPM
1
2
ˆ 4.5000ˆ
ˆ 3.5000
ββ
β
= =
1 2.5000 -0.7500
( ' ) -0.7500 0.2500
X X − =
81.2500 -24.3750ˆvar( )
-24.3750 8.1250β
=
22
L) Estimation du modèle SIM à deux variables en déviations à la moyenne
12 2 2 2
1 2 2
ˆ ( ' ) ' 2.7273
ˆ ˆ =2.7273
x x x y
y x
β
β β
−= =
= −
m) GLS avec la matrice 2
4 0 0 0
0 9 0 0
0 0 4 0
0 0 0 9
σ
Σ = Ω =
.
1
1 1
1
2
3
4 0 0 0 4 0 0 0 ˆ2.6 2.20 9 0 0 0 9 0 0
ˆ ˆ ˆ' ' 2.1 2.2 de l'e0 0 4 0 0 0 4 0
ˆ5.9 5,80 0 0 9 0 0 0 9
GLS X X X y vs
β
β β β
β
−− − = = = =
stimation OLS
Etc… Les autres résultats numériques sont ici: http://www.solo.uqam.ca/eco8600/notes/AAAexo/exo8600_exo2Bq2_solPrintout.pdf La fonction matlab olsmat.m : http://www.solo.uqam.ca/eco8600/notes/AAAexo/olsmat.m Le script matlab est ici : Script *.m http://www.solo.uqam.ca/eco8600/notes/AAAexo/exo8600_exo2Bq2_solCode.m Script Live *.mlx http://www.solo.uqam.ca/eco8600/notes/AAAexo/exo8600_exo2Bq2_solCode.mlx