analyse de la variance à deux facteurs -...
TRANSCRIPT
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Analyse de la variance à deux facteurs
Myriam Maumy-Bertrand1
1IRMA, Université Louis PasteurStrasbourg, France
Master 1 Psychologie du développement06-10-2008
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
ContexteNous nous proposons d’analyser l’influence du temps et detrois espèces ligneuses d’arbre sur la décomposition de lamasse d’une litière constituée de feuilles de Lierre.Pour ce faire, 24 sachets d’une masse identique de feuilles delierre ont été constitués, sachets permettant une décompositionnaturelle. Puis une première série de 8 sachets, choisis auhasard, a été déposée sous un chêne, une deuxième sous unpeuplier, et la dernière série sous un frêne.Après 2, 7, 10 et 16 semaines respectivement, deux sachetssont prélevés au hasard sous chaque arbre et la masserésiduelle est déterminée pour chacun d’eux. Cette masse estexprimée en pourcentage de la masse initiale.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Les donnéesLes valeurs observées sont données dans le tableau suivant :
Semaine Chêne Peuplier Frêne2 85,10 85,20 84,30
87,60 84,90 85,757 75,90 73,00 72,80
72,85 75,70 70,8010 71,60 74,15 67,10
66,95 71,85 64,9516 62,10 67,25 58,75
64,30 60,25 59,00
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Les écrituresNous pouvons écrire ce tableau sous forme standard, qui estcelle utilisée dans la plupart des logiciels et en particulier avecle logiciel R, c’est-à-dire avec trois colonnes, une pour lasemaine, une pour l’espèce et une pour la masse, et 24 lignes,une pour chaque sachet.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Les données
Sachet Semaine Arbre Masse1 2 Chêne 85,102 2 Chêne 87,603 2 Peuplier 85,204 2 Peuplier 84,905 2 Frêne 84,306 2 Frêne 85,757 7 Chêne 75,908 7 Chêne 72,85
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Les données
Sachet Semaine Arbre Masse9 7 Peuplier 73,00
10 7 Peuplier 75,7011 7 Frêne 72,8012 7 Frêne 70,8013 10 Chêne 71,6014 10 Chêne 66,9515 10 Peuplier 74,1516 10 Peuplier 71,85
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Les données
Sachet Semaine Arbre Masse17 10 Frêne 67,1018 10 Frêne 64,9519 16 Chêne 62,1020 16 Chêne 64,3021 16 Peuplier 67,2522 16 Peuplier 60,2523 16 Frêne 58,7524 16 Frêne 59,00
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le butNous nous proposons d’utiliser l’analyse de la variance à deuxfacteurs. Nous observons trois variables :
1 deux d’entre elles sont des variables contrôlées, l’arbre,qualitative à trois modalités, et la semaine qui peut êtreconsidérée comme qualitative à quatre modalités.
2 La troisième variable est une réponse quantitative.Donc l’analyse de la variance à deux facteurs (semaine etespèce d’arbre) croisés, avec interaction, peut convenir, entreautres méthodes d’analyse de ces données.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Le contexteDans l’étude des effets simultanés d’un facteur à I modalités etd’un facteur à J modalités sur une variable quantitative Y ,supposons que Y suive des lois normales, a priori différentesdans les IJ populations disjointes déterminées par laconjonction de deux modalités des facteurs étudiés.Supposons que, dans la population correspondant à lamodalité d’ordre i du premier facteur et à la modalité d’ordre jdu deuxième facteur, nous ayons :
L(Yijk ) = N (µij ;σ2),
pour tout i = 1, . . . , I, j = 1, . . . , J et k = 1 . . . ,K .
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
L’idéePour mettre en évidence les éventuelles différences entre lecomportement de la variable Y dans les I modalités du premierfacteur, dans les J modalités du deuxième facteur, ou encoredans l’interaction entre les deux facteurs, nous considérons deséchantillons indépendants de même taille K de la variable Ydans chacune des IJ populations , soit au total un n-échantillonavec n = I × J × K .
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Le modèle statistique
Pour la variable d’ordre k de la population d’indice (i , j), notéeYijk , nous posons :
Yijk = µ+ αi + βj + (αβ)ij + Eijk ,
pour tout i = 1, . . . , I, j = 1, . . . , J et k = 1, . . . ,K , avec, pouréviter une surparamétrisation, les contraintes
I∑i=1
αi =J∑
j=1
βj =I∑
i=1
(αβ)ij0 =J∑
j=1
(αβ)i0j = 0,
pour i0 = 1, . . . , I et j0 = 1, . . . , J.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Les trois hypothèses du modèleLes variables erreurs Eijk sont supposées indépendantes etsuivre une loi normale N (0;σ2).Leurs réalisations, notées eijk , sont considérées comme leserreurs de mesure, elles sont inconnues et vérifient :
yijk = µij + eijk , pour i = 1, . . . , I, j = 1, . . . , J, k = 1, . . . ,K .
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Les trois testsL’analyse de la variance à deux facteurs avec répétitionspermet trois tests de Fisher.
Le premier testNous testons :
l’effet du premier facteur Fα : Nous testons l’égalité des Iparamètres αi correspondant aux I modalités du premierfacteur
(H0) : les I paramètres αi sont tous nulscontre(H1) : les I paramètres αi ne sont pas tous nuls.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Le deuxième testNous testons :
l’effet du deuxième facteur Fβ. Il consiste à tester l’égalitédes J paramètres βj correspondant aux J modalités dudeuxième facteur
(H0) : les J paramètres βj sont tous nulscontre(H1) : les J paramètres βj ne sont pas tous nuls.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Le troisième testNous testons :
l’effet de l’interaction entre les deux facteurs Fα et Fβ. Ilconsiste à comparer
(H0) : les IJ paramètres (αβ)ij sont tous nulscontre(H1) : les IJ paramètres (αβ)ij ne sont pas tous nuls.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
NotationsNous posons
Y =1n
∑i,j,k
Yijk ,
Y ij• =1K
∑k
Yijk , Y i•• =1
JK
∑j,k
Yijk , Y •j• =1IK
∑i,k
Yijk .
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Notations
SCT =∑i,j,k
(Yijk − Y )2, SCR =∑i,j,k
(Yijk − Y ij•)2,
SCα =∑i,j,k
(Y i•• − Y )2, SCβ =∑i,j,k
(Y •j• − Y )2,
SCαβ =∑i,j,k
(Y ij• − Y i•• − Y •j• + Y )2.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
L’équation de l’anovaL’équation de l’analyse de la variance devient pour ce modèle :
SCTot = SCR + SCα + SCβ + SCαβ.
oùla somme SCTot , la somme totale, mesure la somme descarrés des écarts à la moyenne globale, toutes causesconfondues,
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
L’équation de l’anova - Suite
la somme SCR, la somme résiduelle, cumule les carrésdes écarts des différentes observations à la moyenne del’échantillon dont elles font partie. Dans la somme totaleelle représente la part de la dispersion due auxfluctuations individuelles.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
L’équation de l’anova - Suitela somme SCα, la somme due au premier facteur, ousomme entre modalités du facteur Fα, mesure l’effet dupremier facteur.la somme SCβ, ou somme due au deuxième facteur, ousomme entre modalités du facteur Fβ, mesure l’effet dudeuxième facteur.la somme SCαβ mesure l’effet de l’interaction entre lesdeux facteurs.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
PropriétéSous les différentes hypothèses nulles (H0) d’égalité desparamètres de la décomposition des µij , nous pouvons préciserles lois respectives des variables précédentes. Elles suiventdes lois du χ2 :
LH0
(1σ2 SCTot
)= χ2
n−1, LH0
(1σ2 SCR
)= χ2
n−IJ ,
LH0
(1σ2 SCα
)= χ2
I−1, LH0
(1σ2 SCβ
)= χ2
J−1,
LH0
(1σ2 SCαβ
)= χ2
(I−1)(J−1).
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Suite de la propriétéDe plus, les variables SCR et SCα, SCR et SCβ, SCR et SCαβ
sont indépendantes, de sorte que :
LH0
SCα
I − 1SCR
IJ(K − 1)
= F(I−1),IJ(K−1),
LH0
SCβ
J − 1SCR
IJ(K − 1)
= F(J−1),IJ(K−1),
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Fin de la propriété
LH0
SCαβ
(I − 1)(J − 1)
SCR
IJ(K − 1)
= F(I−1)(J−1),IJ(K−1).
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Les testsLes tests sont réalisés à l’aide des valeurs numériquessuivantes :
y =1
IJK
∑i,j,k
yijk , y ij• =1K
∑k
yijk ,
y i•• =1
JK
∑j,k
yijk , y•j• =1IK
∑i,k
yijk .
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Les tests - Suite
SCTot =∑i,j,k
(yijk − y)2 =
I∑i=1
J∑j=1
K∑k=1
y2ijk
− IJK y2,
SCR =∑i,j,k
(yijk − y ij•)2 =
I∑i=1
J∑j=1
K∑k=1
y2ijk
− KI∑
i=1
J∑j=1
y2ij•,
SCα =∑i,j,k
(y i•• − y)2 = JKI∑
i=1
y2i•• − IJK y2,
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Les tests - Fin
SCβ =∑i,j,k
(y•j• − y)2 = IKJ∑
j=1
y2•j• − IJK y2,
SCαβ =∑i,j,k
(y ij• − y i•• − y•j• + y)2
= KI∑
i=1
J∑j=1
y2ij• − JK
I∑i=1
y2i•• − IK
J∑j=1
y2•j• + IJK y2.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
DécisionPour un seuil α(= 5% = 0,05 en général), les tables de la loi deFisher notée F nous fournissent pour chacun des trois testsune valeur critique c telle que PH0(F < c) = 1− α. Alors nousdécidons : {
si Fobs < c (H0) est vraie ,si c 6 Fobs (H1) est vraie.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Les résultats des calculs sont généralement présentés sous laforme d’un tableau.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Tableau de l’ANOVA
Variation SC ddl s2 Fobs Fc
Due au facteur α SCα I − 1 s2α
s2α
s2R
c
Due au facteur β SCβ J − 1 s2β
s2β
s2R
c
Interaction SCαβ (I − 1)(J − 1) s2αβ
s2αβ
s2R
c
Résiduelle SCR IJ(K − 1) s2R
Totale SCTot n − 1
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
ExemplePour l’exemple précédent, en utilisant R, le tableau de l’analysede la variance s’écrit :
Sum Sq Df F PSemaine 1741.31 3 121.6927 3.004e − 09Arbre 58.08 2 6.0881 0.01495Interaction 30.22 6 1.0559 0.43853Résiduelle 57.24 12Totale 1886.84 23
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
ConclusionSupposons provisoirement que les conditions du modèled’anova à 2 facteurs avec répétitions soient vérifiées, nouspouvons
1 décider d’accepter H1. Il y a effet du premier facteur.2 décider d’accepter H1. Il y a effet du deuxième facteur.3 décider d’accepter H0. Il n’y a pas d’effet de l’interaction
entre les deux facteurs.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
RemarqueS’il y avait eu un effet de l’interaction alors pour préciser le typed’interaction mis en évidence par le test, nous pourrionscomparer les moyennes y ij• pour les différentes valeurs de i etj .Graphiquement, nous porterons en abscisse les valeurs de i(les I modalités). Pour chaque valeur de j nous relierons lesvaleurs de y ij• portées en ordonnées. L’aspect du faisceau deslignes brisées, variant ou non dans le même sens,s’interprétera facilement.À titre d’exemple, nous allons donner ces graphiques bien qu’iln’y ait pas d’effet d’interaction.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Graphique des interactions
FIG.: Représentation graphique des interactions
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance
Graphique des interactions
FIG.: Représentation graphique des interactions
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Vérification des conditionsPour ce modèle, l’estimation des moyennes théoriques µij sefait par les moyennes observées y ij• (« valeurs ajustées »). Lesrésidus sont alors donnés par l’expression :
eijk = yijk − y ij•, i = 1, . . . , I; j = 1, . . . , J; k = 1, . . . ,K .
Leur normalité et l’homogénéité des variances se vérifient parles mêmes méthodes que pour une analyse de la variance à unfacteur.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Vérification des conditions sur l’exempleCommençons par tester la normalité des résidus.> shapiro.test(residus)Shapiro-Wilk normality testdata : residusW = 0.9763, p-value = 0.8187« L’hypothèse de normalité des résidus est acceptée(p-value=0.8187) ».
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Vérification des conditions sur l’exemple - Suite et finNous allons maintenant chercher à tester l’homogénéitédes variances.Malheureusement, dans le cas qui nous intéresse, nous nepouvons pas tester l’homogénéité des populations parcequ’il n’y a que deux observations pour chacune d’elles et lapuissance d’un tel test serait très faible. Nous verrons dansle dernier paragraphe, comment nous pouvons parer à cetinconvénient. La solution que nous proposerons n’est pasaussi performante que si nous testions l’homogénéité maiselle sera un bon indicateur pour savoir si cette conditionest vérifiée.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Comparaisons multiplesLorsque l’effet d’un facteur a été mis en évidence, le test deTukey ou celui de Dunnett s’applique chaque fois que le nombred’observations le permet, à l’aide de la même statistique. Leseffectifs ni et ni ′ sont alors ceux des classes comparées.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Comparaisons multiples sur l’exempleNous allons réaliser les comparaisons multiples pour le facteur« Semaine » avec R.Semainediff lwr upr p adj7-2 -11.966667 -15.71019 -8.2231474 0.000003310-2 -16.041667 -19.78519 -12.29814740.000000116-2 -23.533333 -27.27685 -19.78981410.000000010-7 -4.075000 -7.81852 -0.3314808 0.031662316-7 -11.566667 -15.31019 -7.8231474 0.000004716-10 -7.491667 -11.23519 -3.7481474 0.0003427
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Comparaisons multiples sur l’exempleFacteur 1 : Semaine. Nous obtenons les classes d’égalitésuivantes :
Modalités Moyennes Classesdu facteur observées d’égalitéS2 85.47500 AS7 73.50833 BS10 69.43333 CS16 61.94167 D
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Comparaisons multiples sur l’exempleNous allons réaliser les comparaisons multiples pour le facteur« Arbre » avec R.Arbrediff lwr upr p adj2-1 0.73750 -2.175756 3.65075565 0.78184823-1 -2.86875 -5.782006 0.04450565 0.05370773-2 -3.60625 -6.519506 -0.69299435 0.0161088
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
ExempleFacteur 2 : Arbre. Nous obtenons les classes d’égalitésuivantes :
Modalités Moyennes Classesdu facteur observées d’égalitéChêne 73.30000 APeuplier 74.03750 BFrêne 70.43125 C
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
L’idée générale
Dans le cas où nous étudions l’effet simultané de deux facteursà, respectivement, I et J modalités et que nous disposonsd’une seule observation pour chaque population, c’est à direK = 1, les résultats du paragraphe précédent ne sont plusvalables. Nous devons supposer que l’interaction entre lesdeux facteurs est nulle. Partant du même modèle, nousécrivons plus simplement :
Yij = µ+ αi + βj + Eij
avec les contraintesI∑
i=1
αi =J∑
j=1
βj = 0.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
NotationsNous avons les notations analogues :
y =1IJ
∑i,j
yij , y i• =1J
∑j
yij , y•j =1I
∑i
yij ,
SCTot =∑i,j
(yij − y)2 =∑i,j
y2ij − IJy2,
SCR =∑i,j
(yij − y i• − y•j + y)2,
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Notations
SCα =∑i,j
(y i• − y)2 = J∑
i
y2i• − IJy2,
SCβ =∑i,j
(y•j − y)2 = I∑
j
y2•j − IJy2.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Remarque importanteRemarquons que l’expression définissant, dans le cas avecrépétitions, la somme des carrés associée à l’interaction, estassociée ici à la somme des carrés de la résiduelle.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Tableau de l’ANOVANous avons alors le tableau de l’analyse de la variance suivant :
Variation SC ddl Fobs Fc
Due au facteur α SCα I − 1s2α
s2R
c
Due au facteur β SCβ J − 1s2β
s2R
c
Résiduelle SCR (I − 1)(J − 1)
Totale scT IJ − 1
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
L’idée générale
La démarche est alors analogue à celle de l’analyse de lavariance à deux facteurs avec répétitions. Notons que dans cecas les valeurs ajustées sont données par
µij = y i• + y•j − y
et les résidus par l’expression :
eij = yij − y i• − y•j + y , i = 1, . . . , I; j = 1, . . . , J.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
ExempleL’influence d’un traitement grossissant, à base de vitamines, estétudiée sur des animaux de races différentes. Pour cela nousdisposons d’animaux de trois races, notées Ri , pour i = 1,2,3,et nous avons effectué trois traitements, notés Dj , pourj = 1,2,3, utilisant respectivement 5,10 et 15µg de vitaminesB12 par cm3. Le gain moyen de poids par jour est mesuré, àl’issue d’un traitement de 50 jours dans chaque cas. Un seulanimal est utilisé pour chaque couple « race-traitement ».
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Les donnéesVoici les résultats des mesures :
R1 R2 R3D1 1,26 1,21 1,19D2 1,29 1,23 1,23D3 1,38 1,27 1,22
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
L’objectifNous nous proposons d’effectuer une analyse de la variance àdeux facteurs sans répétition, il y a en effet une seuleobservation par « case ». Les facteurs, contrôlés, à effets fixes,sont la race et la dose, tous les deux à 3 modalités. La réponseest le gain moyen de poids.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Les donnéesCet ensemble de données doit être saisi, dans un logiciel sousla forme d’un tableau empilé :
Race Dose GainR1 D1 1,26R1 D2 1,29R1 D3 1,38R2 D1 1,21R2 D2 1,23R2 D3 1,27R3 D1 1,19R3 D2 1,23R3 D3 1,22
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Les hypothèsesNous testons les hypothèses :
HR0 : les races n’ont pas d’effet,
contreHR
1 : les races ont un effet
et HD
0 : les doses n’ont pas d’effet,contreHD
1 : les doses ont un effet.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Le tableau de l’anovaVoici le tableau de l’analyse de la variance construit par R :
Sum Sq Df Mean Sq F PRace 0.0152667 2 0.0076333 9.7447 0.02900Dose 0.0074000 2 0.0037000 4.7234 0.08849Res. 0.0031333 4 0.0007833
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Les résultatsNous décidons :
1 HR1 est vraie, il y a un effet des races (p =0.02900)
2 HD0 est vraie, il n’y a pas d’effet des doses sur le gain de
poids (p = 0.08849).
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Vérification des hypothèsesNous vérifions à présent les conditions d’application del’analyse de la variance.
Indépendance des données : Ok !Normalité des résidus :> shapiro.test(residus)Shapiro-Wilk normality testdata : residusW = 0.9798, p-value = 0.9632Nous décidons que l’hypothèse de normalité est vérifiée.Nous décidons que la normalité de l’erreur théorique estacceptée.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Vérification des hypothèsesIl nous reste plus qu’à vérifier l’égalité des variances desrésidus ou encore appelé l’homogénéité des variances.Remarquons tout d’abord que nous ne pouvons pas testerl’égalité des variances : en effet nous n’avons qu’uneobservation par « case ». Cependant, à titre indicatif, nouspouvons tester : l’égalité des variances des gains selon lesraces,
H0 : les variances des races sont égales,contreH1 : les variances des races ne sont pas égales.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Vérification des hypothèsesLe test de Bartlett donne :> bartlett.test(residus∼Race,data=exemple2)Bartlett test of homogeneity of variancesdata : residus by RaceBartlett’s K-squared = 3.2583, df = 2,p-value = 0.1961Nous décidons donc que l’hypothèse d’homogénéité estvérifiée. Nous décidons que les variances théoriques desgains des trois races sont égales.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Vérification des hypothèsesNous pouvons tester aussi : l’égalité des variances des gainsdes doses,
H0 : les variances des doses sont égales,contreH1 : les variances des doses ne sont pas égales.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Vérification des hypothèsesLe test de Bartlett donne :> bartlett.test(residus∼Dose,data=exemple2)Bartlett test of homogeneity of variancesdata : residus by DoseBartlett’s K-squared = 1.0819, df = 2,p-value = 0.5822Nous décidons donc que l’hypothèse d’homogénéité estvérifiée. Nous décidons que les variances théoriques desgains des trois doses sont égales.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Vérification des hypothèsesCependant ces deux résultats ne nous garantissent pasl’égalité des 9 variances théoriques mais sont de bonsindicateurs pour l’homoscédasticité.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Comparaisons multiples
Comme nous avons décidé que HR1 est vraie, il y a un effet de
la race, nous allons procéder à des comparaisons multiplespour analyser comment les races sont différentes par rapportau gains de poids.Pour ce faire nous utilisons le test de Tukey au seuil deα = 5% = 0,05.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Script de R et sorties de R
> TukeyHSD(model1)Tukey multiple comparisons of means95% family-wise confidence levelFit : aov(formula = Gain ∼ Race + Dose, data =exemple2)Racediff lwr upr p adj2-1 -0.07333333 -0.1547783 0.0081115870.06867033-1 -0.09666667 -0.1781116 -0.0152217470.02883863-2 -0.02333333 -0.1047783 0.0581115870.6040386
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
Résumé des résultatsNous pouvons résumer ces résultats par le tableau :
Modalités Classesdu facteur d’égalitéR1 AR2 BR3 C
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs
ExempleL’anova à 2 facteurs avec répétitions
La vérification des conditionsLes comparaisons multiples
L’anova à 2 facteurs sans répétition
Modèle et sommes des carrésÉtude complète d’un exemple
ConclusionsNous montrons ainsi que la première race est différente desdeux autres, dont le gain de poids est similaire.Comme nous avons décidé HD
0 est vraie, il n’y a pas d’effet dela dose sur le gain de poids, nous allons calculer le risque β aposteriori.Pour cela, nous calculons : Φ = 1,575. En reportant cettedernière valeur sur le graphique de l’abaque correspondant àν1 = J − 1 = 2 et à ν2 = (I − 1)(J − 1) = 4, nous obtenonsπ1 = 0,45 et β = 0,55. Ce qui signifie, que le non effet de ladose est associé à un risque de l’ordre de 0,55 ce qui estrelativement important.
Myriam Maumy-Bertrand Analyse de la variance à deux facteurs