analyse de la variance à deux facteurs -...

65
Exemple L’anova à 2 facteurs avec répétitions La vérification des conditions Les comparaisons multiples L’anova à 2 facteurs sans répétition Analyse de la variance à deux facteurs Myriam Maumy-Bertrand 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1 Psychologie du développement 06-10-2008 Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

Upload: duongdiep

Post on 12-Sep-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Analyse de la variance à deux facteurs

Myriam Maumy-Bertrand1

1IRMA, Université Louis PasteurStrasbourg, France

Master 1 Psychologie du développement06-10-2008

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

ContexteNous nous proposons d’analyser l’influence du temps et detrois espèces ligneuses d’arbre sur la décomposition de lamasse d’une litière constituée de feuilles de Lierre.Pour ce faire, 24 sachets d’une masse identique de feuilles delierre ont été constitués, sachets permettant une décompositionnaturelle. Puis une première série de 8 sachets, choisis auhasard, a été déposée sous un chêne, une deuxième sous unpeuplier, et la dernière série sous un frêne.Après 2, 7, 10 et 16 semaines respectivement, deux sachetssont prélevés au hasard sous chaque arbre et la masserésiduelle est déterminée pour chacun d’eux. Cette masse estexprimée en pourcentage de la masse initiale.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Les donnéesLes valeurs observées sont données dans le tableau suivant :

Semaine Chêne Peuplier Frêne2 85,10 85,20 84,30

87,60 84,90 85,757 75,90 73,00 72,80

72,85 75,70 70,8010 71,60 74,15 67,10

66,95 71,85 64,9516 62,10 67,25 58,75

64,30 60,25 59,00

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Les écrituresNous pouvons écrire ce tableau sous forme standard, qui estcelle utilisée dans la plupart des logiciels et en particulier avecle logiciel R, c’est-à-dire avec trois colonnes, une pour lasemaine, une pour l’espèce et une pour la masse, et 24 lignes,une pour chaque sachet.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Les données

Sachet Semaine Arbre Masse1 2 Chêne 85,102 2 Chêne 87,603 2 Peuplier 85,204 2 Peuplier 84,905 2 Frêne 84,306 2 Frêne 85,757 7 Chêne 75,908 7 Chêne 72,85

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Les données

Sachet Semaine Arbre Masse9 7 Peuplier 73,00

10 7 Peuplier 75,7011 7 Frêne 72,8012 7 Frêne 70,8013 10 Chêne 71,6014 10 Chêne 66,9515 10 Peuplier 74,1516 10 Peuplier 71,85

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Les données

Sachet Semaine Arbre Masse17 10 Frêne 67,1018 10 Frêne 64,9519 16 Chêne 62,1020 16 Chêne 64,3021 16 Peuplier 67,2522 16 Peuplier 60,2523 16 Frêne 58,7524 16 Frêne 59,00

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le butNous nous proposons d’utiliser l’analyse de la variance à deuxfacteurs. Nous observons trois variables :

1 deux d’entre elles sont des variables contrôlées, l’arbre,qualitative à trois modalités, et la semaine qui peut êtreconsidérée comme qualitative à quatre modalités.

2 La troisième variable est une réponse quantitative.Donc l’analyse de la variance à deux facteurs (semaine etespèce d’arbre) croisés, avec interaction, peut convenir, entreautres méthodes d’analyse de ces données.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Le contexteDans l’étude des effets simultanés d’un facteur à I modalités etd’un facteur à J modalités sur une variable quantitative Y ,supposons que Y suive des lois normales, a priori différentesdans les IJ populations disjointes déterminées par laconjonction de deux modalités des facteurs étudiés.Supposons que, dans la population correspondant à lamodalité d’ordre i du premier facteur et à la modalité d’ordre jdu deuxième facteur, nous ayons :

L(Yijk ) = N (µij ;σ2),

pour tout i = 1, . . . , I, j = 1, . . . , J et k = 1 . . . ,K .

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

L’idéePour mettre en évidence les éventuelles différences entre lecomportement de la variable Y dans les I modalités du premierfacteur, dans les J modalités du deuxième facteur, ou encoredans l’interaction entre les deux facteurs, nous considérons deséchantillons indépendants de même taille K de la variable Ydans chacune des IJ populations , soit au total un n-échantillonavec n = I × J × K .

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Le modèle statistique

Pour la variable d’ordre k de la population d’indice (i , j), notéeYijk , nous posons :

Yijk = µ+ αi + βj + (αβ)ij + Eijk ,

pour tout i = 1, . . . , I, j = 1, . . . , J et k = 1, . . . ,K , avec, pouréviter une surparamétrisation, les contraintes

I∑i=1

αi =J∑

j=1

βj =I∑

i=1

(αβ)ij0 =J∑

j=1

(αβ)i0j = 0,

pour i0 = 1, . . . , I et j0 = 1, . . . , J.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Les trois hypothèses du modèleLes variables erreurs Eijk sont supposées indépendantes etsuivre une loi normale N (0;σ2).Leurs réalisations, notées eijk , sont considérées comme leserreurs de mesure, elles sont inconnues et vérifient :

yijk = µij + eijk , pour i = 1, . . . , I, j = 1, . . . , J, k = 1, . . . ,K .

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Les trois testsL’analyse de la variance à deux facteurs avec répétitionspermet trois tests de Fisher.

Le premier testNous testons :

l’effet du premier facteur Fα : Nous testons l’égalité des Iparamètres αi correspondant aux I modalités du premierfacteur

(H0) : les I paramètres αi sont tous nulscontre(H1) : les I paramètres αi ne sont pas tous nuls.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Le deuxième testNous testons :

l’effet du deuxième facteur Fβ. Il consiste à tester l’égalitédes J paramètres βj correspondant aux J modalités dudeuxième facteur

(H0) : les J paramètres βj sont tous nulscontre(H1) : les J paramètres βj ne sont pas tous nuls.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Le troisième testNous testons :

l’effet de l’interaction entre les deux facteurs Fα et Fβ. Ilconsiste à comparer

(H0) : les IJ paramètres (αβ)ij sont tous nulscontre(H1) : les IJ paramètres (αβ)ij ne sont pas tous nuls.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

NotationsNous posons

Y =1n

∑i,j,k

Yijk ,

Y ij• =1K

∑k

Yijk , Y i•• =1

JK

∑j,k

Yijk , Y •j• =1IK

∑i,k

Yijk .

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Notations

SCT =∑i,j,k

(Yijk − Y )2, SCR =∑i,j,k

(Yijk − Y ij•)2,

SCα =∑i,j,k

(Y i•• − Y )2, SCβ =∑i,j,k

(Y •j• − Y )2,

SCαβ =∑i,j,k

(Y ij• − Y i•• − Y •j• + Y )2.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

L’équation de l’anovaL’équation de l’analyse de la variance devient pour ce modèle :

SCTot = SCR + SCα + SCβ + SCαβ.

oùla somme SCTot , la somme totale, mesure la somme descarrés des écarts à la moyenne globale, toutes causesconfondues,

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

L’équation de l’anova - Suite

la somme SCR, la somme résiduelle, cumule les carrésdes écarts des différentes observations à la moyenne del’échantillon dont elles font partie. Dans la somme totaleelle représente la part de la dispersion due auxfluctuations individuelles.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

L’équation de l’anova - Suitela somme SCα, la somme due au premier facteur, ousomme entre modalités du facteur Fα, mesure l’effet dupremier facteur.la somme SCβ, ou somme due au deuxième facteur, ousomme entre modalités du facteur Fβ, mesure l’effet dudeuxième facteur.la somme SCαβ mesure l’effet de l’interaction entre lesdeux facteurs.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

PropriétéSous les différentes hypothèses nulles (H0) d’égalité desparamètres de la décomposition des µij , nous pouvons préciserles lois respectives des variables précédentes. Elles suiventdes lois du χ2 :

LH0

(1σ2 SCTot

)= χ2

n−1, LH0

(1σ2 SCR

)= χ2

n−IJ ,

LH0

(1σ2 SCα

)= χ2

I−1, LH0

(1σ2 SCβ

)= χ2

J−1,

LH0

(1σ2 SCαβ

)= χ2

(I−1)(J−1).

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Suite de la propriétéDe plus, les variables SCR et SCα, SCR et SCβ, SCR et SCαβ

sont indépendantes, de sorte que :

LH0

SCα

I − 1SCR

IJ(K − 1)

= F(I−1),IJ(K−1),

LH0

SCβ

J − 1SCR

IJ(K − 1)

= F(J−1),IJ(K−1),

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Fin de la propriété

LH0

SCαβ

(I − 1)(J − 1)

SCR

IJ(K − 1)

= F(I−1)(J−1),IJ(K−1).

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Les testsLes tests sont réalisés à l’aide des valeurs numériquessuivantes :

y =1

IJK

∑i,j,k

yijk , y ij• =1K

∑k

yijk ,

y i•• =1

JK

∑j,k

yijk , y•j• =1IK

∑i,k

yijk .

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Les tests - Suite

SCTot =∑i,j,k

(yijk − y)2 =

I∑i=1

J∑j=1

K∑k=1

y2ijk

− IJK y2,

SCR =∑i,j,k

(yijk − y ij•)2 =

I∑i=1

J∑j=1

K∑k=1

y2ijk

− KI∑

i=1

J∑j=1

y2ij•,

SCα =∑i,j,k

(y i•• − y)2 = JKI∑

i=1

y2i•• − IJK y2,

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Les tests - Fin

SCβ =∑i,j,k

(y•j• − y)2 = IKJ∑

j=1

y2•j• − IJK y2,

SCαβ =∑i,j,k

(y ij• − y i•• − y•j• + y)2

= KI∑

i=1

J∑j=1

y2ij• − JK

I∑i=1

y2i•• − IK

J∑j=1

y2•j• + IJK y2.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

DécisionPour un seuil α(= 5% = 0,05 en général), les tables de la loi deFisher notée F nous fournissent pour chacun des trois testsune valeur critique c telle que PH0(F < c) = 1− α. Alors nousdécidons : {

si Fobs < c (H0) est vraie ,si c 6 Fobs (H1) est vraie.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Les résultats des calculs sont généralement présentés sous laforme d’un tableau.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Tableau de l’ANOVA

Variation SC ddl s2 Fobs Fc

Due au facteur α SCα I − 1 s2α

s2α

s2R

c

Due au facteur β SCβ J − 1 s2β

s2β

s2R

c

Interaction SCαβ (I − 1)(J − 1) s2αβ

s2αβ

s2R

c

Résiduelle SCR IJ(K − 1) s2R

Totale SCTot n − 1

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

ExemplePour l’exemple précédent, en utilisant R, le tableau de l’analysede la variance s’écrit :

Sum Sq Df F PSemaine 1741.31 3 121.6927 3.004e − 09Arbre 58.08 2 6.0881 0.01495Interaction 30.22 6 1.0559 0.43853Résiduelle 57.24 12Totale 1886.84 23

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

ConclusionSupposons provisoirement que les conditions du modèled’anova à 2 facteurs avec répétitions soient vérifiées, nouspouvons

1 décider d’accepter H1. Il y a effet du premier facteur.2 décider d’accepter H1. Il y a effet du deuxième facteur.3 décider d’accepter H0. Il n’y a pas d’effet de l’interaction

entre les deux facteurs.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

RemarqueS’il y avait eu un effet de l’interaction alors pour préciser le typed’interaction mis en évidence par le test, nous pourrionscomparer les moyennes y ij• pour les différentes valeurs de i etj .Graphiquement, nous porterons en abscisse les valeurs de i(les I modalités). Pour chaque valeur de j nous relierons lesvaleurs de y ij• portées en ordonnées. L’aspect du faisceau deslignes brisées, variant ou non dans le même sens,s’interprétera facilement.À titre d’exemple, nous allons donner ces graphiques bien qu’iln’y ait pas d’effet d’interaction.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Graphique des interactions

FIG.: Représentation graphique des interactions

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Le modèleLes testsLes statistiquesLes formules de calculsLe tableau de l’analyse de la variance

Graphique des interactions

FIG.: Représentation graphique des interactions

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Vérification des conditionsPour ce modèle, l’estimation des moyennes théoriques µij sefait par les moyennes observées y ij• (« valeurs ajustées »). Lesrésidus sont alors donnés par l’expression :

eijk = yijk − y ij•, i = 1, . . . , I; j = 1, . . . , J; k = 1, . . . ,K .

Leur normalité et l’homogénéité des variances se vérifient parles mêmes méthodes que pour une analyse de la variance à unfacteur.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Vérification des conditions sur l’exempleCommençons par tester la normalité des résidus.> shapiro.test(residus)Shapiro-Wilk normality testdata : residusW = 0.9763, p-value = 0.8187« L’hypothèse de normalité des résidus est acceptée(p-value=0.8187) ».

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Vérification des conditions sur l’exemple - Suite et finNous allons maintenant chercher à tester l’homogénéitédes variances.Malheureusement, dans le cas qui nous intéresse, nous nepouvons pas tester l’homogénéité des populations parcequ’il n’y a que deux observations pour chacune d’elles et lapuissance d’un tel test serait très faible. Nous verrons dansle dernier paragraphe, comment nous pouvons parer à cetinconvénient. La solution que nous proposerons n’est pasaussi performante que si nous testions l’homogénéité maiselle sera un bon indicateur pour savoir si cette conditionest vérifiée.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Comparaisons multiplesLorsque l’effet d’un facteur a été mis en évidence, le test deTukey ou celui de Dunnett s’applique chaque fois que le nombred’observations le permet, à l’aide de la même statistique. Leseffectifs ni et ni ′ sont alors ceux des classes comparées.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Comparaisons multiples sur l’exempleNous allons réaliser les comparaisons multiples pour le facteur« Semaine » avec R.Semainediff lwr upr p adj7-2 -11.966667 -15.71019 -8.2231474 0.000003310-2 -16.041667 -19.78519 -12.29814740.000000116-2 -23.533333 -27.27685 -19.78981410.000000010-7 -4.075000 -7.81852 -0.3314808 0.031662316-7 -11.566667 -15.31019 -7.8231474 0.000004716-10 -7.491667 -11.23519 -3.7481474 0.0003427

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Comparaisons multiples sur l’exempleFacteur 1 : Semaine. Nous obtenons les classes d’égalitésuivantes :

Modalités Moyennes Classesdu facteur observées d’égalitéS2 85.47500 AS7 73.50833 BS10 69.43333 CS16 61.94167 D

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Comparaisons multiples sur l’exempleNous allons réaliser les comparaisons multiples pour le facteur« Arbre » avec R.Arbrediff lwr upr p adj2-1 0.73750 -2.175756 3.65075565 0.78184823-1 -2.86875 -5.782006 0.04450565 0.05370773-2 -3.60625 -6.519506 -0.69299435 0.0161088

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

ExempleFacteur 2 : Arbre. Nous obtenons les classes d’égalitésuivantes :

Modalités Moyennes Classesdu facteur observées d’égalitéChêne 73.30000 APeuplier 74.03750 BFrêne 70.43125 C

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

L’idée générale

Dans le cas où nous étudions l’effet simultané de deux facteursà, respectivement, I et J modalités et que nous disposonsd’une seule observation pour chaque population, c’est à direK = 1, les résultats du paragraphe précédent ne sont plusvalables. Nous devons supposer que l’interaction entre lesdeux facteurs est nulle. Partant du même modèle, nousécrivons plus simplement :

Yij = µ+ αi + βj + Eij

avec les contraintesI∑

i=1

αi =J∑

j=1

βj = 0.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

NotationsNous avons les notations analogues :

y =1IJ

∑i,j

yij , y i• =1J

∑j

yij , y•j =1I

∑i

yij ,

SCTot =∑i,j

(yij − y)2 =∑i,j

y2ij − IJy2,

SCR =∑i,j

(yij − y i• − y•j + y)2,

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Notations

SCα =∑i,j

(y i• − y)2 = J∑

i

y2i• − IJy2,

SCβ =∑i,j

(y•j − y)2 = I∑

j

y2•j − IJy2.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Remarque importanteRemarquons que l’expression définissant, dans le cas avecrépétitions, la somme des carrés associée à l’interaction, estassociée ici à la somme des carrés de la résiduelle.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Tableau de l’ANOVANous avons alors le tableau de l’analyse de la variance suivant :

Variation SC ddl Fobs Fc

Due au facteur α SCα I − 1s2α

s2R

c

Due au facteur β SCβ J − 1s2β

s2R

c

Résiduelle SCR (I − 1)(J − 1)

Totale scT IJ − 1

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

L’idée générale

La démarche est alors analogue à celle de l’analyse de lavariance à deux facteurs avec répétitions. Notons que dans cecas les valeurs ajustées sont données par

µij = y i• + y•j − y

et les résidus par l’expression :

eij = yij − y i• − y•j + y , i = 1, . . . , I; j = 1, . . . , J.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

ExempleL’influence d’un traitement grossissant, à base de vitamines, estétudiée sur des animaux de races différentes. Pour cela nousdisposons d’animaux de trois races, notées Ri , pour i = 1,2,3,et nous avons effectué trois traitements, notés Dj , pourj = 1,2,3, utilisant respectivement 5,10 et 15µg de vitaminesB12 par cm3. Le gain moyen de poids par jour est mesuré, àl’issue d’un traitement de 50 jours dans chaque cas. Un seulanimal est utilisé pour chaque couple « race-traitement ».

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Les donnéesVoici les résultats des mesures :

R1 R2 R3D1 1,26 1,21 1,19D2 1,29 1,23 1,23D3 1,38 1,27 1,22

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

L’objectifNous nous proposons d’effectuer une analyse de la variance àdeux facteurs sans répétition, il y a en effet une seuleobservation par « case ». Les facteurs, contrôlés, à effets fixes,sont la race et la dose, tous les deux à 3 modalités. La réponseest le gain moyen de poids.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Les donnéesCet ensemble de données doit être saisi, dans un logiciel sousla forme d’un tableau empilé :

Race Dose GainR1 D1 1,26R1 D2 1,29R1 D3 1,38R2 D1 1,21R2 D2 1,23R2 D3 1,27R3 D1 1,19R3 D2 1,23R3 D3 1,22

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Les hypothèsesNous testons les hypothèses :

HR0 : les races n’ont pas d’effet,

contreHR

1 : les races ont un effet

et HD

0 : les doses n’ont pas d’effet,contreHD

1 : les doses ont un effet.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Le tableau de l’anovaVoici le tableau de l’analyse de la variance construit par R :

Sum Sq Df Mean Sq F PRace 0.0152667 2 0.0076333 9.7447 0.02900Dose 0.0074000 2 0.0037000 4.7234 0.08849Res. 0.0031333 4 0.0007833

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Les résultatsNous décidons :

1 HR1 est vraie, il y a un effet des races (p =0.02900)

2 HD0 est vraie, il n’y a pas d’effet des doses sur le gain de

poids (p = 0.08849).

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Vérification des hypothèsesNous vérifions à présent les conditions d’application del’analyse de la variance.

Indépendance des données : Ok !Normalité des résidus :> shapiro.test(residus)Shapiro-Wilk normality testdata : residusW = 0.9798, p-value = 0.9632Nous décidons que l’hypothèse de normalité est vérifiée.Nous décidons que la normalité de l’erreur théorique estacceptée.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Vérification des hypothèsesIl nous reste plus qu’à vérifier l’égalité des variances desrésidus ou encore appelé l’homogénéité des variances.Remarquons tout d’abord que nous ne pouvons pas testerl’égalité des variances : en effet nous n’avons qu’uneobservation par « case ». Cependant, à titre indicatif, nouspouvons tester : l’égalité des variances des gains selon lesraces,

H0 : les variances des races sont égales,contreH1 : les variances des races ne sont pas égales.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Vérification des hypothèsesLe test de Bartlett donne :> bartlett.test(residus∼Race,data=exemple2)Bartlett test of homogeneity of variancesdata : residus by RaceBartlett’s K-squared = 3.2583, df = 2,p-value = 0.1961Nous décidons donc que l’hypothèse d’homogénéité estvérifiée. Nous décidons que les variances théoriques desgains des trois races sont égales.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Vérification des hypothèsesNous pouvons tester aussi : l’égalité des variances des gainsdes doses,

H0 : les variances des doses sont égales,contreH1 : les variances des doses ne sont pas égales.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Vérification des hypothèsesLe test de Bartlett donne :> bartlett.test(residus∼Dose,data=exemple2)Bartlett test of homogeneity of variancesdata : residus by DoseBartlett’s K-squared = 1.0819, df = 2,p-value = 0.5822Nous décidons donc que l’hypothèse d’homogénéité estvérifiée. Nous décidons que les variances théoriques desgains des trois doses sont égales.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Vérification des hypothèsesCependant ces deux résultats ne nous garantissent pasl’égalité des 9 variances théoriques mais sont de bonsindicateurs pour l’homoscédasticité.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Comparaisons multiples

Comme nous avons décidé que HR1 est vraie, il y a un effet de

la race, nous allons procéder à des comparaisons multiplespour analyser comment les races sont différentes par rapportau gains de poids.Pour ce faire nous utilisons le test de Tukey au seuil deα = 5% = 0,05.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Script de R et sorties de R

> TukeyHSD(model1)Tukey multiple comparisons of means95% family-wise confidence levelFit : aov(formula = Gain ∼ Race + Dose, data =exemple2)Racediff lwr upr p adj2-1 -0.07333333 -0.1547783 0.0081115870.06867033-1 -0.09666667 -0.1781116 -0.0152217470.02883863-2 -0.02333333 -0.1047783 0.0581115870.6040386

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

Résumé des résultatsNous pouvons résumer ces résultats par le tableau :

Modalités Classesdu facteur d’égalitéR1 AR2 BR3 C

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs

ExempleL’anova à 2 facteurs avec répétitions

La vérification des conditionsLes comparaisons multiples

L’anova à 2 facteurs sans répétition

Modèle et sommes des carrésÉtude complète d’un exemple

ConclusionsNous montrons ainsi que la première race est différente desdeux autres, dont le gain de poids est similaire.Comme nous avons décidé HD

0 est vraie, il n’y a pas d’effet dela dose sur le gain de poids, nous allons calculer le risque β aposteriori.Pour cela, nous calculons : Φ = 1,575. En reportant cettedernière valeur sur le graphique de l’abaque correspondant àν1 = J − 1 = 2 et à ν2 = (I − 1)(J − 1) = 4, nous obtenonsπ1 = 0,45 et β = 0,55. Ce qui signifie, que le non effet de ladose est associé à un risque de l’ordre de 0,55 ce qui estrelativement important.

Myriam Maumy-Bertrand Analyse de la variance à deux facteurs