analyse de variance
DESCRIPTION
ANALYSE DE VARIANCE. M2 Sciences des Procédés - Sciences des Aliments. ANALYSE DE VARIANCE. Exemple. - PowerPoint PPT PresentationTRANSCRIPT
ANALYSE DE VARIANCE
B. PalagosUMR ITAPCemagref
ANALYSE DE VARIANCE
M2 Sciences des Procédés - Sciences des Aliments
2
ANALYSE DE VARIANCE
Forêt 1 Forêt 2 Forêt 3
23.424.424.624.9
25.026.2
18.921.121.122.122.523.524.5
22.522.923.724.024.0
Des forestiers ont réalisé des plantations d’arbres en 3 endroits. Plusieurs années plus tard ils souhaitent savoir si la hauteur des arbres est identique dans les trois forêts. Dans chaque forêt on tire un échantillon d’arbre et on mesure la hauteur de chaque arbre.
ANALYSE DE VARIANCE
Exemple
L’analyse de variance (ANOVA) consiste à chercher si la variabilité des observations peut être en partie expliquée par les différences entre variantes d’un facteur (ici fôret)
3
ANALYSE DE VARIANCE
OBJECTIF DE l’ANOVA
Analyser des données qui dépendent de plusieurs types d’effets agissant simultanément, afin de quantifier ces effets
= expliquer une variable quantitative par une ou des variables qualitatives (facteurs)
En amont de l’ANOVA : plan expérimental (nombre d’expériences pour chaque niveau ou modalité, facteurs)
4
ANALYSE DE VARIANCE
Analyse de la variance à 1 facteur
5
ANALYSE DE VARIANCE
Etude sur l’appréciation sensorielle de la texture de 3 viandes. Seul le caractère fibreux est considéré, noté sur une échelle de 15 points. 15 dégustateurs différents ont noté chacun une viande
13
11
7
11
8
10
8
5
7
5
3
5
6
3
3
CBA
viande
41 y 72 y 103 y
7y
notes pour le caractère fibreux
Exemple
6
ANALYSE DE VARIANCE
Modèle de l’analyse de la variance à 1 facteur :
où
ijiijy
ijy est la variable à expliquer ………………
est l’effet du ième niveau du facteur ….....
est l’effet moyen général ……………….
est la variable aléatoire résiduelle ………
Exemple de la viande :
texture fibreuse d’une viande
caractère fibreux de la viande i
caractère fibreux potentiel
due à l’ensemble des autres causes qui déterminent la note fibreuse
i
ij
Hypothèses :
- les sont indépendants
-
-
- suit une loi
ij
0)( ijE 2)var( ij
ij ),0( 2N
7
ANALYSE DE VARIANCE
Décomposition de l’élément :ijy
)()( iijiij yyyyyy
Exemple de la viande :
3 10 13
5 8 11
6 5 7
3 7 11
3 5 8
Y
=
7 7 7
7 7 7
7 7 7
7 7 7
7 7 7
M
+
-3 0 3
-3 0 3
-3 0 3
-3 0 3
-3 0 3
B
+
-1 3 3
1 1 1
2 -2 -3
-1 0 1
-1 -2 -2
W
données globales =
moyenne générale
+ +écartsinter-colonnes
écartsintra-colonnes
8
ANALYSE DE VARIANCE
En élevant au carré et en sommant, pour toutes les observations :222 )()()(
i jiiji
ii
i jij yyyynyy
Somme des carrés des écarts totaux
Somme des carrés des écarts inter-niveaux
Somme des carrés des écarts intra-niveaux= +
SCETotale = +SCEInter SCEIntra
Exemple de la viande : SCETotale = 140
SCEInter = 90
SCEIntra = 50
Décomposition de la variabilité
9
ANALYSE DE VARIANCE
On souhaite tester les hypothèses :
H0 : " Il n’y a pas d’effet produit "càd les moyennes pour les différents produits (niveaux du facteur) sont égales
contre H1 : " Il y a un effet produit "càd deux moyennes au moins sont différentes
Il s’agit donc de comparer la variabilité inter-niveaux à la
variabilité intra-niveaux du facteur
10
ANALYSE DE VARIANCE
Source de variation
SCE ddl
Inter-niveaux SCE Inter I-1
Intra-niveaux SCE Intra n-I
Totale SCE Totale n-1
On définit le carré moyen inter-groupes :
et le carré moyen intra-groupes :1I
SCECM inter
inter
In
SCECM intra
intra
I nombre de niveaux
11
ANALYSE DE VARIANCE
Pour tester H0 contre H1, on évalue la quantité :intra
inter
CM
CMF
Si l’hypothèse H0 est vraie, la valeur F est faible,sinon, en s’éloignant de cette hypothèse, le rapport F augmente
à partir de quelle valeur observée de F rejette-t-on H0 ?
Si les résidus du modèle de l’analyse de la variance suivent une loi normale, et si H0 est vraie, on sait que F est l’observation d’une variable qui suit la loi de Fisher ayant (I-1) ddl au numérateur et (n-I) ddl au dénominateur : notée F(I-1, n-I)
H0 est rejetée si Fobs > F (I-1, n-I) pour un niveau de significativité donné α, c’est-à-dire si p-value < α (cf. table de Fisher)
12
ANALYSE DE VARIANCE
Exemple de la viande :Tableau d’analyse de la variance
Source de variation SCE ddl CM F p-value
Type de viande 90 2 45
10,8 p < 0,01Résiduelle
(intra-produit)50 12 4,17
Totale 140 14
H0 rejetée = il existe un effet type de viande significatif concernant le caractère fibreux
Tables de la loi de Fisher :
pour α = 5 %, Fα,2,12 = 3,88
pour α = 1 %, Fα,2,12 = 6,93
p-value = p(Fα,1, 2 > Fobs)
13
ANALYSE DE VARIANCE
Analyse de la variance à 2 facteurs
14
ANALYSE DE VARIANCE
viande
juge A B C
1
2
3
4
5
3
5
6
3
3
10
8
5
7
5
13
11
7
11
84.1 x
notes pour le caractère fibreux
7.2 x 10.3 x 7x
7,81. x
82. x
63. x
74. x
3,55. x
Supposons maintenant que 5 juges aient évalué une série de 3
échantillons :
Dispositif complet sans répétition
15
ANALYSE DE VARIANCE
Modèle de l’analyse de la variance à 2 facteurs sans interaction :
où
ijjiijy
ijy est la variable à expliquer ………………
est l’effet du ième niveau du facteur A .....
est l’effet du jème niveau du facteur B ....
est l’effet moyen général ……………….
est la variable aléatoire résiduelle ………
Exemple de la viande :
texture fibreuse d’une viande
caractère fibreux de la viande i
effet lié au juge j
caractère fibreux potentiel
due à l’ensemble des autres causes qui déterminent la note fibreuse
i
ij
Hypothèses :
- les sont indépendants
-
-
- suit une loi
ij
0)( ijE 2)var( ij
ij ),0( 2N
III.2 – Dispositif complet sans répétition
j
16
ANALYSE DE VARIANCE
Equation de la décomposition de la variance :2
....2
...2
...2
.. )()()()( i j
jiiji j
jj i
ii j
ij yyyyyyyyyy
SCET = SCEA + SCEB + SCER
III.2 – Dispositif complet sans répétition
soit :
Source de variation
SCE ddl
Effet principal de A SCEA I-1
Effet principal de B SCEB J-1
Résiduelle SCER (I-1)(J-1)
Totale SCET n-1
17
ANALYSE DE VARIANCE
Tableau d’analyse de la variance
Source de variation SCE ddl CM F
Type de viande 90,0 2 45,0 13,2
Effet juge 22,7 4 5,7 1,7
Résiduelle 27,3 8 3,4
Totale 140 14
1er test : Fobs = 13,2 >> Fα,2,8 = 4,5 avec α = 5 % H0 rejetée avec un risque de 5 % = il existe un effet produit significatif concernant le caractère fibreux
2ème test : Fobs = 1,7 < Fα,4,8 = 3,8 avec α = 5 % H0 non rejetée = il n’existe pas d’effet juge significatif
On teste chaque facteur
18
ANALYSE DE VARIANCE
Comparaison de 3 types de sondes pédologiques pour 2 natures de sol
Type de sol
1 2
Type de sonde
1
43
45
46
53
40
40
40
43
2
41
42
43
44
35
37
40
40
3
42
44
46
48
37
39
40
40
Dispositif complet avec répétitions
19
ANALYSE DE VARIANCE
Modèle de l’analyse de la variance à 2 facteurs avec interaction :
où
ijkijjiijkx )(
ijkx est la variable à expliquer
est l’effet du ième niveau du facteur A
est l’effet du jème niveau du facteur B
est l’interaction des niveaux i et j des 2 facteurs
est l’effet moyen général
est la variable aléatoire résiduelle
i
ijk
Hypothèses :
- les sont indépendants
-
-
- suit une loi
ijk
0)( ijkE 2)var( ijk
ijk ),0( 2N
III.3 – Dispositif complet avec répétitions
j
ij)(
20
ANALYSE DE VARIANCE
B3 B1 B2
A2
A1
Effet moyen
PAS D’INTERACTION
D’INTERACTION
B3 B1 B2
A2
A1
Effet moyen
Avec répétition
21
ANALYSE DE VARIANCE
Equation de la décomposition de la variance :
SCET = SCEA + SCEB + SCEAB + SCER
i
ijj
ijkki j
jiijj
ji
ii j
ijkk
yyyyyyyyyyyy 2.
2........
2.....
2.....
2... )()(K)(IK)(JK)(
soit :
(I-1)(J-1)SCEABInteraction A x B
J-1SCEBEffet principal de B
n-1SCETTotale
IJK-IJSCERRésiduelle
I-1SCEAEffet principal de A
ddlSCESource de variation
3 tests d’hypothèse
22
ANALYSE DE VARIANCE
Tableau d’analyse de la variance
0,7890,241,523,0Sol x sonde
3,92
29,04
F
0,03924,5249,0Type de sonde
< 0,01
p-value
23346,0Totale
6,218112,5Résiduelle
181,51181,5Type de sol
CMddlSCESource de variation
Type de sol
1 2
Type de sonde
1
43
45
46
53
40
40
40
43
2
41
42
43
44
35
37
40
40
3
42
44
46
48
37
39
40
40
23
ANALYSE DE VARIANCE
Effets sol et sonde significatifs pour α = 5 %
Effet sol >> effet sonde
Sonde
Réponse
1 2 3
Sol 1
Sol 2
Pas d’effet d’interaction
24
ANALYSE DE VARIANCE
Si rejet de l’hypothèse testée : effet du facteur Le rejet signifie: il existe au moins 1 niveau différent des autresLe ou lesquels?Il existe des méthodes complémentaires :
- test LSD (Least Significance Difference) de Fischer (ppds)
- test de Scheffe
- test de Dunnett
- test de Duncan
- …
Tests de comparaisons multiples
25
ANALYSE DE VARIANCE
Pour chaque comparaison de 2 moyennes, on calcule une valeur seuil r (range), fonction du carré moyen résiduel de l’ANOVA
Si , alors la différence est déclarée significative, au niveau de signification α
ryy 21
Exemple : test LSD
21,
11
nnCMtr Rddl
ddl de la source de variation résiduelle
Tests de comparaisons multiples