1
Dominique Muller
Laboratoire Inter-universitaire de Psychologie
Cours 3
Bureau : 238Tel : 04 76 82 58 90
Email : [email protected]
2
3 2.5i iY X 3 2.5i iY X
Une menace très sérieuse, très (trop) souvent négligée
« L’ histoire » que nous racontons dans les deux cas semble être la même
Mais dans le second cas une seule observation nous amène à parler d’un effet qui n’existe pas :
Nous devons nous assurer que l’histoire que nous racontons n’est pas indûment influencée par un petit nombre d’observations
=> Encore une fois : regarder ses données
3
Trois indices de détection d’observations déviantes
RSS (Résidus Supprimés Studentisés) :
- la SCE est-elle réduite si l’observation est un facteur ?
- est-elle extrême sur Y ?
- le RSS est une valeur de t (si > 3.5 => pb)
Levier :
- dans quelle mesure l’observation participe à la pente ?
- est-elle extrême sur X ?
- à interpréter en relatif (gap ?)
D de Cook :
- la combinaison de X et Y est-elle étrange ?
- à interpréter en relatif (gap ?)
4
Indices de détection d’observations déviantes
7.46 1.24i iY X
Nous allons suivre le sujet 26 sur plusieurs indicateurs
Dans cet exemple, ce sujet à un score moyen sur X et Y
Sans déviant :
b1 = 1.24
SCR = 745
SCEA = 1874
SCEC = 2619
p < .005
5
Déviant sur X : levier
11.41 0.98i iY X
Le sujet 26 : score moyen sur Y mais extrême sur X
La pente est aplatie (pas forcement le cas si la valeur de Y n’était pas moyenne)
Sans déviant :
b1 = 1.24
SCR = 745
SCEA = 1874
SCEC = 2619
p < .005
6
Déviant sur X : levier
7
8.65 1.24i iY X
Le sujet 26 : score moyen sur X mais extrême sur Y
La pente n’a pas changé (pas forcement le cas si la valeur de X n’était pas moyenne) mais perte de puissance car la SCEA a augmenté (droite plus haute)
Déviant sur Y : Résidus Supprimés Studentisés
Sans déviant :
b1 = 1.24
SCR = 745
SCEA = 1874
SCEC = 2619
p < .005
8
Déviant sur Y : Résidus Supprimés Studentisés
9
Combinaisons déviantes : D de COOK
11.71 0.85i iY X
Le sujet 26 : une combinaison déviante de X et Y
La pente a changé et la SCEA a augmenté (perte de puissance)
Sans déviant :
b1 = 1.24
SCR = 745
SCEA = 1874
SCEC = 2619
p < .005
10
Combinaison déviante : le D de Cook
11
Afin d’utiliser la méthode des moindres carrés (test t, ANOVA, ANCOVA…) plusieurs règles doivent être respectées
Ces règles portent sur la distribution des résidus (aucune règle concernant la distribution des prédicteurs), c’est-à-dire les
Ces résidus doivent être :
distribués normalement
avoir une variance constante
être indépendants les uns des autres
*
*
***
Règles d’application de la méthode des moindres carrés
iε
VI : mode de restitution (Rappel vs. Reconnaissance)
VD : nombre de mots correctement restitués
Un facteur intra-sujets à 2 modalités(ANOVA ou t échantillons appariés)
1 (1) ( 1)i i i i iW RA RE RA RE Avec :
Nous reconnaissons ici le contraste [1 -1]
Cette fois, il apparaît dans le type de calcul et non en tant que codes dans un prédicteur
Si la variable « mode de restitution » est traitée en inter (mais manipulée en intra), il n’y a pas indépendance entre les résidus
Test d’une variable intra à deux modalités = test modèle simpleSoit la comparaison de modèles suivante :
VI intra-sujet à 2 modalités
W 1iB0 ε1ci
W 1iβ0 ε1ai
MC :
MA :Soit ici :
1 0
iW
1 0.5i
W MC :
MA :
SCEC = 27
SCEA = 25.5
Le test de la variable intra à deux modalités est équivalent au test de la moyenne
de W1 contre 0. En effet, savoir si 0i i i iRA RE RA RE
i i iavec W RA RE 1( )
06.027
5.1
27
5.2527
C
AC
SCE
SCESCEPRE
29.0
165.25
015.1
paNSCE
pcpaSCR
FA
VI intra-sujet à 2 modalités
Il n’y a donc pas de différence entre rappel et reconnaissance, F(1,5) < 1, PRE = .06
SCEC = 27
SCEA = 25.5
15
Modèles ANOVA inter à un facteur (catégoriel) : k > 2
Que faire lorsque nous avons une variable catégorielle à plus de deux modalités ?
Exemple : une expérimentation avec 3 conditions et une mesure d’erreur :
- Condition contrôle sans FeedBack (Cond = NoFB)
- Condition avec FeedBack non menaçant (Cond = FBnm)
- Condition avec FeedBack menaçant (Cond = FBm)
Peut-on utiliser un modèle avec un codage 1, 2, 3 pour la variable Cond ?
NON car c’est une variable nominale :
Utilisation d’une famille de contrastes
16
Prédictions théoriques
17
Choix d’une famille de contrastes orthogonaux
La question théorique nous amène à choisir la famille de contrastes suivante :
FBm FBnm NoFB
C1 2 -1 -1
Il suffira ensuite d’utiliser le modèle (augmenté) suivant :
Yi=β0 + β1C1i + β2C2 i + ε i
C2 0 1 -1
18
Famille de contrastes orthogonaux
FBm FBnm NoFB
C1
(=λ1.k)2
(=λ1.1)
-1
(=λ1.2)
-1
(=λ1.3)
C2
(=λ2.k)0
(=λ2.1)
1
(=λ2.2)
-1
(=λ2.3)
0kkλ
1. 0 (2 1 1 0)kkλ
Ceci est une famille de contrastes orthogonaux car elle respecte deux règles :
et 1. 2. 0k kkλ λ
2*0 = 0 1. 2. 0 (0 1 1 0)k kkλ λ
(les contrastes sont orthogonaux deux à deux)
Nous utiliserons toujours k-1 contrastes orthogonaux pour coder une variable catégorielle
Règle 1 : Règle 2 :
-1*1 = -1 -1*-1 = 1
2. 0 (0 1 1 0)kkλ
19
Orthogonaux ou pas ?
Famille de contrastes orthogonaux :
FBm FBnm NoFB
C’1
(=λ1.k)1
(=λ1.1)
1
(=λ1.2)
-2
(=λ1.3)
C’2
(=λ2.k)1
(=λ2.1)
-1
(=λ2.2)
0
(=λ2.3)
1. 0kkλ
2. 0kkλ
1*1 = 1 -1*1 = -1 -2*0 = 0 1. 2. 0k kkλ λ
FBm FBnm NoFB
C’’1
(=λ1.k)1
(=λ1.1)
0
(=λ1.2)
-1
(=λ1.3)
C’’2
(=λ2.k)0
(=λ2.1)
1
(=λ2.2)
-1
(=λ2.3)
1. 0kkλ
2. 0kkλ
1*0 = 0 0*1 = 0 -1*-1 = 1 1. 2. 1k kkλ λ
Famille de contrastes non-orthogonaux :
20
Exemple de famille de contrastes orthogonaux :
Codes des contrastes de Helmert
1 2 3 4 5 6
λ1.k 5 -1 -1 -1 -1 -1
λ2.k 0 4 -1 -1 -1 -1
λ3.k 0 0 3 -1 -1 -1
λ4.k 0 0 0 2 -1 -1
λ5.k 0 0 0 0 1 -1
21
Codes des contrastes polynomiaux
Tendance Groupe
1 2
Linéaire -1 1
1 2 3
Linéaire -1 0 1Quadratique -1 2 -1
1 2 3 4
Linéaire -3 -1 1 3
Quadratique 1 -1 -1 1
Cubique -1 3 -3 1
1 2 3 4 5Linéaire -2 -1 0 1 2
Quadratique 2 -1 -2 -1 2Cubique -1 2 0 -2 1
Quartique 1 -4 6 -4 1
22
Choix d’une famille de contrastes orthogonaux
La question théorique nous amène à choisir la famille de contrastes suivante :
FBm FBnm NoFB
C1 2 -1 -1
C2 0 1 -1
Il suffira ensuite d’utiliser le modèle (augmenté) suivant :
Yi=β0 +β1C1i +β2C2 i + ε i
23
Yi=β0 +β1C1i +β2C2 i + ε i
Yi=β0 +β1C2 i + ε i
Yi=β0 +β1C1i +β2C2 i + ε i
Yi=β0 +β1C1i + ε i
Yi=β0 +β1C1i +β2C2 i + ε i
Yi=β0 + ε i
Comparaison de modèles pour le test du contraste 1 :
MA :
MC :
Comparaison de modèles pour le test du contraste 2 :
MA :
MC :
Comparaison de modèles pour le test omnibus (effet du groupe) :
MA :
MC :
Modèles ANOVA à un facteur (catégoriel) : k > 2
24
Yi=β0 +β1C1i +β2C2 i + ε iDéclarer le modèle :
25
47.11 6.26( 1) 1.11( 1) 54.48Y
47.11 6.26( 1) 1.11(1) 52.26Y
Yi=β0 +β1C1i +β2C2 i + ε i
47.11 6.26(2) 1.11(0) 34.59Y
47.11 6.26 1 1.11 2i i iY C C
Prédiction pour FBm :
Ces prédictions sont les moyennes des trois conditions expérimentales
Prédiction pour FBnm :
Prédiction pour NoFB :
Groupe FBm FBnm NoFB
Moyenne 34.59 52.26 54.48
Modèles ANOVA à un facteur (catégoriel) : k > 2
26
Test omnibus et tests de contrastes
L’anova qui nous est donnée correspond à l’effet omnibus
Erri=β0 +β1C1i +β2C2 i + ε i
Erri=β0 + ε i
MA :
MC :
La comparaison de modèles sous-jacente, illustre la question traitée ici :
Diminue-t-on l’erreur de manière intéressante lorsqu’on prend en compte l’existence des conditions ?
Ici la réponse est oui… mais on ne peut rien dire de plus
(dans statistica “R modèle complet”)
27
Tests des contrastes
21
Yi=β0 +β1C1i +β2C2 i + ε i
Yi=β0 +β1C2 i + ε i
1) Comparaison de modèles pour le test du contraste 1 :
MA :
MC :
Yi=β0 +β1C1i + ε i
Yi=β0 +β1C1i +β2C2 i + ε i2) Comparaison de modèles pour
le test du contraste 2 :
MA :
MC :