séminaire organisé par lécole doctorale thématique psyceduc et le girsef louvain-la-neuve: 10-11...
Post on 04-Apr-2015
104 Views
Preview:
TRANSCRIPT
Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEFLouvain-La-Neuve: 10-11 mars 2011
L’analyse de données L’analyse de données longitudinales: les longitudinales: les
modèles multiniveaux de modèles multiniveaux de croissancecroissancePascal BRESSOUXPascal BRESSOUX
Université Pierre-Mendès-France GrenobleUniversité Pierre-Mendès-France GrenobleLaboratoire des Sciences de l’EducationLaboratoire des Sciences de l’Education
Bruxelles: De Boeck2008
(2e éd. Nov. 2010)
Analyses contextuelles et problèmes posés par les
moindres carrés ordinaires
Données sur plusieurs « niveaux » :
- Un effet-classe sur les acquis des élèves ?
- Un effet-juge sur les condamnations des prévenus ?
- Un effet-quartier sur la délinquance des jeunes ?
- Un effet-pays sur les résultats des élèves à PISA ?
- Etc.
Souvent, structure hiérarchisée.
Exemple : des élèves (niveau 1) dans des classes (niveau 2), etc.
Modèles multiniveaux (ou modèles hiérarchiques linéaires)
Nés des avancées des modèles de contexte et des modèles mixtes.
But : étudier les effets de l’environnement sur le « comportement » individuel.
Principes de l’analyse multiniveau
Académie 1 Académie 2
Ecole 1 Ecole 2
Classe 1 Classe 2
Ecole 3 Ecole 4
Classe 3 Classe 4
él. 1 él. 2 él. 3 él. 4 él. 5 él. 6 él. 7 él. 8 Niveau 1(élèves)
Niveau 2(classes)
Niveau 3(Ecoles)
Niveau 4(Académies)
Exemple d’une structure hiérarchisée à quatre niveaux
… / …
Non-indépendance des résidus
Agrégation vs désagrégation
(voir aussi diapo suivante)
Hétérogénéité des relations
Effets aléatoires et effets fixes
Problèmes posés par l’analyse de données hiérarchisées
Le modèle de régression par les MCO
Droite de régression simple (sans distinction de classes)
yij
xij
x
eij
0
1
x
x
x
x
x
ijijij XY 10
où i = individus (unités d’analyse) et j = macro-unités (indistinctes)
n
4
3
2
1
2
2
2
2
2
00000
0
0000
0000
0000
0000
,
0
0
0
0
0
N~
2,0 Ni ~
Hypothèses sur les erreurs
Admettons maintenant qu’on y inclue une variable de niveau 2, qu’on nommera Z.
Si l’on raisonne sur les individus, on travaille sur des données désagrégées au niveau 1 (N = I):
Estimation MCO des effets-classes (les gammas représentent des effets fixes) (N = I):
Si l’on raisonne sur les groupes, on travaille sur des données agrégées au niveau 2 (N = J):
ijijijij ZXY 210
jjjj ZXY ... 210
ijijJJijijijijij CCCCXY 1133221110 ...
Le modèle multiniveau
ijjij eY 0
jj u0000
ijjij euY 000
Au niveau 1
Au niveau 2
Equation complète
Le modèle « vide » équivalant à une ANOVA avec effets aléatoires
220
20
eu
u
Coefficient de corrélation intra-classe
= mesure du degré de « ressemblance » des individus i qui appartiennent à une même macro unité j.
516 élèves d’âge élémentaire appartenant à 24 classes.
Acquis des élèves mesurés à l’aide d’épreuves standardisées en début et en fin d’année scolaire dans la discipline du français.
On cherche à savoir ce qui fait varier les acquis des élèves en cours d’année.
Les scores d’acquisitions des élèves ont été normalisés, centrés et réduits
Un exemple : étude de la variance des acquis en français à l’école élémentaire
Modèle vide décomposant les parts de variance inter et intra-classes du score final en français
Paramètres Modèle 1 (vide)
Effets fixes
Constante 0,007 (0,078)
Effets aléatoires
Variance inter-classes 0,103 (0,042)
Variance inter-élèves 0,890 (0,057)
–2 log V 1434,071
104,0890,0103,0
103,0
Le modèle multiniveau à constantes aléatoires
Les composants de la variance :
Variance totale :
Niveau 1
Niveau 2
Equation complète
2
00
2
uj
eij
uVar
eVar
20
2ueijyVar
ijijjij eXY 10
101
0000
jj u
ijjijij euXY 01000
220
20
20
20
220
20
20
20
220
220
20
20
20
220
20
20
20
220
220
20
20
20
220
20
20
20
220
000000
000000
000000
000000
000000
000000
000000
000000
000000
euuu
ueuu
uueu
euuu
ueuu
uueu
euuu
ueuu
uueu
V
ije 2e
u j020u
N(0,
)
N(0, )
)
Une matrice de variance-covariance des erreurs « bloc-diagonale »
Un exemple d’estimation avec constantes aléatoires
Modèles expliquant le score final en français (données aménagement du temps scolaire 1997-98)
Paramètres Modèle 1 Modèle 2
Effets fixes
Constante 0,007 (0,078) 0,007 (0,078)
Score initial en français 0,690 (0,031)
Effets aléatoires
Variance des constantes 0,103 (0,042) 0,096 (0,034)
Variance inter-élèves 0,890 (0,057) 0,442 (0,028)
–2 log L 1434,071 1084,083
N = 516
Le score initial (modèle 2) « n’explique » quasiment pas la variance des constantes (variance interclasses), mais il « explique » environ la moitié de la variance inter-élèves (intraclasse).
Le modèle multiniveau complet :constantes et pentes aléatoires
Niveau 1
Niveau 2
Equation complète
ijijjjij eXY 10
jj
jj
u
u
1101
0000
ijijjjijij eXuuXY 101000
Les composants de la variance :
Variance de Y devient fonction quadratique de X
1010
211
200
2
, ujj
uj
uj
eij
uuCov
uVar
uVar
eVar
ijuijuueijij XXXY 0122
120
2 2var
j
j
u
u
1
0
2110
0120,
0
0
uu
uuN
2e
au niveau 2~
au niveau 1, eij ~ N(0, )
Structure des erreurs
Un exemple d’estimation avec constantes et pentes aléatoiresModèles expliquant le score final en français (données aménagement du temps scolaire 1997-98)
Paramètres Modèle 1 Modèle2 Modèle 3
Effets fixes
Constante 0,007 (0,078) 0,007 (0,078) 0,008 (0,069)
Score initial en français 0,690 (0,031) 0,690 (0,041)
Effets aléatoires
Niveau 2 (classes) :
Variances des constantes 0,103 (0,042) 0,096 (0,034) 0,092 (0,033)
Covariance constantes-pentes 0,014 (0,014)
Variance des pentes 0,016 (0,011)
Niveau 1 : variance inter-élèves 0,890 (0,057) 0,442 (0,028) 0,441 (0,025)
–2 log L 1434,071 1084,083 1079,525
N = 516
Calcul de la décroissance de la déviance avec 2 paramètres supplémentaires à estimer :
D = 1084,083 – 1079,525 = 4,558
Pour atteindre p < 0,05, le Khi2 à 2 ddl devrait au moins être égal à 5,99.
Il n’y a donc pas d’évidence ici que la relation entre le score initial et le score final varie en fonction des classes.
37,0016,0092,0
014,0
r
Le tableau montre la covariance constantes-pentes. La corrélation (en fait, ici, elle n’est pas significativement différente de 0) peut être calculée de la manière suivante :
En ce cas, le calcul de la décroissance de la déviance avec 1 paramètre supplémentaire à estimer : D = 1084,083 – 1080,548 = 3,54.
On est proche alors du seuil de significativité
(pour atteindre p < 0,10 ; Khi2 à 1 ddl > 2,71 ;
pour atteindre p < 0,05 ; le Khi2 à 1 ddl > 3,84).
On peut contraindre la covariance constantes pentes à être nulle. Par rapport au modèle sans pentes aléatoires, il n’y a alors qu’un seul paramètre supplémentaire à estimer.
Exemple (mêmes données) :
Variance des constantes = 0,094 (erreur-type = 0,033)
Variance des pentes = 0,017 (erreur-type = 0,011)
Variance de niveau 1 = 0,427 (erreur-type = 0,028)
–2 log L = 1080,548
Un exemple d’estimation avec constantes et pentes aléatoiresModèles expliquant le score final en maths (données aménagement du temps scolaire 1997-98)
Paramètres Modèle 1 Modèle2 Modèle 3 Modèle 4
Effets fixes
Constante 0,010 (0,072) 0,003 (0,064) 0,016 (0,064) 0,016 (0,064)
Score initial en maths 0,711 (0,031) 0,713 (0,042) 0,713 (0,042)
Effets aléatoires
Niveau 2 (classes) :
Variances des constantes 0,080 (0,036) 0,077(0,028) 0,077(0,029) 0,077(0,029)
Covariance constantes-pentes 0,004 (0,013)
Variance des pentes 0,019 (0,012) 0,019 (0,012)
Niveau 1 : variance inter-élèves 0,920 (0,059) 0,442 (0,028) 0,425 (0,028) 0,425 (0,028)
–2 log L 1446,170 10079,990 10074,956 10075,028
N = 516∆(2 – 3) = 5,034 (pour 2 ddl) ; ∆(2 – 4) = 4,962 (pour 1 ddl)
ATTENTION!
Une question de méthode d’estimation :
-Maximum de vraisemblance complet (ML ou FML)
Ou
-Maximum de vraisemblance restreint, ou résiduel (RML)
ijijjjij eXY 10
jjj uZ 001000
jjj uZ 111101
ijijjjijjijjij eXuuXZXZY 1011100100
au niveau 1
au niveau 2
Equation complète
Interaction inter-niveaux
Ajoutons une variable Z de niveau 2
Le modèle multiniveau de croissance
x
y
y
t t1 t2 t3
Relation entre les scores initial et final pour un échantillon d’individus
Relation entre le temps et les scores pour un individu donné
Classe 1
Elève 1 Elève 2
mes. 1 Niveau 1(Mesures)
Niveau 2(Elèves)
Niveau 3(Classes)
Exemple d’une structure hiérarchisée de croissance
mes. 2 mes. 3 mes. 1 mes. 2 mes. 3
Classe 2
Elève 3 Elève 4
… /…
Niveau 1 :
Formalisation du modèle de croissance
Niveau 2 :
En intégrant dans une même équation :
titiitiiiti eXTEMPSY 210
202
111101
001000
i
iii
iii
uZ
uZ
tiiititiitiiti eTEMPSuuXTEMPSZTEMPSZY 102011100100 *
Rythme de croissance fonction aussi de Z
Caractéristique qui varie avec le temps
Caractéristique interindividuelle stable dans le temps
Niveau initial moyen
Rythme de croissance moyen
Variance de Y fonction du temps (= gestion de l’hétéroscédasticité des erreurs)
Une mesure du déroulement du temps est nécessaire (âge, durée…)
Modèle très souple
Fonctionne pour données non équilibrées (ne nécessite pas le même nombre de mesures par sujet)
Fonctionne pour des mesures prises à différents moments et dont l’espacement diffère (ne nécessite pas que tous les sujets soient mesurés au même moment).
Permet de prendre en compte des environnements « macro » pour les individus:
- classes, écoles, etc. pour les élèves
- ateliers, usines, etc. pour les ouvriers
- quartiers, villes, etc. pour les jeunes
- Circonscription, canton, etc. pour les électeurs
- Etc.
1er exemple : Une étude empirique
L’évolution des perceptions de soi dans le passage CM2-6e
Méthode
Participants
62 élèves appartenant à 6 classes de CM2 en t1 et 9 classes de 6e en t2 et t3
Matériel
Echelle SPP de Harter traduite et validée par Nurra et Pansu (perceptions de soi, importance accordée aux domaines, soutien social perçu)
Jugement des enseignants (score de 0 à 10 en français et en maths)
Fiches de renseignements sociodémographiques (âge, sexe…)
Procédure
Echelle SPP (perceptions de soi, importance aux domaines, soutien social perçu) passée à 3 temps.
Jugement des enseignants (français + maths) récolté à 3 temps.
T1: fin CM2 (mai 2005)
T2 : début 6e (octobre-novembre 2005)
T3 : fin 6e (mai 2006)
Elève 1
1
1,5
2
2,5
3
3,5
4
0 2 4 6 8 10 12
Elève 2
1
1,5
2
2,5
3
3,5
4
0 2 4 6 8 10 12
Elève 12
0
0,5
1
1,5
2
2,5
3
3,5
4
0 2 4 6 8 10 12
Elève 14
0
0,5
1
1,5
2
2,5
3
3,5
4
0 2 4 6 8 10 12
Elève 51
0
0,5
1
1,5
2
2,5
3
3,5
4
0 2 4 6 8 10 12
Elève 41
0
0,5
1
1,5
2
2,5
3
3,5
4
0 2 4 6 8 10 12
Quelques cas individuels de croissance
Peut-on établir un modèle de tout cela?
Moyennes observées
0 6 12
3,05 2,97 2,92
Evolution moyenne des perceptions de soi scolaires
Une spécification linéaire semble adaptée : de toute façon, impossible de spécifier une fonction
d’ordre plus élevé (seulement 3 points)
La structure des données peut être considérée comme complexe :
Niveau 1 : mesures
Niveau 2 : les élèves
Niveau 3 : les classes de CM2 et de 6e (structure aléatoire croisée).
Variables intégrées dans le modèle :
Variable TEMPS mesurée en nombre de mois (0, 6, 12)
Des caractéristiques stables dans le temps (sexe, à l’heure ou en avance)
Des caractéristiques qui varient dans le temps (importance du domaine de l’école, jugement des enseignants, soutien des camarades)
Modèle à tester (différent de celui de Harter)
Sentiment de compétence scolaire
Soutien social perçu
Jugement de l’enseignant
Etude de la croissance du sentiment de compétence scolaire
Paramètres Modèle 1 Modèle 2 Modèle 3
Effets fixes
Constante 2,981 (0,074)* 3,044 (0,076)* 1,226 (0,298)*
Temps –0,011 (0,005)* –0,073 (0,032)*
Heure –0,074 (0,142)
Avance 0,159 (0,218)
Garçon –0,065 (0,086)
Soutien camarades 0,035 (0,075)
Jugement enseignant 0,098 (0,010)*
Importance de l’Ecole 0,096 (0,044)*
Temps × Soutien camarades
0,025 (0,010)*
Effets aléatoires
Niveau 2 : Constante Temps Cov constante*temps
0,306 (0,062) 0,290 (0,060)0,0005 (0,0003)
0,075 (0,024)0,0000 (0,0002)
Niveau 1 : 0,108 (0,014) 0,086 (0,014) 0,099 (0,017)
–2 log L (Full ML) 252,93 245,33 171,34
Effets fixes : * p < .05
Epstein :Dans modèle hiérarchique de soi, les schémas de haut degré (e.g. l’estime de soi) sont plus résistants aux changements que les conceptions d’ordre inférieur (e.g. la perception de soi dans des domaines spécifiques).
Peut-on tester cette hypothèse ?
Si hypothèse vraie, on devrait observer que la part de variance interindividuelle est plus forte pour l’estime de soi que pour la perception de soi dans des domaines spécifiques.
Certaines hypothèses pourraient facilement être testées avec les modèles multiniveaux de croissance
Estime de soi (Valeur
propre)
Scolaire Conduite Apparence Physique Social
Part de variance interindividuelle(Rho)
64,9 % 74,0 % 69,9 % 79,8 % 67,1 % 59,2 %
Fonction de variance interindividuelle
ns Tendance signif
(p < .10)Augmente
avec le temps
ns SignifAugmente
avec le temps
ns ns
Rythme de croissance moyen
ns significatif(décroît dans le temps)
ns ns ns ns
L’estime de soi mesurée avec l’échelle de Rosenberg donne les valeurs suivantes :- Part de variance interindividuelle : Rho = 68,1 %- Fonction de variance interindividuelle : ns- Rythme de croissance : nsATTENTION, il faudrait aussi tenir compte de la fidélité des mesures.
2e exemple : Modèle de croissance des effets à long terme de la réduction des
effectifs au CP
Méthode
Participants
100 classes expérimentales (8 à 12 élèves par classe dans les faits avec une moyenne égale à 10,45)
100 classes témoins (15 à 27 élèves par classe dans les faits avec une moyenne égale à 21,29).
Toutes dans des milieux défavorisés (écoles en zone d’éducation prioritaire)
Le Ministère de l’Education Nationale français a lancé en 2002-2003 une expérimentation d’envergure visant à réduire la taille des classes de CP (1ère
année élémentaire) à 10 élèves dans les zones défavorisées.
Les élèves ont été suivis jusqu’à la fin de la 2e année élémentaire (en fait jusqu’au début de la 3e année mais les scores ne peuvent pas être mis sur la même échelle que les scores précédents).
Leurs acquisitions en français-lecture ont été testées 5 fois (avec items d’ancrage).
-Début, milieu et fin CP
-Début et fin CE1
(Dans les écoles témoins, ces évaluations n’ont porté que sur 10 élèves choisis aléatoirement.)
Modèles de réponse à l’item ont permis de mettre tous les scores sur une même échelle de mesure.
Structure des données :
Niveau 1 : mesures (Nt = 5433)
Niveau 2 : les élèves (Ni = 1163)
Niveau 3 : les écoles (Nj = 69)
Variables intégrées dans le modèle :
Variable TEMPS mesurée en nombre de mois (0, 5, 8, 12, 20)
Des caractéristiques stables dans le temps (origine sociale, sexe)
Des caractéristiques de niveau supérieur (ancienneté enseignant, expérimentation)
1163 élèves retenus pour les analyses (i.e. ceux qui étaient présents à la première et à la dernière évaluation).
Figure 1 : Evolution des résultats bruts
Variable d'analyse : score_francais
N time Obs N Moyenne Ecart-type Minimum Maximum
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 0 1163 1163 -0.7470158 1.1387861 -3.6658400 3.5490100
5 1163 1095 1.0424832 0.9507920 -1.4529400 5.8454600
8 1163 999 1.8025968 1.0972123 -2.5008300 5.7569900
12 1163 1013 1.9704838 1.1691808 -0.9668000 5.7569900
20 1163 1163 2.8968559 1.1230747 -0.3306000 6.3903300
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
-1
-0,5
0
0,5
1
1,5
2
2,5
3
3,5
0 5 10 15 20 25
Temps
Sco
re e
n f
ran
çais
Gpe contrôle
Gpe expé
Figure 2 : Evolution des résultats bruts en fonction du groupe expérimental
Quelle spécification adopter?
Une spécification cubique?
-1
-0,5
0
0,5
1
1,5
2
2,5
3
3,5
0 5 10 15 20 25
Temps
Sco
re f
ran
çais
Figure 3 : Spécification cubique des résultats (sans variables de contrôle)
Finalement, choix pour une spécification piecewise avec
deux ruptures de pente
Paramètres Modèle 1(inconditionnel =
« vide »)
Modèle 2(inconditionnel de
croissance)Effets fixes Constante 0,379 (0,047)*** -0,147 (0,049)**Temps 0,170 (0,002)***(Temps – 8)*post-CP (Temps – 12)*CE1 Effets aléatoires Variance inter-écoles (niveau 3)Variance constantesCovariance Constantes/tempsVariance temps
0,090 (0,027)***
0,094 (0,027)***
Variance inter-élèves (niveau 2)Variance constantesCovariance Constantes/tempsVariance temps
0,335 (0,037)***
0,703 (0,035)***
Variance intra-élèves (niveau 1) 2,370 (0,051)*** 0,610 (0,013)***–2 log L (déviance) 20760,97 14951,46
Nt = 5433 (mesures)
Ni = 1163 (élèves)
Nj = 69 (écoles)
Modèle 2 inconditionnel de croissance :Variance totale = 0,094 + 0,703 + 0,610 = 1,407
Variance inter-écoles = 0,094/1,407 = 0,0688 (6,88 % de la variance totale)
Variance inter-élèves = 0,703/1,407 = 0,4996 (49,96 % de la variance totale)
Variance intra-élèves = 0,610/1,407 = 0,4336 (43,36 % de la variance totale)
Paramètres Modèle 3 Modèle 4Effets fixes Constante -0,684 (0,049)*** -0,683 (0,056)***Temps 0,323 (0,003)*** 0,323 (0,004)***(Temps – 8)*post-CP -0,304 (0,009)*** -0,305 (0,007)***(Temps – 12)*CE1 0,097 (0,009)*** 0,098 (0,008)***Effets aléatoires Variance inter-écoles (niveau 3)Variance constantesCovariance Constantes/tempsVariance temps
0,090 (0,026)***
0,144 (0,037)***-0,0052 (0,0017)**0,0005 (0,0001)***
Variance inter-élèves (niveau 2)Variance constantesCovariance Constantes/tempsVariance temps
0,749 (0,036)***
0,791 (0,041)***-0,0062 (0,0016)***0,0011 (0,0001)***
Variance intra-élèves (niveau 1) 0,379 (0,013)*** 0,282 (0,007)***–2 log L (déviance) 12907,32 12468,15
Nt = 5433 (mesures)
Ni = 1163 (élèves)
Nj = 69 (écoles)
Modèle 3 :Variance totale = 0,090 + 0,749 + 0,379 = 1,218
Variance inter-écoles = 0,090/1,218 = 0,0739 (7,39 % de la variance totale)
Variance inter-élèves = 0,749/1,218 = 0,6149 (61,49 % de la variance totale)
Variance intra-élèves = 0,379/1,218 = 0,3112 (31,12 % de la variance totale)
Paramètres Modèle 5Effets fixes Constante -0,361 (0,141)*Temps 0,297 (0,007)***(Temps – 8)*post-CP -0,243 (0,014)***(Temps – 12)*CE1 0,067 (0,014)***Profession du père (référence = cadre sup.)
Agriculteur/artisan -0,399 (0,175)*Prof. intermédiaire -0,1575 (0,151)Employé -0,319 (0,143)*Ouvrier -0,556 (0,127)***Autre -0,602 (0,128)***
Fille 0,240 (0,053)***CP réduit 0,023 (0,097) nsAncienneté CP 0,006 (0,006) nsTemps*CP réduit 0,0295 (0,0075)***(Temps – 8)*post-CP*CP réduit -0,0641 (0,0154)***(Temps – 12)*CE1*CP réduit 0,0225 (0,0158) nsTemps*Ancienneté CP 0,0019 (0,0005)***(Temps – 8)*post-CP*Ancienneté CP -0,0050 (0,0011)***(Temps – 12)*CE1*Ancienneté CP 0,0034 (0,0011)**Effets aléatoires Variance inter-écoles (niveau 3)Variance constantesCovariance Constantes/tempsVariance temps
0,140 (0,037)***-0,0054 (0,0017)**0,0005 (0,0001)***
Variance inter-élèves (niveau 2)Variance constantesCovariance Constantes/tempsVariance temps
0,751 (0,039)***-0,0065 (0,0015)***0,0011 (0,0001)***
Variance intra-élèves (niveau 1) 0,277 (0,007)***–2 log L (déviance) 12353,10
-1
-0,5
0
0,5
1
1,5
2
2,5
3
3,5
0 5 10 15 20 25
Temps
Sco
re f
ran
çais
Gpe contrôle
Gpe expé
Figure 4 : Evolution des scores de français selon le groupe expérimental ou contrôle (la figure est tirée du modèle 5)
Pour explorer d’autres possibilités de ce genre de
modèles
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
3
3,5
0 5 10 15 20 25
Temps
Sco
re f
ran
çais
Défavorisés
Favorisés
Figure 5 : Evolution des scores de français selon la catégorie socioprofessionnelle du père
Les pentes sont parallèles pendant les périodes de scolarisation. Les défavorisés
« perdent » par rapport aux favorisés durant la période de vacances.
Figure 6 : Evolution de l’effet de l’ancienneté sur les score de français
MERCI POUR VOTRE ATTENTION
… « Qui s’assemble se ressemble »
- Destin commun (partage d’un même environnement)
- interactions (influence mutuelle)
« Qui se ressemble s’assemble »…
- Eventuelle sélection par les écoles- Eventuel choix des parents
- Ségrégation spatiale en cas de carte scolaire
« Similarité » des individus au sein des contextes
Illustration du biais d’agrégation (Cf. observations classes DEP 95 : Relation entre jugement des enseignants et scores des élèves)
ijij SJ
007,0020,047,2ˆ
jj SJ .022,016,4.ˆ
006,0
Jugement
Score
M1
M2M3
jijij SSJ .080,0060,003,4ˆ
011,0008,0
contexte inter intra
Corrélation (toutes classes confondues) = 0,28 (p = 0,003).
Corrélation inter-classes = –0,77 (p = 0,002).
Corrélation médiane intra-classes = 0,73.
Approche par la régression :
L’estimation de la part de variance inter-groupes
Simulation…
Groupe Nombres aléatoires Moyenne Ecart-type
123456789
10
39 65 76 45 45 19 90 69 64 6173 71 23 70 90 65 97 60 12 1172 20 47 33 84 51 67 47 97 1975 17 25 69 17 17 95 21 78 5837 48 79 88 74 63 52 06 34 3002 89 08 16 94 85 53 83 29 9587 18 15 70 07 37 79 49 12 3898 83 71 70 15 89 09 39 59 2410 08 58 07 04 76 62 16 48 6847 90 56 37 31 71 82 13 50 41
57.3057.2053.7047.2051.1055.4041.2055.7035.7051.80
20.4931.0526.1830.7625.3638.2729.2331.0029.1623.71
Total 50.63 28.50
ρ = 0,059 (Proc ANOVA).
Donc, part de variance inter-groupes = 5,9 %
Données issues de tables de nombres aléatoires, groupées dans des macro-unités(extrait de Wonnacott & Wonnacott, 1991, p. 867)
yij
xij
u j0
Classe j
Moyenne
Droites de régression avec constantes aléatoires
y i j
x i j
1 1 u j
C l a s s e j
M o y e n n e
Droites de régression avec constantes et pentes aléatoires
Fonction de la variance interindividuelle de la perception de soi scolaire
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0 2 4 6 8 10 12 14
Temps (en nombre de mois)
Var
ian
ce i
nte
rin
div
idu
elle
de
la
per
cep
tio
n d
e so
i sc
ola
ire
Effet du soutien des camarades sur le sentiment de compétence scolaire
(Soutien faible = M – 1s ; soutien moyen = M ; soutien fort = M + 1s)
1
1,5
2
2,5
3
3,5
4
0 2 4 6 8 10 12
Temps
Sen
tim
ent
de
com
pét
ence
sco
lair
e
Soutien faible
Soutien moyen
Soutien fort
top related