2.3.1. Le contrôle des variables
Le contrôle des variables a pour but principal l'élimination des corrélations illusoires.
On distinguera le contrôle "ex post" du contrôle "ex ante", ce dernier étant plus ambitieux que le premier.
Le contrôle « ex post »
• Le contrôle "ex post" est l'équivalent de l'introduction d'une variable test ( au sens de Lazarsfeld) et correspond plus ou moins à l'idée de groupe de contrôle. Il intervient au niveau de l'analyse des résultats, et non à celui de la construction du dessin de recherche.
• On le pratique lorsqu'on a le pressentiment que la relation A-B peut s'expliquer par la double présence d'une corrélation entre B et T d'une part, entre A et T d'autre part.
T
vd
vi
Cas-types dans le contrôle ex post
• Le contrôle ex post peut produire diverses figures logiques:
• - la disparition de la corrélation: dans chacun des contextes définis par la variable test, la relation A-B est annulée. Exemple 1
• - l'interaction complète: le sens de la relation A-B s'inverse en fonction des contextes définis par la variable test.. Exemple 2
• - le renforcement sectoriel de la corrélation: un des contextes voit la relation A-B renforcée, pendant q'un autre la voit diminuée. Exemple 3.
Prot Cath Cas type 1
Libs 850 400 ANNULATION
Cos 400 850
=0.68 =0.32
Ville Camp
P C P C
Li 800 200 50 200
Co 200 50 200 800
Exercice de contrôle des variables
• Exercice Contrôle Variable.xls
Prot Cath Cas type 2
P+ 410 410 INTERACTION
P- 140 140 COMPLETE
=.745 =0.745
Ville Camp
P C P C
P+ 400 10 10 400
P- 100 40 40 100
Cad O/E Cas type 3
C+ 600 400 RENFORCEMENT ET
C- 400 600 AFFAIBLISSEMENT
=.60 =0.40
Ville Camp
P C P C
C+ 80 20 520 380
C- 20 80 380 520
A B Cas type 4
Y+ 2600 1150 RENFORCEMENT ET
Y- 1100 600 ANNULATION
=.70 =0.66
Ville Camp
A B A B
Y+ 2000 1000 600 150
Y- 1000 500 100 100
Limites du contrôle ex post
• 1. Nombre de cas insuffisant
• 2. Césures inadéquates
• 3. Absence des variables pertinentes
Les phases du contrôle ex ante1. (Définir les hypothèses à tester)2. Définir les variables d’interprétation3. Repérer les corrélations illusoires possibles. Deux critères: a)
association de la variable parasite avec la v.i., b) association des cette même variable avec la v.d.
4. Définir au besoin les états des variables du modèle5.Choisir un mode de contrôle par exclusion (limitation de la validité
externe) ou par inclusion6. Définir le nombre de cas nécessaires 7. (N.B. La démarche n’a pas de limites absolues: elle est poussée
plus ou moins loin, selon les besoins et les moyens de l’étude) 8. Ce modèle, dit de « décomposition des proportions » est certes très
informateur, mais aussi très coûteux. On cherche souvent à atteindre des buts analogues par le biais de modèles « path »
Exemple1. H: une forte hétérogamie augmente-t-elle le risque de séparation
(propension à envisager celle-ci)?2. Interprétations par
a) plus grande probabilité des conflits de valeurs : cv1 et cv2b) plus grande difficulté d’intégration sociale: di1 et di2
3. Variables parasites éventuelles: ) différence d’âge (a1 vs a2) et différence de niveau social (ns1 et ns2)
4. H: h1 et h2; PS:ps1 et ps2; CV: cv1 et cv2; DI:di1 et di2; DA:da1 et da2; DNS:dns1 vs dns2
5. Théoriquement, cela fait 32 « cases » dans lesquelles observer la propension à la séparation (% de ps2 par exemple)
6. Une économie peut être faite par exclusion des cas avec grande différence d’âge: on n’a « plus que » 16 cases à observer!!
7. On voit les limites du modèle de « décomposition des proportions » et l’intérêt des modèles « path »
Notion d’ « analyse de cheminement » ( « path analysis »)
• Il s’agit de passer d’associations statistiques « apparentes » - qui sont des associations « brutes » de deux variables - à des coefficients « directs », ou « nets », qui sont des relations « de dépendance causale » (Boudon), entre deux variables, dégagées des apports « indirects » dus aux liens « parasites » avec d’autres variables.
• Forme générale d’une relation « apparente » : f(ij) = p(i,,j) – p(i,non-j). Cette forme est asymétrique : f(ij) différent de f(ji).
• On peut aisément calculer une forme symétrique: phi(ij) = racine2 de f(ij)*f(ji).
• Donnons les noms de a(ij) et de d(ij) aux coefficients de dépendance directe, respectivement asymétriques et symétriques, que l’on recherche
• On peut passer, dans certaines conditions, des f(ij) aux a(ij) - respectivement phi(ij) et d(ij) - par le biais des règles de Wright
Règles de Wright
• Dans diverses conditions (absence d’effets d’interaction; non récursivité), les règles de Wright suivantes sont applicables pour passer des f(ij) ou phi(ij), donnés, aux a(ij) ou d(ij), recherchés:
a) Une relation brute est égale à la somme des relations directes et indirectes qui la composent;
b) Une relation indirecte est égale au produit des relations directes qui la composent
I J
K
aij
ajkaik
f (ij) = a (ij)
f(ik) = a(ik) + a(ij)*a(jk)
f(jk) = a(jk) + a(ki) *a(ij)
n.b. attention aux coefficients symétriques et asymétriques:
Phi(ij) = racine2 de f(ij)*f(ji)
1. On dispose au départ des coefficients « bruts » f(ij), f(ik) et f(jk), avec f(ij) = p(i,j)-p(i,non-j) et ainsi de suite.
2. On veut connaître les coefficients « nets » ou « directs » ou « de dépendance causale » a(ij), a(ik) et a(jk).
Application
Réseau de parenté des jeunes adulte genevoisCôté paternel
Réseau de parenté des jeunes adulte genevoisCôté paternel
Précautions• . Ce passage de relations brutes d'association à des coefficients
nets de dépendance suppose évidemment des contraintes que le chercheur doit assumer, sans toujours savoir s'il a raison de le faire:
• - La valeur des coefficients dépend bien évidemment des variables incluses dans le modèle;
• - C'est au chercheur de "prédire" les liens directs qu'il établit entre variables; autrement dit c'est à lui de dessiner le schéma fléché que le modèle statistique va évaluer;
• - Il faut postuler l'absence d'effets interactions complexes entre variables
• - Il faut postuler des relations linéaires• On le voit, le chemin est un peu périlleux et il vaut peut-être mieux
utiliser ces techniques pour tester comparativement diverses hypothèses que pour donner une description – valable "en soi" – d'un système complexe de relations.