Indices de liaison pour un tableau croisé et utilisation du PEM (Pourcentage de l’Écart Maximum) dans le
logiciel Trideux
Lyon – ISH – Vendredi 7 juin 2013 – 14h-17h Salle Baulier
Philippe Cibois
Laboratoire Printemps CNRS ; Université de [email protected]
1) Pratiques culturelles (lecture) : qui le plus, quoi, de combien (H/F) ?
2) Londres 1911 : paléo-enquête à la manière de Bourdieu.
3) Y a-t-il un ordre entre syndicats et partis ?
4) Pour le local et le global : le PEM
5) Le zodiaque est-il ordonné ?
1) Enquête sur les pratiques culturelles des français de 1997
"Vous personnellement, quelles catégories de livres lisez-vous LE PLUS SOUVENT ? "
A - Des œuvres de la littérature classiqueB - Des romans autres que policiers ou d'espionnageC - des romans policiers ou d'espionnageD - Des livres de poésieE - Des livres sur l'histoireF - Des livres reportages d'actualitéG - Des livres pour enfantsH - Des albums de bandes dessinéesI - Des livres d'artJ - D'autres beaux livres illustres de photographiesK - Des essais politiques, philosophiques, religieuxL - Des livres de cuisineM - Des livres de décoration et d'ameublementN - Des livres de bricolage ou de jardinageO - Des livres scientifiques, techniques
EffectifsPourcentages
Littérature
Oui Non Total
Masculin 1567,8
185292,2
2008100
Féminin 32914,0
201686,0
2345100
Total 48511,1
386888,9
4353100
Case Féminin – oui : écart au pourcentage moyen14,03 – 11,14 = 2,89
Ordre Ori Type de lecture % de lecture % féminin écart PrépondéranceA Littérature 11,1 14,0 2,9 FémiB Romans 30,3 41,7 11,4 FémiC Policiers 19,2 20,5 1,3 FémiD Poésie 2,8 3,5 0,6 FémiE Histoire 14,9 11,3 -3,6 MascF Actualité 5,0 5,2 0,2 FémiG Livres pour enfants 2,1 3,3 1,3 FémiH BD 9,6 6,2 -3,3 MascI Livre d'art 3,1 3,4 0,3 FémiJ Beaux livres 2,3 2,3 0,0 =K Essais 7,0 6,1 -0,9 MascL Cuisine 9,3 13,8 4,5 FémiM Décoration 2,5 3,6 1,1 FémiN Bricolage/jardinage 5,6 4,3 -1,3 MascO Sciences & Techniques 6,5 3,0 -3,6 Masc
Ordre d’origine
Type de lecture % moyen % féminin écart PrépondéranceRomans 30,3 41,7 11,4 FémiCuisine 9,3 13,8 4,5 FémiLittérature 11,1 14,0 2,9 FémiPoliciers 19,2 20,5 1,3 FémiLivres pour enfants 2,1 3,3 1,3 FémiDécoration 2,5 3,6 1,1 FémiPoésie 2,8 3,5 0,6 FémiLivre d'art 3,1 3,4 0,3 FémiActualité 5,0 5,2 0,2 FémiBeaux livres 2,3 2,3 0,0 =Essais 7,0 6,1 -0,9 MascBricolage/jardinage 5,6 4,3 -1,3 MascBD 9,6 6,2 -3,3 MascSciences & Techniques 6,5 3,0 -3,6 MascHistoire 14,9 11,3 -3,6 Masc
Ordre selon l’écart entre pourcentage féminin et pourcentage moyen
EffectifsPourcentages
Littérature
Oui Non Total
Masculin 1567,8
185292,2
2008100
Féminin 32914,0
201686,0
2345100
Total 48511,1
386888,9
4353100
Littérature :
Case féminin-oui
Observé = 329Théorique = 485 x 2345 / 4353Théorique = 261,3Écart = 329 – 261,3 = 67,7Contribution au χ2 =67,7 x 67,7 / 261,3 = 17,6 Ensemble du tableau χ 2 total = 42,8χ2max = 4353 x (Plus petite dim.-1)Phideux = 42,8 / 4353 = 0,0098V de Cramér = Racine (χ2 / χ2max) Racine (0,0098) = 0,099 ou 9,9% du χ2 maximum
EffectifsPourcent.
Littérature
Oui Non Total
Masculin 1567,8
185292,2
2008100
Féminin 32914,0
201686,0
2345100
Total 48511,1
386888,9
4353100
EffectifsPourcent.
Romans
Oui Non Total
Masculin 34317,1
166582,9
2008100
Féminin 97841,7
136758,3
2345100
Total 132130,3
303269,7
4353100
Littérature :
Case féminin-oui
Écart = = 67,7 Ensemble du tableau χ 2 total = 42,8φ2 = 0,0098V de Cramér = 0,099
Romans :
Case féminin-oui
Écart = = 266,4 Ensemble du tableau χ 2 total = 310,3φ2 = 0,0713V de Cramér = 0,267
Type de lectureÉcart à l’indép. Khideux V de cramér % moyen
% féminin
Écart au % moyen
Romans 266,4 310,3 0,27 30,3 41,7 11,4Cuisine 104,7 119,7 0,17 9,3 13,8 4,5Littérature 67,7 42,8 0,10 11,1 14,0 2,9Livres pour enfants 29,5 39,8 0,10 2,1 3,3 1,3Décoration 25,2 23,6 0,07 2,5 3,6 1,1Poésie 14,2 6,7 0,04 2,8 3,5 0,6Policiers 30,1 5,4 0,04 19,2 20,5 1,3Actualité 4 0,3 0,01 5,0 5,2 0,2Beaux livres -0,3 0,0 0,00 2,3 2,3 0,0Livre d'art 6,7 1,4 0,02 3,1 3,4 0,3Essais -20,3 5,9 0,04 7,0 6,1 -0,9Bricolage/jardinage -30,9 16,8 0,06 5,6 4,3 -1,3Histoire -84,1 51,5 0,11 14,9 11,3 -3,6BD -78,1 65,2 0,12 9,6 6,2 -3,3Sciences & Techniques -83,5 105,4 0,16 6,5 3,0 -3,6
Ordre selon le khideux (du plus féminin au plus masculin)
EffectifsPourcent.
Littérature
Oui Non Total
Masculin 1567,8
185292,2
2008100
Féminin 32914,0
201686,0
2345100
Total 48511,1
386888,9
4353100
Q de Yule : Produits croisés
Cases à écart positif : femi-oui et masc-non 329 x 1852 = 609 308 paires d’individus
Cases à écart négatif : masc-oui et femi-non 156 x 2016 = 314 496 paires d’individus
L’écart pour les cases positives est de 609 308 - 314 496 = 294 812
Ce qui représente par rapport au nombre total de paires 609 308 + 314 496 = 923 804 une proportion de 294 812 / 923 804 = 0,319 soit 31,9% des cas
Odd
even / oddPair / impair
odd change
Oddsde l’imparité à l’inégalité
Chances : bonne situation / mauvaise situation
Cote 0,75 / 0,25 = 3 / 1 trois contre un
Risques : mauvaise situation / bonne situation
Chances = 1 / risques
EffectifsPourcent.
Littérature
Oui Non Total
Masculin 1567,8
185292,2
2008100
Féminin 32914,0
201686,0
2345100
Total 48511,1
386888,9
4353100
Odds Risques des femmes de ne pas lire de la littérature contre chances d’en lire : 86,0 / 14,0 = 6,1 contre 1
Risques des hommes de ne pas lire de la littérature contre chances d’en lire : 92,2 / 7,8 = 11,9 contre 1
Odds ratioRapport des risques11,9 / 6,1 = 1,9 : les hommes ont presque deux fois plus de risques de ne pas lire que les femmes
Rapport des chances(1/11,9) / (1/6,1) = 0,51 : les chances des hommes sont la moitié de celles des femmes
EffectifsPourcent.
Littérature
Oui Non Total
Masculin 1567,8
185292,2
2008100
Féminin 32914,0
201686,0
2345100
Total 48511,1
386888,9
4353100
Odds Risques des femmes de ne pas lire de la littérature contre chances d’en lire : 86,0 / 14,0 = 6,1 contre 1
Risques des hommes de ne pas lire de la littérature contre chances d’en lire : 92,2 / 7,8 = 11,9 contre 1
Odds ratioRapport des risques11,9 / 6,1 = 1,9 : les hommes ont presque deux fois plus de risques de ne pas lire que les femmes
Rapport des chances(1/11,9) / (1/6,1) = 0,51 : les chances des hommes sont la moitié de celles des femmes
EffectifsPourcent.
Littérature
Oui Non Total
Masculin 1567,8
185292,2
2008100
Féminin 32914,0
201686,0
2345100
Total 48511,1
386888,9
4353100
Odds Risques des femmes de ne pas lire de la littérature contre chances d’en lire : 86,0 / 14,0 = 6,1 contre 1
Risques des hommes de ne pas lire de la littérature contre chances d’en lire : 92,2 / 7,8 = 11,9 contre 1
Odds ratioRapport des risques11,9 / 6,1 = 1,9 : les hommes ont presque deux fois plus de risques de ne pas lire que les femmes
Rapport des chances(1/11,9) / (1/6,1) = 0,51 : les chances des hommes sont la moitié de celles des femmes
Type de lecture V cramér OR 1/OR Q YuleLivres pour enfants 0,10 0,17 5,72 0,703Cuisine 0,17 0,27 3,72 0,576Romans 0,27 0,29 3,47 0,553Décoration 0,07 0,35 2,87 0,483Littérature 0,10 0,52 1,94 0,319Poésie 0,04 0,61 1,63 0,241Livre d'art 0,02 0,81 1,23 0,104Policiers 0,04 0,83 1,20 0,090Actualité 0,01 0,92 1,08 0,039Beaux livres 0,00 1,01 0,99 -0,007Essais 0,04 1,33 0,75 -0,142Bricolage/jardinage 0,06 1,72 0,58 -0,265Histoire 0,11 1,85 0,54 -0,298BD 0,12 2,34 0,43 -0,401Sciences & Techniques 0,16 3,90 0,26 -0,592
Effectifs & Pourcentages
Lit des romans policiers
Age Oui Non Total
61 et + 13415,1
75684,9
890100
46-60 14417,8
66582,2
809100
36-45 16419,8
66580,2
829100
26-35 19120,1
76179,9
952100
<25 67123,1
67176,9
873100
Total 351819,2
351880,8
4353100
Londres VABL DCAP FINT SLBI DULL DEFI Total
VWEL 39 194 209 113 48 33 636
WELL 15 138 255 202 100 41 751
POOR 4 33 61 70 58 39 265
VBAD 1 10 10 22 13 17 73
Total 59 375 535 407 219 130 1725
2) Londres 1911Kendal & Stuart (1961 : 558) : enquête faite à Londres en 1911
The table (shows the distribution of 1725 school children who were classified :(1) according to their standard of clothing (Very well clad, Well clad, Poor but passable, Very badly clad), and (2) according to their intelligence (Very able, Distinctly capable, Fairly intelligent, Slow but intelligent, Dull, Mentally deficient or slow and dull)
Kendal, M. and Stuart, A (1961). The Advanced Theory of Statistics, Volume 2, London : C. Griffin and C°.
Londres VABL DCAP FINT SLBI DULL DEFI Total
VWEL396,1
9430,5
20932,9
11317,8
487,5
335,2
636100
WELL152,0
13818,4
25534,0
20226,9
10013,3
415,5
751100
POOR4
1,533
12,561
23,070
26,458
21,939
14,7265100
VBAD1
1,410
13,710
13,722
30,113
17,817
23,373
100
Total593,4
37521,7
53531,0
40723,6
21912,7
1307,5
1725100
Londres : ligne de crête des écarts au pourcentage moyen
Londres VABL DCAP FINT SLBI DULL DEFI
VWEL 17,2 55,7 11,7 -37,1 -32,7 -14,9
WELL -10,7 -25,3 22,1 24,8 4,7 -15,6
POOR -5,1 -24,6 -21,2 7,5 24,4 19,0
VBAD -1,5 -5,9 -12,6 4,8 3,7 11,5
Londres : ligne de crête des écarts positifs à l’indépendance
Paires concordantes
Intel+ Intel= Intel- Total
HabitsSup 233 322 81 636
HabitsInf 201 620 268 1089
Total 434 942 349 1725
Londres 2 lignes x 3 colonnes
Paires discordantes
Intel+ Intel= Intel- Total
HabitsSup 233 322 81 636
HabitsInf 201 620 268 1089
Total 434 942 349 1725
Paires concordantes233 x 620 = 144 460233 x 268 = 62 444322 x 268 = 86 296Total 293 200
Paires discordantes201 x 322 = 64 722201 x 81 = 16 281620 x 81 = 50 220Total 131 223
Indice gamma : différences entre concordantes et discordantes sur total des pairesConcord - Discord = 293 200 - 131 223 = 161 977Concord + Discord = 293 200 + 131 223 = 424 423
Gamma = 161 977 / 424 423 = 0,382
Goodman, L. A. and Kruskal, W. H. (1954). Measures of Association for Cross Classifications. Journal of the American Statistical Association, 49, 732-764.
Effectifs FO CFDTNon-Synd
CGT Auto CFTCNon-Vote
Total
Très confiance 14 24 12 137 11 4 6 208Plutôt confiance 38 43 22 137 40 12 45 337
Plutôt pas confiance 15 7 19 25 25 4 34 129Pas conf. du tout 11 13 38 18 25 3 62 170
Total 78 87 91 317 101 23 147 844
Écarts à l’indépendance
FO CFDTNon-Synd
CGT Auto CFTCNon-Vote
Très confiance -5,2 2,6 -10,4 58,9 -13,9 -1,7 -30,2Plutôt confiance 6,9 8,3 -14,3 10,4 -0,3 2,8 -13,7
Plutôt pas confiance 3,1 -6,3 5,1 -23,5 9,6 0,5 11,5Pas conf. du tout -4,7 -4,5 19,7 -45,9 4,7 -1,6 32,4
3) Ouvrier français 1970 : Confiance dans les syndicats
Adam, G. Bon,F. Capdevielle, J. Mouriaux, R.(1970). L’ouvrier français en 1970, Paris, Presses de la FNSP.
Écarts lignes permutées CGT CFDT CFTC FO Auto
Non-Synd
Non-Vote
Très confiance 58,9 2,6 -1,7 -5,2 -13,9 -10,4 -30,2
Plutôt confiance 10,4 8,3 2,8 6,9 -0,3 -14,3 -13,7
Plutôt pas confiance -23,5 -6,3 0,5 3,1 9,6 5,1 11,5
Pas conf. du tout -45,9 -4,5 -1,6 -4,7 4,7 19,7 32,4
Écarts lignes permutées CGT CFDT CFTC FO Auto
Non-Synd
Non-Vote
Très confiance 58,9 2,6 -1,7 -5,2 -13,9 -10,4 -30,2
Plutôt confiance 10,4 8,3 2,8 6,9 -0,3 -14,3 -13,7
Plutôt pas confiance -23,5 -6,3 0,5 3,1 9,6 5,1 11,5
Pas conf. du tout -45,9 -4,5 -1,6 -4,7 4,7 19,7 32,4
Somme des écarts positifs = 176,3
4) Liaisons locales, liaisons globales : le PEM Pourcentage de l’Écart Maximum
4.1 Le PEM local
Observé CGT CFDT CFTC FO AutoNon-Synd
Non-Vote Total
Très confiance 137 24 4 14 11 12 6 208
Plutôt confiance 137 43 12 38 40 22 45 337
Plutôt pas confiance
25 7 4 15 25 19 34 129
Pas conf. du tout 18 13 3 11 25 38 62 170
Total 317 87 23 78 101 91 147 844
Case CGT- Très confiance :Observé 137Théorique 317 x 208 / 844 = 78,1Ecart au théo. 137 – 78,1 = 58,9
Maximum 208Théorique 317 x 208 / 844 = 78,1Écart au théo. 208 – 78,1 = 129,9
L’écart observé représente par rapport au maximum une proportion de 58,9 / 129,9 = 0,453 soit en pourcentage 45,3%PEM = 45,3%
PEM CGT CFDT CFTC FO Auto
Non-Synd
Non-Vote
Très confiance 45,3 3,9 -29,4 -27,2 -55,8 -46,5 -83,4
Plutôt confiance 5,5 15,8 20,4 14,6 -0,8 -39,5 -25,3
Plutôt pas confiance
-48,4 -47,4 2,5 4,7 11,2 6,6 10,8
Pas conf. du tout -71,8 -25,8 -35,2 -30,0 5,8 27,1 27,6
Ensemble des PEM positifs et négatifs
PEM CGT CFDT CFTC FO Auto
Non-Synd
Non-Vote
Très confiance 45,3 3,9 -29,4 -27,2 -55,8 -46,5 -83,4
Plutôt confiance 5,5 15,8 20,4 14,6 -0,8 -39,5 -25,3
Plutôt pas confiance
-48,4 -47,4 2,5 4,7 11,2 6,6 10,8
Pas conf. du tout -71,8 -25,8 -35,2 -30,0 5,8 27,1 27,6
PEM positifs sur plan factoriel 1 - 2
4.2 Le PEM global : recherche du maximum
Début CGT CFDT CFTC FO AutoNon-Synd
Non-Vote Total
Très confiance 208 x x x x x x 208
Plutôt confiance 337Plutôt pas confiance
129
Pas conf. du tout 170
Total 317 87 23 78 101 91 147 844
Fin CGT CFDT CFTC FO AutoNon-Synd
Non-Vote Total
Très confiance 208 x x x x x x 208
Plutôt confiance 109 87 23 78 40 x x 337Plutôt pas confiance
x x x x 61 68 x 129
Pas conf. du tout x x x x x 23 147 170
Total 317 87 23 78 101 91 147 844
Écarts (si max) CGT CFDT CFTC FO Auto Non-SyndNon-Vote
Très confiance 129,9
Plutôt confiance 52,3 13,8 46,9
Plutôt pas confiance 45,6 54,1
Pas conf. du tout 4,7 117,4
Liaison Max CGT CFDT CFTC FO AutoNon-Synd
Non-Vote Total
Très confiance 208 208
Plutôt confiance 109 87 23 78 40 337
Plutôt pas confiance 61 68 129
Pas conf. du tout 23 147 170
Total 317 87 23 78 101 91 147 844
Eff. Théo. CGT CFDT CFTC FO AutoNon-Synd
Non-Vote
Très confiance 78,1 21,4 5,7 19,2 24,9 22,4 36,2
Plutôt confiance 126,6 34,7 9,2 31,1 40,3 36,3 58,7
Plutôt pas confiance 48,5 13,3 3,5 11,9 15,4 13,9 22,5Pas conf. du tout 63,9 17,5 4,6 15,7 20,3 18,3 29,6
Somme des écarts positifs dans le cas du maximum = 464,5
Rappel : somme des écarts positifs observés= 176,3PEM global = 176,3 / 464,5 x 100 = 37,9%
Femmes
Hommes Ver Poi Bel Tau Gém Can Lio Vie Bal Sco Sag Cap Total
H-Verseau 536 478 518 535 532 500 451 478 478 413 430 502 5851
H-Poisson 482 592 536 541 525 506 484 463 503 475 443 482 6032
H-Bélier 555 560 596 584 525 508 543 452 525 461 451 521 6281
H-Taureau 511 508 582 607 552 523 527 462 490 448 438 460 6108
H-Gémaux 488 497 557 520 577 496 469 461 433 433 421 458 5810
H-Cancer 487 508 512 530 478 504 446 436 462 397 420 456 5636
H-Lion 456 502 522 482 478 461 466 431 455 440 402 472 5567
H-Vierge 445 463 489 500 426 464 413 457 409 381 395 434 5276
H-Balance 490 494 482 493 481 450 482 406 494 392 449 440 5553
H-Scorpion 441 437 459 483 464 433 426 382 434 392 432 401 5184
H-Sagittaire 455 445 475 436 456 423 411 395 443 377 419 435 5170
HCapricorne 498 496 445 554 456 461 443 398 469 411 398 494 5523
Total 5844 5980 6173 6265 5950 5729 5561 5221 5595 5020 5098 5555 67991
5) Le signe des conjoints
Cibois, Ph. (1997). Les pièges de l'analyse des correspondances, Histoire & Mesure, 12 (3/4), pp. 299-320.
Femmes
Hommes Ver Poi Bel Tau Gém Can Lio Vie Bal Sco Sag Cap
H-Verseau 33 20 29 24
H-Poisson 61 30
H-Bélier 15 26 29
H-Taureau 27 44 17 27
H-Gémaux 30 69 15
H-Cancer 12 11 29
H-Lion 12 17 11 29 17
H-Vierge 10 14 19 52H-Balance 13 28 37 33H-Scorpion 10 9 43
H-Sagittaire 11 18 31 13
HCapricorne 23 10 45 15 43
Ecarts à l’indépendance positifs supérieurs à 9
PEM global = 2,0% Première valeur propre = 0,0006
PEM 1ère VP GammaV de
CramérCramér*
Khi-deux
p=
Londres 2 lignes
3 colonnes26,6% 0,049 0,382 0,220 0,0485 83,63 0,000
Londres 4 lignes
6 colonnes23,3% 0,079 0,332 0,184 0,0338 174,82 0,000
Confiance Syndicats
37,9% 0,238 0,525 0,295 0,0873 221,05 0,000
Signes Conjoints
2,0% 0,0006 0,017 0,014 0,0002 139,17 0,124
* Cramér (1946 : 282) : « φ2 / q-1 may be used as a measure, on a standardized scale, of the degree of dependance between the variables ». [q est la plus petite dimension du tableau]
Cramér, H. (1946). Mathematical Methods of Statistics. Princeton Univ. Press.
Comparaisons entre indices
Harald Cramér, Mathematical Methods of Statistics,Princeton, PUP, 1946, p. 444
Kr = χ2/n/(min(nb lignes, nb col) -1)= 568,5/ (25263 x 3) =0,00750
0-1M 1-2M 2-3M +M3
OENF 9558 9558
1ENF 11110 11110
2ENF 3635 3635
3ENF 778 778
4E1+ 182 182
9558 11110 3635 969 25263
Χ2 = 75789 = n x 3
0-1M 1-2M 2-3M +M3
OENF 1339 5173 3046 9558
1ENF 1521 9589 11110
2ENF 3635 3635
3ENF 778 778
4E1+ 182 182
6116 10928 5173 3046 25263
Χ2 = 35867,65
Khi2/Khi2max = 568,5 / 35867,65=0,016PKM = 1,6% (PEM = 10,7%)
S
Marge modifiée