dfmg3 sha.mcs.quanti méthode quantitative. dfmg3 plan du cours rappels sur la méthode scientifique...
TRANSCRIPT
DFMG3
SHA.MCS.Quanti
Méthode Quantitative
DFMG3
Plan du Cours
• Rappels sur la méthode scientifique en Sciences de la Vie
• Rappels sur le raisonnement• Rappels sur les principaux outils statistiques –
tests - intervalle de confiance• La causalité
DFMG3
théorie scientifique et justification (rappels)
• Popper– Une théorie scientifique ne représente
• ni une vérité
• ni même un de ses fragments
– Provisoire, elle contribue à un paradigme susceptible d'être réfuté à tout moment par des mises à l'épreuve successives
– Plus elle est solide, plus elle résistera et sera corroborée
Une propriété fondamentale
de toute théorie scientifique
est d'être réfutable corr
obor
atio
n
démonstrationde la
faussetéde la théorie
Théorie corroborée(mais jamais AVEREE)
réfutationessai deréfutation
…
réfutationessai deréfutation
réfutation
THEORIE
énoncés réfutables
hypothèse
hypothèse
hypothèse
corr
obor
atio
nco
rrob
orat
ion
démonstrationde la
faussetéde la théorie
Théorie corroborée(mais jamais AVEREE)
Théorie corroborée(mais jamais AVEREE)
réfutationessai deréfutation
…
réfutationessai deréfutation
réfutation
réfutationessai deréfutation
réfutationréfutationessai deréfutationessai de
réfutation
……
réfutationessai deréfutation
réfutationréfutationessai deréfutationessai de
réfutation
réfutationréfutation
THEORIE
énoncés réfutables
THEORIE
énoncés réfutablesénoncés réfutables
hypothèse
hypothèse
hypothèse
hypothèse
hypothèse
hypothèse
hypothèse
hypothèse
hypothèse
DFMG3
la démarche expérimentale (rappels)
méthode expérimentale• émettre une hypothèse:
cause effet
• écrire un protocole: conditions + hypothèse + méthode
• tester l’hypothèse par expériences construites répétées à l’identique
–Faire le bilan des variables ayant une action sur le système étudié et isoler le système
–Monter une situation où toutes les variables sont fixes sauf 2
(la cause et l’effet à observer)
–Appliquer la cause et observer la relation entre cause et effet
• valider ou invalider l’hypothèse
en sciences de la vie• obligatoire
• Obligatoire
• Difficile
• paramètres non tous connus
• multitude de paramètres difficiles à isoler + variabilité effet
relation cause - effet sera entachée d’un aléa résultant de l’action des variables non maîtrisées dans l’expérience: incertitude
DFMG3
variabilité
Instrumentale(technique de mesure)
Pré-instrumentale(technique prélèvement)
variabilitéanalytique
variabilitébiologique
Intra-sujet
Inter-sujet
génétiquephénotypeenvironnement(, , social)
fonde la notion de HASARD et d’INCERTITUDE
d’ALEATOIRE
CAUSE
EFFET
autrescauses inconnues
connues
valeur différente selon les individusnb
0
200
400
600
800
1000
1200
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
DFMG3
la démarche en sciences de la vie (rappels)
se rapprocher de la méthode expérimentale – émettre une hypothèse– écrire un protocole: conditions + hypothèse + méthode
– tester l’hypothèse par une « expérimentation »• Sur groupe(s) de sujets aussi déterminé(s) que possible
= échantillon(s)• Effectuer les mesures
– Calculer et comprendre les résultats • valider ou invalider l’hypothèse sur le(s) groupe(s)• en tenant compte de l’incertitude • due à la variabilité des mesures de l’effet chez chaque patient car
on ne peut « fixer » tous les paramètres causaux
– Généraliser à une population
DFMG3
Contraintes et conséquences
• Contraintes: causes souvent intriquées et effets variables (gradient) selon les individus
• Expérimentation sur groupe(s)– «similaires» pour les autres causes connues– permettant de simuler un individu «type»
• Aléa ou Incertitude– «modéliser» l’aléa ou incertitude ? – «raisonner» et «statuer» sous incertitude ?
• Généralisation– «généraliser» sous incertitude ? TESTS
DFMG3
Plan du Cours
• Rappels sur la méthode scientifique en Sciences de la Vie
• Rappels sur le raisonnement– Exemple– Echantillon et population– Variables– Tests & risques
• Rappels sur les principaux tests• La causalité
DFMG3
Statuer sous incertitude: exemple
lignée de souris présentant 20% de tumeurs malignes spontanées
sur 1 échantillon de 100 souris
substance X
Observé:
31 souris avec tumeur maligne
Question: la substance X est-elle cancérigène ?
DFMG3
Statuer sous incertitude: exemple
lignée de souris présentant 20% de tumeurs malignes spontanées
100 échantillons de 100 souris
fluctuations d’échantillonnage
100 échantillons de 100 souris
% lots
31
20
% lots
31
20substance X
% lots
31
% lots
% lots
31
tous les échantillons ne sont pas à 20% de tumeurs31% est une valeur possible
on aurait pu observer une autre valeur que 31%20% est une valeur observable
DFMG3
Statuer sous incertitude: exemple
lignée de souris présentant 20% de tumeurs malignes spontanées
constaté: 31 souris avec tumeur maligne
échantillon de 100 souris
substance X
Question: la substance X est-elle cancérigène ?
• on a constaté une différence : 31% - 20% = 11%– mais existent les « fluctuations d’échantillonnage
• Question– A-t-on beaucoup de chances d’observer au moins cette différence si X n’est pas
cancérigène?– à partir de quelle probabilité peut-on considérer X comme cancérigène ?– cette probabilité « seuil » sera le « risque d’erreur »– conclure en fonction du « seuil de significativité » que l’on s’est donné
DFMG3
• Faire un test statistique (cad: tenant compte des fluctuations d’échantillonnage)
– qui donnera la probabilité d’observer au moins cette différence si X n’est pas cancérigène?
– conclure en fonction du « seuil de significativité » que l’on s’est donné
• Raisonnement– hypothèse (nulle) X non cancérigène = l’échantillon provient au
hasard de la population avec taux 20%– Test: Comparaison fréquences
• Calcul probabilité(H0) P = 0,06
– Conclusion / seuil (5%)• P > 0,05 donc non rejet de H0 (H0 n’est pas réfutée)
– Conclusion clinique: on ne peut pas dire S cancérigène
Statuer sous incertitude: exemple
DFMG3
Plan du Cours
• Rappels sur la méthode scientifique en Sciences de la Vie
• Rappels sur le raisonnement– Exemple
– Echantillon et population– Variables– Tests & risques
• Rappels sur les principaux tests• La causalité
DFMG3
Série statistique
collection d’objets, éléments, individus– de même nature– suffisamment semblables pour pouvoir être étudiés
ensemble– soumise à des critères inclusion et non-inclusion– exemples
• ensemble de patients diabétiques âgés de 15 à 30 ans
• ensemble de cellules infectées par le VIH
• ensemble de résultats de glycémie
• analyse portera sur les caractéristiques communes aux éléments de la série dont la valeur varie selon les individus– exemple: sexe, valeur de la glycémie …
DFMG3
Population & Echantillon
• Population: série exhaustive– finie (étudiants en PACES en 2011-2012)
– infinie ou très grande• connue (étudiants en France en 2010)
• inconnue (patients atteints par le VIH)
– valeurs en population souvent inconnues
• Échantillon: sous-ensemble fini– extrait d’une population
échantillonnage
DFMG3
échantillonner ?
• But des études / expérimentations– émettre des conclusions valables en population– connaître les propriétés des variables dans la population
• Échantillonnage nécessaire– si population infinie
– si les ressources de l’étude sont limitées
– si attente d’avoir tous les individus impossible• exemple: tester un médicament contre le cancer du sein
– si la mesure de la variable étudiée est destructrice• exemple: mesurer la durée de vie d’un objet manufacturé sur tous les
objets: plus rien à vendre à la fin !!!
• Échantillonnage représentatif nécessaire
DFMG3
échantillon représentatif ?
• Sous-ensemble extrait de la population ressemblant le plus possible à celle-ci
• par tirage au sort ou tirage aléatoire– = prélever au hasard une fraction de la population
– chaque individu a la même chance d’être choisi que les autres
– procédure objective
– moyens: pile ou face, boule dans une urne (loto), table de nombres aléatoires …
– exemple: échantillon aléatoire des étudiants
– numérotation de 1 à 10000 des étudiants
• tirage par table de nombres au hasard de 100 numéros
• les étudiants correspondants forment un échantillon aléatoire de 100 sujets extrait de la population des étudiants
DFMG3
Relations échantillon aléatoire # population
• Échantillon E simple tiré au hasard de population P
• n observations indépendantes Xi
– obtenues par• tirage avec remise, ou• tirage sans remise mais grande population
– donc de même loi de probabilité que celle de la population
• Pour le raisonnement, on prend une variable d’intérêt quantitative: Tension Artérielle Systolique (TAS)
– Population: moyenne =14, écart-type =2
– Échantillon: moyenne m, écart-type s
DFMG3
• Mesure de Tension Artérielle Systolique (TAS)• Tous les individus
n’ont pas la même TAS
• Que dire de la TAS sur un ensemble d’individus ?
représentée par 2 valeurs– Valeur moyenne de la TAS
– Ecart-type montrant la dispersion vis à vis de la moyenne
• Dans l’exemple:
– Population: moyenne =14, écart-type =2
– Échantillon: moyenne m, écart-type s
Relations échantillon randomisé # population
2 3 2 4 5 820 25
43
80
149
286
379
447 448
339
207
141
50
27
6 20
50
100
150
200
250
300
350
400
450
500
700
900
1100
1300
1500
1700
1900
2100
2300
2500
2700
2900
3100
3300
3500
3700
3900
4100
4300
4500
4700
> 4
900
Poids de naissance
Nb
de
nou
veau
-nés
2 3 2 4 5 820 25
43
80
149
286
379
447 448
339
207
141
50
27
6 20
50
100
150
200
250
300
350
400
450
500
700
900
1100
1300
1500
1700
1900
2100
2300
2500
2700
2900
3100
3300
3500
3700
3900
4100
4300
4500
4700
> 4
900
Poids de naissance
Nb
de
nou
veau
-nés
moyenne
écart-type
DFMG3
• Plus la taille des échantillons est grande, plus la distribution de la moyenne m est étroite autour de
Relations échantillon aléatoire # population
nb
0
200
400
600
800
1000
1200
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
4000 échantillons de taille 100
nb
0
200
400
600
800
1000
1200
1400
1600
1800
2000
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
4000 échantillons de taille 1000
DFMG3
Intérêt & inconvénients des échantillons
• Intérêt – Aléatoire: représentatif de la population
• Inférence des valeurs globales en population avec leur écart-type (variance)
• évite les biais de sélection (choix des « bons patients »)
– Coûts plus faibles– Meilleur taux de réponses– Données de meilleure qualité– Rapidité des résultats– Seul utilisable si « analyse destructrice »
• Inconvénient– Parfois échantillon de grande taille nécessaire– Imprécision
DFMG3
Des échantillons comparables …
• Randomisation– Tirage au sort de la répartition entre les échantillons– Permet de «répartir de façon équilibrée»
• les sujets et donc • les variables qui jouent sur la relation cause-effet
– L’aléa, l’incertitude, encore appelé « hasard » (cad effet des variables autres que la cause sur la relation)
• a alors un caractère probabiliste• pourra être « modélisé mathématiquement » par des tests et des
intervalles de confiance
– On pourra alors juger, en probabilité (« d’avoir raison quand on dit l’effet est lié à la cause »)
DFMG3
Des échantillons comparables …
• La randomisation– Permet d’éviter les biais de sélection
(ex: éviter de choisir seulement des patients « bons répondeurs » à un traitement)
– Permet de travailler sur des échantillon(s) comparables sur tout sauf la cause
– Autorise la comparaison des groupes et des résultats– Permet de «généraliser» à la population les résultats
obtenus (l’existence ou non d’une relation entre une cause et un effet)
DFMG3
Intervalle de confiance (IC)
• à partir d’un échantillon, on aura une estimation ponctuelle d’un paramètre– exemple: taille moyenne des individus de l’échantillon
• Mais– Cet échantillon n’est qu’un des échantillons possibles tirés de la
même population– L’estimation ponctuelle n’est qu’une des estimations possibles
• intervalle de confiance à 95% du paramètre– intervalle de valeurs qui a 95% de chance de contenir la vraie
valeur du paramètre estimé– cad l'ensemble des valeurs raisonnablement compatibles avec le
résultat observé (l’estimation ponctuelle)– donne une visualisation de l’incertitude de l’estimation.
DFMG3
Intervalle de confiance (IC) exemple
•Etude– essai thérapeutique entre molécule et placebo– Critère de jugement: réduction relative de mortalité
•Résultat: RRR = 0,2 [IC95: 0,05 – 0,35]– Signifie
• Il y a 95 chances sur 100 d’observer une valeur de réduction relative de la mortalité entre 5% et 35%
DFMG3
Plan du Cours
• Rappels sur la méthode scientifique en Sciences de la Vie
• Rappels sur le raisonnement– Exemple– Echantillon et population
– Variables– Tests & risques
• Rappels sur les principaux tests• La causalité
DFMG3
Variable
• Elément– mesurable / comptable– dont la mesure peut prendre différentes valeurs– exemple
• Taille d’un individu• Nombre d’étudiants• Présence de séquelles
• Caractéristiques– Type: quantitative, qualitative, censurée– Plage / ensemble de valeurs possibles– Dimension: unité de valeurs
• Aléatoire si– la valeur de la mesure, pour un sujet donné, ne peut être prédite
avec certitude– donc à laquelle est associée une loi de probabilité
DFMG3
Variable: Types
Qualitative–Valeur = une parmi des catégories exclusives–Qualitative nominale : catégories sans relation d’ordre
ex : groupe sanguin, couleur des yeux
• dichotomique ( booléenne, binaire) ex : sexe
–Qualitative ordinale : catégories ordonnéesex : score douleur (nulle-modérée-forte), protéinurie (0,+,++
…)
•Remarques–On peut «éclater une variable à K catégories» en K-1 variables binaires–Aucune opération mathématique n’a de sens–Les opérations logiques entre catégories ont un sens pour une variable
qualitative ordinale–Les effectifs cumulés entre catégories ont un sens pour une variable
qualitative ordinale
DFMG3
Variable: Types
Quantitative : – Valeur = résultat de la mesure d'une quantité – Quantitative continue
• Valeur est exprimée par un nombre réel
ex : taille, poids, glycémie
• Nombre infini de valeurs possibles entre 2 valeurs quelconques
– Quantitative discrète• Valeur est exprimé par un nombre entier
ex : nombre d’enfants, nb de selles/jour
• Nombre fini de valeurs
•Remarques– On peut transformer une V quantitative en V qualitative ordinale en déterminant
des seuils (déterminer des classes de valeurs)
– Cette transformation induit une perte d’information
– Les opérations mathématiques et logiques ont un sens
DFMG3
Variable: types
• Censurée : survenue d’un événement– Double valeur:
• Présence ou absence de l’événement• Délai d’apparition de l’évènement
– similaire à 2 variables associées ex : Survenue d’un décès dans l’année qui suit opération
comptage du décès (qualitatif)
délai de survenue du décès (quantitatif)
ex : Survenue d’une séquellecomptage de la séquelle (qualitatif)
délai de survenue de la séquelle (quantitatif)
DFMG3
Variable: représentation des valeurs
• suspension de virus de la mosaïque du tabac– inoculée à des plants de tabac
– génotypiquement identiques
– sur une feuille de même rang entre les nervures d'un rang donné
– Mesure du temps de latence de la maladie (en jours)
Temps variable (13-34j)Malgré
conditions standardisées
=Variabilité biologique
valeur centrale
écarts
Tps de latence de l’échantillon = valeur centrale ± valeur d’écart
paramètresde position
paramètresde dispersion
graphique
DFMG3
Statistiques descriptives
Paramètres théoriques
Paramètres observés
Ensemble exhaustif de sujets dont on a
défini les caractéristiques
Sous-ensemble fini issu d’une
population
sélectionreprésentativité
tirage au sortpopulation échantillon
Paramètres de position
Paramètres de dispersion
DFMG3
Plan du Cours
• Rappels sur la méthode scientifique en Sciences de la Vie
• Rappels sur le raisonnement– Exemple– Echantillon et population
– Variables – Tests & risques
• Rappels sur les principaux tests• La causalité
DFMG3
Statuer sous incertitude
?
Pour une variable X : on connaît les paramètres dans la population à quoi peut-on s’attendre dans un échantillon ?
population échantillontirage au sort
?
Pour une variable X : on a calculé les paramètres dans un échantillon à quoi peut-on s’attendre dans la population ?
population échantillontirage au sort
Pour une variable X : on a calculé les paramètres dans 2 échantillons peut-on conclure à un effet de la cause dans la population ?
population effet ? CAUSE
+
-
échantillon 1tirage au sort
échantillon 2tirage au sort
DFMG3
Statuer sous incertitude: exemple
• Étude
• question• Problématique• Hypothèses
–H0 (hypothèse nulle)
–H1 (hypothèse alterne)• Sous H0 : Test statistique
–Choix–Vérification conditions–Calcul de petit p = degré de signification
• Conclusion / seuil –Seuil–Conclusion / hypothèses
• Conclusion clinique
• Population 20% K• Échantillon 31% K• Substance X cancérigène?• Comparaison % obs à % th
– Echantillon aléatoire issu de la population avec taux 20% (=X non cancérigène)
– Inverse
– Comparaison fréquence obs à th– N grand
– P = 0,06
– 5% = 0,05– P > 0,05 donc non rejet de H0
Test statistique = test d’hypothèse
DFMG3
étapes des tests
1. Énoncé de la problématique– question– type de problème statistique (population, échantillons, type de variable)
– choix du seuil de signification = risque (en général 5%)
2. Hypothèses– toujours formulées en termes de population car
• fluctuations d’échantillonnage
• on veut conclure sur la (les) population(s) dont est/sont extrait(s) le(s) échantillon(s) observé(s)
– toujours 2 hypothèses•hypothèse nulle (H0) : « rien ne change, pas d’effet … »
– échantillon(s) extrait(s) au hasard de la même population
– en général = inverse de ce que l’on cherche à montrer•hypothèse alternative (H1)
– échantillon(s) non extrait(s) au hasard de la même population
DFMG3
étapes des tests
3. H0 est supposée vraie (démarche expérimentale) et calcul de petit p (degré de signification = proba d’avoir au moins une différence égale à celle observée) au moyen d’un test statistique
–Choix du test–vérification conditions
• nombre de sujets• normalité de distribution des variables
4. Conclusion statistique– p > : non rejet de H0– p : rejet de H0 au risque p
5. Évaluation des biais éventuels– biais de sélection– biais de classement– biais de confusion
6. Conclusion clinique
cf cours biais
DFMG3
Risques et règles de décision
• avant la décision …– Supposition H0 vraie (hypothèse à réfuter)
– Test effectué donnant• p (p-value): degré de signification• = probabilité d’avoir une différence au moins égale à celle observée
• Règle de décision– Si p : H0 peu probable rejet de H0 au risque p
– Si p > : H0 probable non rejet de H0 au risque p
0
seuil
écart-réduit
non rejet de H0 rejet de H0
H0 vraie
p
DFMG3
• risque α– Seuil de signification ou risque de 1ère espèce ou erreur de type 1– probabilité de rejeter H0 alors que H0 est vraie– exemple: risque de considérer un produit actif alors qu’il est inactif
– Fixé a priori avant le test• en général 5% (mais < 5% dans les essais thérapeutiques si nouveau produit toxique)
• risque β– risque de 2ème espèce ou erreur de type II– probabilité de ne pas rejeter H0 alors que H1 est vraie– exemple: risque de considérer un produit inactif alors qu’il est actif
– Fixé a priori avant le test• en général < 20% (parfois > 20% si comparaison de 2 produits à toxicité et coût similaires)
décision
rejet de H0 non rejet de H0
réalitéH0 est vraie risque α
faux positifs1- α
H1 est vraie 1-β (puissance) risque βfaux négatifs
Risques et règles de décision
DFMG3
Degré de signification et conclusion statistique
Comparaison de 2 traitements
différence cliniquement intéressanteou non cliniquement intéressante
rejet de H0
(différence statistiquement significative)
c’est peut être
vrai(1-β)
c’est peut être
faux(α)
non rejet de H0
(différence non statistiquement significative)
C’est peut être par manque de puissance
(β)
La différence est peut être suffisamment
faible(1- α)
DFMG3
règles de décision à 5%
– Si p (5%) : H0 peu probable rejet de H0 au risque p
– Si p > (5%) mais p 10% : H0 probable non rejet de H0 au risque p
mais tendance à la significativité
– Si p > (5%) : H0 probable non rejet de H0 au risque p
Seuil(5%)
0 écart-réduit
non rejet de H0 rejet de H0
H0 vraie
p
10%
tendance
DFMG3
Plan du Cours
• Rappels sur la méthode scientifique en Sciences de la Vie
• Rappels sur le raisonnement
• Rappels sur les principaux tests• La causalité
DFMG3
Les tests
• Choix du test statistique dépend– de la question: comparaison, liaison – des types des variables: quantitative, qualitative, censurée
• Variable à expliquer (effet)• Variables explicatives (cause, facteurs de confusion)
– des lois de probabilité suivies par les variables– de la taille du/des échantillon(s)
• petits• grands (N > 30)
• mais – sont toujours des tests d’hypothèse– demandent de suivre la même démarche
DFMG3
Tests: variables qualitatives
Comparaison Fréquence (%) observée à
fréquence (%) théorique
H0 : F = Fth
H1 : F Fth Écart-réduitChi2 de PearsonFischer exact
exemple: le % de diabétiques à Montpellier est-il le même que dans la population française ?
question, variables hypothèses tests
ComparaisonK fréquences observées
séries appariées
H0 : égalité FT1 = F T2
H0 : différence F T1 F T2 Chi2 de Mc Nemar
exemple: % de fumeurs est-il constant avant et après une nouvelle méthode de sevrage ?
ComparaisonK fréquences (%) observées
échantillons indépendants
H0 : FA = FB = FC
H1 : au moins une F est Chi2 de Pearson Fischer exact
exemple: % d’asthmatiques identiques dans 5 capitales européennes ?
Liaison/relationdeux variables qualitatives
H0 : Indépendance, OR = 1H1 : Liaison, OR 1
Chi2 de Pearson IC1- de OR
Fisher exact
exemple: maladie coronarienne et sexe ?
DFMG3
Tests: variables quantitatives
Comparaison2 moyennes observées 2 séries appariées
H0 : égalité µT1 = µ T2
H1 : différence µ T1 µ T2
Student apparié, paired T testWilcoxon apparié, test des signes (sign ou signed rank test)
exemple: VEMS avant et après réadaptation à l’effort
Comparaisonmoyenne observée à
moyenne théorique
H0 : µ = µth
H1 : µ µth
Écart-réduitStudent, T test
exemple: taux de glycémie des enfants « obèses » est-il dans la normale ?
question, variables hypothèses tests
Comparaison2 moyennes observées 2 échantillons indépendants
H0 : µA = µB
H1 : µA µB Écart-réduitStudent, T testMann-Whitney,
exemple: VEMS chez les asthmatiques selon le statut addiction au tabac
Comparaison2 variances observées 2 séries appariées
H0 : égalité vT1 = vT2
H1 : différence v T1 v T2
Test F
exemple: variance TAS entre 2 groupes : sain # atteint de drépanocytose
DFMG3
Tests: variables quantitatives
ComparaisonK moyennesÉchantillons indépendants
H0 : indépendance, µA = µB = µC
H1 : liaison, au moins une µ est ANOVAKruskall-Wallis
exemple: groupe sanguin et carence martiale
Liaison2 variables quantitatives
H0 : Indépendance, = 0H1 : Liaison, 0
Coefficient de corrélation linéaire de Pearson
de Spearman exemple: taux de CD4 et charge virale chez les HIV naïfs de traitement
question, variables hypothèses tests
DFMG3
X et Y = 2 variables aléatoires continues– événement élémentaire [x< X <x+dx , y< Y <y+dy]– probabilité : P (x< X <x+dx , y< Y <y+dy) = f(x,y)dx.dy x = E(X) espérance de X y
x2 = V(X) variance de X y
Y = E(Y) espérance de Y x
y2 = V(Y) variance de Y x
– Cov(X,Y) = E[(X- x)(Y- Y)] covariance théorique de X et de Y
Corrélation linéaire 2 variables quantitatives
f(x,y)
x yx
f(x)
loi de Laplace-Gaussà deux dimensions
DFMG3
Corrélation linéaire - population
• Coefficient de corrélation linéaire théorique
– Valeur:
– Propriétés• nombre sans dimensions
• 0 1 ou –1 +1
• renseigne sur l’indépendance entre X et Y
– Si = 1 alors Y = aX +b
(dépendance totale)
– Si X et Y indépendants (en proba) alors Cov(X,Y)=0
donc = 0
attn : l’inverse n’est pas vrai
– Si > 0 alors X et Y varient dans le même sens
– Si < 0 alors X et Y varient en sens contraire
yx
)Y,Xcov(
DFMG3
Corrélation linéaire - échantillon
– Un échantillon de taille N– 2 variables aléatoires X et Y mesurées sur les mêmes sujets
• 1er sujet x1 y1
• 2ème sujet x2 y2
• …• Nième sujet xN yN
– Valeurs calculées
N
xm
ix
1N
)mx(s
2xi
x
N
ym
iy
1N
)my(s
2yi
y
2yi
2xi
yixi
)my()mx(
)my)(mx(r
Mêmes propriétés que
DFMG3
• Statistique inférentielle– r est une variable aléatoire– Seul point abordé
• comparaison de r à la valeur théorique 0
• en considérant que cela revient à tester l’indépendance
• à la condition que les deux variables X et Y soient normales
– Problème• échantillon taille N
– 2 variables normales X et Y
– coefficient observé r
• Hypothèses
– H0: E avec r provient au hasard de Pop avec = 0
– H1: E avec r provient au hasard de Pop avec 0
• Calcul de r
• Lecture dans la table à (N-2) ddl
Corrélation linéaire - échantillon
DFMG3
Plan du Cours
• Rappels sur la méthode scientifique en Sciences de la Vie
• Rappels sur le raisonnement• Rappels sur les principaux tests
• La causalité
DFMG3
et la conclusion …
mesureeffet
randomisation
cause
E1 E2
test
RESULTATstatistique
Conclusion généralisable si
Mesure effet valide, fiableNombre de sujets suffisantsBonne randomisationPeu de perdus de vueTest statistiques adéquatsAbsence de biais
CONCLUSION CLINIQUE ….
DFMG3
Et généraliser ….
généralisation (si possible)
inférence statistique
résultats
Population CIBLE
Population SOURCE
retraits en cours d’étude
groupes / échantillons étudiés inclus
Critères d'inclusion Critères de non-inclusion Modalités de recrutement
groupes / échantillons
analysés
DFMG3
Causalité
lien causal = faisceau d'arguments
1. Preuves expérimentales2. Reproductibilité : caractère systématique ou presque du lien3. Temporalité: la cause doit précéder son effet4. Relation dose-effet: plus la "dose" de cause augmente plus
son effet (positif ou négatif) est augmenté5. Suppression de la cause: si la cause est supprimée, l'effet
dû à la cause disparaît6. Spécificité: innocenter d'autres causes7. Cohérence avec d'autres données scientifiques8. Force de l'association statistique (RR ou OR élevé)
DFMG3
Schémas d’étude
DFMG3
Conclusion: de la rigueur
• Rigueur– dans l’énoncé des hypothèses, de la question de
recherche et des objectifs– dans le choix et le recueil des variables à mesurer pour
représenter la cause et l’effet … et les autres– dans la sélection de la population– dans la sélection des échantillons (groupes) –
TAS/randomisation– dans les analyses statistiques et – dans la démarche amenant aux conclusions