dfmg3 sha.mcs.quanti méthode quantitative. dfmg3 plan du cours rappels sur la méthode scientifique...

DFMG3

SHA.MCS.Quanti

Méthode Quantitative

DFMG3

Plan du Cours

• Rappels sur la méthode scientifique en Sciences de la Vie

• Rappels sur le raisonnement• Rappels sur les principaux outils statistiques –

tests - intervalle de confiance• La causalité

DFMG3

théorie scientifique et justification (rappels)

• Popper– Une théorie scientifique ne représente

• ni une vérité

• ni même un de ses fragments

– Provisoire, elle contribue à un paradigme susceptible d'être réfuté à tout moment par des mises à l'épreuve successives

– Plus elle est solide, plus elle résistera et sera corroborée

Une propriété fondamentale

de toute théorie scientifique

est d'être réfutable corr

obor

atio

n

démonstrationde la

faussetéde la théorie

Théorie corroborée(mais jamais AVEREE)

réfutationessai deréfutation

…


réfutation

THEORIE

énoncés réfutables

hypothèse

hypothèse

hypothèse

corr

obor

atio

nco

rrob

orat

ion

démonstrationde la

faussetéde la théorie




…


réfutation


réfutationréfutationessai deréfutationessai de

réfutation

……


réfutationréfutationessai deréfutationessai de

réfutation

réfutationréfutation

THEORIE

énoncés réfutables

THEORIE

énoncés réfutablesénoncés réfutables

hypothèse

hypothèse

hypothèse

hypothèse

hypothèse

hypothèse

hypothèse

hypothèse

hypothèse

DFMG3

la démarche expérimentale (rappels)

méthode expérimentale• émettre une hypothèse:

cause effet

• écrire un protocole: conditions + hypothèse + méthode

• tester l’hypothèse par expériences construites répétées à l’identique

–Faire le bilan des variables ayant une action sur le système étudié et isoler le système

–Monter une situation où toutes les variables sont fixes sauf 2

(la cause et l’effet à observer)

–Appliquer la cause et observer la relation entre cause et effet

• valider ou invalider l’hypothèse

en sciences de la vie• obligatoire

• Obligatoire

• Difficile

• paramètres non tous connus

• multitude de paramètres difficiles à isoler + variabilité effet

relation cause - effet sera entachée d’un aléa résultant de l’action des variables non maîtrisées dans l’expérience: incertitude

DFMG3

variabilité

Instrumentale(technique de mesure)

Pré-instrumentale(technique prélèvement)

variabilitéanalytique

variabilitébiologique

Intra-sujet

Inter-sujet

génétiquephénotypeenvironnement(, , social)

fonde la notion de HASARD et d’INCERTITUDE

d’ALEATOIRE

CAUSE

EFFET

autrescauses inconnues

connues

valeur différente selon les individusnb

0

200

400

600

800

1000

1200

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

DFMG3

la démarche en sciences de la vie (rappels)

se rapprocher de la méthode expérimentale – émettre une hypothèse– écrire un protocole: conditions + hypothèse + méthode

– tester l’hypothèse par une « expérimentation »• Sur groupe(s) de sujets aussi déterminé(s) que possible

= échantillon(s)• Effectuer les mesures

– Calculer et comprendre les résultats • valider ou invalider l’hypothèse sur le(s) groupe(s)• en tenant compte de l’incertitude • due à la variabilité des mesures de l’effet chez chaque patient car

on ne peut « fixer » tous les paramètres causaux

– Généraliser à une population

DFMG3

Contraintes et conséquences

• Contraintes: causes souvent intriquées et effets variables (gradient) selon les individus

• Expérimentation sur groupe(s)– «similaires» pour les autres causes connues– permettant de simuler un individu «type»

• Aléa ou Incertitude– «modéliser» l’aléa ou incertitude ? – «raisonner» et «statuer» sous incertitude ?

• Généralisation– «généraliser» sous incertitude ? TESTS

DFMG3

Plan du Cours


• Rappels sur le raisonnement– Exemple– Echantillon et population– Variables– Tests & risques

• Rappels sur les principaux tests• La causalité

DFMG3

Statuer sous incertitude: exemple

lignée de souris présentant 20% de tumeurs malignes spontanées

sur 1 échantillon de 100 souris

substance X

Observé:

31 souris avec tumeur maligne

Question: la substance X est-elle cancérigène ?

DFMG3



100 échantillons de 100 souris

fluctuations d’échantillonnage

100 échantillons de 100 souris

% lots

31

20

% lots

31

20substance X

% lots

31

% lots

% lots

31

tous les échantillons ne sont pas à 20% de tumeurs31% est une valeur possible

on aurait pu observer une autre valeur que 31%20% est une valeur observable

DFMG3



constaté: 31 souris avec tumeur maligne

échantillon de 100 souris

substance X

Question: la substance X est-elle cancérigène ?

• on a constaté une différence : 31% - 20% = 11%– mais existent les « fluctuations d’échantillonnage

• Question– A-t-on beaucoup de chances d’observer au moins cette différence si X n’est pas

cancérigène?– à partir de quelle probabilité peut-on considérer X comme cancérigène ?– cette probabilité « seuil » sera le « risque d’erreur »– conclure en fonction du « seuil de significativité » que l’on s’est donné

DFMG3

• Faire un test statistique (cad: tenant compte des fluctuations d’échantillonnage)

– qui donnera la probabilité d’observer au moins cette différence si X n’est pas cancérigène?

– conclure en fonction du « seuil de significativité » que l’on s’est donné

• Raisonnement– hypothèse (nulle) X non cancérigène = l’échantillon provient au

hasard de la population avec taux 20%– Test: Comparaison fréquences

• Calcul probabilité(H0) P = 0,06

– Conclusion / seuil (5%)• P > 0,05 donc non rejet de H0 (H0 n’est pas réfutée)

– Conclusion clinique: on ne peut pas dire S cancérigène


DFMG3

Plan du Cours


• Rappels sur le raisonnement– Exemple

– Echantillon et population– Variables– Tests & risques


DFMG3

Série statistique

collection d’objets, éléments, individus– de même nature– suffisamment semblables pour pouvoir être étudiés

ensemble– soumise à des critères inclusion et non-inclusion– exemples

• ensemble de patients diabétiques âgés de 15 à 30 ans

• ensemble de cellules infectées par le VIH

• ensemble de résultats de glycémie

• analyse portera sur les caractéristiques communes aux éléments de la série dont la valeur varie selon les individus– exemple: sexe, valeur de la glycémie …

DFMG3

Population & Echantillon

• Population: série exhaustive– finie (étudiants en PACES en 2011-2012)

– infinie ou très grande• connue (étudiants en France en 2010)

• inconnue (patients atteints par le VIH)

– valeurs en population souvent inconnues

• Échantillon: sous-ensemble fini– extrait d’une population

échantillonnage

DFMG3

échantillonner ?

• But des études / expérimentations– émettre des conclusions valables en population– connaître les propriétés des variables dans la population

• Échantillonnage nécessaire– si population infinie

– si les ressources de l’étude sont limitées

– si attente d’avoir tous les individus impossible• exemple: tester un médicament contre le cancer du sein

– si la mesure de la variable étudiée est destructrice• exemple: mesurer la durée de vie d’un objet manufacturé sur tous les

objets: plus rien à vendre à la fin !!!

• Échantillonnage représentatif nécessaire

DFMG3

échantillon représentatif ?

• Sous-ensemble extrait de la population ressemblant le plus possible à celle-ci

• par tirage au sort ou tirage aléatoire– = prélever au hasard une fraction de la population

– chaque individu a la même chance d’être choisi que les autres

– procédure objective

– moyens: pile ou face, boule dans une urne (loto), table de nombres aléatoires …

– exemple: échantillon aléatoire des étudiants

– numérotation de 1 à 10000 des étudiants

• tirage par table de nombres au hasard de 100 numéros

• les étudiants correspondants forment un échantillon aléatoire de 100 sujets extrait de la population des étudiants

DFMG3

Relations échantillon aléatoire # population

• Échantillon E simple tiré au hasard de population P

• n observations indépendantes Xi

– obtenues par• tirage avec remise, ou• tirage sans remise mais grande population

– donc de même loi de probabilité que celle de la population

• Pour le raisonnement, on prend une variable d’intérêt quantitative: Tension Artérielle Systolique (TAS)

– Population: moyenne =14, écart-type =2

– Échantillon: moyenne m, écart-type s

DFMG3

• Mesure de Tension Artérielle Systolique (TAS)• Tous les individus

n’ont pas la même TAS

• Que dire de la TAS sur un ensemble d’individus ?

représentée par 2 valeurs– Valeur moyenne de la TAS

– Ecart-type montrant la dispersion vis à vis de la moyenne

• Dans l’exemple:

– Population: moyenne =14, écart-type =2

– Échantillon: moyenne m, écart-type s

Relations échantillon randomisé # population

2 3 2 4 5 820 25

43

80

149

286

379

447 448

339

207

141

50

27

6 20

50

100

150

200

250

300

350

400

450

500

700

900

1100

1300

1500

1700

1900

2100

2300

2500

2700

2900

3100

3300

3500

3700

3900

4100

4300

4500

4700

> 4

900

Poids de naissance

Nb

de

nou

veau

-nés

2 3 2 4 5 820 25

43

80

149

286

379

447 448

339

207

141

50

27

6 20

50

100

150

200

250

300

350

400

450

500

700

900

1100

1300

1500

1700

1900

2100

2300

2500

2700

2900

3100

3300

3500

3700

3900

4100

4300

4500

4700

> 4

900

Poids de naissance

Nb

de

nou

veau

-nés

moyenne

écart-type

DFMG3

• Plus la taille des échantillons est grande, plus la distribution de la moyenne m est étroite autour de

Relations échantillon aléatoire # population

nb

0

200

400

600

800

1000

1200

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

4000 échantillons de taille 100

nb

0

200

400

600

800

1000

1200

1400

1600

1800

2000

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

4000 échantillons de taille 1000

DFMG3

Intérêt & inconvénients des échantillons

• Intérêt – Aléatoire: représentatif de la population

• Inférence des valeurs globales en population avec leur écart-type (variance)

• évite les biais de sélection (choix des « bons patients »)

– Coûts plus faibles– Meilleur taux de réponses– Données de meilleure qualité– Rapidité des résultats– Seul utilisable si « analyse destructrice »

• Inconvénient– Parfois échantillon de grande taille nécessaire– Imprécision

DFMG3

Des échantillons comparables …

• Randomisation– Tirage au sort de la répartition entre les échantillons– Permet de «répartir de façon équilibrée»

• les sujets et donc • les variables qui jouent sur la relation cause-effet

– L’aléa, l’incertitude, encore appelé « hasard » (cad effet des variables autres que la cause sur la relation)

• a alors un caractère probabiliste• pourra être « modélisé mathématiquement » par des tests et des

intervalles de confiance

– On pourra alors juger, en probabilité (« d’avoir raison quand on dit l’effet est lié à la cause »)

DFMG3

Des échantillons comparables …

• La randomisation– Permet d’éviter les biais de sélection

(ex: éviter de choisir seulement des patients « bons répondeurs » à un traitement)

– Permet de travailler sur des échantillon(s) comparables sur tout sauf la cause

– Autorise la comparaison des groupes et des résultats– Permet de «généraliser» à la population les résultats

obtenus (l’existence ou non d’une relation entre une cause et un effet)

DFMG3

Intervalle de confiance (IC)

• à partir d’un échantillon, on aura une estimation ponctuelle d’un paramètre– exemple: taille moyenne des individus de l’échantillon

• Mais– Cet échantillon n’est qu’un des échantillons possibles tirés de la

même population– L’estimation ponctuelle n’est qu’une des estimations possibles

• intervalle de confiance à 95% du paramètre– intervalle de valeurs qui a 95% de chance de contenir la vraie

valeur du paramètre estimé– cad l'ensemble des valeurs raisonnablement compatibles avec le

résultat observé (l’estimation ponctuelle)– donne une visualisation de l’incertitude de l’estimation.

DFMG3

Intervalle de confiance (IC) exemple

•Etude– essai thérapeutique entre molécule et placebo– Critère de jugement: réduction relative de mortalité

•Résultat: RRR = 0,2 [IC95: 0,05 – 0,35]– Signifie

• Il y a 95 chances sur 100 d’observer une valeur de réduction relative de la mortalité entre 5% et 35%

DFMG3

Plan du Cours


• Rappels sur le raisonnement– Exemple– Echantillon et population

– Variables– Tests & risques


DFMG3

Variable

• Elément– mesurable / comptable– dont la mesure peut prendre différentes valeurs– exemple

• Taille d’un individu• Nombre d’étudiants• Présence de séquelles

• Caractéristiques– Type: quantitative, qualitative, censurée– Plage / ensemble de valeurs possibles– Dimension: unité de valeurs

• Aléatoire si– la valeur de la mesure, pour un sujet donné, ne peut être prédite

avec certitude– donc à laquelle est associée une loi de probabilité

DFMG3

Variable: Types

Qualitative–Valeur = une parmi des catégories exclusives–Qualitative nominale : catégories sans relation d’ordre

ex : groupe sanguin, couleur des yeux

• dichotomique ( booléenne, binaire) ex : sexe

–Qualitative ordinale : catégories ordonnéesex : score douleur (nulle-modérée-forte), protéinurie (0,+,++

…)

•Remarques–On peut «éclater une variable à K catégories» en K-1 variables binaires–Aucune opération mathématique n’a de sens–Les opérations logiques entre catégories ont un sens pour une variable

qualitative ordinale–Les effectifs cumulés entre catégories ont un sens pour une variable

qualitative ordinale

DFMG3

Variable: Types

Quantitative : – Valeur = résultat de la mesure d'une quantité – Quantitative continue

• Valeur est exprimée par un nombre réel

ex : taille, poids, glycémie

• Nombre infini de valeurs possibles entre 2 valeurs quelconques

– Quantitative discrète• Valeur est exprimé par un nombre entier

ex : nombre d’enfants, nb de selles/jour

• Nombre fini de valeurs

•Remarques– On peut transformer une V quantitative en V qualitative ordinale en déterminant

des seuils (déterminer des classes de valeurs)

– Cette transformation induit une perte d’information

– Les opérations mathématiques et logiques ont un sens

DFMG3

Variable: types

• Censurée : survenue d’un événement– Double valeur:

• Présence ou absence de l’événement• Délai d’apparition de l’évènement

– similaire à 2 variables associées ex : Survenue d’un décès dans l’année qui suit opération

comptage du décès (qualitatif)

délai de survenue du décès (quantitatif)

ex : Survenue d’une séquellecomptage de la séquelle (qualitatif)

délai de survenue de la séquelle (quantitatif)

DFMG3

Variable: représentation des valeurs

• suspension de virus de la mosaïque du tabac– inoculée à des plants de tabac

– génotypiquement identiques

– sur une feuille de même rang entre les nervures d'un rang donné

– Mesure du temps de latence de la maladie (en jours)

Temps variable (13-34j)Malgré

conditions standardisées

=Variabilité biologique

valeur centrale

écarts

Tps de latence de l’échantillon = valeur centrale ± valeur d’écart

paramètresde position

paramètresde dispersion

graphique

DFMG3

Statistiques descriptives

Paramètres théoriques

Paramètres observés

Ensemble exhaustif de sujets dont on a

défini les caractéristiques

Sous-ensemble fini issu d’une

population

sélectionreprésentativité

tirage au sortpopulation échantillon

Paramètres de position

Paramètres de dispersion

DFMG3

Plan du Cours


• Rappels sur le raisonnement– Exemple– Echantillon et population

– Variables – Tests & risques


DFMG3

Statuer sous incertitude

?

Pour une variable X : on connaît les paramètres dans la population à quoi peut-on s’attendre dans un échantillon ?

population échantillontirage au sort

?

Pour une variable X : on a calculé les paramètres dans un échantillon à quoi peut-on s’attendre dans la population ?

population échantillontirage au sort

Pour une variable X : on a calculé les paramètres dans 2 échantillons peut-on conclure à un effet de la cause dans la population ?

population effet ? CAUSE

+

-

échantillon 1tirage au sort

échantillon 2tirage au sort

DFMG3


• Étude

• question• Problématique• Hypothèses

–H0 (hypothèse nulle)

–H1 (hypothèse alterne)• Sous H0 : Test statistique

–Choix–Vérification conditions–Calcul de petit p = degré de signification

• Conclusion / seuil –Seuil–Conclusion / hypothèses

• Conclusion clinique

• Population 20% K• Échantillon 31% K• Substance X cancérigène?• Comparaison % obs à % th

– Echantillon aléatoire issu de la population avec taux 20% (=X non cancérigène)

– Inverse

– Comparaison fréquence obs à th– N grand

– P = 0,06

– 5% = 0,05– P > 0,05 donc non rejet de H0

Test statistique = test d’hypothèse

DFMG3

étapes des tests

1. Énoncé de la problématique– question– type de problème statistique (population, échantillons, type de variable)

– choix du seuil de signification = risque (en général 5%)

2. Hypothèses– toujours formulées en termes de population car

• fluctuations d’échantillonnage

• on veut conclure sur la (les) population(s) dont est/sont extrait(s) le(s) échantillon(s) observé(s)

– toujours 2 hypothèses•hypothèse nulle (H0) : « rien ne change, pas d’effet … »

– échantillon(s) extrait(s) au hasard de la même population

– en général = inverse de ce que l’on cherche à montrer•hypothèse alternative (H1)

– échantillon(s) non extrait(s) au hasard de la même population

DFMG3

étapes des tests

3. H0 est supposée vraie (démarche expérimentale) et calcul de petit p (degré de signification = proba d’avoir au moins une différence égale à celle observée) au moyen d’un test statistique

–Choix du test–vérification conditions

• nombre de sujets• normalité de distribution des variables

4. Conclusion statistique– p > : non rejet de H0– p : rejet de H0 au risque p

5. Évaluation des biais éventuels– biais de sélection– biais de classement– biais de confusion

6. Conclusion clinique

cf cours biais

DFMG3

Risques et règles de décision

• avant la décision …– Supposition H0 vraie (hypothèse à réfuter)

– Test effectué donnant• p (p-value): degré de signification• = probabilité d’avoir une différence au moins égale à celle observée

• Règle de décision– Si p : H0 peu probable rejet de H0 au risque p

– Si p > : H0 probable non rejet de H0 au risque p

0

seuil

écart-réduit

non rejet de H0 rejet de H0

H0 vraie

p

DFMG3

• risque α– Seuil de signification ou risque de 1ère espèce ou erreur de type 1– probabilité de rejeter H0 alors que H0 est vraie– exemple: risque de considérer un produit actif alors qu’il est inactif

– Fixé a priori avant le test• en général 5% (mais < 5% dans les essais thérapeutiques si nouveau produit toxique)

• risque β– risque de 2ème espèce ou erreur de type II– probabilité de ne pas rejeter H0 alors que H1 est vraie– exemple: risque de considérer un produit inactif alors qu’il est actif

– Fixé a priori avant le test• en général < 20% (parfois > 20% si comparaison de 2 produits à toxicité et coût similaires)

décision

rejet de H0 non rejet de H0

réalitéH0 est vraie risque α

faux positifs1- α

H1 est vraie 1-β (puissance) risque βfaux négatifs

Risques et règles de décision

DFMG3

Degré de signification et conclusion statistique

Comparaison de 2 traitements

différence cliniquement intéressanteou non cliniquement intéressante

rejet de H0

(différence statistiquement significative)

c’est peut être

vrai(1-β)

c’est peut être

faux(α)

non rejet de H0

(différence non statistiquement significative)

C’est peut être par manque de puissance

(β)

La différence est peut être suffisamment

faible(1- α)

DFMG3

règles de décision à 5%

– Si p (5%) : H0 peu probable rejet de H0 au risque p

– Si p > (5%) mais p 10% : H0 probable non rejet de H0 au risque p

mais tendance à la significativité

– Si p > (5%) : H0 probable non rejet de H0 au risque p

Seuil(5%)

0 écart-réduit

non rejet de H0 rejet de H0

H0 vraie

p

10%

tendance

DFMG3

Plan du Cours


• Rappels sur le raisonnement


DFMG3

Les tests

• Choix du test statistique dépend– de la question: comparaison, liaison – des types des variables: quantitative, qualitative, censurée

• Variable à expliquer (effet)• Variables explicatives (cause, facteurs de confusion)

– des lois de probabilité suivies par les variables– de la taille du/des échantillon(s)

• petits• grands (N > 30)

• mais – sont toujours des tests d’hypothèse– demandent de suivre la même démarche

DFMG3

Tests: variables qualitatives

Comparaison Fréquence (%) observée à

fréquence (%) théorique

H0 : F = Fth

H1 : F Fth Écart-réduitChi2 de PearsonFischer exact

exemple: le % de diabétiques à Montpellier est-il le même que dans la population française ?

question, variables hypothèses tests

ComparaisonK fréquences observées

séries appariées

H0 : égalité FT1 = F T2

H0 : différence F T1 F T2 Chi2 de Mc Nemar

exemple: % de fumeurs est-il constant avant et après une nouvelle méthode de sevrage ?

ComparaisonK fréquences (%) observées

échantillons indépendants

H0 : FA = FB = FC

H1 : au moins une F est Chi2 de Pearson Fischer exact

exemple: % d’asthmatiques identiques dans 5 capitales européennes ?

Liaison/relationdeux variables qualitatives

H0 : Indépendance, OR = 1H1 : Liaison, OR 1

Chi2 de Pearson IC1- de OR

Fisher exact

exemple: maladie coronarienne et sexe ?

DFMG3

Tests: variables quantitatives

Comparaison2 moyennes observées 2 séries appariées

H0 : égalité µT1 = µ T2

H1 : différence µ T1 µ T2

Student apparié, paired T testWilcoxon apparié, test des signes (sign ou signed rank test)

exemple: VEMS avant et après réadaptation à l’effort

Comparaisonmoyenne observée à

moyenne théorique

H0 : µ = µth

H1 : µ µth

Écart-réduitStudent, T test

exemple: taux de glycémie des enfants « obèses » est-il dans la normale ?


Comparaison2 moyennes observées 2 échantillons indépendants

H0 : µA = µB

H1 : µA µB Écart-réduitStudent, T testMann-Whitney,

exemple: VEMS chez les asthmatiques selon le statut addiction au tabac

Comparaison2 variances observées 2 séries appariées

H0 : égalité vT1 = vT2

H1 : différence v T1 v T2

Test F

exemple: variance TAS entre 2 groupes : sain # atteint de drépanocytose

DFMG3

Tests: variables quantitatives

ComparaisonK moyennesÉchantillons indépendants

H0 : indépendance, µA = µB = µC

H1 : liaison, au moins une µ est ANOVAKruskall-Wallis

exemple: groupe sanguin et carence martiale

Liaison2 variables quantitatives

H0 : Indépendance, = 0H1 : Liaison, 0

Coefficient de corrélation linéaire de Pearson

de Spearman exemple: taux de CD4 et charge virale chez les HIV naïfs de traitement


DFMG3

X et Y = 2 variables aléatoires continues– événement élémentaire [x< X <x+dx , y< Y <y+dy]– probabilité : P (x< X <x+dx , y< Y <y+dy) = f(x,y)dx.dy x = E(X) espérance de X y

x2 = V(X) variance de X y

Y = E(Y) espérance de Y x

y2 = V(Y) variance de Y x

– Cov(X,Y) = E[(X- x)(Y- Y)] covariance théorique de X et de Y

Corrélation linéaire 2 variables quantitatives

f(x,y)

x yx

f(x)

loi de Laplace-Gaussà deux dimensions

DFMG3

Corrélation linéaire - population

• Coefficient de corrélation linéaire théorique

– Valeur:

– Propriétés• nombre sans dimensions

• 0 1 ou –1 +1

• renseigne sur l’indépendance entre X et Y

– Si = 1 alors Y = aX +b

(dépendance totale)

– Si X et Y indépendants (en proba) alors Cov(X,Y)=0

donc = 0

attn : l’inverse n’est pas vrai

– Si > 0 alors X et Y varient dans le même sens

– Si < 0 alors X et Y varient en sens contraire

yx

)Y,Xcov(

DFMG3

Corrélation linéaire - échantillon

– Un échantillon de taille N– 2 variables aléatoires X et Y mesurées sur les mêmes sujets

• 1er sujet x1 y1

• 2ème sujet x2 y2

• …• Nième sujet xN yN

– Valeurs calculées

N

xm

ix

1N

)mx(s

2xi

x

N

ym

iy

1N

)my(s

2yi

y

2yi

2xi

yixi

)my()mx(

)my)(mx(r

Mêmes propriétés que

DFMG3

• Statistique inférentielle– r est une variable aléatoire– Seul point abordé

• comparaison de r à la valeur théorique 0

• en considérant que cela revient à tester l’indépendance

• à la condition que les deux variables X et Y soient normales

– Problème• échantillon taille N

– 2 variables normales X et Y

– coefficient observé r

• Hypothèses

– H0: E avec r provient au hasard de Pop avec = 0

– H1: E avec r provient au hasard de Pop avec 0

• Calcul de r

• Lecture dans la table à (N-2) ddl

Corrélation linéaire - échantillon

DFMG3

Plan du Cours


• Rappels sur le raisonnement• Rappels sur les principaux tests

• La causalité

DFMG3

et la conclusion …

mesureeffet

randomisation

cause

E1 E2

test

RESULTATstatistique

Conclusion généralisable si

Mesure effet valide, fiableNombre de sujets suffisantsBonne randomisationPeu de perdus de vueTest statistiques adéquatsAbsence de biais

CONCLUSION CLINIQUE ….

DFMG3

Et généraliser ….

généralisation (si possible)

inférence statistique

résultats

Population CIBLE

Population SOURCE

retraits en cours d’étude

groupes / échantillons étudiés inclus

Critères d'inclusion Critères de non-inclusion Modalités de recrutement

groupes / échantillons

analysés

DFMG3

Causalité

lien causal = faisceau d'arguments

1. Preuves expérimentales2. Reproductibilité : caractère systématique ou presque du lien3. Temporalité: la cause doit précéder son effet4. Relation dose-effet: plus la "dose" de cause augmente plus

son effet (positif ou négatif) est augmenté5. Suppression de la cause: si la cause est supprimée, l'effet

dû à la cause disparaît6. Spécificité: innocenter d'autres causes7. Cohérence avec d'autres données scientifiques8. Force de l'association statistique (RR ou OR élevé)

DFMG3

Schémas d’étude

DFMG3

Conclusion: de la rigueur

• Rigueur– dans l’énoncé des hypothèses, de la question de

recherche et des objectifs– dans le choix et le recueil des variables à mesurer pour

représenter la cause et l’effet … et les autres– dans la sélection de la population– dans la sélection des échantillons (groupes) –

TAS/randomisation– dans les analyses statistiques et – dans la démarche amenant aux conclusions

dfmg3 sha.mcs.quanti méthode quantitative. dfmg3 plan du cours rappels sur la méthode scientifique...

Documents