tests paramétriques sur variabilités et moyennes

TESTS PARAMÉTRIQUES

SUR VARIABILITÉS ET MOYENNES

Pierre MORETTO, Université Paul Sabatier, Toulouse

III.

UE 45.2 CHIV

Tests paramétriquesLe

s éta

pes Normalité de la distribution

(²) Comparaison des distributions

Test « F » de Fisher-Snedecor Comparaison des moyennes

Test « t » de Student Données appariées Données Non appariées

Si la distribution est normale à ±2 correspond 95.5% de la population.

Intervalle entre 2.28% et 95.5% correspond à 4.

Pente=(Q95-Q2.28)/ 4 PThéo=(95.5-2.28)%/4=0.23

Droite de Henry Calcul de la pente

Détermination graphique Anamorphose

Normalité d’une distribution /Indices Une distribution est normale si:

Les indices centraux sont confondus Mode=Médiane=Moyenne

68.25% de la population à ± 1 95.5% de la population à ± 2

Si ces faits sont retrouvés à partir des données expérimentales alors, la distribution peut être considérée comme « Normale »

Normalité d’une distribution

Normalité d’une distribution Détermination graphique Détermination / indices Test du ²

Test du ²

Le test du ² permet de comparer 2 distributions.

Si il est appliqué à la comparaison de la distribution de la donnée expérimentale et d’une distribution normale (au sens Gaussien), il permet de vérifier très précisément la normalité de la distribution expérimentale.

Test du ²

Comparer 2 fréquences Expérimentale (rouge) Normale (Bleu)

Quantifier la somme des différences/classes

Règle de décision / valeur théorique

Principe

Test du ²

Calculer l’écart centré réduit pour chaque centre de classe Xi

Trouver la probabilité associée dans la table de la Loi Normale Centrée Réduite

Quantifier la différence

141414

14

111

1

))(Pr()(

.....

))(Pr()(

Thx

x

Thx

x

fxmx

x

fxmx

x

Test du ²

Pour chaque classe, une fth et une fobs(ni/N)

Calculer la différence de ces fréquences pour chaque classe

Quantifier la différence

1414

11

.....

thobs

thobs

ff

ff

Test du ²

Calcul de l’indice

th

thobs

f

ff 2)(²

Carré des différences

Rapportée à Fth

Somme

« Surface entre les 2 courbes »

Test du ²

Règle de décision

th

thobs

f

ff 2)(²

Une table des valeurs de ²La valeur est lue pour un Degrès De Liberté (ddl=N-1)A un risque choisi (10%, 5%, 1%)

Test du ²

Règle de décision

th

thobs

f

ff 2)(²

Si ²Théorique> ²Calculé au risque choisi les distributions diffèrent significativement. Sinon elles sont statistiquement semblables.

Test du ²

Le ² calculé sur un échantillon de 19 sujets est de 32.5.

La distribution est-elle normale au risque 5% ?

La distribution est-elle normale au risque 1% ?

Exemple Table du ²

Test du ²

Le ²théorique à P=0.05 pour un ddl=18 est de 28.87

Correction Table du ²

32.5 > 28.87 donc ²calculé >²théorique

Les distributions observées (expérimentale) et théorique (Loi Normale) ne diffèrent pas à P<0.05

La distribution expérimentale est « normale » au risque P<5%

Test du ²

Le ²théorique à P=0.01 pour un ddl=18 est de 34.80

Correction Table du ²

32.5 < 34.8 donc ²calculé <²théorique

Les distributions observée (expérimentale) et théorique (Loi Normale) ne sont pas semblables à P<0.01

La distribution n’est pas normale au risque P<1% Risque inférieur entraîne une décision plus sévère

COMPARAISON D’ÉCHANTILLONS PARAMÉTRIQUES

Pierre MORETTO, Université Paul Sabatier, Toulouse

III.

UE 45.2 CHIV

Règles de décisions et orientations Les distributions des échantillons A et B

sont-elles normales (Gaussiennes) ? Si OUI, tests paramétriques Si NON,

Transformation (racine, log ..) et retour à Tests Non paramétriques (Ch V)

Comparaison d’échantillons

Comparaison d’échantillons paramétriques

Méthodologie générale: Distributions normales

Comparaison des variances des échantillons de distributions normales A (²A) et B (²B)


Comparaison des variances

Echantillon A Echantillon B

AAA nm ,², BBB nm ,²,

Comparaison des variances

Le test est appelé « Test F de Fisher-Snedecor » Il est basé sur le rapport (F) des variances des

échantillons A et B Donc

si les variances sont semblables le rapport F est proche de 1

si les variances diffèrent le rapport F s’éloigne de 1

Dans les 2 cas … l’objectivité impose de savoir de combien et à quel risque ?

Test F de Fisher-Snedecor

Soit 2 échantillons :

L’hypothèse (H0) du test est que les

variances sont comparables donc que :

BBBAAA nmetnm ,²,____,²,

1²

²

B

AF


La comparaisons de 2 variances (²A et ²B avec ²A> ²B ) d’échantillons d’effectifs nA et nB est basée sur le rapport F= ²A/ ²B.

F est comparé à une valeur théorique Fs donnée par la table du F à un seuil /2. La lecture se fait à l’intersection de la colonne (nA-1) et de la ligne (nB-1).

Si F<Fs les 2 variances ne diffèrent pas significativement au seuil

Test F de Fisher-Snedecor à /2 = 2.5%

La lecture se fait à l’intersection de la colonne (nA-1) et de la ligne (nB-1)


Exemple:2 méthodes de dosage du Lactate (mmol/l) ont été répétées à partir d’un même échantillon sanguin, 25 fois avec la méthode A, 30 fois avec la méthode B

On trouve:

Dans la table de « F » au risque =2.5% ….. Fs,2.5%=2.15

Le rapport F= ²A/ ²B=5.16/1.96=2.63 et F> Fs

d’où …….

Les variances diffèrent significativement au risque 5%

30,96.1²,10.18

25,16.5²,08.18

BBB

AAA

nm

nm

Test F: comparaison de variance Intérêt:

Distributions différentes des échantillons A et B

Si A et B sont 2 méthodes de mesure La plus faible variabilité d’une mesure à l’autre

renseigne sur la précision de l’outil de mesure.

Comparaison des moyennes des échantillons de distributions normales A et B


Comparaison de moyennes

Les échantillons sont de distributions normales Les variances ne diffèrent pas significativement Test « t » de Student permet la comparaison des

moyennes

Comparaison de moyennes

Si les échantillons A et B sont indépendants Test « t » adapté aux variables non

appariées

Si les échantillons A et B sont dépendants Test « t » adapté aux variables appariées

Ex: avant/après entraînement

Test « t » de StudentNon Apparié

Soit 2 variables distribuées selon la Loi Normale

Les moyennes diffèrent-elles ? Le test porte sur la différence des

moyennes

BBBAAA nmetnm ,²,____,²,

BA mmd


La comparaison entre 2 moyennes mA et mB observées sur nA et nB cas est basée sur l’écart réduit avec :

Si <1.96 la différence n’est pas significative au risque =5%

NB: cette formule est utilisable nA.nB>30

B

B

A

A

BA

nn

mm

²²


Exemple: Comparaison des notes obtenues en

statistique entre 2 groupes A (Relit ses cours) et B (Ne relit pas)

De sorte que: 73,7.5²,88.4

67,4²,85.5

BBB

AAA

nm

nm

Correction


Ici =2.6 >1.96 donc la différence de moyenne est significative à 5%

CCl: Relire ses cours avant d’arriver en TP semble significativement influencer le résultat à l’examen

6.2

737.5

674

88.485.5

²²

B

B

A

A

BA

nn

mm

Test « t » de StudentApparié

Soit 2 variables dépendantes distribuées selon la Loi Normale

Les moyennes diffèrent-elles ?

yyyxxx nmetnm ,²,____,²,

Test « t » de Student Apparié

Dans les cas où les données des séries X et Y sont dépendantes (Appariées; qui vont par paires), le test n’est pas construit sur la différence des moyennes mais sur les différences de chaque paire.

n

YX

YX

n

Y

Y

Yn

X

X

X

nn

y

n

x

n

,²

.

.

.

____,²

.

.

.

_,²

.

.

.1111

Test « t » de StudentApparié

La comparaison entre 2 moyennes appariées mA et mB observées sur nA et nB cas est basée sur l’écart réduit avec :


NB: cette formule est utilisable nA.nB>30

n

²

tests paramétriques sur variabilités et moyennes

Documents