probabilités et statistiques année 2009/2010 [email protected]...
TRANSCRIPT
![Page 2: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/2.jpg)
Cours n°12
Théorie des tests statistiques
![Page 3: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/3.jpg)
3
Test ?
Problème de décision … en contexte incertainExemples :
Le médicament MEDOC est-il efficace ? La machine PROD est-elle bien réglée ? Les OGM sont-ils dangereux ? L’augmentation de 2% de nos ventes ce dernier mois
est-elle significative ?
![Page 4: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/4.jpg)
4
Points communs aux exemples
La décision ne peut être certaine ;elle sera prise sur la base d’observations ; tous les facteurs influents ne sont pas
connus, et encore moins mesurés.
Utilisation du formalisme probabiliste
![Page 5: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/5.jpg)
5
Vous avez dit hypothèse ?
On oppose deux hypothèses : MEDOC : efficace vs non efficace PROD : bien réglée vs déréglée OGM : dangereux vs inoffensifs
Notations : H0 : hypothèse nulle
H1 : hypothèse alternative
![Page 6: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/6.jpg)
6
Qui est H0 ?
Les deux hypothèses n’ont pas le même rôle MEDOC :
• le fabricant pense que le médicament est efficace
H0 : efficace
• les autorités de santé veulent des preuves
H0 : inefficace
OGM ? PROD ?
![Page 7: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/7.jpg)
7
Démarche
1. On fixe H0 et H1.
2. On évalue une quantité, appelée score ou statistique de test.
3. Si cette quantité dépasse un certain seuil, on rejette H0.
4. On probabilise notre décision…
![Page 8: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/8.jpg)
8
Un exemple simpl(ist)e
Exemple de type PROD Usine de fabrication de tubes pour cosmétiques Procédé par extrusion de polymère, puis coupure
Paramètre sensible : épaisseur du tube en m
![Page 9: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/9.jpg)
9
Problème et hypothèses
En fonctionnement normal, l’épaisseur mesurée d’un tube suit une loi normale N(mold,sold
2), où :• mold = 208 m
• sold = 10,8 m
Un changement de fournisseur fait suspecter une diminution de la moyenne : mnew = 202 m.
On observe 20 épaisseurs de tubes, réalisations indépendantes d’une v.a. de loi normale N(m,sold
2).
A-t-on m = mold ou m = mnew ?
![Page 10: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/10.jpg)
10
![Page 11: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/11.jpg)
11
![Page 12: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/12.jpg)
12
Démarche
H0 : m = mnew
Score = épaisseur moyenne Décision : si > seuil, on rejette H0
On probabilise :Sous H0, est de loi normale N(mnew,sold
2/20)
P( > seuil / H0) = 1 -
€
e
€
e
€
e
€
seuil−mnewsold
20
⎛
⎝
⎜ ⎜ ⎜ ⎜
⎞
⎠
⎟ ⎟ ⎟ ⎟
€
e
![Page 13: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/13.jpg)
13
![Page 14: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/14.jpg)
14
Le risque
On fixe un niveau de risque : = 5% On évalue seuil pour que :
P( > seuil / H0) = Ici, seuil = mnew + 1.64 sold/√20 = 205,97
La région { > seuil} est la région critique.
Signification ?Toujours la loi des grands nombres (simulation)
€
e
€
e
![Page 15: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/15.jpg)
15
seuil = 205,97
![Page 16: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/16.jpg)
16
Décisions selon les cas
Supposons :1. = 206,42. = 207,93. = 205,2
Décisions :1. rejet de H0
2. rejet de H0
3. on conserve H0
€
e
€
e
€
e
![Page 17: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/17.jpg)
17
Le risque
Si on décide de rejeter H0, on a peu de chances de faire erreur (cf. risque ).
Et si on conserve H0, a-t-on raison ?? Risque de seconde espèce :
= P( ≤ seuil / H1)Ici, = P(N(202,10.82/20) ≤ 205,97) = 20%
est appelé risque de première espèce.
€
e
![Page 18: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/18.jpg)
18
seuil = 205,97
![Page 19: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/19.jpg)
19
Récapitulons
H0 H1
H0
H1
Réalité
Décision
![Page 20: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/20.jpg)
20
Déroulement d’un test
1. On fixe H0.
2. On définit une région critique (rejet de H0) à partir d’un score S :
rejet de H0 si S ≥ seuil
3. On fixe qui détermine seuil tel que :P(S ≥ seuil / H0) =
Ø On décide, et si on conserve H0, on regarde
![Page 21: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/21.jpg)
21
Retour sur le choix de H0
Seul est maîtrisé. Exemple PROD :
Situation 1 : grosses séries de moyenne qualité :• Risque majeur : arrêter la production à tort.
= P(arrêt / bien réglé) : H0 = « bien réglé »
Situation 2 : CDC client très strict :• Risque majeur : produire de mauvais composants.
= P(production / mal réglé) : H0 = « mal réglé »
![Page 22: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/22.jpg)
22
Dernières remarques
et varient en sens contraire. Diminution simultanée de et
possible en augmentant la taille de l’échantillon.
Critiques : Il se peut qu’aucune des deux hypothèses ne soit
correcte (risques de 3ème espèce !!) Si on rejette H0 avec = 5%, que donnent 4% ?
1% ? …
![Page 23: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/23.jpg)
23
Notion de p-valeur
Test de région critique de la forme :rejet de H0 si S ≥ seuil
On observe sobs
On évalue la probabilité :p = P(S ≥ sobs / H0)
p est appelée p-valeur (p-value)
![Page 24: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/24.jpg)
24
Retour sur l’exemple
1. Cas où = 206,4 :p-valeur = P(N(202,10.82/20)>206,4) = 0.034
2. Cas où = 207,9 :p-valeur = P(N(202,10.82/20)>207,9) = 0.0073
3. Cas où = 205,2 :p-valeur = P(N(202,10.82/20)>205,2) = 0.093
€
e
€
e€
e
![Page 25: Probabilités et Statistiques Année 2009/2010 laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr](https://reader035.vdocuments.pub/reader035/viewer/2022062512/551d9ddb497959293b8e8231/html5/thumbnails/25.jpg)
25
= 205,2
€
e
p-value = 0.093