spécificité : le croisement de trois compétences
TRANSCRIPT
Spécificité : le croisement de trois compétences
Infographie : L’Antisèche du Parisien magazine
Dataviz : la page DataMatch de Paris-Match
Journalisme de données ou journalisme statistique ?
● Journalisme de données : ○ Analyser des jeux de données pour produire de
l’information.● Statistique descriptive :
○ Ensemble de techniques pour décrire un jeu de données.● Statistique inférentielle :
○ Utiliser les données pour apprendre quelque chose sur un paramètre auquel on s’intéresse.
● En général, le data-journalisme reste dans une démarche descriptive.
● Journalisme statistique :○ utiliser la statistique inférentielle pour répondre à des
questions journalistiques.
EuroMillions : Quels numéros faut-il jouer ?
Question : Une chance sur 116 millions de remporter la cagnotte mais a-t-on toujours la même probabilité de partager les gains ?
Réponse :● Si tous les joueurs jouent parfaitement au hasard : pas de
stratégie gagnante● Si certains joueurs ont des numéros fétiches, alors il faut
jouer les numéros les moins souvent joués.
Problème : Comment savoir si certains numéros sont plus joués que d'autres ?
Problème et intuition
Données disponibles : ● Pas de données sur ce que jouent les joueurs● Pour chaque tirage, on a les numéros et les étoiles tirés
ainsi que le nombre de vainqueurs à chaque rang.● Exemple : date : 09 mars 2014, boules : 2-20-27-33-45,
étoiles : 6-10, vainqueurs au rang 1,2,3 : 28, etc
Intuition : ● Utiliser le nombre moyen de vainqueurs quand un
numéro est tiré pour estimer ce que jouent les joueurs.● Le nombre de vainqueurs à chaque tirage est un sondage
sur les stratégies des joueurs.
Résultats
Numéros les plus souvent joués : ● 21 : joué dans 13% des grilles● 37 : joué dans 8,5% des grilles
Combinaisons les plus souvent jouées : ● 21-11-13-12-35 1-9 : 1 fois sur 40
millions● 37-48-1-36-25 4-11 : 1 fois sur 300
millions
Quelle est la probabilité de partager le gain ?
Si la probabilité qu'une grille soit jouée suit une loi de Bernouilli de paramètre p, le nombre de vainqueurs sachant que N grilles sont jouées suit une loi de Poisson de paramètres N * p.
Résultat : ● Combinaison la plus souvent jouée : 40% de chances
qu'il y ait au moins un autre vainqueur.● Combinaison la moins souvent jouée : 6,5% de chances
qu'il y ait au moins un autre vainqueur.● En jouant les nombres les moins souvent joués, j'ai 6 fois
moins de chances de partager le gain.
Pour en savoir plus
Notre Site : www.askmedia.fr
Notre Blog : www.askmedia.fr/blog
Notre Twitter : @askmedia_