td analyse de données pour l’évaluation de l ... · - appende à faie un calcul d’exposition...
TRANSCRIPT
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 1
TD Analyse de données pour l’évaluation de l’exposition Octobre 2014
1 Contexte et objectif du TD
Pour réaliser une évaluation de l’exposition d’une population à un contaminant chimique, plusieurs sources
de données sont nécessaires : des données de consommations alimentaires d’une part et des données de
composition des aliments d’autre part. La précision de l’évaluation de l’exposition dépend à la fois de la
méthodologie employée et des données utilisées.
Les données utilisées proviennent la plupart du temps de fournisseurs différents et ont souvent été produites
pour des objectifs différents. Un travail d’analyse et de préparation des données est donc nécessaire avant
tout calcul. Ce travail de préparation permet d’utiliser correctement les données et de pouvoir exploiter les
résultats au mieux.
L’objectif de ce TD est de découvrir les problématiques de gestion et de traitements des données auxquelles
nous sommes confrontés au cours d’une analyse du risque alimentaire. Dans ce TD, nous souhaitons mener
une évaluation de l’exposition d’une population au plomb.
Il s’articulera en 3 phases :
- Apprendre à faire un calcul d’exposition
- Analyser et préparer les données de consommation
- Analyser et préparer les données de contamination
Pour simplifier ce TD, nous nous abstenons des problématiques de conversion d’unités et supposerons que
les chiffres présentés sont dans des unités de mesure cohérentes.
Ce TD se déroule sur 3 heures : vous devez donc consacrer environ 1 heure pour chacune des phases.
Ce que vous devez rendre à la fin du TD
A la fin de ce TD, vous devez remettre les fichiers Excel correspondant à votre travail effectué pendant ce TD.
Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu, créez un dossier avec les noms
de famille de votre binôme (par exemple Dupont_Durand).
Dans la suite de ce document, nous ferons référence à ce dossier sous le terme dossier_de_votre_binome.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 2
2 TD 1 – calculer une exposition
L’objectif de ce TD est de réaliser un premier calcul d’exposition à partir de données déjà préparées.
Où trouver les données pour le TD ?
L’ensemble des fichiers nécessaires pour le TD 1 se trouvent sur le lecteur réseau TD dans le dossier
UC_Risque_Analyse_Donnees/TD1.
FAITES UNE COPIE DE CE DOSSIER SUR VOTRE ESPACE DISQUE N:/
2.1 Réaliser un calcul d’exposition
Dans cette partie, nous allons travailler sur le fichier calcul_exposition_plomb.xls, plus précisément avec les
feuilles intitulées matrice_contamination et matrice_consommation_ENQ1.
La feuille intitulée matrice_contamination contient une matrice représentant la moyenne des teneurs en
plomb pour plusieurs groupes d’aliments. Cette matrice a été réalisée à partir d’un ensemble de teneurs en
plomb mesurées dans différents aliments puis regroupées selon différents groupes d’aliments.
La feuille intitulée matrice_consommation_ENQ1 contient une matrice représentant la consommation
hebdomadaire en différents groupes d’aliments d’une population d’individus ayant répondus à une enquête
de consommation que nous nommerons ENQ1. Ces consommations ont été divisées par le poids des individus.
Description des champs de la feuille matrice_consommation_ENQ1
Nom du champ Description
identi Identifiant de la personne ayant répondu à l’enquête
libellegroupe Libellé du groupe aliments consommés
SommeDeqte Sommes des quantités consommées divisées par le poids de l’individu
Notre objectif dans cette partie est de calculer l’exposition de notre population au plomb pour les groupes
aliments Abats et Crustacés et mollusques.
Question 1 : Avant de faire le calcul d’exposition proprement dit, nous devons préparer nos données de
consommation : nous devons filtrer les consommations et ne conserver que celles correspondant aux groupes
d’aliments désirés pour pouvoir les multiplier avec les moyennes de contamination correspondantes.
- Construisez un tableau croisé dynamique représentant les sommes des consommations des individus
de l’enquête ENQ1 en Abats et en Crustacés et mollusques. Vous placerez notamment dans le tableau
croisé dynamique :
o la variable identi dans la zone champs de ligne
o la variable libellegroupe dans la zone de champs de colonne.
- Renommez la feuille de calcul contenant ce tableau croisé en tableau_ENQ1.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 3
- Notez que vous n’avez que les consommateurs d’Abats et/ou de Crustacés et mollusques. Faites
apparaitre les non-consommateurs en prenant soin que la quantité affichée dans le tableau soit 0 pour
ces non consommateurs.
- Combien d’individus sont présents dans votre tableau croisé avant l’affichage des éléments sans
données ? …………………………………………………………………………………………………………………………………………..
- Combien d’individus sont présents dans votre tableau croisé après l’affichage des éléments sans
données ………………………………………………………………………………………………………………………………………………
- Quelle est donc la taille de la population de l’ENQ 1 ? …………………………………………………………………………
Aide :
Dans un tableau croisé dynamique, pour faire afficher les éléments sans données :
- Faites un clic droit sur la variable considérée dans le tableau croisé
- Un menu contextuel s’ouvre. Choisissez alors Champ.
- Une fenêtre apparait alors. Cochez la case Afficher les éléments sans données.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 4
Aide :
Dans un tableau croisé dynamique, pour modifier la valeur affichée pour les cellules vides :
- Faites un clic droit sur le tableau croisé
- Un menu contextuel s’ouvre. Choisissez alors Options du tableau.
- Une fenêtre apparait alors. Cochez la case Cellules vides, afficher et saisissez le chiffre 0 dans la zone
de texte adjacente.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 5
Question 2 : Nous allons maintenant réaliser le calcul d’exposition de la population de l’ENQ1 au plomb pour
le groupe d’aliments Abats.
- Dans une cellule (en dehors du tableau croisé), faites la multiplication de la quantité consommées en
Abats pour le premier individu de notre enquête (numéro = 1000101) avec la teneur moyenne en
plomb pour ce groupe d’aliments.
- Propagez maintenant ce calcul aux autres individus de l’enquête.
- Quelle est l’exposition de l’individu 2235301 pour le groupe Abats ? ………………………………..…………………
- Quelle est l’exposition de l’individu 4737601 pour le groupe Abats ? …………………………………………………..
Question 3 :
- En suivant la même méthode, calculez l’exposition de la population de l’ENQ1 au plomb pour le groupe
d’aliments Crustacés et mollusques.
- Quelle est l’exposition de l’individu 4791101 pour le groupe Crustacés et mollusques ?
…………………………………………………………………………………………………………………………………………………………….
- Quelle est l’exposition de l’individu 4737601 pour le groupe Crustacés et mollusques ?
…………………………………………………………………………………………………………………………………………………………….
Aide :
Vous devez obtenir quelque chose de similaire à cette image :
Aide :
Vous devriez avoir utilisé les références absolues…..
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 6
Question 4 : Pour les besoins de ce TD, nous supposerons que la DHT du plomb est de 250.
- Représentez sur un même graphique les expositions des individus au plomb et la DHT pour le groupe
Abats.
- Représentez sur un même graphique les expositions des individus au plomb et la DHT pour le groupe
Crustacés et mollusques.
- Calculer l’amplitude de dépassement de la DHT pour chaque individu de l’ENQ1 pour les groupes
d’aliments Abats et Crustacés et mollusques.
- Quelles sont vos conclusions quant à l’exposition de cette population au plomb pour ces deux groupes
d’aliments ? Si vous avez des réserves à émettre précisez-les.
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
Aide :
Vous devriez obtenir un graphique similaire à celui-ci :
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 7
Question 5 :
- En suivant la même méthode, calculez l’exposition de la population de l’ENQ1 au plomb pour le groupe
d’aliments produits laitiers.
- Quelles sont vos conclusions quant à l’exposition de cette population au plomb pour ces deux groupes
d’aliments ? Si vous avez des réserves à émettre précisez-les.
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………
- Pouvez-vous conclure de la même manière pour le groupe d’aliments Crustacés et mollusques et le
groupe d’aliments produits laitiers ? Justifiez votre réponse.
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………
Ce que vous devez rendre à la fin du TD 1
Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu/dossier_de_votre_binome,
créez un dossier TD1. Ajoutez dans ce dossier le fichier Excel calcul_exposition_plomb.xls contenant vos
réponses.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 8
3 TD 2 – Analyser et préparer les données de consommation
De nombreuses sources de données permettent de connaitre la consommation alimentaire d’une population.
Il est important de caractériser la population considérée dans l’enquête choisie pour mener un calcul
d’exposition afin d’être en mesure d’interpréter correctement les résultats obtenus.
Où trouver les données pour le TD ?
L’ensemble des fichiers nécessaires pour le TD 2 se trouvent sur le lecteur réseau TD dans le dossier
UC_Risque_Analyse_Donnees/TD2.
FAITES UNE COPIE DE CE DOSSIER SUR VOTRE ESPACE DISQUE N:/
3.1 Caractérisation des consommateurs
Dans cette partie, nous allons travailler sur le fichier ENQ_1_consommateur.xls situé dans le dossier
caracterisation_consommateur. Ce fichier présente certaines caractéristiques sociodémographiques des
individus ayant répondus à une enquête de consommation individuelle que nous nommerons ENQ1. Le
tableau ci-dessous décrit les champs de ce fichier.
Description des champs du fichier ENQ_1_consommateur.xls
Nom du champ Description
identi Identifiant de la personne ayant répondu à l’enquête
libelle_sexe Sexe de la personne ayant répondu à l’enquête
age Age de la personne ayant répondu à l’enquête
est_enceinte Indique si la personne considérée était enceinte ou non au moment où elle a répondu à l’enquête
libelle_region Région d’habitation de la personne ayant répondu à l’enquête
Question 1 :
- Représentez la répartition par âge de la population à l’aide d’un tableau croisé dynamique puis d’un
histogramme.
- Combien de classes d’individus obtenez-vous ? …………………………………………………………………………………
Ce chiffre vous parait-il adapté à un calcul d’exposition ? En d’autres termes, compte tenu des classes
d’individus obtenues, pensez-vous pouvoir identifier les tranches d’âges potentiellement à risque ?
……………………………………………………………………………………………………………………………………………………………
……………………………………..……………………………………………………………………………………………………………………
- À partir du tableau croisé dynamique construit précédemment, créez des groupes individus plus
appropriés à l’analyse des futurs résultats des calculs d’exposition.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 9
- Qu’en concluez-vous quant à la représentativité de la population ?
……………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………..
…………………………………………………………………………………………………………………………………………………………..
…………………………………………………………………………………………………………………………………………………………..
Aide :
Pour répondre à cette question, vous pouvez utiliser la fonction Groupes et créer un plan disponible à partir
du tableau croisé dynamique.
- Faites un clic-droit avec la souris sur le champ du tableau croisé que vous souhaitez grouper.
- Un menu contextuel s’ouvre. Choisissez alors Grouper et créer un plan puis Grouper.
- Une fenêtre apparait alors vous permettant de définir vos groupes
- Après avoir validé en cliquant sur OK, votre tableau croisé dynamique est mis à jour en prenant en
compte les paramètres saisis.
Début : 1ère valeur à prendre
en compte. Elle fera donc
partie du 1er groupe.
Fin : Dernière valeur à
prendre en compte. Elle fera
donc partie du dernier
groupe
Par : Le chiffre qui
représente l’intervalle pour
chaque groupe
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 10
Question 2 :
- En suivant la même démarche que pour la question 1, caractérisez la population de l’enquête ENQ1
en utilisant la région d’habitation et le sexe des personnes ayant répondu.
- Si besoin, créez des groupes plus appropriés à l’analyse des futurs résultats des calculs d’exposition.
- Qu’en concluez-vous quant à la représentativité de la population ?
…………………………………………………………………………………………………………………………………………………………..…
………………………………………………………………………………………………………………………………………………………..……
……………………………………………………………………………………………………………………………………………………..………
…………………………………………………………………………………………………………………………………………………..…………
………………………………………………………………………………………………………………………………………………..
3.2 Caractérisation des consommations
L’exposition globale d’un individu est fonction de son panier de consommation : les populations les plus
consommatrices sont les plus exposées. Dans cette partie, nous allons travailler sur le fichier
ENQ_1_conso_semaine.xls situé dans le dossier TD2/caracterisation_consommation. Ce fichier décrit les
consommations des individus ayant répondu à l’enquête de consommation ENQ1. Les consommations ont été
sommées par groupe d’aliments et divisées par le poids de l’individu.
Description des champs du fichier ENQ_1_conso_semaine.xls
Nom du champ Description
identi Identifiant de la personne ayant répondu à l’enquête
libellegroupe Libellé du groupe aliments consommés
SommeDeqte Sommes des quantités consommées divisées par le poids de l’individu
libelle_sexe Sexe de la personne ayant répondu à l’enquête
age Age de la personne ayant répondu à l’enquête
est_enceinte Indique si la personne considérée était enceinte ou non au moment où elle a répondu à l’enquête
libelle_region Région d’habitation de la personne ayant répondu à l’enquête
Question 1 :
- Représentez dans un graphique les consommations en chacun des groupes de produits ? Selon vous,
quel(s) groupe(s) d’aliments vous semble(nt) intéressants à analyser plus précisément ?
.........................................................................................................................................………………………
…………………………………………………………………………………………………………………………………..………………………
…………………………………………………………………………………………………………………………………..………………………
…………………………………………………………………………………………………………………………………..
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 11
Question 2 :
- Représentez dans un tableau croisé dynamique, la somme des consommations d’abats selon l’âge des
individus. Créez des groupes d’âges avec des intervalles de 10 ans.
- Une fois ce tableau croisé créé, représentez le sous forme de graphique.
- Pouvez-vous tirer une conclusion concernant l’âge des forts consommateurs ?
…………………………………………………………………………………………………………………………………………………………..
……………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………….…………………………..
- Est-ce que cette observation est de nature à vous faire remettre en cause ou nuancer vos conclusions
du TD 1 ?
....................................................................................................................................................
…………………………………………………………………………………………………………………………………………………………..
…………………………………………………………………………………………………………………………………………………………..
Question 3 : l’objectif de cette question est de représenter les distributions des consommations. Nous allons
travailler sur le groupe aliments Abats.
- Représentez dans un tableau croisé dynamique, la somme des consommations en Abats de chaque
individu. Pour faciliter la suite de cet exercice, nommez tableau_abats la feuille contenant ce tableau.
Vous placerez dans le tableau croisé dynamique :
o la variable libellegroupe dans la zone champ de page ;
o la variable identi dans la zone champ de ligne.
- Notez que vous n’avez que les consommateurs d’Abats dans votre tableau. Faites apparaitre les non-
consommateurs en prenant soin que la quantité affichée dans le tableau soit 0 pour ces non
consommateurs.
- Pour calculer des fréquences, la première étape est de créer une colonne contenant les seuils des
intervalles de fréquence.
- Dans la feuille tableau_abats, créer une colonne Intervalles contenant les valeurs suivantes : 0, 2, 4,
6, 8, 10, 12, 14, 16, 18, 20. Placez cette colonne de valeur en dehors du tableau croisé.
Aide :
Pour créer ce tableau croisé, vous devez déposer la variable libellegroupe dans la zone champ de page du
tableau croisé dynamique.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 12
- À côté de la colonne Intervalles, créez une colonne Fréquences. Placez cette colonne de valeur en
dehors du tableau croisé.
- Calculez les fréquences correspondantes à chacun des intervalles et ajoutez les dans la colonne
Fréquence.
Aide :
Vous devez obtenir les colonnes suivantes :
Nombre de résultats inférieurs ou égaux à 0
Nombre de résultats inférieurs ou égaux à 5
Nombre de résultats inférieurs ou égaux à 10
Nombre de résultats inférieurs ou égaux à 15
Nombre de résultats inférieurs ou égaux à 20
Aide :
Pour calculer les fréquences, il faut utiliser la fonction Excel FREQUENCE.
- Sélectionnez la cellule correspondant au premier intervalle dans la colonne Fréquences.
- Allez dans le menu Insertion puis choisissez Fonction.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 13
- Une fenêtre s’ouvre alors. Cherchez et sélectionnez la fonction FREQUENCE puis cliquez sur le
bouton OK
- Il faut maintenant paramétrer la fonction FREQUENCE en remplissant ses champs :
o Dans Tableau_données, indiquez les plages de cellules correspondant aux quantités
consommées ;
o Dans Matrice_intervalles, indiquez les plages de cellules correspondant aux intervalles de
fréquences créés précédemment.
- Utilisez le bouton situé à côté de chacun des champs pour pouvoir utiliser la souris et
sélectionner les plages de cellules adéquates. Lorsque vous avez terminé, cliquez sur le bouton
pour revenir à la fenêtre de la fonction FREQUENCE.
- Une fois les 2 champs remplis, cliquez sur OK. Vous devez obtenir le calcul de la fréquence pour le
premier intervalle.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 14
- Pouvez-vous tirer une conclusion concernant les forts consommateurs ?
……………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………..…
…………………………………………………………………………………………………………………………………………………………
- Est-ce que cette observation est de nature à vous faire remettre en cause ou nuancer vos conclusions
du TD 1 ?
............................................................................................................................................................……
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
Ce que vous devez rendre à la fin du TD 2
Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu/dossier_de_votre_binome,
créez un dossier TD2. Ajoutez dans ce dossier les fichiers Excel contenant vos réponses. :
- ENQ_1_consommateur.xls
- ENQ_1_conso_semaine.xls
- Il faut maintenant propager la fonction sur les autres intervalles de fréquences.
- Sélectionnez l’ensemble des cellules dans lesquelles il faut propager le calcul de la fréquence
- Tout en gardant ces cellules sélectionnées, appuyez sur la touche F2 puis sur CTRL+MAJ+ENTRÉE.
- Vous devez maintenant avoir une fréquence en face de chaque intervalle.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 15
4 TD 3 – Analyser et préparer les données de contamination
Certaines méthodes statistiques (notamment les approches probabilistes) sont sensibles à la qualité et la
quantité des données disponibles. Pour pouvoir choisir la méthode de calcul adaptée, il est donc essentiel de
caractériser ses données.
Où trouver les données pour le TD ?
L’ensemble des fichiers nécessaires pour le TD 3 se trouvent sur le lecteur réseau TD dans le dossier
UC_Risque_Analyse_Donnees/TD3.
FAITES UNE COPIE DE CE DOSSIER SUR VOTRE ESPACE DISQUE N:/
4.1 Caractérisation des données de contamination
Dans cette partie, nous allons travailler sur le fichier mesure_plomb.xls. Ce fichier présente les teneurs en
plomb mesurées dans différents aliments. Ces données de contamination se présentent sous la forme de listes
de mesures de contamination organisées en groupe d’aliments. Le tableau ci-dessous décrit les champs de ce
fichier.
Description des champs du fichier mesure_plomb.xls
Nom du champ Description
id_mesure Identifiant de la mesure
id_contaminant Identifiant du contaminant
nom_contaminant Nom du contaminant
id_aliment Identifiant de l’aliment analysé
nom_aliment Nom de l’aliment analysé
id_groupe_aliment Identifiant du groupe aliment
nom_groupe_aliment Nom du groupe aliment
id_laboratoire Identifiant du laboratoire ayant effectué les analyses
unite_mesure Unité de la mesure effectuée
quantite_numerique Quantité de contaminant retrouvé dans l’aliment analysé. Cette valeur est renseignée si la teneur en contaminant dans l’aliment analysé était supérieure à la LOQ. Sinon les 2 colonnes signe_quantite_imprecise et quantite_imprecise_valeur sont renseignées
signe_quantite_imprecise Signe de l’imprécision dans la mesure de contamination. Cette colonne est renseignée si la mesure est inférieure à la LOQ ou la LOD. De plus, la colonne quantite_imprecise_valeur est aussi renseignée.
quantite_imprecise_valeur Quantité imprécise de contaminant retrouvé dans l’aliment analysé. Cette valeur est renseignée si la mesure est inférieure à la LOD ou la LOQ.
loq La limite de quantification associée à la mesure
lod La limite de détection associée à la mesure
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 16
Question 1 :
- Calculez le nombre de mesures disponibles par groupe d’aliments.
- Faites un histogramme représentant les résultats.
- Quelles conclusions en tirez-vous sur les calculs et leurs futures interprétations ?
..................................................................................................................................................................
..................................................................................................................................................................
..................................................................................................................................................................
Question 2 :
- Quel est le pourcentage d’échantillons supérieurs à la limite de détection ? Calculez ce pourcentage
sur l’ensemble des données disponibles et par groupes d’aliments
..................................................................................................................................................................
..................................................................................................................................................................
- Faites un histogramme représentant les résultats. Ajoutez une série sur ce graphique pour visualiser
les groupes présentant plus de 50% de données censurées.
Quelles conclusions en tirez-vous sur les calculs effectués dans le TD 1 et leurs interprétations ?
..................................................................................................................................................................
..................................................................................................................................................................
..................................................................................................................................................................
- Quelles conclusions en tirez-vous quant aux consommations et aux groupes d’aliments intéressants à
analyser ?
..................................................................................................................................................................
..................................................................................................................................................................
..................................................................................................................................................................
4.2 Choix du traitement de la censure
Nous allons maintenant traiter la censure c’est-à-dire remplacer les valeurs du type « < LOD » ou « < LOQ »
par une valeur précise. L’objectif est au final de remplacer les 2 colonnes quantite_numerique et
quantite_imprecise_valeur par une seule colonne que nous appellerons teneur_plomb contenant une valeur
précise de contamination pour chaque mesure effectuée sur le plomb. Pour cela, nous allons remplacer la
mesure censurée par la LOD ou la LOQ multipliée par un coefficient.
Question 3 : Mettez en œuvre les 3 scénarios suivant :
- Scénario 1 :
Pour chaque mesure de contamination :
- si une valeur existe dans la colonne quantite_numerique, on la copie dans la colonne teneur_plomb
- si une valeur existe dans la colonne quantite_imprecise_valeur, on applique l’une des 2 formules
suivantes :
o Si mesure < LOD, remplacer par α LOD avec α = 0
o Si mesure < LOQ, remplacer par β LOQ avec β = 0
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 17
- Scénario 2 :
Pour chaque mesure de contamination :
- si une valeur existe dans la colonne quantite_numerique, on la copie dans la colonne teneur_plomb
- si une valeur existe dans la colonne quantite_imprecise_valeur, on applique l’une des 2 formules
suivantes :
o Si mesure < LOD, remplacer par α LOD avec α = 1
o Si mesure < LOQ, remplacer par β LOQ avec β = 1
- Scénario 3 :
Pour chaque mesure de contamination :
- si une valeur existe dans la colonne quantite_numerique, on la copie dans la colonne teneur_plomb
- si une valeur existe dans la colonne quantite_imprecise_valeur, on applique l’une des 2 formules
suivantes :
o Si mesure < LOD, remplacer par α LOD avec α = 0.5
o Si mesure < LOQ, remplacer par α LOD + β LOQ avec α = 0.5 et β = 0.5
Créez une colonne teneur_plomb pour chaque scénario et appliquez le scénario correspondant c’est-à-dire
remplacer les valeurs censurées par des valeurs précises pour n’avoir plus qu’une seule colonne contenant
des valeurs précises de contamination pour chaque mesure effectuée sur le plomb.
A la fin, vous devez donc avoir une colonne teneur_plomb_1 pour le scénario 1, teneur_plomb_2 pour le
scénario 2 et teneur_plomb_3 pour le scénario 3.
Aide :
Pour répondre à cette question, vous pouvez utiliser les fonctions :
- SI ()
- ESTVIDE ()
N’hésitez pas à faire des transformations intermédiaires si nécessaires.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 18
4.3 Agrégation des mesures de contamination
Après avoir traité la censure, il faut maintenant agréger les mesures de contamination c’est-à-dire nous
ramener à une mesure de contamination pour chaque groupe d’aliments en appliquant une des méthodes
d’agrégation suivante :
- Moyenne : on prend la moyenne de la liste des mesures de contamination ;
- Maximum : on prend le maximum de la liste des mesures de contamination.
Question 4 : Pour chacun des 3 scénarios réalisés précédemment, agrégez les mesures de contamination pour
chaque groupe d’aliments en utilisant les 2 méthodes moyenne, maximum. En d’autres termes, pour chacun
des 3 scénarios, vous devez obtenir un tableau sur le modèle de celui-ci :
Nom groupe Moyenne Maximum
Groupe 1
Groupe 2
Etc…
Question 5 : Proposez une/des représentation(s) graphique(s) permettant de visualiser pour chaque groupe
d’aliments les différentes moyenne obtenues selon les 3 scénarios.
- Faites la même chose avec le maximum.
Quelles conclusions en tirez-vous ? Quelles peuvent être les conséquences sur le calcul ?
..................................................................................................................................................................
..................................................................................................................................................................
..................................................................................................................................................................
Est-il pertinent de faire plusieurs calculs d’exposition se basant sur les 3 scénarios ? Justifiez votre
réponse.
..................................................................................................................................................................
..................................................................................................................................................................
..................................................................................................................................................................
Aide :
Il pourrait être pertinent de faire plusieurs graphiques représentant les moyennes/maximum élevés d’une
part et les moyennes/maximum faibles d’autre part.
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 19
Question 6 : Représentez pour le scénario 1 sur un même graphique la moyenne et le maximum des mesures
de contamination pour chaque groupe d’aliments.
- Faites la même chose pour les scénarii 2 et 3.
Quelles conclusions en tirez-vous ? Quelles peuvent être les conséquences sur le calcul ?
..................................................................................................................................................................
..................................................................................................................................................................
..................................................................................................................................................................
- Est-il pertinent de faire plusieurs calculs d’exposition utilisant la moyenne et le maximum des mesures
de contamination ? Justifiez votre réponse.
..................................................................................................................................................................
..................................................................................................................................................................
..................................................................................................................................................................
Ce que vous devez rendre à la fin du TD 3
Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu/dossier_de_votre_binome,
créez un dossier TD3. Ajoutez dans ce dossier le fichier Excel mesure_plomb.xls contenant vos réponses.
Bonus : S’il vous reste du temps……
- Réalisez le TD1 en utilisant cette fois les données disponibles dans la feuille
matrice_consommation_ENQ2.
- Reprenez le TD2 avec le fichier ENQ_2_consommateur.xls situé dans le dossier
caracterisation_consommateur. Ce fichier présente certaines caractéristiques sociodémographiques
des individus ayant répondus à une enquête de consommation individuelle que nous nommerons
ENQ2. Le tableau ci-dessous décrit les champs de ce fichier. Nous supposerons que cette enquête
ENQ2 a eu lieu 5 ans après l’enquête ENQ1.
Description des champs du fichier ENQ_2_consommateur.xls
Nom du champ Description
nomen Identifiant de la personne ayant répondu à l’enquête
age Age de la personne ayant répondu à l’enquête
sexe Sexe de la personne ayant répondu à l’enquête
reg Région d’habitation de la personne ayant répondu à l’enquête
enceinte Indique si la personne considérée était enceinte ou non au moment où elle a répondu à l’enquête
UC Risques sanitaires environnementaux et alimentaires pour l’Homme Page 20
- Comparer vos résultats avec ceux que vous avez obtenus pour l’ENQ1.
- Reprenez le TD2 avec le fichier ENQ_2_conso_semaine.xls situé dans le dossier
caracterisation_consommation. Ce fichier décrit les consommations des individus ayant répondu à
l’enquête de consommation ENQ2. Les consommations ont été sommées par groupe d’aliments et
divisées par le poids de l’individu.
Description des champs du fichier ENQ_2_consommateur.xls
Nom du champ Description
nomen Identifiant de la personne ayant répondu à l’enquête
libgr Libellé du groupe aliment consommés
SommeDeqte Sommes des quantités consommées divisées par le poids de l’individu
age Age de la personne ayant répondu à l’enquête
sexe Sexe de la personne ayant répondu à l’enquête
reg Région d’habitation de la personne ayant répondu à l’enquête
enceinte Indique si la personne considérée était enceinte ou non au moment où elle a répondu à l’enquête
- Comparer vos résultats avec ceux que vous avez obtenus pour l’ENQ1.
Ce que vous devez rendre à la fin du Bonus
Sur le lecteur réseau TD dans le dossier UC_Risque_Analyse_Donnees/Rendu/dossier_de_votre_binome,
créez un dossier Bonus. Ajoutez dans ce dossier les fichiers Excel contenant vos réponses.