chronologie des episodes de ozone dans … · chronologie des épisodes de pollution par l’ozone...

44
Octobre 2006 CHRONOLOGIE DES EPISODES DE POLLUTION PAR LOZONE DANS LA REGION DE LETANG DE BERRE Etude de faisabilité En collaboration avec :

Upload: buidung

Post on 16-Sep-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

Octobre 2006

CHRONOLOGIE DES EPISODES DE POLLUTION PAR L’OZONE DANS LA REGION DE L’ETANG DE BERRE Etude de faisabilité

En collaboration avec :

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 2 sur 44

Table des matières

1. Objet de l'étude ....................................................................................................................................... 3

2. Méthodologie........................................................................................................................................... 5 2.1. CLASSIFICATION DES PICS HORAIRES EN TYPOLOGIE D’EPISODES DE POLLUTION ..............6

2.2. CARACTERISATION DES JOURNEES DE POLLUTION .........................................................13

2.3. CLASSIFICATION TEMPORELLE DES EPISODES ................................................................14

3. Conclusions ...........................................................................................................................................18

Table des figures .........................................................................................................................................20

Table des tableaux.......................................................................................................................................22

Table des Annexes ......................................................................................................................................23

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 3 sur 44

1. Objet de l'étude

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 4 sur 44

1. Objet de l’étude

Cette notice fait le bilan de la pré-étude sur la chronologie des pics d’ozone sur le domaine d’intervention d’AIRFOBEP. L’objectif de cette pré-étude est d’évaluer la possibilité de classifier les épisodes de pollution d’ozone en fonction de la localisation des stations concernées et de l’évolution de cette dernière au cours du temps. Cette classification portera sur la distinction d’épisodes typiques et atypiques, sachant que seule l’évolution temporelle des épisodes typiques est étudiée.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 5 sur 44

2. Méthodologie

2.1. Classification des pics horaires en typologie d’épisodes de pollution 2.2. Caractérisation des épisodes 2.3. Classification temporelle des épisodes

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 6 sur 44

2. Méthodologie

La méthode employée pour permettre l’étude chronologique des épisodes de pic d’ozone suit la démarche suivante : - Classification des situations horaires de pics d’ozone : chaque heure de dépassement est alors considérée

indépendamment des autres. Chacune d’entre elle est simplement caractérisée par un ensemble d’indicateur spécifiant si la concentration relevée en chacune des stations dépasse un seuil donné. On tente alors de regrouper les cas similaires c’est à dire ceux pour lesquels les dépassements se produisent aux niveaux des mêmes stations (ou sur des stations proches géographiquement). On obtient de cette façon, différentes classes représentatives de tous les cas de pollution horaires possibles.

- Caractérisation des journées de pollution (toute journée durant laquelle s’est produit au moins 1 pic) : une journée de pollution peut être caractérisée par un ensemble de 24 paramètres : chacun d’eux définit l’état de pollution observé à une heure donnée : il désigne soit l’une des classes de pollution horaire définie dans l’étape précédente soit le cas d’une absence de pollution.

- Classification des épisodes de pollution : puisque désormais les journées de pollution sont entièrement définies par la donnée d’un nombre limité de paramètres ne pouvant prendre qu’un nombre d’état restreint, leur classification est désormais possible. Il sera alors possible de regrouper les journées de pollution présentant les mêmes caractéristiques et d’isoler les cas atypiques. Pour l’instant, une approche mathématique n’a pas pu être développée pour permettre cette classification. Cependant une approche manuelle basée sur une représentation simplifiée des différents épisodes a donné des résultats prometteurs.

La méthodologie proposée s’adapte aux différentes situations de dépassement d’ozone (dépassement horaire d’une valeur limite de 180 µg /m3, de 150 µg/m3, ou de 110 µg/m3). Cependant, les caractères choisis pour caractériser les épisodes de pollution (voir 2.1 et 2.2) sont alors dépendant de la valeur limite choisie. Dans cette pré-étude, nous nous sommes attachés uniquement aux dépassements du seuil horaire de 180 µg/m3.

2.1. Classification des pics horaires en typologie d’épisodes de pollution

Cette première étape consiste à constituer plusieurs listes de dates horaires correspondants à des épisodes de pollution dits « similaires » au moyen de l’analyse historique de données d’observations. Cette série de listes est obtenue à partir d’un traitement statistique (décrit section 2.1.1) appliqué à un ensemble de paramètres qualifiant chacun des pics. Nous détaillerons dans la section 2.1.3 les paramètres testés et le choix retenu. Le traitement statistique utilisé (classification hiérarchique ascendante, ou CAH) nécessite d’avoir un jeu de donnée complet, c’est à dire que pour chaque échéance temporelle, une donnée doit être disponible pour chacune des stations retenus. Compte tenu des disfonctionnement éventuels des appareils de mesure et des périodes de maintenance, cela n’est pas le cas ; et des données d’observations sont manquantes. La section 2.1.2 présente la base données employée, tandis que la section 2.1.4 présente les résultats obtenus.

2.1.1 Description de la classification hiérarchique ascendante Le but de la classification est de regrouper les individus constituants une population donnée en différentes classes, en fonction des divers caractères qui les définissent. Une même classe doit regrouper des individus dont les caractères sont proches et deux classes différentes doivent contenir des individus aussi différents que possible.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 7 sur 44

Dans notre cas, chacune des dates pour lesquelles un pic de pollution a pu être observé, constitue un individu. Les caractères qui le définissent pourront être des relevés de concentration ou des observations météorologiques. Il existe de nombreuses méthodes de classification. Celles qui sont dites « hiérarchiques ascendantes » s’effectuent de la façon suivante : Chaque point est tout d’abord considéré comme étant une classe à lui seul ; lors de chacune des itérations suivantes, la méthode rassemble deux de ces points en recherchant le minimum d’un critère de dissemblance (ou le maximum d’un critère de ressemblance), estimé à partir des valeurs des caractères propres à chaque individu. Chaque itération entraîne donc la disparition d’une classe, cette classe regroupant deux classes présentes lors de l’itération précédente; lorsque la classification est terminée, une seule classe demeure, regroupant l’ensemble des éléments. Cependant, la méthode mémorise l’ensemble du processus d’agrégation qui peut être représenté par un dendrogramme (figure ci-dessous). Un paramètre généralement appelé « niveau d’agrégation » permet d’évaluer la perte d’information consentie pour une classification donnée. Il permet généralement de choisir le nombre de classes à conserver. Pour obtenir une classification en un nombre de classe ainsi déterminé, il suffit alors de « couper » l’arbre à l’emplacement correspondant.

Figure 1 : Dendrogramme obtenu pour la classification de 14 individus et valeur du niveau d’agrégation (plus la valeur est

grande, plus les pertes d’informations sont importantes). L’une des méthodes les plus employées, la méthode de Ward, utilise comme critère d’agrégation la valeur de l’inertie intraclasse. Cette quantité est la moyenne du carré des distances entre chaque point inclus dans une classe et le centre de gravité de cette classe. Une bonne classification cherchera donc à minimiser au maximum cette valeur pour permettre l’obtention de classe très homogène. On peut démontrer que la recherche de ce critère revient aussi à maximiser la différence existante entres deux classes différentes. La classification obtenue assure donc non seulement l’homogénéité de chaque classe mais aussi un contraste maximum entre deux classes distinctes. Notons que la classification obtenue n’est pas forcement la meilleure. La seule possibilité pour l’obtenir serait d’évaluer chacune des classifications possibles, ce qui demeure une tache irréalisable pour un tel nombre de données. La CAH garantie simplement la classification optimale en k classes à partir d’une partition en k+1 classes.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 8 sur 44

Plus concrètement, voici un rapide descriptif de la procédure utilisée dans la méthode de Ward. L’estimateur de proximité est calculé comme étant la perte d’inertie du nuage impliqué par le regroupement des deux points considérés. Plus cette valeur est forte, plus les points sont donc dissemblables. Pour deux points A et B, elle peut être calculée facilement par la relation :

( )BAdPP

PPBABA

BA ,),( 2

+=δ (2)

avec : - PA et PB les poids des individus A et B. Ils sont tels que la somme de tous les poids de tous les individus vaut 1. PA vaut donc 1/N (où N est le nombre total d’individu) si A correspond à un point isolé, ou n/N si A est une classe avec n le nombre d’individus regroupés dans cette classe. - d2(A,B) le carré de la distance séparant le point A du point B. Cette distance est évaluée de la même manière qu’une distance classique si ce n’est que la formule est généralisé au cas d’un espace à p dimensions, où p est le nombre de caractères définissant chaque point. Ainsi si A1, A2, …, Ap sont les caractères de l’individu A et si B1, B2, …, Bp ceux définissant B, on aura :

( ) ( )2

1

2 , ∑=

−=p

iii BABAd (3)

Les valeurs des caractères définissant chacun des individus sont généralement : - centrées afin de placer l’origine de l’espace des caractères au niveau du barycentre du nuage de points, - réduites afin de donner le même poids à chacun des caractères quel que soit leur degré de variation et de former des quantités adimensionnées rendant le calcul des distances indépendant des unités utilisées pour l’expression des caractères. La procédure de zonage recherche alors le minimum de cette quantité et rassemble les deux points concernés dans la même zone. Il faut alors recalculer la valeur de perte d’inertie δ associée au regroupement de la nouvelle zone et de tous les autres points. On peut démontrer qu’elle peut être calculée par la relation :

( ) ( )CBA

CCBCA

PPPBAPCBPPCAPP

BAC++

−+++=

),(),(),(),(

δδδδ Υ (4)

avec : - AUB la zone formée par le regroupement des points A et B, - C un autre point du domaine, - PA, PB et PC respectivement les poids des points A, B et C.

La procédure se poursuit jusqu’au nombre de classe choisie par l’utilisateur. Le rapport du cumul des pertes d’inertie observées sur l’inertie initiale de nuage (somme du carré des distances entre les points et le centre de gravité du nuage) donne le niveau d’agrégation. C’est une valeur comprise entre 0 et 1, qui croît avec la réduction du nombre de classe et qui est d’autant plus forte que la perte d’information consentie est importante.

2.1.2 Constitution de la base de données nécessaire à la CAH La classification des différents pics de pollution à l’aide de la classification hiérarchique ascendante passe en premier lieu par la constitution d’une base de données qui va regrouper les différents individus à classer (c’est à dire dans notre cas, les échéances horaires d’occurrence des pics sur une ou plusieurs stations) et par le choix d’un certain nombre de critères qui vont caractériser la nature de ces pics. La classification regroupera alors les individus en fonction de la plus ou moins grande proximité de ces critères.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 9 sur 44

Dans le cadre de cette étude, la CAH ne doit porter que sur les dates concernées par un pic de pollution sur au moins une des stations d’observation. La base de donnée disponible correspond aux mesures horaires d’ozone pour les 16 stations du réseau AIRFOBEP et pour la période allant de janvier 2000 à janvier 2005. L’année 1999 n’a pas été retenue de part un trop grand nombre de données manquantes (certaines stations ont été mises en service qu’au cours de l’année 1999). Dans une première approche, aucune station du réseau AIRMARAIX n’a été considérée. Lors de la classification temporelle définitive des épisodes de pollution, l’ajout de certaines stations (tel qu’au niveau d’Avignon) pourra être éventuellement envisagé pour affiner la classification. Comme indiqué précédemment, la CAH ne peut travailler que sur des dates (ou individus) pour lesquelles tous les caractères sont disponibles. S’il manque l’un des caractères, la distance avec les autres individus ne peut être estimée et le processus échoue. Or des données d’observations sont manquantes. Compte tenu de la nature de l’étude (classification des épisodes TYPIQUE d’ozone correspondants au dépassement du seuil horaire de 180 µg/m3) et compte tenu des objectifs visés (évaluation de la possibilité de réaliser une chronologie complète et fine des pics d’ozone), nous avons choisis de compléter et réduire la base de données avec les choix suivants :

• Seule la période couvrant les mois de mai à octobre a été considérée. • La nuit (de 22H à 5H), il a été considéré qu’aucun dépassement avait lieu (les dépassements

éventuellement observés ont donc été considérés comme ATYPIQUE dans cette pré-étude). • En journée, lorsqu’une valeur manquante était encadrée par deux valeurs inférieures à 90 µg/m3, il a

été choisi de considérer qu’aucun dépassement n’avait lieu pour cette échéance manquante. • Enfin, une reconstruction automatique par analyse des configurations de dépassement a été effectuée

pour compléter les données manquantes. Cette reconstruction automatique dépend de la valeur du seuil de dépassement.

A la suite de ces opérations et pour le seuil à 180 µg/m3, sur les 26496 échéances temporelles possibles, il restait 1985 échéances (7.5%) pour lesquelles une valeur d’ozone était manquante pour au moins 1 des 16 stations d’observation. Ces échéances horaires ont été écartées.

2.1.3 Sélection des caractères et du nombre de classe Les caractères sont les paramètres en fonction desquels la CAH sera réalisée. La CAH regroupera les individus aux caractères proches. Le choix des variables à prendre en compte est donc important. Ces paramètres doivent par ailleurs obéir à deux critères :

• Demeurer disponible dans l’avenir : dans notre cas, cela implique donc de travailler sur une base de données d’observations en ne considérant que les stations qui resteront en service dans les années futures. Aucune station n’a été écartée par ce critère.

• Etre disponible rapidement dans un cadre opérationnel : les caractères utilisés dans la CAH étant nécessaires à la classification des épisodes de pollution futurs, il est indispensable que toutes ces variables puissent être obtenues rapidement.

Compte tenu de ces critères, nous nous sommes donc restreints aux données d’observations d’ozone sur les 16 stations du réseau AIRFOBEP. Aucune autre donnée externe (tel que par exemple des données météorologiques) n’a été considérée. Plusieurs variables ont été envisagées pour caractériser chaque individu (une date horaire) en terme d’épisode de pollution :

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 10 sur 44

a) Utilisation d’un barycentre pondéré des stations qui déclenchent lors de la même échéance temporelle. Ce

paramètre est finalement peu discriminant quand on considère les différents cas possibles de dépassement sur la zone (voir Figure 2).

b) Utilisation de la seule information de présence d’un dépassement ou non (0/1) pour chaque station. Ce paramètre ne prend donc pas en considération la distance entre deux stations qui dépassent, et est encore moins discriminant que le caractère précédent (voir Figure 3).

c) Utilisation de l’information de la présence d’un dépassement ou non à chaque station et une zone globale de dépassement (voir Figure 4). Pour chaque individu (échéance horaire), quatre paramètres sont alors ajoutés : ils correspondent aux abscisses et ordonnées minimales/maximales du rectangle couvrant toutes les stations qui dépassent .Comme dans le cas (b), les dépassements par stations ont trop de poids.

d) Utilisation uniquement d’une zone de dépassement global : pour chaque individu (échéance horaire), quatre paramètres sont alors associés qui correspondent aux abscisses et ordonnées minimales/maximales du rectangle couvrant toutes les stations qui dépassent. Des problèmes peuvent subsister théoriquement (voir Figure 5). Cependant, ces cas se rencontrent très peu finalement. D’autre part, une variante en associant une seconde zone de dépassement décalée d’un angle de quarante cinq degré a été testée. L’amélioration de la discrimination des épisodes par la CAH ne fût pas flagrante par rapport à l’utilisation d’une seule zone de dépassement.

Figure 2 : Illustration du caractère (a) : avec cette approche, pour la CAH, les cas présentés sur les cartes de droite et de

gauche sont très proches car seul le barycentre des stations qui dépasse est pris en compte.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 11 sur 44

Figure 3 : Illustration du caractère (b) : dans ce cas, la situation représentée sur la carte du haut à autant de chance d’être

associé à l’une ou l’autre situations de dépassement représentés sur les graphes du bas. Il apparaît pourtant que l’association avec la carte de droite est nettement plus judicieuse.

Figure 4 : Illustration du caractère (c) pour la CAH : les deux cas de dépassement représentés sur ces cartes sont caractérisés

par les coordonnées d’un rectangle englobant toutes les stations qui dépassent. De cette façon, contrairement à l’approche illustrée sur la figure 3, ces 2 situations de pollution apparaissent comme très différentes.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 12 sur 44

Figure 5 : Illustration du caractère (d) pour la CAH : les deux situations de dépassement présentées sur ces cartes apparaissent

comme identiques pour la CAH. Nous avons finalement retenu le choix (d) pour caractériser l’épisode de pollution pour chaque individu (échéance horaire).

2.1.4 Résultats de la CAH choisie La CAH a été appliquée à l’ensemble du jeu d’observations sélectionné lors de la phase 2.1.2. Les résultats obtenus ont montré le caractère particulier de la station AURIBEAU, qui représentait à elle seule la classe la plus importante (314 échéances horaires avec un dépassement observé uniquement à Auribeau pour un total de 1026 échéances horaires). De plus sa situation très excentrée par rapport aux autres stations du réseau impliquait deux problèmes :

- les concentrations relevées sur cette station ne semblent que rarement liées à la pollution observée sur le reste du réseau

- la CAH distinguait des situations très proches au seul titre que l’une des configurations de pollution incorporait la station d’Auribeau

La station d’Auribeau a donc finalement été écartée du jeu de donnée d’entrée.

Par ailleurs, suite aux remarques d’AIRFOBEP, il a été entrepris d’évaluer la non prise en compte de la station de Marignane-Ville : sa localisation (site urbain) contribue à minimiser grandement sa représentativité. L’existence locale de fortes concentrations en NOx tendent à réduire les concentrations d’ozone observées qui ne sont donc plus représentatives de la pollution régionale.

Des tests ont été effectués en ne considérant pas les observations de ces deux stations. La comparaison des classifications obtenues en sortie de CAH montrent une cohérence plus importante lorsque ces deux stations ne sont pas considérées. Dans la suite de cette pré-étude et en accord avec AIRFOBEP, nous avons choisi de ne plus considérer ces deux stations. A titre d’information, les observations pour la station des Saintes Marie de la Mer pourraient être également écartées lors de l’étude finale. La CAH a donc été appliquée sur les dates sélectionnées (708 échéances temporelles) avec les critères définis dans la section 2.1.3. Vingt classes ont été retenues. Pour ces vingt classes, la valeur du niveau d’agrégation est de 4.45%, ce qui correspond à une perte d’information très faible : il est à noter cependant que ce paramètre ne porte que sur l’information disponible en entrée de la CAH : la réduction d’une situation de pollution à un ensemble de quatre caractères (les coordonnées d’un rectangle englobant la localisation des pics) constitue déjà une simplification importante de l’ensemble des paramètres caractérisant cette situation.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 13 sur 44

Toutefois, si l’on considère que les données restantes restituent correctement l’essentiel des propriétés des cas que l’on désire analyser, alors on peut dire que la réduction à une partition de vingt classes n’entraîne quasiment pas de perte d’information. L’effectif (nombre d’échéance temporelle) de chacune de ces classes est donné dans le tableau suivant, tandis que les figures de l’annexe 1 présentent les fréquences de dépassement du seuil 180 µg/m3 en chacune des stations pour chacune des classes, ainsi que les vecteurs de vents moyens associés à ces classes.

2.2. Caractérisation des journées de pollution

La première étape nous a permis d’obtenir une partition de l’ensemble des cas de pollution horaire possibles. Désormais il est donc possible de qualifier chaque journée de pollution comme une succession des différentes classes que l’on vient de déterminer et d’une classe correspondante à l’absence de pollution. Il est important de noter que plus le nombre de classe composant la partition des classes horaires de pollution est grand, plus la classification des événement de pollution s’avérera délicate. Il sera alors nécessaire Dans le cadre de cette pré-étude de validation de la méthode, nous avons donc choisi dans un premier temps de limiter ce nombre. Pour ce faire :

- les classes ayant un faible effectif d’individus (classes 9 , 14, 16, 17) ou caractéristique d’un épisode particulier de dépassement d’ozone (classe 8) ont été écartées

- - des classes présentant des épisodes de pollution relativement similaires ont été regroupées sous la même classe.

Le Tableau 1 présente ainsi les choix de regroupement et d’écartement des classes. A partir de cette classification simplifiée, chacun des épisodes de pollution a finalement pu être associé à un vecteur dont chacune des composantes désigne soit l’une des typologies de pollution soit une absence de dépassement.

Classe Effectif Classe écartée Classe regroupée1 60 2 43 3 37 4 51 5 164 6 42 Avec la 3 7 11 Avec la 2 8 38 X 9 4 X

10 27 11 27 12 24 13 71 14 21 X 15 10 Avec la 13 16 2 X 17 5 X 18 41 19 16 Avec la 18 20 14

Tableau 1 : Description des 20 classes en sortie de la CAH.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 14 sur 44

2.3. Classification temporelle des épisodes

A ce stade, chaque épisode de pollution a pu être réduit à un ensemble restreint de paramètres. Pour atteindre notre objectif, il reste à classifier ces différentes journées ce qui revient désormais à regrouper celles dont les paramètres caractéristiques sont proches. Toutefois, à l’heure actuelle aucune approche mathématique n’a pu être établie car de nombreuses difficultés techniques restent à surmonter. Cependant une approche manuelle utilisant une représentation schématique simplifiée des cas de pollution a pu être mise au point. Pour cela il a été nécessaire de définir une méthode de visualisation de chacun des événements de pollution. Pour permettre une classification manuelle, cette représentation doit se faire sur un graphe unique et comporter la plus grande partie des caractéristiques de la chronologie du pic. Pour ce faire, on procède de la façon suivante pour chacune des journées de pic :

- on recherche la première heure polluée de la journée considérée. Grâce aux étapes précédentes on sait désormais quelle est la typologie de pollution horaire associée. On représente alors ce pic sur une carte de la zone d’étude par un point unique dont la position correspond au barycentre des coordonnées des stations pondérées par la fréquence de dépassement observé en chacune d’elle pour la typologie de pollution considérée. En outre, sa couleur est représentative de l’étendue des dépassements sur la zone d’étude (de vert : dépassement limité à une station, à rouge : dépassement sur toute la zone d’étude). La Figure 6 donne la représentation associée de cette manière à chacune des typologies.

- la deuxième heure de pollution est représentée de la même façon. Si la typologie associée est différente de la première, on relie les deux points obtenus par une flèche donnant le sens d’évolution de l‘événement

- on procède ainsi jusqu’à la dernière heure polluée.

Par ailleurs, pour permettre une détection plus aisée de « l’origine » du pic, le premier épisode de dépassement observé au cours de la journée est visualisé au moyen d’un triangle, tandis que pour les autres échéances, on utilise un cercle.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 15 sur 44

Figure 6 : Barycentre et code couleur associés (à gauche) à chaque classe d’épisode horaire de dépassement (à droite).

Au final, chaque journée polluée peut être représentée par une carte unique donnant la succession des différents pics horaires et, pour chacun d’eux, le centre et l’étendue de la zone impactée. Cette représentation ne permet cependant pas de mettre en évidence un certain nombre d’éléments :

- deux typologies horaires identiques se succédant apparaissent comme un unique point. On peut toutefois noter que pour les 169 jours qui présentent un dépassement, 70% ne présentent que des dépassements pendant 4 échéances horaires ou moins. Le risque de l’existence d’un épisode très singulier du fait de la répétition prolongée d’une typologie donnée est donc faible

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 16 sur 44

- les cas d’absence de pollution n’apparaissent pas : deux événements caractérisés par le même enchaînement de typologies mais dont l’un incorpore une période non polluée se verront représenter de la même façon. Cependant, sur les 169 jours qui présentent un dépassement, 66% des épisodes de pollution ne produisent sans discontinuité et 30% d’entre eux se composent de 2 séquences polluées séparées par une unique période non polluée. La durée de cette période est alors dans la grande majorité des cas égale à 1 heure.

- les heures où se produisent les pics n’apparaissent pas : deux successions de pics identiques mais se produisant à des périodes de la journée très différentes sont visualisées de la même façon.

A titre d’exemple, la Figure 7 représente un événement temporel correspond à un épisode de brise : Le départ de l’épisode (triangle vert sous le rond vert) se situe dans la région de Sausset les Pins / Carry le rouet (avec une petite extension vers Martigues quand on regarde la Figure 6 présentant les barycentres). L’épisode se déplace ensuite sur tout le pourtour Est de l’étang (point jaune : de Sausset les Pins jusqu’à Berre l’étang/Vitrolles). Cet épisode de pollution s’étend ensuite à tout le pourtour de l’étang (point rouge) pour ensuite se terminer 4 heures plus tard au niveau de la côte sud de l’étang (point vert).

Figure 7 : Exemple de représentation temporelle de la succession d’épisodes horaires de dépassement d’ozone.

Moyennant ces simplifications, un regroupement manuel peut alors être réalisé pour regrouper certaines typologie temporelle sous une même classe. La Figure 8 présente ainsi un tel essai de regroupement pour deux cas bien distinct. En outre, un nombre important d’enchaînement temporel semble être difficilement regroupable sous une catégorie et mérite une attention plus particulière sur l’application d’une telle méthode.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 17 sur 44

Figure 8 : Exemple de deux classements préliminaire des enchaînements temporels des épisodes horaires de dépassement.

On peut cependant faire les remarques suivantes :

- La méthode envisagée permet l’obtention d’une classification, bien qu’imparfaite, des événements journaliers de pollution d’ozone : Ceci tend à prouver la faisabilité de cette analyse.

- Si le regroupement de plusieurs classes s’est fait de façon relativement aisée, l’affectation de certaines journées dans telles ou telles typologies auraient certainement pu être réalisées selon d’autres configurations. L’expertise d’AIRFOBEP concernant les cas de pollution de leur zone d’étude sera certainement nécessaire pour trancher ce genre de cas qui ne se justifient pour l’instant que par un choix arbitraire.

- Le nombre de classes et d’événements atypiques (non associés à une typologie) est déjà relativement important. S’il est possible qu’un raffinement apporté à la méthode de classification puisse permettre d’éliminer certains des cas atypiques (par exemple en décomposant un épisode en deux parties séparées par une période d’absence de pollution), globalement il devrait tendre à augmenter son pouvoir discriminant : il se pourrait alors que le nombre de classe explose et que leur effectif respectif se réduise fortement. Un choix dans les paramètres discriminants (présence de période sans pollution, « étalement » d’une typologie horaire, période d’occurrence de l’événement, nombre de typologie horaire conservé) sera donc certainement inévitable.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 18 sur 44

3. Conclusions

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 19 sur 44

3. Conclusions

L’objectif de cette pré-étude était d’évaluer la faisabilité d’établir une classification temporelle de l’enchaînement des épisodes de pollution à l’ozone sur la zone d’AIRFOBEP. A partir d’une base de données complètes d’observations d’ozone de 2000 à 2005, il a été sélectionné un sous-ensemble répondant à certains critères dans le cadre d’une étude du dépassement du seuil de 180 µg/m3. Ces critères sont nécessaires entre autre pour l’application d’un premier traitement statistique, au moyen d’une classification hiérarchique ascendante, qui a pour objet de regrouper les échéances temporelles ayant des caractéristiques similaires. A cette fin, nous avons choisi d’associer à chaque échéance temporelle, 4 caractères qui permettent de décrire l’étendue géographique où des dépassements sont observés. Au terme de cette classification, 20 classes ont été obtenues. Dans un deuxième temps cette partition a été modifiée afin de permettre une classification simplifiée des épisodes de pollution : Les typologies de moindre effectif ont été écartées et certaines ont pu être regroupées 2 à 2. Finalement ce nouvel ensemble de classe a permis la caractérisation de chaque journée de pollution qui s’est alors réduite à un ensemble restreint de paramètres indiquant la succession des typologies horaires de pollution rencontrées au cours de la journée. La détermination de famille d’épisodes de pollution est désormais réalisable en associant les événements caractérisés par le même ensemble d’indicateurs (ou par des indicateurs proches). La classification des événements n’a pu être réalisé par une approche mathématique mais une méthode manuelle a pu être mise au point : Elle utilise une représentation simplifiée et concise de chaque épisode de pollution sous la forme d’une cartographie unique schématisant la succession des différents états de pollution et, pour chacun d’eux, la localisation et l’étendue de la zone impactée. La comparaison de ces cartographies a pu aboutir à la constitution d’une première classification des épisodes pollués d’ozone de l’année 2002. Cette partition provisoire, bien qu’imparfaite et ayant nécessité quelques simplifications, constitue un élément très encourageant quant à la faisabilité d’une étude chronologique complète des pics d’ozone de la zone d’étude. Plusieurs développements restent encore à envisager dans l’optique de l’étude finale :

- un éventuel raffinement de la base de donnée initiale, en terme de période (mois d’hiver, nuit) et en terme de stations considérées (écartement de Saintes Marie de la mer ?; Ajout de Stations Airmaraix ?).

- traitement des typologies écartées au cours de cette étape préliminaire. - gestion de plusieurs caractéristiques des épisodes mises sous silence jusqu’à présent : typologie horaire

persistante sur plusieurs heures, existence de situation non polluée au sein d’un épisode, période d‘apparition de l’événement. Ceci devrait pouvoir être réalisé simplement par une étude secondaire effectuée au sein de chacune des classes issues d’une première classification ayant ignoré ces phénomènes. Par ailleurs, ceci conduira certainement à un fractionnement des classes actuelles qui sont déjà nombreuses. Il sera donc certainement nécessaire de réaliser des choix quant à l’importance que l’on accorde à chacune de ces caractéristiques.

- développement éventuel d’une méthode mathématique globale de classification des paramètres caractéristiques des épisodes de pollution : elle pourrait s’avérer utile notamment si l’on désire abaisser le seuil de concentration des pics ou élargir la période d’étude : ceci pourrait avoir pour conséquence d’augmenter grandement le nombre de cas et rendre alors impossible une classification manuelle. Il reste cependant plusieurs problèmes techniques à surmonter avant d’atteindre cet objectif. Même dans ce cas, la méthode de visualisation développée dans ce document restera utile car elle permettra la vérification et la synthèse de l’analyse mathématique.

- éventuellement, extension de l’analyse aux autres seuils de dépassement (150 et 110 µg/m3) : ceci pourrait poser quelques problèmes : classification manuelle délicate du fait de la multiplication des épisodes pollués, quantité de mémoire allouée nécessaire à la CAH exorbitante, complétion de la base de donnée plus difficile …

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 20 sur 44

Table des figures

Figure 1 : Dendrogramme obtenu pour la classification de 14 individus et valeur du niveau d’agrégation (plus la valeur est grande, plus les pertes d’informations sont importantes). ...........................................................................................................7 Figure 2 : Illustration du caractère (a) : avec cette approche, pour la CAH, les cas présentés sur les cartes de droite et de gauche sont très proches car seul le barycentre des stations qui dépasse est pris en compte.................................................10 Figure 3 : Illustration du caractère (b) : dans ce cas, la situation représentée sur la carte du haut à autant de chance d’être associé à l’une ou l’autre situations de dépassement représentés sur les graphes du bas. Il apparaît pourtant que l’association avec la carte de droite est nettement plus judicieuse. ................................................................................................11 Figure 4 : Illustration du caractère (c) pour la CAH : les deux cas de dépassement représentés sur ces cartes sont caractérisés par les coordonnées d’un rectangle englobant toutes les stations qui dépassent. De cette façon, contrairement à l’approche illustrée sur la figure 3, ces 2 situations de pollution apparaissent comme très différentes. ...............11 Figure 5 : Illustration du caractère (d) pour la CAH : les deux situations de dépassement présentées sur ces cartes apparaissent comme identiques pour la CAH. ................................................................................................................................12 Figure 6 : Barycentre et code couleur associés (à gauche) à chaque classe d’épisode horaire de dépassement (à droite)..........15 Figure 7 : Exemple de représentation temporelle de la succession d’épisodes horaires de dépassement d’ozone. .....................16 Figure 8 : Exemple de deux classements préliminaire des enchaînements temporels des épisodes horaires de dépassement...................................................................................................................................................................................17 Figure 9 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 1............................................................................................................................................................................25 Figure 10 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 2............................................................................................................................................................................26 Figure 11 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 3............................................................................................................................................................................27 Figure 12 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 4............................................................................................................................................................................28 Figure 13 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 5............................................................................................................................................................................29 Figure 14 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 6............................................................................................................................................................................30 Figure 15 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 7............................................................................................................................................................................31 Figure 16 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 8............................................................................................................................................................................32 Figure 17 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 9............................................................................................................................................................................33 Figure 18 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 10..........................................................................................................................................................................34 Figure 19 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 11..........................................................................................................................................................................35 Figure 20 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 12..........................................................................................................................................................................36

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 21 sur 44

Figure 21 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 13..........................................................................................................................................................................37 Figure 22 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 14..........................................................................................................................................................................38 Figure 23 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 15..........................................................................................................................................................................39 Figure 24 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 16..........................................................................................................................................................................40 Figure 25 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 17..........................................................................................................................................................................41 Figure 26 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 18..........................................................................................................................................................................42 Figure 27 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 19..........................................................................................................................................................................43 Figure 28 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la classe 20..........................................................................................................................................................................44

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 22 sur 44

Table des tableaux

Tableau 1 : Description des 20 classes en sortie de la CAH. .........................................................................................................13

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 23 sur 44

Table des Annexes

Annexe 1 : Illustration de la fréquence de dépassement du seuil de 180 µg/m3 pour chacune des 20 classes issues de la CAH, et illustration des vecteurs vents moyens associés............................................24

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 24 sur 44

Annexe 1 : Illustration de la fréquence de dépassement du seuil de 180 µg/m3 pour chacune des 20 classes issues de la CAH, et illustration des vecteurs vents moyens associés.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 25 sur 44

Figure 9 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 1.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 26 sur 44

Figure 10 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 2.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 27 sur 44

Figure 11 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 3.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 28 sur 44

Figure 12 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 4.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 29 sur 44

Figure 13 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 5.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 30 sur 44

Figure 14 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 6.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 31 sur 44

Figure 15 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 7.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 32 sur 44

Figure 16 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 8.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 33 sur 44

Figure 17 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 9.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 34 sur 44

Figure 18 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 10.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 35 sur 44

Figure 19 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 11.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 36 sur 44

Figure 20 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 12.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 37 sur 44

Figure 21 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 13.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 38 sur 44

Figure 22 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 14.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 39 sur 44

Figure 23 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 15.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 40 sur 44

Figure 24 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 16.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 41 sur 44

Figure 25 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 17.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 42 sur 44

Figure 26 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 18.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 43 sur 44

Figure 27 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 19.

Chronologie des épisodes de pollution par l’ozone dans la région de l’étang de Berre

Page 44 sur 44

Figure 28 : Fréquence (%) du dépassement du seuil de 180 µg/m3 (haut) et vecteur vent moyen associé (bas) dans le cas de la

classe 20.