extremvÄrdesanalys av ...827017/fulltext01.pdff x(x): fördelningsfunktion f x(x): täthetsfunktion...

51
EXTREMVÄRDESANALYS AV GRUNDVATTENNIVÅMÄTSERIER Ezra M. Haaf May 2015 TRITA-LWR Examensarbete 14:12 ISSN 1651-064X LWR-EX 2014:12

Upload: others

Post on 21-Mar-2021

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

EXTREMVÄRDESANALYS AVGRUNDVATTENNIVÅMÄTSERIER

Ezra M. Haaf

May 2015

TRITA-LWR Examensarbete 14:12ISSN 1651-064XLWR-EX 2014:12

Page 2: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

c© Ezra M. Haaf 2015Degree Project Environmental Engineering and Sustainable InfrastructureEngineering Geology and Geophysics in association with COWI ABDepartment of Land and Water Resources EngineeringRoyal Institute of Technology (KTH)SE-100 44 STOCKHOLM, SwedenReference should be written as: E. Haaf (2015) “Extremvärdesanalys av grundvattennivåmätserier”TRITA-LWR Examensarbete 14:12 p. (35)

ii

Page 3: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

SAMMANFATTNING

Kunskapen om att kunna beräkna sannolikheten av extrema grundvattennivåer ärgrundläggande när man uppskattar risken av bottenupptryckning eller jordskred somuppstått på grund av högt porvattentryck. Detta görs genom att först anpassa grund-vattennivåobservationer till sannolikhetsfördelningar och sedan extrapolera till bestämdaåterkomstnivåer. Ändå har det hittills forskats mycket litet inom extremvärdesanalys avgrundvattennivåer med hjälp av sannolikhetsfunktioner. I Trafikverkets TK-Geo beskrivsen metod som utvecklades på 80-talet och som baseras på tillämpning av en etableradmetodik inom hydrologi till grundvattennivåmätserier. I detta arbete studeras aktuellforskning inom den hydrologiska extremvärdesteorin för att uppdatera metodiken inomgrundvattenforskning. För att testa metoderna har tillämpats den på fler än 100 långagrundvattennivåmätserier inom SGU:s grundvattennät. Etablerade punktskattningsme-toder som Maximum likelihood och Probility-weighted moments med L-moment jäm-förs med den mer vedertagna momentmetoden. Inom svensk forskning har årliga max-imiserier för urval av indata föredragits över den mer komplexa metoden som baseraspå överskridelseserier. Båda ansatserna diskuteras liksom deras inverkan på skattningen.Normal-, Weibull och Gumbelfördelningen jämförs med dem inom extremvärdesteorinoftast använda generaliserade extremvärdes- och Paretofördelningarna. För att kunna up-pskatta modellens lämplighet diskuteras och implementeras ett antal tester av anpass-ningsgraden såsom Anderson-Darling- och Kolmogorov-Smirnoff-testet. Resultatet ären överblick och rekommendation för lämpliga modeller samt en beskrivning av tillvä-gagångssättet för beräkning av återkomstnivåer.Anpassning av sannolikhetsfunktioner kräver att indata är oberoende och likafördelade,alltså tvärtemot vad grundvattennivåobservationer kan förväntas vara, eftersom grund-vattnets säsongsvariation är okänd inte bara över ett år, utan oftast även över ett okäntantal år. Allmänt leder detta till en underskattning av extremvärden vilken bör undvikas.Exempel på identifiering av sådana data samt förslag på hantering ges.

iii

Page 4: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

iv

Page 5: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

ENGLISH SUMMARY

The ability to calculate the probability of extreme groundwater levels is fundamental,when estimating the risk of hydraulic heave at the bottom of an excavation or landslidestriggered by excess pore water pressure. This can be done by fitting historic groundwa-ter level data to probability density functions and extrapolating to certain return levels.However, very little research has been done in the field of estimating extreme groundwa-ter level with probability density functions. The design guide (TK-Geo) of the SwedishTransport Administration (Trafikverket) gives a brief description of a method developedin the eighties. It is based on applying well-established hydrological theory to groundwa-ter level time series. In this study, recent research on hydrologic extreme value analysisis applied and used to bring the methods in groundwater up to date. More than 100 longtime-series of groundwater data recorded by SGU in the Swedish groundwater network(often used as reference series) are utilized for testing. Established parameter estimationtechniques such as Maximum Likelihood Estimation and Probability-Weighted Momentswith L-moments are compared and weighed against the traditionally used Method of Mo-ments. Swedish research with focus on this topic usually takes advantage of the simplicityof the Block Maxima Approach, while evading the more complex Peaks over Thresholdmethod. These methods are also applied and discussed as to how their use influences theinferences made. Traditionally used statistical distributions such as the Normal, Weibulland Gumbel distributions are compared to the more flexible and presently more popularGeneralized Extreme Value distribution and Generalized Pareto distribution. In orderto estimate model adequacy a number of goodness-of-fit tests are discussed and imple-mented, such as the Anderson-Darling test and Kolmogorov-Smirnoff test. This resultsin a general overview of how to compute return levels for high return periods and whichmodels should be preferred.Fitting probability density distributions requires the data to be independent and identi-cally distributed, a condition, which groundwater level measurements are generally notin accordance with. This is a consequence of the groundwater’s inherent seasonality notonly within one year, but also over random numbers of years. Using data with seasonalityresults in underestimation of extremes and should be avoided. Examples of identificationand recommendations for handling this sort of phenomena are given.

v

Page 6: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

vi

Page 7: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

Innehåll

SAMMANFATTNING . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iiiENGLISH SUMMARY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 INTRODUKTION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1 Syfte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Metod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3 Avgränsningar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2 HYDROGEOLOGI OCH GRUNDVATTENNIVÅER . . . . . . . . . . . . . . . . . . . . . . 22.1 Grundvatten - bildning, uppkomst och förändring . . . . . . . . . . . . . . . . . . . 22.2 Grundvattnets fluktuation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.2.1 Akviferens hydrogeologi och dess roll . . . . . . . . . . . . . . . . . . . . . . 42.2.2 Inomårs- och långtidsfluktuation . . . . . . . . . . . . . . . . . . . . . . . . 42.2.3 Korttids- och dyngsvariation . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.2.4 Störningar idag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.2.5 Framtida störningar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.3 Markstabilitet och konskvenser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.3.1 Upptryck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.3.2 Släntstabilitet och skredrisk . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.4 Mätning av grundvattennivåer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 STATISTISK MODELLERING . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3.1 Introduktion i statistisk modellering av extremvärden . . . . . . . . . . . . . . . . . 73.1.1 Avrinning och grundvattennivåer . . . . . . . . . . . . . . . . . . . . . . . . 73.1.2 Grundläggande sannolikhetsteori och statistik . . . . . . . . . . . . . . . . . 83.1.3 Oberoende likafördelade slumpvariabler och stationäritet . . . . . . . . . . . 8

3.2 Årliga extremvärden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.2.1 GEV - Generaliserad Extremvärdesfördelning . . . . . . . . . . . . . . . . . . 103.2.2 Normalfördelning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.3 EV1 - Gumbelfördelning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.4 Weibullfördelning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.2.5 Log-Pearson typ III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3.3 Överskridelseserier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.3.1 Generaliserad Paretofördelning . . . . . . . . . . . . . . . . . . . . . . . . . 123.3.2 Tröskelurval . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.3.3 Deklustring . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3.4 Statistisk inferens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.4.1 Momentmetoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.4.2 L-moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.5 Modellurval . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.5.1 Kvantilplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.5.2 Täthetsplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.5.3 L-moment-diagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.5.4 Anpassningsgrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

vii

Page 8: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

3.6 Riskkommunikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.6.1 Återkomsttid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.6.2 Förväntad väntetid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.6.3 Konfidensintervall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.7 Statistiska verktyg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 RESULTAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

4.1 Mätserier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194.2 Årliga maximivärden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

4.2.1 Visuell granskning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.2.2 Goodness-of-fit-tester . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.2.3 L-moment-diagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224.2.4 Kombinerande av L-moment och anpassningsgrad . . . . . . . . . . . . . . . 22

4.3 Överskridelseserier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234.3.1 Anpassning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234.3.2 L-moment-diagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4.4 Jämförelse av årliga maximiserier och överskridelseserier . . . . . . . . . . . . . . . . 254.4.1 Shape-parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.4.2 Återkomstnivå . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264.4.3 Beroende . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

5 DISKUSSION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275.1 Rekommendationer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

6 SLUTSATS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30REFERENSER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32BILAGOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

viii

Page 9: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

FÖRORD

This masters thesis completes my studies at the Technical University of Munich (TUM)and the Royal Institute of Technology in Stockholm (KTH). The thesis was carried outboth at KTH and at the hydrogeology group of COWI Sweden AB in Stockholm. I amgrateful for the chance and trust I have been given at COWI and for the enjoyable workatmosphere. I especially want to thank Jonas Sundell for his excellent guidance but alsofriendship, Bosse Olofsson for inspiring and creativity-invoking conversations as wellas my colleagues and friends at COWI, KTH and TUM. Finally, I want to express mythanks to Marit for her help overcoming language-hurdles as well as the Haafs and theFahlanders for being great families.

Ezra Haaf, Stockholm, April 2014

ix

Page 10: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

x

Page 11: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

FÖRKORTNINGAR

EVT: ExtremvärdesteoriSMHI: Sveriges Metreologiska och Hydrologiska InstitutSGU: Sveriges Geologiska UndersökningarKTH: Kungliga Tekniska HögskolanGEV: Generaliserad extremvärdesfördelningGPD: Generaliserad paretofördelingEV1: GumbelfördelningLP3: Logpearson typ 3 fördelning

SYMBOLER

FX(x): FördelningsfunktionfX(x): Täthetsfunktionx: Medelvärde

xi

Page 12: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

xii

Page 13: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

ABSTRACT

Syftet med detta examensarbete är att kunna beräkna sannolikheten av extrema grund-vattennivåers återkomsttid. Detta är av betydelse för till exempel dimensionering avgrundläggning när risken för hydraulisk bottenupptryckning eller skredrisk måste kvan-tifieras. I föreliggande examensarbete valdes 139 långa grundvattennivåmätserier medvarierande hydrogeologiskt miljö ut ur SGU:s grundvattennät. Dessa tidsserier anpas-sas till olika statistiska fördelningsfunktioner för att prognostisera grundvattennivån somuppträder med en visst återkommsttid. Normal-, Weibull- och Gumbelfördelning lik-som logpearson typ 3-fördelning (LP3) och Generaliserad Extremvärdesfördelning (GEV)samt Generaliserad Paretofördelning (GPD) testades och jämfördes. Därutöver beräk-nades huruvida dessa är lämpliga som modeller för predikteringen av återkommstnivåer.Två olika ansatser diskuteras för att välja ut tidsseriernas extremvärden, årliga maximis-erier och överskridelseserier samt deras lämplighet med hänsyn till grundvattennivånsårstidsfluktuation och periodicitet. I undersökningen framgår att den vedertagna nor-malfördelningen oftast är en lämplig modell men i vissa fall måste förkastas. GEV ochLP3 tillåter oftast en bättre anpassning än normalfördelningen men är känsligare motoutliers. GPD visar sig ha god anpassningsgrad till överskridelseserier. Det krävs dockdeklustring av mätserier vilket leder till ett minskad antal värden som fördelningen kananpassas på.

Nyckelord: Hydrogeologi; Grundvattennivå; Extremvärdesteori; Mätintervall; Årstidsfluktua-tion

1 INTRODUKTION

Ökning eller avsänkning av grundvattennivånoch jordens portryck kan orsaka nedsatt mark-stabilitet. Därför är det centralt att kunnaprediktera extrema grundvattennivåer för attberäkna risken för skred eller bottenupptryck-ning. En vanlig metod för att att uppskattasannolikheten för att en viss kritisk nivå kom-mer att överstigas - är att anpassa historiskagrundvattennivåserier till sannolikhetsfördel-ningar och extrapolera utöver seriens längd(Persson, 2008). Därigenom är det möjligt attberäkna med vilken återkomsttid en viss kritisknivå under- eller överskrids. I Trafikverkets TK-geo finns en kortfattad beskrivning av en metodför hur detta kan genomföras som utveckladespå 80-talet (Svensson, 1984). Inom hydrologioch meteorologi har det forskats under mycketlång tid inom extremvärdeteori (Gumbel, 1957).Forskningsfältet är fortfarande mycket aktivt(Chavez-Demoulin & Davison, 2012).

1.1 SyfteDenna rapport syftar till att undersöka huru-vida de metoder för extremvärdesanalys somutvecklats inom andra forskningsområden kan

tillämpas på grundvattennivåmätserier. I ochmed detta undersöks vilka krav de olika teori-erna ställer och vilka fördelningar som ärlämpligast.

1.2 Metod

I detta examensarbete testas mätserier av grund-vattennivåobservationer mot olika fördelnings-funktioner samt beräknas om dessa är lämpliga.Genom detta kan den fördelning som bäststämmer överens med observerade data enligtgoodness-of-fit tester bestämmas och sedan an-vändas för att beräkna återkomsttid för 50, 100och 200 års extremvärden. Metoder för beräkn-ing av konfidens för återkomstnivåer användsför att beskriva hur tillförlitlig prognosen är.Två olika ansatser diskuteras för att välja ut ob-servationernas extremvärden - årliga maximis-erier och överskridelseserier. De olika ansat-sernas lämplighet med hänsyn till grundvat-tennivåns beteende utvärderas. En analys avtvå olika inferensmetoder för punktestimeringgenomförs. Genom att tillämpa metodernapå mer än 100 mätserier från SGU:s grundvat-tennät har metodernas lämplighet i olika hydro-geologiska miljöer kunnat utvärderas.

1

Page 14: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

1.3 AvgränsningarExamensarbetet kommer endast behandlagrundvattenserier i SGU:s grundvattennätsom har mätts längre än 40 år. Ett urvalparametriska fördelningar, inferensmetodersamt goodness-of-fit-tester testades som ärbeprövade inom extremvärdesteori. Metodernatestas enbart för maximiserier.

2 HYDROGEOLOGI OCH GRUNDVAT-TENNIVÅER

"Ever-newer waters flow on those who stepinto the same rivers." Herakleitus

Citatet ovan relateras främst till livet och dessföränderlighet. Men krafterna som styr vat-tnets flöde, metaforens symbol, framkallar ettaldrig konstant och aldrig upprepande tillstånd igrundvattnet. Orsaken till den ihållande förän-dringen beskrivs i detta kapitel.

2.1 Grundvatten - bildning, uppkomstoch förändring

För att kunna prognostisera grundvattennivåer-nas förändring är det viktigt med en förståelseav grundvattnets uppkomst och de faktorer somstyr dess beteende över tiden. Grundvatten ärdet vatten som helt fyller hålrum i jord ochberg. Grundvattnets rörelse styrs av tyngd-kraften och den resulterande friktion som upp-står vid kontakt med markens material (Hölt-ing & Coldeway, 2009). Grundvattnet är endel av det hydrologiska kretsloppet (se figur 1)med huvudkomponenterna nederbörd, avrin-ning och avdunstning och solen som drivkraft.Dessa faktorer påverkar kontinuerlig grundvat-tnets kemiska tillstånd och piezometriska nivå.Fuktig luft transporteras genom atmosfärenoch när luftmassorna stiger kondenserar en delav fukten. Kondenset faller som regn, dagg,dimdroppar, snö eller hagel och når jorden,där den dels avrinner till ytvatten och havetoch dels avdunstar. Avdunstningen sker frånmark och öppna vattenytor genom evapora-tion, genom transpiration från växter eller sub-limation (övergång från snö/is till vattenånga)(Knutsson & Morfeldt, 1993). Avrinning skergenom ytavrinning som delas upp i mättad-eller Hortonsk ytavrinning. Mättad ytavrin-ning uppstår när marken är fullständig mät-tad och därigenom inte kan ta upp mer vat-

ten. Om markens infiltrationspacitet är lä-gre än regnets eller snösmältningens intensitetuppkommer infiltrationsöverskott också kalladHortonsk ytavrinning (Hillel, 2004). Vattensom varken avdunstar eller avrinner, flödargenom markytan förbi rotzonen och blir grund-vatten, efter ha nått grundvattenytan (se avs-nitt 2.2.1). Grundvatten bildas i inströmn-ingsområden och avrinner i utströmningsområ-den. Dessa in- och utströmningsområden förän-dras med en varierande grundvattennivå överårstiderna(Grip & Rohde, 1994). Grundvattenär i ständig rörelse genom bildning och avrin-ning.För att kunna beräkna grundvattenbildningeni ett specifikt avrinningsområde behöver net-tonederbörden, avrinningen och den totala av-dunstningen kvantifieras. Dessa parametrar ut-gör vattnets kretslopp och kvantifieras i vatten-balansekvationen (ekvation 1) (Grip & Rohde,1994).

N = Q+A±m (1)

därN : NettonederbördenQ : AvrinningenA : Totala avdunstningenm : Magasinförändringen

Nettonederbörden är den del av nederbördensom inte tas upp av växterna eller avdunstaroch motsvarar ungefär avrinning eller grundvat-tenbildning i området. I Sverige (1961 - 1990)är medelnettonederbörden lägst vid Sveriges sy-dostliga kust och ökar generellt med nordvästligväderstreck från mindre än 200 mm/år till merän 600 mm/år enligt data från SMHI, se figur 2.Samtidigt varierar tidpunkten där grundvat-tenbildningen är som störst beroende på ge-ografiskt läge. I Syd- och Mellansverige bildasden största delen av grundvattentillskottet un-der vinter och vår, medan det sker en förskjut-ning mot sommaren längre norrut SGU (2013).Ytterligare faktorer som påverkar grundvatten-bildning är klimatet (tex mikroklimata), to-pografin eller markytans genomsläppligheten(Knutsson & Morfeldt, 1993). Lokalt kan där-för stora skillnader i grundvattenbildningensstorlek förekomma.

2

Page 15: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

Figur 1. Hydrologiskt kretslopp (Knutsson & Morfeldt, 1993).

Figur 2. Årlig medelnettonederbörd i Sverige.

I urbana miljöer leder stadens värmeförlust tillhögre temperaturer och ökad evapotranspira-

tion. Samtidigt kan mindre nederbörd infil-trera genom de hårdgjorda ytorna och iställetledas bort genom ledningssystemet (Lundmark& Olofsson, 2002). Detta gör att grundvatten-bildningen i städer är generellt lägre än i natur-miljöer vid samma nettonederbörd.

2.2 Grundvattnets fluktuation

Grundvattenbildningens storlek som beskrivsovan varierar inte bara inom ett år beroendeav nettonederbörden utan också från år tillår. I ett grundvattenmagasin under naturligaförhållanden är grundvattennivåns fluktuationrelativt regelbunden och sker över perioder avolika långa perioder och med varierande am-plituder. Fluktuationen beror framförallt påårstid, akvifermaterial och -storlek, topografisktläge, väderlek samt storskaliga väderfenomensom NAO (North Atlantic Oscillation) (Svens-son, 1984; SGU, 2013; de Vita & Fabbroncino,2007). Dessa faktorer leder till att grundvatten-nivån kan ha olika komplexa rörelsemönster.Utöver detta influerar ofta antropogen aktivitetgrundvattennivåerna på ett extremt sätt somkan innebära allt från en utjämning till enmer stabil nivå eller ett fullständigt regimskifte.En överblick har sammanställts av Svensson(1984). Ytterligare litteratur som har använts idet här avsnittet är Hölting & Coldeway (2009);Knutsson & Morfeldt (1993); Hiscock (2005).

3

Page 16: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

2.2.1 Akviferens hydrogeologi och dess roll

Grundvatten fyller ut sammanhängande hål-rum, som kan vara porer eller sprickor ochförkastningar samt hålrum i större strukturersom karst. En Akvifer har en tillräckligt storporositet för att kunna genomsläppa en sig-nifikant mängd vatten för ekonomiskt uttag(Hillel, 2004). Akviferer har varierarande egen-skaper. I en öppen akvifer ligger grundvatteny-tan där trycknivån motsvarar atmosfärtrycket.Ovanpå en sluten akvifer finns ett tätande lagersom gör att trycknivån kan vara högre än vat-tennivån. Det är dock vedertaget att tala omgrundvattennivå oavsett om det rör sig om enöppen eller sluten akvifer.

Grundvattennivån i inströmningsområden lig-ger oftast djupare än i utströmningsområ-den och visar en vanligtvis större fluktuationKnutsson & Morfeldt (1993). Detta berorpå utjämningseffekten som innebär att akv-iferer i utströmingsområden inte bara får till-skott från nederbördstillfällen utan också frångrundvatten uppströms. Detta medför att vari-ationerna är lägre i lägre liggande områdenän på höjder. Svängningarnas storlek berorpå akviferens material, mäktighet och utsträck-ning. Principiellt gäller att grundvattenma-gasin med låg porositet eller mindre utsträck-ning uppvisar stora svängningar. Det mot-satta beteendet ser man för stora magasin ochakviferer med hög genomsläpplighet. En-ligt en studie från Naturvårdsverket (Natur-vardsverket, 1999), finns fem typiska grundvat-tenmiljöer i Sverige; kristalllin bergrund, sed-imentär berggrund, morän och svallsediment,samt öppna och slutna akviferer i isälvssedimentoch morän. Det senare är den vanligaste akvifer-typen i Sverige SGU (2013).Morän kan skilja sig betydligt i kornstorleks-fördelning och därigenom också i vattengenom-släpplighet och fluktuationsbredd. Urbergfungerar som ett litet grundvattenmagasin, dvssprickor och deras konnektivitet gör att nivåeroch fluktuationer kan skilja sig åt markant i ettoch samma område. Fluktuationen har en övregräns som kan vara väldefinerad genom marky-tan eller ett ogenomsläppligt lager ovanpå. Sam-tidigt finns det komplexare hydrauliska trösklarsom ett anslutet grund- eller ytvattenmagasin.Dessa skapar en flytande övre begränsning som

kan begränsa grundvattennivån. Läckande akv-iferer (figur 3) kan också bidra till ett mindrelinjärt samband mellan perkolationsmängd ochgrundvattenyta.

2.2.2 Inomårs- och långtidsfluktuationSom beskrivits i avsnitt 2.1 måste några förut-sättningar uppfyllas för bildning av grundvattenfrån nederbörd. För att markvatten ska kunnanå den mättade zonen måste fältkapaciteten hauppnåtts. Den är beroende av markens kapil-lärtryck och vattenhalt Flühler & Roth (2004).Beroende på det och olika faktorer som karak-teriseras i avsnitt 2.2.1 finns det vanligtvis enviss fasförskjutning och utjämning. Reaktio-nen på förändrat väder är således inte alltid di-rekt. Tillsammans med tjällösningen och snös-mältningen ökar nivåerna. Däremot sjunkergrundvattenytan under mindre nettonederbörddvs sommar, sensommar och höst.Variationsbredden över flera år kan vara stor.I figur 4-A exempelvis visas grundvattenytansvariation för varje månad under flera år. Dettaberor på en överlagring av klimatstyrda pro-cesser (Svensson, 1984). Medianens förlopp lik-nar den grundvattenregim som är vanlig förMellan- och Sydsverige (SGU, 2013). Samtidigtär det tydligt att den månatliga variationsbred-den är särskilt stor under sensommaren, vilketär beroende av torrperiodens längd.

2.2.3 Korttids- och dyngsvariationDirekta och indirekta korttidsvariationersärskiljs. De viktigare, direkta variationernaär en följd av intensiva regn åtföljda av tor-rperioder och ökad evapotranspiration. Yt-terligare svängningar kan komma från vatten-nivåförändringar i närbelägna ytvattenmagasineller påverkan från tidvatten. Grundvatten fluk-tuerar med tidvatten i närliggande havsvatten,dock med sjunkande amplitud och större för-dröjning med ökande avstånd. Processen somdrivs genom tyngdkraften beror på lokal den-sitet (indirekta variationer) och har mest bety-delse i urberget.

2.2.4 Störningar idagMedan naturliga processer är stationära övertid dvs medelvärdet är konstant, kan mänskligaingrepp förändra det underliggande systemetfullständigt (Huggenberger & Epting, 2011). Påglesbygden kan ett sådant ingrepp vara dräner-ing av skog, våtmarksområden eller jordbruks-

4

Page 17: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

Figur 3. Akviferkarakteristika. Ur Stal & Wedel (1984).

A B78.5

79.5

80.5

81.5

gv-n

ivå

[m.ö

.h]

j f m a m j j a s o n d

nede

rbör

d[m

m]

1997 1998 1999 2000 2001 2002

050

100

150

7879

8081

82gv

-niv

å[m

.ö.h

.]

nederbörd 8524rör 6010

Figur 4. A: Ackumulerad variation från 1975 - 2013. Grundvattenobservation från rör 6010 i Mel-lansverige ur SGU:s grundvattennät. B: Fördröjningen i responsen till nederbörden är till en vissgrad synlig i röret 6010 över fem år. Grundvattenobservation och nederbörd från Östergötlands län.

mark, samt skogsetablering och skogsavverkn-ing (Knutsson & Morfeldt, 1993). I urbanaområden är rörelsemönster delvis väldigt kom-plexa. Särskilt de nedre grundvattenmagasinenär påverkade av lokala och tekniska förutsät-tningar (Lundmark & Olofsson, 2002). Van-ligt är inläckage och bortledning av rå- ochdagvatten till marken samt urtag av grund-vatten genom brunnar eller länspumpning. Istorstäderna är undermarksbyggande såsombergrum eller schakt som kan dränera markenallt vanligare (SGU, 2013). I och med städernasbefolkningstillväxt och en önskad förtätningfortsätter andelen hårdgjorda ytor att växa.Detta innebär en allt mer reducerad grund-vattenbildning genom bortledning av dagvat-ten liksom ökad evapotranspiration. Sam-tidigt är stadens mark mycket heterogen ochutsätts för ständiga förändringar. En ny byg-gnad kan förändra den lokala grundvattenreg-

imen genom förträngning och förändrade hy-drauliska betingelser (Huggenberger & Epting,2011). Likaså påverkar rivningen av ett hus medlänspumpning eller annat vattenuttag grundvat-tennivån (SGU, 2013).

2.2.5 Framtida störningarMedan dessa effekter är mycket väl kända finnsdet en viss osäkerhet kring hur framtidensstörningar kommer att se ut. Med ökande be-folkning, produktivitet och resursförbrukningsåsom klimatförändringar är särskilt det hydrol-ogiska kretsloppet drabbat. Kommande kli-matförändringar kommer att öka fuktigheteni atmosfären med en intensifierad hydrologiskcykel till följd. Detta kommer att innebärafrekvent torka och intensiv nederbörd (Tren-berth, 1998) vilket påverkar grundvattenbild-ningen och grundvattennivåns fluktuation en-ligt storskaliga klimatmodeller (Allen et al.,

5

Page 18: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

2010). Fortfarande är dock osäkerheten storinom klimatmodellerna och predikteringen avframtidens klimat är en utmaning. För dennordiska regionen utgår man från ökad neder-börd (SMHI, 2012) med en lokal heterogen bildför grundvattennivåökningarnas storlek Kid-mose et al. (2012). Detta beror huvudsakligenpå lokala variationer i dräneringsförmågan hosakviferen och anslutna vattendrag.

2.3 Markstabilitet och konskvenserBortsett från påverkan av anslutande ekosystemsom är avgörande för vattenförsörjning, land-och skogsbruk i några regioner i Sverige, finnsdet betydande geotekniska frågeställningar kop-plade till grundvattennivåernas extremvärden.När det byggs under grundvattnets tryck-nivå måste markstabiliteten undersökas. Föratt undvika horisontellt eller vertikalt brottmåste motorvägar och byggnader dimension-eras för ett visst vattentryck. Det dimen-sionerande vattentrycket styrs av den lägstaeller högsta möjliga grundvattenytan (Vägver-ket, 2009). Även vid bergförankring av en an-läggning är variationsbredden avgörande för omkraftspelet i bergförankringen kan övergå fråndrag till tryck (Akfidan & Sadek, 2012). Omgrundvattennivåernas extremvärden inte beak-tas kan omfattande skador och livsfara upp-komma.

2.3.1 UpptryckNär en konstruktion utförs under grundvat-tenytan utsätts bottenplattan för hydraulisktupptryck. Den karakteristiska vertikala lastensom resulterar från egentyngden Ek absorberasalltså inte bara av kornskelettet utan också avdet karakteristiska upptrycket. I motsats tillgrundläggning i omättad mark reducerar upp-trycket effektivspänningen mellan jord och bot-tenplatta (figur 5).Reduceringen ökar linjärt ju längre ner un-der grundvattnets trycknivå bottenplattan in-stalleras. Utan särskilda åtgärder kan detta ledatill lyftning av konstruktionen. Grundvattnetskarakteristiska lyftkraft Lk resulterar från vat-tnets specifika densitet γv och den volym grund-vatten Ve som förträngs av byggnaden, se ekva-tion 2. Upptrycket som verkar på kornskelet-tet beskrivs genom effektivspänningen σ′ somberäknas till:

Lk = γv · Ve (2)

Både högsta och lägsta trycknivå är därföravgörande för beräkning av volymen vatten somträngs bort.

2.3.2 Släntstabilitet och skredrisk

Snabba grundvattennivåförändringar, vanligenorsakade av nederbörd, kan orsaka skred i lu-tande områden (lutning över 1:10) och gles veg-etation (Skredkommissionen, 1995). Även vidlägre lutning kan skred uppstå i sammanbandmed byggaktivitet eller erosion vid släntens fot.Jordarten, portrycket och jordens hållfasthetär styrande för skredrisken (Skredkommissio-nen, 1995). I områden med höga portryck ochhöga skjuvspänningar finns det risk för skredsom inträffar i en slänt när portrycket vid enviss zon stiger och reducerar normalspännin-gen. Därigenom går jorden över från elastiskttill plastiskt tillstånd och en glidyta med min-skad friktion uppstår. Detta kan ske i ytligajordlager som är kopplade till nederbörd elleri djupare skikt där nederbörden inte utlöser endirekt reaktion (Persson, 2008). I båda fallen ärdock kunskap om sannolikheten av höga grund-vattennivåer viktig för att bedöma risken.

2.4 Mätning av grundvattennivåerGrundvattennivåer mäts i grundvattenrör ochbrunnar i berg och jord med två huvudsak-liga mätningssätt. Oftast mäts nivåer i ettrör manuellt, med ljud- eller ljuslod som äranslutet till ett måttband. När lodet når grund-vattennivån i röret, avläsas djupet från röretsöverkant. Alternativt kan vid ett känt djuptryckmätare installeras som loggar grundvat-tnets trycknivå och kan avläsas med jämna mel-lanrum. Insamling av grundvattennivådata övertid kan ha olika syften. Dels är grundvattensit-uationen av intresse för uppskattning av riskerför skred och byggnaders stabilitet samt över-vakning av områden där grundvattnet läckerin i bergrum, dels för utvinning av dricks-och bruksvatten. Grundvattennivåmättserierkan dessutom användas för att få en bättreförståelse av den hydrogeologiska situationen iett område. Datan kan sedan tillämpas för attkonseptualisera och modellera grundvattenma-gasin eller, liksom i denna rapport, predikteradess extrema värden. Tyvärr är datakvalitetenav grundvattennivåmätserier oftast bristfällig.Över längre tid sköts mätningar oftast av olikaaktörer vid ibland oregelbunda tillfällen. Datan

6

Page 19: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

dim. värde

Egentyngd Ek

Lyftkraft Lk

Figur 5. Hydraulisk upptryckt egentyngd.

lagras sällan centralt och äldre mätningar före-ligger oftast inte i digital form. Detta bland an-nat ledde till beslutet att tillämpa SGU:s grund-vattennät som innehåller grundvattennivåmät-serier i digital form med regelbunden mätinter-vall.

3 STATISTISK MODELLERING

För att kunna beräkna sannolikheten att en vissgrundvattennivå överskrids, används en prin-cip som har etablerats framförallt inom hy-drologi. Sannolikhet för överskridelse av enviss grundvattennivå kallas återkomsttid vilkakan sedan användas som beslutsstöd. I sam-band kallas grundvattennivån även återkomst-nivå. Först selekteras från en historisk grund-vattennivåmätserie en empirisk extremvärdes-fördelning. Detta urval görs antingen genomatt välja ut årliga maximivärden eller alla värdensom överskrider en vald tröskelnivå. Sedan an-passas på detta urval en sannolikhetsfördelningsom uttrycker hur sannolika olika grundvatten-nivåer är (återkomsttid). Principerna förtydli-gas närmare i detta kapitel.

3.1 Introduktion i statistisk modeller-ing av extremvärden

Extremvärdesteori utvecklades ursprungligenför att kunna analysera extrema värden ochsannolikheten för hur ofta sådana uppkom-mer. Extrema värden är sådana värden somavviker avsevärt från urvalets median (Gumbel,1957). Det har alltid varit en nödvändighet att

kunna uppskatta sannolikheten av händelsermed låg inträdessannolikhet (extrema värden)men med stora konsekvenser för samhället.Bland annat är dagens vattenförsörjning, vat-tenkraft (även elkraft och tung industri genomkyl- och råvatten) och jordbruk i stora delarberoende av statistisk modellering av flödetsstorlek och dess sannolikhet. En stor del avutvecklingen har därför drivits genom samar-beten mellan hydrologer och statistiker (Katzet al., 2002). Medan tillämpningen av EVT i kli-matforskning och meteorologisk forskning lik-som i försäkrings- och finansindustrin numeraär standardförfarande, finns det få publikationerinom grundvattennivåanalys. Dit hör Svensson(1984); Bichler & Fürst (2012) och Kidmoseet al. (2012). Svensson (1984) beskriver detal-jerat teori och tillämpning men har inte testatett antal metoder som har blivit standardför-farande idag inom hydrologi. Bichler & Fürst(2012) och Kidmose et al. (2012) tillämpar nyaremetoder som ansatsen med överskridelseseriermen fokuserar inte på en ingående beskrivningoch jämförelse av metoder. I denna rapport skadärför dessa metoder som har använts på grund-vattennivåmätserier överses och beskrivas samthittills oanvända metoder testas.

3.1.1 Avrinning och grundvattennivåer

Skillnaden mellan exempelvis flödesavrinnings-data och grundvattennivåobservationer är flera.I figur 6 visas tex att flödesnivån har en större

7

Page 20: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

variation än grundvattennivån som reagerarmycket svagare och med fördröjning på ökadnederbörd. Storleksordningen på grundvat-tennivåns respons beror dock på olika om-ständigheter som geohydraulisk läge, akviferenstyp och litologi. Dessutom är den hydrologiskacykeln, som beskrivits i ekvation 1 en dynamiskprocess utan minne - om än årstidsberoende. Iakviferer däremot summeras flera hydrologiskacykler av olika ålder och kemisk sammansät-tning (Hölting & Coldeway, 2009) - ett lång-varigt beroende av förflutna värden. Detta kanvara problematiskt för statistisk modellering, seavsnitt 3.1.3. Bortsett från det faktum att detunderliggande fysikaliska systemet skiljer sig, ärantagandet om ett maxvärde för flödesavrinningtvivelaktigt (Gumbel, 1957). Däremot är detobestritt att det finns en övre gräns för grund-vattennivåer som oftast är okänd. Det kan varatex en hydraulisk tröskel (grundvatten töms iett ytvattenmagasin vid viss trycknivå) eller en-bart markytan (Persson, 2008), som leder tillgrundvattenöversvämning vid överksridelse.

3.1.2 Grundläggande sannolikhetsteori ochstatistik

I detta avsnitt repeteras kort några av sanno-likhetsteorins centrala koncept. Kottegoda &Rosso (2008), Loucks et al. (2005) är litteratursom används och erbjuder en mer djupgåendeförklaring.Fundamentet i probabilitetsteorin är denstokastiska variabeln X . Detta är en variabel,som liksom grundvattennivån, vilkens värdeinte kan förutsägas med säkerhet eller är icke-deterministisk, också kan kallas slumpvariabel.I och med att den årshögsta grundvattennivånkan anta en spännvidd av värden kan den sessom en kontinuerlig slumpvariabel. En kon-tinuerlig slumpvariabel är definierad genom tä-thetsfunktionen i ekvation 3.

fX(x) ≥ 0

Pr [x1 ≤ X ≤ x2] =

∫ xb

xa

fX(x)dx ≤ 1 (3)

Om xa och xb motsvarar det lägsta respektivehögsta värdet som X kan inneha, blir ytan un-der integralet lika med den maximala proba-biliteten, dvs 1. Fördelningsfunktionen FX(x)

som ger sannolikhet av underskridelse liggermellan 0 och 1 och defineras som:

FX(x) =

∫ x

−∞fX(z)dz (4)

Grundvattennivåobservationer av samma mät-punkt som har mätts kronologiskt över en visstidsperiod kan också kallas tidsserie. Grundvat-tennivåer mäts över tid och lagras med olikasyften se avsnitt 2.4. Utifrån dessa insam-lade mätserier kan framtida extremvärden meden viss återkomsttid (se avsnitt 3.6) prognos-tiseras med tillämpande av sannolikhetsteorin.Genom att använda tidsseriens historiska data,kan i många fall grundvattennivåobservation-erna anpassas till en eller flera statistiska mod-eller, dvs täthetsfunktioner. Den lämpligasteanpassningen kan därefter extrapoleras utöverseriens maximinivå och ge motsvarande sanno-likheter för framtida värden. Observera attstokastiska modeller beskriver ett system utanatt rent formellt behandla dess fysikaliska egen-skaper. Därför är det viktigt att vara särskiltnoggrann med dataurval och förberedelse så attmodellernas krav uppfylls. Vilka de är beskrivsnedan.

3.1.3 Oberoende likafördelade slumpvari-abler och stationäritet

För att kunna använda fördelningsfunktionerinom extremvärdesteori behöver några kravuppfyllas. Datan måste vara oberoende ochlikafördelad (förkortat o.l.f.; även i.i.d., inde-pendent and identically distributed). Detta in-nebär att värden dels ska vara oberoende avvarandra och dels kommer från samma san-nolikhetsfördelningsfunktion. Om så inte ärfallet, underskattas återkomstnivåer (Chavez-Demoulin & Davison, 2012). En metodför att undersöka beroendet mellan värden ien dataserie är att använda ett korrelogram.Ett korrelogram visar urvalets autokorrelationmot tidsförskjutningen. Autokorrelationen gergraden av likhet mellan en tidsserie och entidsförskjuten version av sig själv över fleratidsintervaller. Autokorrelationen motsvararkorrelationen mellan två dataserier, men bådadataserier är samma serie - den första represen-tera sig själv i ursprunglig form och den andraär tidsförskjuten med en eller flera intervaller, idetta fall år. Resultatet kan vara mellan -1 och

8

Page 21: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

Figur 6. Förhållandet av grundvattennivå (tre översta grafer), flödesvattenspegel och nederbörd. UrDufford (1958).

+1, där -1 motsvarar perfekt negativ korrela-tion och +1 perfekt positiv korrelation. Detbetyder att helt oberoende data har noll autoko-rrelation när tidsförskjutningen > 1. I figur 7-A redovisas autokorrelation mot tidsförskjut-ning på rör 17-2 som visar att nästa års värde(lag = 2) generellt har en positiv korrelationmed förra årets värde.

Ytterligare en förutsättning för att användade statistiska modellerna i detta arbete är atttidsserierna är stationära (Katz et al., 2002). Sta-tionäritet betyder att variabelns variabilitet ärbegränsad till en viss bredd. Under stationäritetkan man beräkna konfidensintervaller för an-passningsfel som blir mindre ju fler observa-tioner eller ju effektivare estimatorn är (Millyet al., 2008). Det är dock inte tydligt om grund-vattennivåer är stationära. De varierar kraftigtfrån år till år och kan emellanåt följa decen-nielånga cykler. På grund av detta är det särskiltsvårt att bevisa en trend i en tidsserie av grund-vattenobservationer även om det finns mångaavancerade statistiska verktyg, se Loucks et al.(2005); Visser & Petersen (2012); Hirsch et al.

(1982). Om tidsserier är korta kan det varasvårt att identifiera om de innehåller en kort-varig trend eller inte. Rör 52-8 ur SGU:s grund-vattennät som har mäts från 1971 till idag visaren nedåtgående trend mellan 1971 och 1978, sevänster i figur 7-B1. Jämför man hela tidsse-rien kan man dock utgå från att perioden mel-lan 1971 och 1978 handlade sig om en kort-varig trend inom den naturliga fluktuationenfigur 7-B2. Bland andra Milly et al. (2008); Peel& Bloschl (2011); Bakker (2012) argumenterarför att det numera inte är meningsfullt att inomvattenresursplanering och analys utgå från sta-tionäritet för att störningarna har blivit så ex-trema. Vid betraktande av grundvattennivåmät-serier är frågan svårare att besvara.

3.2 Årliga extremvärdenEtt urval Xmax av extremvärden görs genomatt välja den högsta uppmätta nivån inom enviss period (figur 8-A). Perioden kan väljas fritt,dock ska beroendet mellan värden minimeras.Inom hydrologi väljs för denna period det såkallade hydrologiska året som slutar efter åretstorraste tid (i Sverige 31. september). Detta

9

Page 22: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

A B-2

B-1 C

0 5 10 15

-0.4

0.2

0.8

tidsförskjutning

auto

korr

elat

ion

20132012

sammahögvattentillfälle

+hö

jd

44.5

45.0

45.5

46.0

46.5

1970 1980 1990 2000 2010

m.ö

.h

rör 52-8

44.5

45.0

45.5

46.0

46.5

1972 1974 1976 1978

m.ö

.h

rör 52-8

Figur 7. A: Korrelogram på SGU - rör 17-2. Hög autokorrelation vid tidsförskjutning 1, 9, 13 och14, svag autokorrelation vid 2, 4, 5, 8, 10, 11 och 15. B-1: Rör 52-8 från sommar 1970 till sommar1977 med trendlinje. B-2: Rör 52-8 från sommar 1970 till mars 2013. C: 2012:s decembervärde ärmaxvärdet för hela året och kommer från samma högvattentillfälle som 2013:s januari och kalen-derårets maxima. Detta leder dock till överskattning av återkomstnivåer, eftersom båda sammatillfälle ingår två gånger i den årliga maximiserien.

eftersom nederbörden som faller under vin-tern och oftast lagras som snö ska kunna räk-nas i samma årsbilans med snösmältningen. ISverige slutar det hydrologiska året vid må-nadsskiftet september oktober. Denna principär också ett lämpligt antagande för grundvat-tennivåer eftersom maximivärdena oftast nåsvid årsskiftet. Detta kan leda till att sammamaxnivå räknas för båda åren, om december-nivån är det årshögsta för tex 2012 och januari-maxima för 2013, se figur 7-C. Önskvärda ärdock oberoende värden och det hydrologiskaåret tillämpas i stället för kalenderåret.Hädanefter defineras X , slumpvariabelnfrån avsnitt 3.1.2, Xmax dvs sekvensensmarginalfördelning FX(x) av alla årliga max-imivärden. Årliga extremvärden kallas ocksåBlock Maxima Approach (BMA) eller AnnualMaxima Series (AMS) i litteraturen. Metodenhar följande problem:

• mindre effektiv, eftersom bara ett värde förvarje år används

• den näst högsta nivån under ett år kanvara mycket högre än högsta nivån undermånga år

Inom statistik säger Fisher-Tippettsatsenatt maximivärden av ett urval som bestårav oberoende likafördelade slumpvariablermotsvarar en generaliserad extremvärdesfördel-ning (GEV). Det vill säga: om maximivärde-nas empiriska fördelningsfunktion med stor-lek n konvergerar i en fördelningsfunktionnär n tenderar mot oändligheten, måste dennafördelningsfunktion vara en generaliserad ex-tremvärdesfördelning (beskrivs i avsnitt 3.2.1.Satsen motsvarar den centrala gränsvärdsatsenför medelvärdena. I detta arbete anpassas dockinte bara GEV till årliga maximiserier utanockså Gumbel-, Weibull-, Normal- och Log-pearson typ 3-fördelningen. Detta görs efter-som nämnda fördelningar har använts inomhydrologi och hydrogeologi och lämplighetenska testas för prediktering av extrema grund-vattennivåer. Efterföljande avsnitt förklarar ochjämför tillämpade fördelningar.

3.2.1 GEV - Generaliserad Extremvärdes-fördelning

Den generaliserade extremvärdesfördelningenär en kombination av tre fördelningar: Gumbel-, Fréchet- och Weibullfördelning. Fördelning-

10

Page 23: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

A B

+hö

jd

tid

+hö

jd

tid

Figur 8. A: Årliga Maximivärden (hydrologsikt år). Blåa kretsar motsvarar extremvärden. B:Princip av överskridelse av tröskeln (streckad linje). Fyllda kretsar motsvarar extremvärden övertröskeln.

funktionen är treparametrisk, scale (α), loca-tion (ε) och shape (k).

fX(x) =1

α

[1 + k

(x− εα

)](−1/k)−1exp

[−{

1 + k(x− ε

α

)}−1/k](5)

FX(x) = exp(−[1− k(x− ε)

α

]1/k )(6)

när:1 + k(x− α) > 0 ∧ α > 0

Locationparametern beskriver fördelningensförskjutning på den horisontala axen medanscaleparametern uttrycker fördelningens sprid-ning. Shapeparameterns k representerar däre-mot fördelningens svans och är deriverad avskevheten. Tre fall särskiljs:

k

= 0, Gumbelfördelningen, exponent. svans> 0, Fréchetfördelningen, tung svans< 0, Weibullfördelningen, trunkerad svans

En tung svans (Fréchet) betyder att svansenminskar långsammare än vid Gumbelfördelnin-gen. När shapeparametern blir negativ, ärsvansen tunn dvs den minskar snabbare och blirlika med noll (trunkerad). Konsekvensen äratt överskridelsesannolikheten av en viss nivå ärnoll.

3.2.2 Normalfördelning

Normalfördelningen är den mest bekanta ochanvända fördelningen. Den är särskilt lämpligför värden nära medelvärdet men visar oftastmindre lämplighet för approximering av värden

med låga överskridelseprobabiliteter. Svensson(1984); Bengtsson & Boström (2008); Persson(2008) visar dock att normalfördelningen intekan uteslutas som lämplig för extremvärdes-fördelningar av grundvattennivåmätserier.

fX(x) =1

σ√

2Πexp

[−1

2

(x− µσ

)2](7)

FX(x) =1

2

[1 + erf

(x− µ√2σ2

)](8)

3.2.3 EV1 - GumbelfördelningGumbelfördelningen eller EV1 använder 2parametrar, location (η) och scale (α) och är ettspecialfall av den generaliserade extremvärdes-fördelningen . GEV har varit särskilt populärinom extremvärdesanalys och används när denunderliggande fördelningen är normal- eller ex-ponentialfördelad. Den har applicerats Inomnederbördsanalys (Kottegoda & Rosso, 2008)men också inom grundvatten (Svensson, 1984;Kidmose et al., 2012) med location- (α) ochshapeparameter (η)

fX(x) =α−1 exp(− x− η

α

)exp

[− exp

(− x− η

α

)](9)

FX(x) = exp

[− exp

(− x− η

α

)](10)

3.2.4 WeibullfördelningDen tvåparametriska Weibullfördelningen ärsom Gumbelfördelningen en av de asymp-totiska fördelningarna inom generaliserad ex-tremvärdesteori och har använts ofta för att

11

Page 24: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

beskriva naturliga fenomen. Den exponen-tierade Weibullfördelningen med ytterligare enshapeparameter är mer flexibel och används idenna studie. De tre parametrarna med loca-tion parameter (ζ), den första shapeparametern(k) och den andra shapeparametern (β) har föl-jande täthetsfunktion fX samt fördelningsfunk-tion FX

fX(x) =ζk

β

[x

β

]k−1 [1− exp

(− x

β

)k]α−1exp

(− x

β

)k(11)

FX(x) =1− exp

[−(x− ζ

β

)δ](12)

3.2.5 Log-Pearson typ III

Log-Pearson typ 3 (LP3) fördelningen är enav Pearsonfördelningarna och kallas också förtreparametrisk gammafördelning. Den rek-ommenderas i USA av U.S. Water ResourcesCouncil i Bulletin 17B (Interagency AdvisoryCommittee on Water Data, 1982) för använd-ing i vattenresursanalyser. LP3 har två väx-elverkande shape parametrar (Griffis & Ste-dinger, 2007) och använder tre parametrar, lo-cation (µ), scale(σ) och shape (γ) är dock min-dre flexibel än GEV (Gilleland & Katz, 2011)extRemes. Fördelnings- och tätthetsfunktionerär:

Om γ 6= 0, α =4

γ

2

och ξ = µ− 2σ

γ

Om γ > 0

fX(x) =(x− ξ)α−1 exp

(− x−ξ

β

)βαΓ(α)

(13)

FX(x) =G(α, x−ξβ

)Γ(α) (14)

Om γ = 0 är fördelningen normalfördelningen

Om γ < 0

fX(x) =(x− ξ)α−1 exp

(− x−ξ

β

)βαΓ(α)

(15)

FX(x) =1−G(α, x−ξβ

)Γ(α) (16)

3.3 Överskridelseserier

Som alternativ till de årliga extremvärden kanen extremvärdesfördelning av alla värden överen viss tröskel (POT - peaks over threshold,eller PDS - partial duration series) väljas, sefigur 8-B. Det betyder att fler än ett värde kananvändas per kalenderår. Katz (2004) framhäveratt detta möjliggör en högre statistisk effek-tivitet. Hanteringen av överskrideleserier kandäremot vara problematiska på grund av:

• maximivärden är oftast inte oberoendehändelser utan två efterföljande utfall kanha uppmäts vid ett och samma högvatten-tillfälle se figur 7-C,

• tröskelvalet erfordrar flera beräkningsstegoch påverkar återkomstnivåer

Hittills har metoden ansetts som olämplig(Svensson, 1984; Bengtsson & Boström, 2008)inom grundvatten på grund av beroendet av vär-den. Emellertid har utvecklats så kallade dek-lustringsverktyg som möjliggör att värden somligger över tröskeln men tillhör samma tillfällekan identifieras. Anledningen till att metodentidigare förkastats är inte längre giltig.

3.3.1 Generaliserad Paretofördelning

Modellen som är lämplig att använda medöverskridelseserier är den generaliseradeParetofördelningen (GPD) med parametrarshape (k), location (ε) och scale (α) (PickandsIII, 1975). Fördelningen approximerar barafördelningens svans genom att anpassas till top-par över en tröskel u. Detta innebär att model-

12

Page 25: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

leringen fokuserar på fördelningens svans (Katz,2004).

fX(x) =α1/k

(α+ k(x− ε))1/k+1(17)

FX(x) =

1−(

1 + k(x−ε)α

)−1/kför k 6= 0

1− exp(− x−ε

α

)för k = 0

(18)där:

x > µ om ξ > 0 och µ 6 x 6 µ− σ

ξom ξ < 0

Utfall över tröskeln antas förekomma enligten poissonprocess som är en stokastisk pro-cess i kontinuerlig tid. Denna används föratt beskriva slumpmässiga händelser som skermed hastighet λu. Återkomsttiderna uppskattasgenom att beräkna förekomsten av toppar överhela mätperioden, se Pickands III (1971); David-son & Smith (1990) och enligt ekvation 19:

zp =

{u+ α

k

((λup)

k)

för k 6= 0

u+ α ln(λup) för k = 0(19)

Pickands III (1975) visade att överskridelseseriermed oberoende toppar bara kan modellerasmed tre olika asymptotiska fördelningar, se ek-vation 20.

k

= 0, Exponentielltyp, "lätt" svans> 0, Paretotyp, "tung" svans< 0, Betatyp, trunkerad svans

Likheten mellan GEV-fördelningen och GPDmed tröskel u ligger i parametrarna. Shapeparametern (k) i båda fördelningar är sammamedan scale parametern (α) har följande förhål-lande:

α = αGEV + kGEV (u− εGEV ) (20)

3.3.2 TröskelurvalValet av en lämplig tröskel för vilken denasymptotiska fördelningen i ekvation 18 gäller,erfordrar en genomgång av flera metoder somsäkerställer ett acceptabelt tröskelval. En för lågtröskel leder till ett beroende mellan värden ochkravet är att utfallen följer en poissonprocess.Om tröskeln däremot väljs för högt, reducerasdatamängden vilket i sin tur leder till hög vari-ans och osäkerhet i resultaten. I denna rapportanvänds framförallt två grafiska hjälpmedel sombeskrivs nedan.

Medelöverskridande över tröskeln

Metoden utvecklades av Davidson & Smith(1990) som föreslog att tröskelnivån ska rym-mas inom intervallet där medlet av dettröskelöverskridande värdet (Xu − U ) är enlinjär funktion av tröskelnivån U (Xu ärmedelvärdet av alla tröskelöverskridande vär-den). Medelöverskridande (Mean Excess) dvsmedelvärdet av alla värden som ligger övertröskeln u enligt ekvation 21, där xi,nu är deni:e observationen över tröskeln och xmax är dethögsta värdet i sampeln som beräknas enligt föl-jande ekvation:{(

u,1

nu

∑nui = 1xi,nu − u

): u ≤ xmax

}(21)

I diagrammen 9-C visas medelexcessen gente-mot tröskelnivån.Stabilisering av fördelningens parameter

Tröskelurvalet kan vara oentydligt (figur 9)-A. För att kunna kontrollera att modellenhar samma parameter för en dataserie, anpas-sas dataserien med olika tröskelnivåer. Vidvarje tröskelnivå plottas sedan parametrarna. Sålänge dessa är konstanta, är tröskelnivån god-känd. I Threshold Choice (tröskelval) plotfigur 9-A visas respektive scale- och shapeparam-eter mot olika tröskelnivåer.Ytterligare metoder för tröskelurval

Ytterligare två metoder som inte tillämpadesi denna rapport kan användas för att välja uttröskeln. Cunnane (1973) anger att 1,65 top-par per år är ett antal som levererar bra resul-tat, vilket nås genom att höja tröskeln stegvisoch notera antalet toppar per år. Det visade sigdock att värdet 1,65 toppar inte levererar någonbra anpassning av GPD. Samma problem upp-stod vid användning av den fasta-percentil meto-den. I denna metod väljs en bestämd percentil,t.ex 90-percentilen av datan som tröskel. Förde-len är att lika många utfall för varje grundvat-tenrör används. Däremot visade sig att anpass-ningen resulterade i att anpassningen avvek av-sevärt från datan.

3.3.3 Deklustring

Enligt poissonprocessen måste alla värden somanvänds för att anpassa en fördelning varaoberoende av varandra. Om man väljer ut alla

13

Page 26: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

B

A

C

22.0 22.5 23.0 23.5

010

2030

tröskel u

mod

ifier

adsc

ale

22.0 22.5 23.0 23.5-1.4

-0.8

-0.2

tröskel u

shap

e

u

tid

gv-n

iva

Xmin

Xu2

Xu1

nr 1 nr 222.0 22.5 23.0 23.5

0.3

0.5

0.7

0.9

med

elex

cess

tröskel U

Figur 9. A: Threshold choice plot för scale och shape parametern. Tröskelvalet kan göras därparametrarna är stabila, dvs mellan 22,3 och 23,0. B: Deklustring med tröskel S och tidsvillkorΘ. Anpassad efter Lang et al. (1999). C: Mean residual life plot för station 1-7. Tröskeln liggermellan 22,3 och 23,0 där medelexcessen är linjär.

toppar över en tröskel kan det hända att grund-vattennivån är över tröskeln under några veckori följd. Alla dessa värden får dock inte ingå i se-rien, utan bara det högsta. Om alla används,leder detta till en underskattning och klustringav återkomstnivåer (Chavez-Demoulin & Davi-son, 2012). För att kringgå den därmed intro-ducerade biasen finns ett flertal så kallade dek-lustringsmetoder. Här valdes följande metod:

1. Första utfallet inleder första klustret

2. Första observationen under tröskeln Uavslutar klustret såvida tidsvillkoret Θhåller

3. Om fler värden finns i samma kluster, be-hålls bara högsta värdet

4. Nästa utfall inleder nästa kluster

5. Processen upprepas till slutet av serien

Två utfallXε1 ochXε2 anses som oberoende närtröskeln U underskrids inom ett visst tid Θ (sefigur 9-B) som väljs av utföraren.

3.4 Statistisk inferens

För att kunna anpassa observationer till proba-bilitetsmodeller behövs statistisk inferens. Förbefintlig grundvattendata kan detta samman-fattas i två steg: (a) urval av fördelningsfunk-tion för slumpvariabeln (grundvattennivåmät-serie) och (b) estimering av probabilitetsmod-ellens parametrar. Parametrarna av en modellsom ska beskriva grundvattennivåernas sanno-likhet att inträffa kan beräknas utan optimer-ingsalgoritmer med hjälp av momentmetodenoch L-momentmetoden (L-moments).

3.4.1 Momentmetoden

Momentmetoden är en vedertagen metod ochförklaras enklast med hjälp av ett exempel. OmX är en slumpvariabel (grundvattennivå i ettrör) och xi, i = 1,2,..n är urvalsvärdet (mättanivåer), beräknas medelvärdet till:

x =1

n

n∑i=1

xi (22)

14

Page 27: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

och urvalets varians är definerat som

s2 =1

n− 1

n∑i=1

(xi − x)2, (23)

där den allmänna ekvationen för det r:e mo-mentet är:

mr = n−1n∑i=1

(xi − x)r, för r ≥ 2 (24)

Dessa två sampelmoment används som punk-testimatorer och utifrån dem beräknas parame-trar för tvåparametriska fördelningar (tex nor-malfördelning, lognormalfördelning). I falletav normalfördelningen motsvarar sampelmo-menten x, µ och s2, σ se ekvation 7. För an-dra fördelningar såsom lognormalfördelningentransformeras medelvärdet och variansen för attfå µlnX och σlnX :

µ̂lnX = lnx− σ̂lnX2

(25)

σ̂lnX =

√ln

[( sx

)2+ 1

](26)

Ytterligare formler för andra fördelningar hit-tas i Kottegoda & Rosso (2008). Ett problemmed momentmetoden är att den inte är robustmot outliers eftersom differensen mellan obser-vation och medelvärde är upphöjt i r, se ekva-tion 24.

3.4.2 L-momentsEn alternativ metod för estimeringenav parametrar är den så kallade L-momentmetoden. Med L-momentmetodenkan beräknas mer precist parametrar än medmomentmetoden (Kochanek et al., 2010) ochmaximimetoden (Hosking et al., 1985) när ur-valsstorleken är liten. L-momenten är mer ro-busta än de konventionella momenten (Hosk-ing, 1990) och är användbara så länge sam-pelns väntevärde är ändligt, vilket anses givetför grundvattennivåer (jämför avsnitt 3.1.1). Ioch med att de använda serierna är korta ochatt urvalsstorleken är liten, tycktes lämpligtatt beräkna alla parametrar i detta arbetetmed L-momentmetoden. Sampel-L-momentensestimater beräknas med hjälp av probabilityweighted moments (Loucks et al., 2005) med def-inition

βr = E{[X[FX(x)

]r}, (27)

för r:e probabilitetsviktade moment och därFX(x) är fördelningsfunktionen och E är vän-tevärdet. Estimatorer br för βr beräknas medden allmänna ekvationen (28), där n antal ob-servationer modelleras med slumpvariabeln X .Observationerna är sorterade med index j i sti-gande ordning. En mer omfattande beskrivn-ing finns i Hosking (1990); Hosking & Wallis(1995); Loucks et al. (2005).

br =1

n

n∑j=r+1

(j − 1

r

)X(j)/

(n− 1

r

)

=1

r + 1

n∑j=r+1

(j − 1

r

)X(j)/

(n

r + 1

)för r = 1, · · · , n− 1 (28)

Utifrån ekvation 28 beräknas sampel-L-momenten:

`1 = β0

`2 = 2β1 − β0`3 = 6β2 − 6β1 + β0

`4 = 20β3 − 30β2 + 12β1 − β0 (29)

L-momenten `r kan sen användas för attberäkna de olika fördelningarnas parametrar.Ett exempel för den generaliserade paretofördel-ningen ges i ekvation 30. För andra fördelningarhittas formler för att bestämma sampelns punk-testimat i tabell 2 i Hosking (1990).

k =`1

`2 − 2(shape)

α =(1 + k)`1 (scale) (30)

L-momentkvoten är förhållandet mellan tvåolika sampel-L-moment. De kan användas föratt beskriva sampelns egenskaper där τ3 är L-skevheten (ekvation 31) och τ4 L-kurtosis (ek-vation 32).

τ3 =`3`2

(31)

τ4 =`4`2

(32)

Sampel-L-momenten kan dessutom användasför sammanfattande statistik på samma sätt somvanliga moment. Dessutom kan en grafiskgoodness-of-fit konstrueras där samplens L-momentkvoten plottas gentemot olika fördel-ningars L-momentkvot. Med hjälp av denna di-agram kan anpassningsgraden bedömmas. Ennärmare beskrivning av metoden hittas i avs-nitt 3.5.3.

15

Page 28: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

3.5 ModellurvalDet finns ett stort antal metoder för att ver-ifiera observationens anpassning till en proba-bilitetsmodell. I detta avsnitt beskrivs två icke-parametriska statistika och tre grafiska metoder.

3.5.1 Kvantilplot

En kvantilplot (QQ plot) som i figur 10 visarförhållandet mellan rangordnade, observer-ade återkomstnivåer och beräknade återkom-stnivåer från anpassningen. Observationernasskattade probabilitet beräknas till i(n+1), där när antal observationer och i är dess rang. För attfå modellens kvantiler inverteras fördelnings-funktionen.

3.5.2 Täthetsplot

Täthetsplotten visar den anpassade täthetsfunk-tionen mot datans histogram och täthetsesti-mat (figur 10-B. Täthetsestimaten är en icke-parametrisk metod att estimera en slumpvari-abels täthetsfunktion med hjälp av av datans his-togram. Detta kan beräknas med vanliga statis-tiska programvaror. Tanken är att den anpas-sade täthetsfunktionen följer histogrammen ochtäthetsestimaten ungefär utan att den behövermotsvara dem exakt.

3.5.3 L-moment-diagram

Diagrammen i figur 10-C visar förhållandetmellan L-skevhet (ekvation 31) och L-kurtosis(ekvation 32). För alla undersökta fördel-ningar, treparametriska fördelningar (GEV,LP3, GPD) och de tvåparametriska normal-, gumbel- exponential- samt uniformfördelnin-gen (N,G,E,U) finns funktioner som beskriverderas standardförhållanden mellan skevhet ochkurtosis. Dessa kan plottas som linjer förtreparametriska fördelningar eller som punk-ter för tvåparametriska fördelningar (Hosk-ing, 1990). Förhållandet beskriver fördelnin-gens form och när mätserier sample-L-kvoterplottas på samma diagram kan deras möjligakoppling till en sannolikhetsfördelning analy-seras. Om en mätseries sampel-L-skevhet/L-kurtosis ligger på linjen som beskriver fördel-ningens definierade Lskevhet/L-kurtosis tyderdet på att mätserien kan modelleras med justdenna fördelning. Normal- och gumbelfördel-ningen har fasta shapeparametrar, därför harde ett fast förhållande mellan L-skevhet och L-kurtosis. De tre-parametriska fördelningarna

däremot har en shapeparameter som möjlig-gör Utöver detta är sampel-L-kurtosis direktrelaterad till svansens tjocklek. Logpearsontyp 3-fördelningen blir normalfördelningen närskevheten är noll och har vid samma skevheten lägre kurtosis än GEV (och GPD, närskevheten överstiger en viss storlek). Detta be-tyder att GEV-fördelningen ger högre sanno-likhet vid samma utfall. När L-momentkvotensvärden för olika rör på diagrammen plottas visaslämpligheten av olika fördelningar för sampelnsfördelningar. Ju närmare kvoten kurvan är,desto bättre är anpassningsgraden.

3.5.4 AnpassningsgradFör att analysera en anpassad fördelnings lämp-lighet kan man använda sig av tester somjämför fördelningsfunktionen med den em-piriska fördelningsfunktionen. Anpassnings-graden (eng. Goodness-of-fit test) kan bara an-vändas för att förkasta en sannolikhetsfördel-ning. Testernas resultat är en statistika somsen kan jämföras med ett kritiskt värde viden viss signifikansnivå. I detta arbetet valdessignifikansnivån α = 0.05. När en testadfördelning (modell) förkastas har datan med 95procents sannolikhet inte genererat från dennamodell.

Kolmogorov-Smirnov:Det mest kända Goodness-of-fit testet är det såkallade Kolmogorov–Smirnovtestet (K–S-test)som är ett icke-parametriskt test som kan an-vändas för att jämföra observationer med kon-tinuirliga fördelningsfunktioner. Teststatistikanär den absoluta maximala differensen mellanden empiriska och den hypotetiska fördelnings-funktionen. Om sampelstorleken n > 35,gäller 1.3581√

nför signifikansnivån α = 0.05. För

mindre sampelstorlekar refereras till AppendixC.7 i Kottegoda & Rosso (2008).

Dn = supx|Fn(x)− F (x)| (33)

K-S:testet behöver stora urvalsstorlekar för attfungera ordentligt och är mest sensitiv närfördelningar skiljer sig i mitten av fördelnin-gen.

Anderson-Darling:Anderson-Darlingtestet (A–D-test) ger störrevikt till fördelningens svans än K–S-testet.

16

Page 29: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

A

B

C

D

-2 -1 0 1 2teoretiska kvantiler

sam

pels

kvan

tiler

1.0 1.2 1.4 1.6 1.8 2.0

0.0

1.0

2.0

3.0

kvantil

täth

et

-0.2 0.0 0.2 0.4 0.6

0.0

0.1

0.2

0.3

0.4

L-skevhet

L-ku

rtos

is

G EN

U

GEVPE3GPA

5 10 20 50 100Återkomsttid år

Åte

rkom

stni

Figur 10. A: Normalkvantilplot av en slumpvis genererade dataserie. Modellen är lämplig förbeskrivning av medelbeteendet och för låga kvantiler. Höga kvantiler underskattas dock för dennaobservationspunkt. B: Täthetsplot. Histogram av datan, och täthetsestimat (prickig) samt anpass-ning. C: L-momentdiagram som visar de bekanta värdena för olika fördelningar. D: Generiskåterkomstnivåplot med 95% konfidensintervall.

Detta betyder att A–D-testet är lämpligareför anpassningen av extremvärden där svansensmodellering påverkar extrapoleringen starkt.Vid signifikansnivån α = 0.05 är det kritiskavärdet 2.492.

A2 =n− 1

n

n∑i=1

(2i− 1)

{ln [F (Yk)] + ln [1− F (Yn+1−k)]}(34)

3.6 RiskkommunikationNär man använder sig av riskbaserade metoderär det viktigt att kunna kommunicera riskoch dess innebörd. Med konfidensinter-valler beskrivs enbart modellens osäkerhet.Därutöver finns det ytterligare sorters osäker-heter: inherent modell- och mätosäkerhet sombehöver beaktas när det görs en prediktering.

3.6.1 ÅterkomsttidInom hydrometerologisk prediktering användsoftast konceptet återkomsttid för att beskriva

högvattentillfällen. Begreppet infördes föratt underlätta tolkning av probabilitet. Iårliga maximiserier motsvarar sannolikheten0,98 en 50 års återkomsttid enligt ekvation 35.Återkomsttid kan dock tolkas på olika sätt.50 års återkomsttid kan betyda att den överen (mycket) lång period bara förekommer var50:e år. Däremot är mätlängden i Sverige rel-ativt kort med hänsyn till återkomsttiden sompredikteras. Därför är det oftast lämpligare attanse att en 50 års återkomsttid har 1 chans på50 att förekomma varje år. Båda tolkningar ärkorrekta men den förstnämnda kan feltolkas.Förhållandet mellan återkomsttid T och kvan-til p av ett visst flöde är

T =1

1− p(35)

I figur 10-D visas en anpassad paretofördel-ning och probabiliteter omtolkade till återkom-sttider. Konfidensintervaller beräknades medparametrisk bootstrap och observationerna

17

Page 30: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

plottades med Hazens plottingformel anpas-sad för extremvärdesfördelningnar (Kottegoda& Rosso, 2008), se ekvation 36 med n antal ob-servationer, i rangordnade observationer och pimotsvarande percentil.

pi =i− 0.5

n(36)

3.6.2 Förväntad väntetidEn riskbaserad bedömning av valda återkomst-tider görs med hjälp av den geometriska fördel-ningen i ekvation 37. Fördelningen används föratt modellera antalet försök n innan försöket ly-ckas. I fallet där man antar året som referens,lyckas varje försök med probabilitet p = 1/T(Kottegoda & Rosso, 2008).

Pr [X = n] = (1− p)n−1p,för n = 1, 2, 3, · · · (37)

Om man ställer frågan hur många år n går in-nan ett utfall med probabilitet p inträder, an-vänds den motsvarande fördelningsfunktionen(Hayter, 2012) i ekvation 38. Detta kan varaviktigt i beslutsprocessen, där en återkomsttidväljs för dimensioneringen.

Pr [X ≤ n] =n∑i=1

(1− p)i−1p

= 1− (1− p)n (38)

3.6.3 KonfidensintervallKonfidensintervall uttrycker osäkerhet i de up-pskattade parametrarna och visar om observa-tionerna är inom konfidensgränserna. Det äralltså väntat, inte säkert, att om man repeterarexperimentet flera gånger (dvs mäter grundvat-tennivåer vid samma station över flera år, fleragånger) ligger parametrarna i tex 95% av allatilllfällen inom gränserna. Det finns ett flertalmetoder för bestämning av konfidensintervallmen fokus i denna rapport ligger på bootstrap-metoden som förklaras kort i följande avsnitt.

Parametrisk bootstrap:Efter anpassningen av en fördelning till obser-vationer genereras utifrån fördelningens esti-mater ny pseudodata. Det nya stickprovet(av samma storlek) anpassas därpå till sammafördelning, som ger ett nytt set skattningar.

Proceduren repeteras ett antal gånger (rekom-menderat är fler än 500 gånger). Skattningarnaav alla slumpässiga urval bildar för sig en fördel-ning. Dess 2,5 och 97,5 percentiler används förberäkningen av det 95%:a konfidensintervallet.Metoden är enkel att använda men utgår från attden ursprungligt anpassade modellen är sann.

Icke-parametrisk bootstrap:Den icke-parametriska metoden fungerar påsamma sätt som den parametriska, bortsett fråndatagenereringen. Ett obundet slumpmässigturval av samma storlek från stickprovet (dvs ob-servationerna) med återläggning görs. Det be-tyder att samma observation kan finnas fleragånger i urvalet. Proceduren upprepas enligtden parametriska bootstrapmetoden, se (3.6.3,parametrisk bootstrap). Problemet är att storastickprov krävs och inferensen är begränsad tillurvalet.

3.7 Statistiska verktygFör datahantering och statistisk modelleringvaldes det fria, plattformsoberoende statis-tikprogrammet och programspråket R. Källko-den är publicerad under en GNU-licens vilketinnebär att programmet kan användas, under-sökas, vidaredistribueras och förändras i egnasyften. Det finns kompilerade versioner förLinux, OS X och Windows. I jämförelse medden kommersiella mjukvaran SAS R© finns detredan nu en större mängd funktioner samtidigtsom tillväxten är större (Muenchen, 2013).Även om programspråket inte är lika elegant,konsistent och snabbt som konkurrentens, är deredan nämnda argumenten anledningen till attprogrammet har blivit störst bland akademiskastatistiker. Särskilt inom extremvärdesanalysföreligger de flesta funktionerna i R (Gillelandet al., 2013). Utöver det finns det flera tilläggsom har utvecklats av användare och vilka opti-merar arbetsflödet. Funktionerna hittas i dessatillägg och kan laddas ner från CRAN (http://www.r-project.org/) eller direkt i program-varan. De tillägg som används mest i detta ar-betet är sammanfattade i tabell 1.Användargränssnittet är enbart kommando-radsbaserat till skillnad från andra statistikpro-gram. En grupp utvecklare har dock släpptRStudio, som är ett fritt och mer användbartgrafiskt gränssnitt som rekommenderas av för-fattaren.

18

Page 31: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

Tabell 1. Lista med tillämpade användarutvecklade tillägg.

Namn Version Beskrivning

fitdistrplus 1.0-0 Funktioner för att anpassa parametriska fördelningar, inkl bootstrap-metoden för bestämning av konfidensintervall

ggplot2 0.9.3.1 Implementerar Wilkinsons "Grammar of graphics" och förenklar snabbplottning av samma data med olika framställning

lmom 1.6 Funktioner för att beräkna L-momenten och punktestimat för olikafördelningsfunktioner; stöd för L-momentdiagram

plyr 1.8 Verktyg för att kombinera data och applicera funktionerPOT 1.1-3 Verktyg för överskridelseserier, inkl hjälpmedel till tröskelval och olika

inferensmetoderxts 0.9.3 Aggregeringsfunktioner för tidsserierzoo 1.7-9 Metoder för oregelbundna tidsserier

4 RESULTAT

4.1 MätserierI detta kapitel tillämpas teorin och metodernasom diskuterats hittills. Syftet var att kunnaanvända teknikerna på representativ data ochkunna göra allmängiltiga påståenden, ommöjligt. För detta ändamål tycktes historiskmätdata från SGUs grundvattennät vara lämplig(Dessa serier används dessutom som referenssta-tioner vid tillämpning av Chalmersmodellen,(Persson, 2008)). SGU sköter mätningar och la-grar långa mätserier av grundvattennivåer överhela landet se figur 11. Enligt Kim et al. (2007)skulle det behövas en mätningsfrekvens på 8,9dagar för att kunna beskriva periodiciteten till-räckligt - daglig variation utesluten. Detta ärdock inte givet i SGU:s grundvattennät där manmäter omkring var annan vecka. För snabbrea-gerande magasin kan det alltså betyda att deverkliga topparna inte finns uppmätta. För till-räckligt långa mätserier kan det däremot utgåsfrån att maximivärdena har fångats tillräckligtofta.Benämningen som används i rapporten togsfrån SGU:s nomenklatur, både område ochstation för ett nummer som skiljs åt medtankstreck. Ett rör med stationsnummer 7 somligger i området 55 blir följaktligen 55-7. Efter-som många rör etablerats i samma område över-lappar en del rör varandra på kartan i figur 11.Rören är fördelade över hela landet, dock kon-centrerade till ett trettiotal platser.För utvärdering och anpassning är det lämpligtatt använda mätserier längre än 40 år. Inomgrundvattennätet finns 141 mätstationer (se ap-

pendix på sidan 35) som uppfyller kravet. Sta-tionerna etablerades mellan 1958 och 1972.Fördelaktigt med SGUs grundvattennät ärdessutom att metadata finns tillgänglig. Ifigur 11 syns vilka typer av magasin som ärbland de utvalda rören och i vilket geohy-drauliskt läge de befinner sig. Tyvärr är detinte lika många i varje kategori utan de flestarören ligger i ett inströmningsområde. Dessu-tom överväger öppen jord-akvifer inom kate-gorin akvifertyp. Fyra rör saknar metadata.

4.2 Årliga maximivärdenFör varje utvald serie tas det högsta värdetinom ett hydrologiskt år för att bilda en ex-tremvärdesserie. SGU:s mätfrekvens är cirkatvå gånger per månad. De faktiska maximivär-dena är följaktligen inte nödvändigtvis infån-gade när mätningarna görs. Ändå antas att åretsuppmätta högsta värde är representativt. I deföljande listpunkterna beskrivs alla utförda steg:

1. Visuell granskning av alla ex-tremvärdesserier och utsortering av seriermed synlig instationäritet eller tydligt fe-laktiga värden

2. Normalisering av empiriska ex-tremvärdesserier enligt ekvation 39.

3. Beräkning av L-momenten enligt ekva-tion 29

4. Beräkning av parametrar för normal-, gumbel-, weibull-, logpearson 3-fördelningen samt generaliserade ex-tremvärdesfördelningen

19

Page 32: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

0

25

50

75

100

bö bs jö js n/aakvifertyp

anta

l berg öppetberg slutetjord öppetjord slutet

0

20

40

60

80

instr med utsr vattdel n/ageohydraulisk läge

anta

l inströmnomrintermed lägeutströmomrvattendelarläge

kilometer0 300

N

Figur 11. 141 valda rör med tillräckligt långa mätserier. Några rör överlappar varandra på kartan.Övre panelen visar fördelningen av akvifertypen. Undre visar det geohydrauliska läget i terrängen.

A B0

2

4

6

-1 0 1normaliserad gv-niva

anta

l

0

2

4

6

-0.4 -0.2 0.0 0.2normaliserad gv-niva

anta

l

Figur 12. A: Histogram dataserie rör 6-23. B Histogram dataserie rör 10-1 med täthetsestimat.

20

Page 33: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

5. Rangordning av observationer från lägsttill högst för att få den empiriska fördelnin-gen och utförande Anderson-Darling ochKolmogorov-Smirnovtester med de i steg 4beräknade parametrarna

Extremvärdena har normaliserats genom att draav medelvärdet x av varje värde xi. Detta skamöjliggöra en bättre jämförbarhet.

zj = xi − x (39)

4.2.1 Visuell granskningSom tidigare diskuterats är stationäritet ett cen-tralt villkor för anpassning av probabilitetsmod-eller. Datan visar ibland stor varians men sällantydliga uppåt- eller nedåtriktade trender somdessutom är långvariga. Efter ett samtal medBo Thunholm1 från SGUs grundvattengruppvisade det sig att även SGU i detta läge inteser några tecken på klimatstyrd instationäritet.Därför valdes att ignorera kortvariga trenderoch främst titta på följande fall:

• trender som tyder på ett regimskifte dvsen grundläggande ändring i grundvatten-nivåerna

• outliers utan stöd i data

• uppenbarligen påverkade serier

Utsorteringen gjordes på ett subjektiv sätt sombeskrivs i bilaga I (se sida 35). Ingen statistikakunde hittas som löser uppgiften automatisktpå ett tillfredsställande sätt. Dataserier för rören1-8, 8-2, 16-74, 19-5, 37-32 och 55-13 visadeoutliers, förändrade referensnivåer och annanpåverkan se bilaga II (36). Några dataserier bear-betades så att enskilda datapunkter togs bort,eller referensnivåer anpassades. Slutligen är en-dast 139 av 141 undersökta serier kvar som upp-fyller kriterierna för att ingå i analysen. Eftergranskningen av tidsserierna bildades en em-pirisk marginalfördelning av seriernas årsmax-imivärden (hydrologiskt år). Sedan plottadeshistogram och täthetsestimater för att under-söka den empiriska datans fördelning. Trettondataserier visade sig ha mer än ett typvärde ellertvå regioner där grundvattnet befinner sig mest,se figur 12. Av dessa är rören 10-1, 16-42, 53-6och 55-7 möjligtvis något påverkade men utan

uppenbart regimskifte. Fem av de 13 rörentillhör gruppen som har flerårsvariationer ochär långsamt reagerande. Resten av de berördarören verkar dock inte särskilja sig från de andrarör som analyserats.

4.2.2 Goodness-of-fit-testerEfter visuell granskning anpassas fördel-ningar till datan genom L-momentmetoden.Sedan beräknas fördelningens anpassningsgradgenom Kolmogorov-Smirnov-statistikan Dn

och Anderson-Darling-statistikan A2. MedanA-D-testet viktar fördelningens svans, beräk-nas med K-S-testet den största differensen mel-lan observationerna och fördelningen. A2 ochDn behöver vara under en kritisk nivå så attfördelningen inte blir förkastat och är vid sig-nifikansnivån α = 0.05 2.492 för AD-testet och1.3581√

nför KS-testet, där n är antal år, respektive.

Dessa nivåer beskrivs i avsnitt 3.5.4.Kolmogorov-Smirnov-testet i figur 13-Avisar att särskilt normalfördelningen, GEV-fördelningen, och logpearson typ 3 har enanpassning under den kritiska nivån. En-ligt Kolmogorov-Smirnov-testet är det möjligtatt anpassa GEV-fördelningen till alla 139rören. För logpearson- och normalfördel-ningen förkastas ingen respektive 6 anpass-ningar. De treparametriska fördelningarna- GEV, Weibullfördelningen och Logpearsontyp 3-fördelningen - visar generellt lägre differ-enser, vilket tyder på bättre anpassning. Nor-malfördelningen är liksom GEV-fördelningenen bra modell för datan enligt testet.Anderson-Darling-testet i figur 13-B talar ettannat språk. Testet beskrivs tidigare somsärskilt känsligt på fördelningens svans efter-som det ger lägre överskridelseprobabiliteteren större vikt. Normalfördelningen stickerut som särskilt robust i testerna och 133 av139 mätserier kan inte förkastas. De 6 rörsom förkastas stämmer överens med rören somförkastas i KS-testet. Alla dessa och en ytterli-gare serie visar upp outliers med stort avståndtill typvärdet. AD-testet förkastar också GEV-och LP3-fördelningar när det finns outliers medstort avstånd. Anpassningen av LP3 förkas-tas framförallt när det finns outliers på bådasidor medelvärdet, dvs den högre och den lä-gre svansen. GEV däremot är särskilt känslig

12013-06-11

21

Page 34: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

Dn

A2

A B

132 108 104 94 115

0.0

0.5

1.0

1.5

2.0

2.5

Normal EV1 GEV Weibull LP3

133 115 139 115 139

0.05

0.10

0.15

0.20

Normal EV1 GEV Weibull LP3

Figur 13. A: Lådagram på anpassningarnasDn-värden är lika som eller lägre än det kritiska värdet.Diagrammen visar 50% av alla värden i lådan, det svarta strecket är medianen, strecken utanförlådan representerar alla värden som är maximalt 1,5 gånger avståndet mellan de yttre kvartilen.Värden som har större avstånd markeras med en prick. Siffrorna ovanför lådorna är antalet ickeförkastbara dataserier av 139 testade serier vid signifikansnivå 0, 05.B: Lådagram på anpassningarnas A2-värden lika som eller lägre än det kritiska värdet.

mot outliers på den lägre svansen och negativskevhet. Båda fördelningarna ger dock en när-mare anpassning på datan när testet accepterasmed en median omkring 0,3. Alla accepteradeanpassningar till Weibull och EV1, som verkarminst lämpliga, kan beskrivas genom GEV ochLP3. Weibullfördelningen förkastas när de em-piriska fördelningarna har positiv skevhet, EV1däremot vid negativ skevhet. Sex av de nio se-rierna som anpassades till normalfördelningenoch förkastades, accepteras för ingen fördelningalls.Normalfördelningen kan inte förkastas för deflesta serierna enligt goodness-of-fit-testerna.För att verifiera detta plottades en kvantilplottför varje serie och det iakttogs huruvida denövre svansen avviker från de teoretiska kvantil-erna. De högsta 5-6 värdena ingick i den visuellaanalysen. Endast 34 av alla serier har en övresvans som liknar normalfördelningen. Däremothar 56 rör en tjockare svans och 51 en tunnaresvans än normalfördelningen. Detta tyder på ettbehov av en mer flexibel modellering av svansenän som är möjlig med normalfördelningen.

4.2.3 L-moment-diagram

I figur 14 plottas L-kurtosis mot L-skevhet. Vi-suellt innehåller bilden mycket brus och ingenpåtaglig anpassning till någon av fördelningarnaverkar existera. 110 av 139 dataserier grupperarsig där L-skevheten ligger i en intervall mellan-0,2 och +0,2. Följaktligen är de empiriska ex-tremvärdesfördelningarna relativt symmetriskaoch har till och med en svag övervikt på den

negativa sidan. L-kurtosis som styr de extremautfallens sannolikhet är dock mycket mer ut-spridd. Detta betyder att svansens tjocklek vari-erar mycket. Ungefär hälften av datan har en L-kurtosis högre än GEV-fördelningen vid sammaL-skevhet medan den andra hälften ligger underfördelningarna. Som visuellt hjälpmedel plot-tades en line of best-fit, som bäst passar ob-serverade data. Ett tjugotal rör verkar approx-imera GEV-fördelningen och tre rör ligger näraden fördefinierade punkten av normalfördelnin-gen. Även om bruset är mycket högt, liggeralla rörens medelvärden (fyrdelade rutan) när-mast normalfördelningen. Den prickade lin-jen är en kvadratisk regression med formelny = 0.14937 − 0.08823x + 0.73423x2 (felterm0.08595) och är i linje med GEV-fördelningen.Även om resultaten tyder på att GEV- ochnormalfördelningen är de bästa modellerna, ärspridningen av L-kvoterna stor och andra mod-eller inte uteslutna.

4.2.4 Kombinerande av L-moment och an-passningsgrad

För att kunna understryka de visuellt un-dersökta känsligheterna av olika fördelningari avsnitt 4.2.2, kombinerades L-moment-diagrammen och A-D-testen. I figur 15 visas allaseriers kvot mellan L-skevhet och L-kurtosis.Dessutom markeras om anpassningen förkas-tades (triangel) eller om den godkändes (rek-tangel). Alla förkastade serier har en högnegativ skevhet och de flesta förkastade an-passningar har en hög kurtosis. Den gener-

22

Page 35: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

0.0

0.2

0.4

-0.25 0.00 0.25L -skewness

L-k

urto

sis

mätserie

fördelningar

EV1

GEV

LP3

normal

weibull

Figur 14. L-moment-diagram. Prickarna representerar rörens L-kurtosis mot L-skevhet. Den fyrde-lade rutan är alla rörens snittvärde, den prickade linjen (line of best-fit) är en kvadratisk regressionmed 95% konfidens (ytan).

aliserade extremvärdesfördelningen är en icke-förkastbar modell för alla serier med positivskevhet oavsett kurtosis. I det kombineradediagrammet har en kurva som representeraralla definierade förhållanden av möjliga GEV-modeller plottats. Serier med hög negativskevhet och hög kurtosis förkastas liksom se-rier med kurtosis omkring -0,2 och negativskevhet. I jämförelse med normalfördelningenär GEV känsligare på den undre svansen, seockså figur 13. Logpearson typ 3-fördelningenvisar på liknande sätt känslighet vid negativ ochpositiv skevhet. Serier som har bara lätt negativskevhet är däremot mindre känsliga för förkast-ning än GEV. På den negativa sidan av kurto-sis förkastas dock samma värden på GEV somockså förkastas på LP3.

4.3 Överskridelseserier4.3.1 AnpassningAnpassningen av den generaliseradeparetofördelningen (GPD) till överskridele-serier kräver mer tid än anpassningen till årligamaximiserier. Först tas de visuellt granskadeserierna från avsnitt 4.2.1 och tillämpas på i

avsnitt 3.3.2 beskrivna metoder. Metodernaanvänds på ett iterativt sätt tills den bästa an-passningen med det störst möjliga antalet data-punkter hittas. Följande steg utfördes för varjedataserie:

1. en tröskel väljs som ligger inom en inter-vall, där funktionen Xu − U är linjär

2. en tröskelurval-plot (threshold choice plot)ritas ut för att verifiera antagen tröskel.Tröskeln kan väljas för högt så att det finnsför få observationer för en stabil anpass-ning.

3. Beräkning av shape- och scaleparametrarvid olika tröskelnivåer för att hitta tröskeldär dessa parametrar är konstanta.

4. Efter att en lämplig tröskelnivå har valts,deklustreras serien. Perioden efter dennivåer inte längre är beroende Θ av varan-dra mellan två utfall bestämmdes till 120dagar.

5. Efter deklustringen beräknas urvalets L-moment

23

Page 36: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

A C

B

D

E0

20

40

normal tjock tunnsvans

anta

l

-0.10.00.10.20.30.40.5

-0.4 -0.2 0.0 0.2L-skewness

L-k

urto

sis

förkastadnejja

-0.1

0.0

0.1

0.2

0.3

0.4

-0.4 -0.2 0.0 0.2L-skewness

L-k

urto

sis

förkastadnejja

-0.1

0.0

0.1

0.2

0.3

0.4

-0.4 -0.2 0.0 0.2L-skewness

L-k

urto

sis

förkastadnejja

gamma

-2 -1 0 1para

met

er

Figur 15. A: Alla seriers förhållande mellan L-skevhet och L-kurtosis. Trekant representerar rörvilkas anpassningar till normalfördelningen förkastades med AD-test. B: Alla seriers förhållandemellan L-skevhet och L-kurtosis. Trekant representerar rör deras anpassningar till GEV förkastadesmed AD-test. C: Alla seriers L-skevhet och L-kurtosis förhållande. Trekant representerar rör de-ras anpassningar till LP3 har förkastats. Deras anpassningar till LP3 förkastades med AD-test. D:gamma-värde. När γ = 0 blir fördelningen normalfördelningen E: Svansform av analyserade serier.En visuell granskning utfördes med särskild hänsyn till den övre svansen.

6. Därefter anpassas GPD med L-moment-metoden, där kvantildiagrammen och tä-thetsplotten används som hjälpmedel. Omtröskeln väljs för lågt stämmer täthetsesti-mat (prickad) och täthetsfunktion inte öv-erens. Om så är fallet behöver tröskelnjusteras med hjälp av metoderna förtröskelurval och hela processen med steg1 - 5 upprepas tills överlagringen är koher-ent.

4.3.2 L-moment-diagramNär GPD:n har anpassats till alla serier, plot-tas ett L-moment-diagram (figur 16). Uren L-moment-diagram kan utläsas om endataseries fördelning har en form som liknaren statistisk modell, i detta fall den generalis-erade paretofördelningen. Observationernas L-skevhet och L-kurtosis är mestadels positiva.En kvadratisk regressions kurva av datan med

formel y = 0.1715 − 1.2196x + 0.3783x2 ochfeltermen 0.1264 har en god överensstämmelsemed den fördefinierade kurvan och 95%:a kon-fidensintervallen omsluter den helt. Dessutomligger urvalets medelvärde nära linjen. Endastett fåtal värden avviker från kurvan i större ut-sträckning. Outliers i detta diagram är fram-förallt anpassningar till en serie som krävde entröskel i övre percentilen, vilket innebär att os-äkerheten gällande parametrar är större. Dettapå grund av att mindre datapunkter generelltleder till högre varians.Här avslöjas också problemet med över-skridelseserier inom grundvatten. Anpass-ningsprocessen erfordrar ibland att tröskelnivånligger i en hög percentil, se figur 17-A, så att en-dast få värden ingår i anpassningen. Cunnane(1973) rekommenderar 1,69 utfall per år, en rek-ommendation som inte kan upfyllas i de utvalda

24

Page 37: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

0.0

0.3

0.6

-0.25 0.00 0.25 0.50 0.75L -skevhet

L-k

urto

sis fördelning

GPD

Figur 16. L-momentdiagram för GPD. Polynomisk regression (blå prickad) ligger på paretofördel-ningens definierade kurva med enbart minimal avvikelse. Den prickade linjen (line of best-fit) ären kvadratisk regression med 95% konfidens (ytan).

grundvattenserierna, se figur 17-B. Inte för enenda serie används fler observationer för anpass-ningen än för årliga maximiserier. I praktikenvar en lämplig anpassning med ett större antalvärden över tröskeln inte möjligt. Anpassningarresulterar alltför ofta i trunkerade former sominte följer histogrammens eller täthetestimatensform. Särskilt långsamt reagerande rör medflerårsvariationer är svåra att modellera och gerbara få värden att anpassa täthetsfunktionen till.I nämnda serier uppträder extrema värden säl-lan och är alltid klustrade.

4.4 Jämförelse av årliga maximiserieroch överskridelseserier

Det finns två olika sätt att välja ut den em-piriska extremvärdesfördelningen från sammadataserie. Årliga maximiserier generellt harstörre avvikelse från modellernas fördefinier-ade förhållanden av L-skevhet och L-kurtosis(visas i L-momentdiagrammen). Fördelningarssvansar kan modelleras på ett mer noggrantsätt medan värden under en vald tröskel ignor-eras. Däremot är den använda datamängdenmindre vilket leder till större osäkerhet i pa-rameterskattning. Även om anpassningen skerpå olika marginalfördelningar kan shapeparam-

etern, som är motsvarande på GEV och GPD,jämföras, liksom autokorrelationen.

4.4.1 Shape-parameter

I avsnitt 3.3.1 beskrevs att shape-parametern,som kontrollerar fördelningens svanstjock-lek, motsvarar varandra på GEV och GPD.Hos årliga maximiserier är shape-parameterngenerellt större och mindre spridd än hos över-skridelseserier. Huvuddelen är positiv ochligger mellan 0 och 1. Detta betyder attfördelningarna har en tung svans. Shape-parametrarnas fördelning av överskridelseserierger en annan bild (figur 17-C). Den största de-len är negativ och är därför trunkerad. Fördel-ningarna har alltså en betaform med trunkeradsvans, vilket betyder att värdena konvergerarmot en övre gräns.Antalet observationer är olika på grund av ur-valsprocessen i årliga maximierserier och över-skridelseserier. Beroendet mellan differens ochantal observationer som ingick i anpassningav GPD undersöktes. I figur 17-D visas attju fler observationer som ingår desto störreär avvikelsen mellan GEV:s och GPD:s shape-parametrar. Eftersom ett större antal värdeni anpassningen sänker osäkerheten i parame-

25

Page 38: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

60

70

80

90

100

tröskel

perc

entil

0

1

2

10 20 30 40antal värden över tröskel u

k GE

V-

k PO

T

0

2

4

6

8

0.00 0.25 0.50 0.75utfall per år över tröskel

anta

lårligamaximivärden

över-skridelseserier

-1 0 1

met

od

A B

C D

Figur 17. A: Tröskelnivåns percentil av mätdatan summerad föra alla mätserier. B: Fördelning avantalet värden över tröskeln per år för alla mätserier. C: Jämförelse av shapeparameter för max-imiserier och överskridelseserier.D: Differensen mellan shapeparametern växer ju fler värden somär över tröskeln (överskridelseserier).

terestimeringen tyder detta på att GEV ochGPD leverar olika resultat för samma mät-serie. Eftersom GPD bara anpassas till denempiriska fördelningens svans kan den mod-elleras noggrant. Anpassningen av GEV däre-mot syftar på att anpassa den undre svansen,mitten av sampelfördelningen samt den övresvansen utan viktning. En tolkning är därför attGPD:modellen är tillförlitligare när det gällershapeparametern och GEV-anpassningen över-skattar parametern vilket leder till överskattadeåterkomstnivåer. Generellt är dock differensenökning svag, särskilt med hänsyn till det 95%:akonfidensintervallet som rymmer ett konstantförhållande.

4.4.2 ÅterkomstnivåEfter att ha anpassat alla dataserier kan manräkna ut kvantilerna som leder till återkomst-nivåer. Beräkningen genomfördes för anpass-ningar av GEV, GPD och normalfördelningen.I figur 18 plottades återkomstnivåns differensmellan olika fördelningsfunktioner vid 50, 100och 200 års återkomsttid för alla mätserier. Dif-ferensen varierar mellan noll och 2 meter. Om

värdet är negativt är den förstnämnda fördel-ningens återkomstnivå lägre än den som sub-traheras. GEV ger något lägre återkomstnivåerän normalfördelningen och växer med stigandeåterkomsttid. Detta betyder att en mer kon-servativ prognos appliceras vid tillämpningenav normalfördelningen än vid användning avGEV. Jämförelse av GEV med den generalis-erade paretofördelningen visar en komplexarebild. Även här är återkomstnivåer som beräk-nades med GEV generellt lägre än GPD:s. Dif-ferensen är som mest vid en 50 års återkom-sttid, sjunker sedan vid en 100 års återkomst-tid för att bli större igen vid 200 års återkom-sttid. Normalfördelningens återkomstnivåerär följaktligen mindre konservativa än GPD-fördelningens. Generellt växer differensensspridning med ökande återkomsttid.

4.4.3 BeroendeEtt centralt villkor för tillämpning av proba-bilistiska modeller är att observationerna be-höver vara oberoende och likafördelade. Ifigur 19 visas beroende av värden mot tids-förskjutningen, den så kallade autokorrelatio-

26

Page 39: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

-1

0

1

GEV - Normalfördelning GEV - GPD Normalfördelning - GPD

diffe

rens

[m]

50 100 200 50 100 200 50 100 200Återkomsttid Återkomsttid Återkomsttid

Figur 18. Differens av 50, 100 och 200 års återkomstnivåer redovisade som fiolplot för olika fördel-ningsfunktioner. Fiolplotten visar vilka värden som uppträder mest genom att kombinera en täthet-sestimat och ett lådagram.

nen. I den översta panelen visas autokorre-lation av överskridelseserier utan deklustring.Därunder syns samma serier men efter deklus-tring. Värden över konfidensintervallet ansessom statistiskt signifikant. Beroendet är bety-dligt mindre efter deklustring. Enbart de värdenpå de första två tidsförskjutningarna är högreän resten, fastän lägre än utan deklustring. Au-tokorrelationen av årliga maximiserier är högreän deklustrade överskridelseserier och till ochmed någorlunda högre än överskridelseserierutan deklustring. En tolkning är att det in-herenta beroendet i tidsserier framträder ävenom ett helt år ligger mellan värdena. Detta harkonsekvenser för användningen av probabilis-tiska modeller.

5 DISKUSSION

I denna rapport har genomförts en analys somsyftar till att hitta en lämplig metod för attkunna beräkna extrema grundvattennivåer ochsannolikheten att de inträffar. Beräkning avgrundvattnets återkomstnivåer krävs när riskenför skred eller hydraulisk bottenupptryckningutreds vid byggande under marken. Inom hy-

drogeologi finns endast ett fåtal publikationersom behandlar ämnet. Dessa publikationer gerdock varken vägledning för att genomföra enextremvärdesanalys eller testar metoder med ettstort antal grundvattennivåmätserier. I dettaarbete har en grundläggande litteraturstudiegjorts som sammanfattar nödvändig teori,samt en prövning av vilka metoder som kanfungera med grundvattennivåmätserier. Allametoder testades med ett större antal grundvat-tennivåmätserier ur SGU:s nationella grundvat-tennät.Inledningsvis undersöktes möjligheten attautomatisera alla analyser och genomföraberäkningar satsvis. Oftast uppstod dock fel ochdärför ändrades angreppssättet till att granskavarje grundvattenserie för sig. I praktikenfinns sällan behov av att bearbeta ett stort antaldataserier samtidigt så att en manuell granskn-ing är en smärre uppgift i relation till hela anal-ysen. Erfarenheten av SGU:s grundvattenserierär att datan har en bra struktur och ordning,dock saknas information om felaktiga värden.Enstaka mätvärden kan sakna stöd i samman-hang av hela dataserien, hela dataserier kanvara tydligt påverkade, vissa dataserier tyder

27

Page 40: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

Autokorrelation av överskridelseserier efter deklustring

-0.5

0.0

0.5

1.0

-0.5

0.0

0.5

1.0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

tidsförskjutning [år]

Aut

okor

rela

tion

Autokorrelation av årliga maximiserier

Aut

okor

rela

tion

Figur 19. Autokorrelation av alla 139 grundvattennivåmätserier, överskridelseserier efter deklus-tring och årliga maximiserier.

på funktionsfel av röret, och i flera fall har ref-erensnivån förändrats så att serien vid en visstidpunkt är förskjuten. Om sådana dataserieranvänds blir en extremvärdesanalys inadekvat.Därför är det viktigt med en granskning avdataserier innan någon analys utförs.Dataserierna som används i analysen innehållergenerellt mätvärden från två tillfällen underen månad. Den låga mätfrekvensen kan ledatill att alla maximivärden inte har registrerats.

Detta kan i sin tur leda till att de högstagrundvattennivåerna systematiskt försummas,vilket i sin tur leder till en underskattning avmodellens parametrar. Om dataseriens årligamaximivärden (empiriska marginalfördelnin-gen) undersöks, överensstämmer de inte alltidmed den förväntade formen som har positivskevhet. Denna form är vanlig för empiriska ex-tremvärdesfördelningar och sannolikhetsfördel-ningar som GEV, och LP3 följer denna form.

28

Page 41: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

Två tredjedelar av de analyserade empiriskaextremvärdesfördelningarna har däremot neg-ativ skevhet vilket betyder att det föreligger entrunkerad svans. Ett trettiotal dataserier har enform som varken har större negativ eller positivskevhet. Dessa skulle följaktligen bäst mod-elleras med en normalfördelning.Anpassningen kan dock inte bara utförasmed hänsyn till visuell överensstämmelse.Med Kolmogorov-Smirnov- och Anderson-Darlingen-testet kan visas att maximivärdenur en mätserie kan komma från en fördel-ningsfunktion, och fördelningsfunktionen kandärmed inte förkastas som lämplig modell.Efter att alla mätserier mot alla anpassade fördel-ningsfunktioner har testats, framgår tydligt attGEV- och LP3 inte går att förkastas för någonmätserie om man fokuserar på fördelningensmitt. Detta framgår från Kolmogorov-Smirnov-testet. När modellernas signifikansnivå un-dersöks med Anderson-Darling-testet, viktasdifferensen mellan den teoretiska och den em-piriska fördelningens svans, visar sig att varkenGEV eller LP3 är lämpliga för alla serier. Nor-malfördelningen däremot kan anpassas till allamätserier förutom 7 serier som har en stor neg-ativ L-skevhet. Skevheten på dessa serier or-sakas av ett fåtal låga värden som avviker starktfrån huvuddelen av datan. Nämnda värden kananses som outliers och tas bort för att nå ett inteförkastar parametrisering av normalfördelnin-gen. De treparametriska GEV och LP3 fördel-ningarna möjliggör - när modellen inte förkas-tas - en passning med mindre differens mellandatan och modellen än passningen med nor-malfördelningen. Med Anderson-Darling-testetförkastas allmänt ett större antal fördelnings-funktioner än Kolmogorov-Smirnov och kanföljaktligen ses som en mer strikt test. Föratt kunna utvärdera huruvida dataseriens formhänger ihop med förkastning av modeller, kom-bineras det frekvensfunktionbaserade AD:testetoch L-momentdiagrammen. Det visade sig attdenna presentationsform kan visa hur datase-riens form hänger ihop med modellens måttpå anpassningsbarhet. Har dataserien en nega-tiv L-skevhet och en L-kurtosis som är störreän 0,1 förkastas oftast anpassningar med GEV-fördelningen. Vid hög negativ eller positivL-skevhet och L-kurtosis större än 0,2 förkas-tas oftast anpassningar med LP3-fördelningen.Normalfördelningen förkastas oftast vid en neg-

ativ L-skevhet mindre än -0,3. En viktig up-ptäckt är även att alla fördelningsfunktionerförkastas för en del av mätserierna när det strik-tare Anderson-Darling-testet används, så attingen modell alls kan hittas för metoden därfördelningsfunktioner anpassas till årets max-imivärden.Den generaliserade Paretofördelning (GPD) haranpassats till överskridelseserier som gener-erades genom att välja alla värden som över-stiger en viss tröskel. Detta skall säkerställaen högre statistisk effektivitet samt reduc-era beroendet mellan värdena. Grundvatten-nivåmätserier med flerårsvariationer har dockoftast inom en 40-års period enbart ett parperioder med höga nivåer som kan uppfat-tas som extremvärden. Dessa värden inträffarfrämst klustrade, dvs värdena är beroende avde föregående värdena så att bara en maxima ien fas kan användas. Även i serier med mindreperiodicitet återstår efter deklustring mindre änett värde per år. För låga tröskelnivåer ledertill felaktig skattning av parametrar så att dettamål inte kan uppnås i praktiken. Stickprovetsom utgör en överskridelseserie är alltid min-dre än den motsvarande serien av årliga max-imivärden. Däremot kan överskridelseserieranpassas väl till en GPD som line-of-best-fit i L-momentdiagrammen visar. Utöver detta visaren analys av beroende mellan värden - i bådaårliga maximiserier och överskridelseserier - attöverskridelseserier är mindre autokorrelerade(efter deklustring) än årliga maximiserier. Au-tokorrelationen är dock i båda urvalsmetodernagenerellt högre än vad som skulle kunna förvän-tas och tyder på ett resterande beroende som hareventuellt sin orsak i flerårsvariationer.Ytterligare en jämförelse som gjordes mel-lan överskridelse- och årliga maximiserier ärskillnaden mellan shape-parameterarnas stor-lek som är motsvarande för GEV och GPD.Shape-parametern definierar formen av fördel-ningens svans. Anpassningar till GPD resulter-ade oftare i en negativ shape-parameter som ärmotsvarande en trunkerad svans. Anpassningartill GPD är överlag positiva, vilket motsvarar entung svans och därmed högre återkomstnivåer.I början av avsnitt 3 beskrivs att en grundvatten-nivå har en övre gräns som inte kan överstigas.Detta fysiska randvillkor återspeglas uppenbartframförallt i överskridelseserier. Problemet ärdock att den fysiska tröskeln inte är känd och

29

Page 42: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

är möjligtvis inte densamma som modellens.Risken återstår följaktligen att grundvatten-nivån eventuellt kan bli högre än trunkeringensom anpassningen fastslår.Resultatet av en modell med trunkerad svanssyns tydligt när återkomstnivåer jämförs mellanolika modeller, GEV, GPD och normalfördel-ning. Återkomstnivåer som beräknades mednormalfördelningen (som inte har någon pa-rameter som möjliggör en modellering avsvansen) är högre än för GEV och GPD.Utöver detta tillkommer osäkerheten genomskattningsfel av parametrarna (som kan beräk-nas med konfidensinterval).

5.1 Rekommendationer

En möjlig lösning för att kunna hantera en ex-tremvärdesanalys av grundvattennivåmätserierpresenteras i figur 20. Efter utsortering avfelaktiga värden ur en dataserie, börjar manmed att selektera en årlig maximiserie efter-som den generellt utgör ett större stickprov änden motsvarande överskridelseserien. Sedan an-passas olika fördelningar och jämförs i olikagodness-of-fit tester. Anpassningarnas skattadeparametrarna som inte har förkastats kan sedananvändas för att beräkna återkomstnivåer förfastslagna återkomsttider. Dessa kan dessu-tom jämföras i en scenarioanalys där differensenmellan dataserien och modellen och förkast-ning testas. Fördelningen med den lägsta AD-statistikan kan sedan anses som mest lämplig.Förkastas alla anpassningar till årliga maximis-erier - eller vill man utvidga scenarioanalysen- genomförs en anpassning av den generaliser-ade paretofördelningen på en överskridelseserie.Överskridelseserier och GPD skall om möjligtinte användas utan jämförelse med årliga max-imiserier och motsvarande modeller. Dettaeftersom antalet mätvärden som ingår i över-

skridelseserier är lägre än på maximiserier ochger större varians och sämre skattning.

6 SLUTSATS

Vi skulle gärna kunna fastställa en säker siffrapå en 50-, 100- eller 200-års återkomsttid. Menvarken de tidigare använda metoderna ellermetoder som har inom andra forsknings kange ett riskfritt och tvärsäkert värde. Flera mod-eller måste testas, jämföras, konfidensintervallermåste beräknas och osäkerheterna i rådatanskall vägas in. Slutligen kan ändå hävdas att detär beroende på mätserie vilken fördelning sompassar bäst. Medan GEV och LP3 har en låg dif-ferens mellan Normalfördelningen är oftast enmodell som inte går att förkastas och som sam-tidigt ger en konservativ skattning av återkom-stnivåer. Däremot är det inte alltid givet att enanpassning med en normalfördelning kan god-kännas. Ett problem som återstår är beroendetmellan värden i framförallt årliga maximiseriersom hänger ihop med flerårsvariationen. Omöverskridelseserier används kan detta problemreduceras men anpassningen baseras på mindredata.

Framtida studierMetoderna som används i detta arbete ärbaserade enbart på uppmätta grundvattennivån,dock skulle andra variabler som tex nordat-lantiska oscillationen (NAO) - ett storskaligtklimatfenomen - kunna ingå. Även om klimat-förändringens inverkan på grundvattnets ex-tremvärden hittills inte har kunnat fastställaskan dock metoder utvecklas som tar hänsyntill stigande grundvattenbildning. I byggpro-jekt där oftast enbart korta mätserier i prognos-rören är tillgängliga kan en metod som alterna-tiv till chalmersmodellen utvecklas där param-eterestimaten från långa korrelerande mätserieranvänds som priors i en bayesisk estimering avparameter för prognosrören.

30

Page 43: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

årsmaximivärde från varje års månadsmedel väljs

Årliga maxima(hydrologisk år)

Överskridelseserier(tröskelbestämning,

deklustrar)

Normalfördelning

GEV fördelning Tröskelurval

Logpearson 3 fördelning

Weibull/EV1 fördelning

Goodness-of-fit tester

Återkomsttider motsvarande kvantiler

Återkomstnivåer

Analys av grundvattenseriefelaktiga mätningar tas bort

Scenarioanalys med alla godkända fördelningar

Godkänd

Förkastning elleralternativmodell

GPD fördelning

Figur 20. Flödesschema för en möjlig metod för beräkning av återkomstnivåer .

31

Page 44: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

REFERENSER

Akfidan, J. & Sadek, R. (2012). Dimensionering och utförande av bottenplattor utsatta för upptryck.Examensarbete, Kungliga Tekniska Högskolan, TRITA-BKN, Examensarbete 362.

Allen, D.M., Cannon, a.J., Toews, M.W. & Scibek, J. (2010). Variability in simulated recharge usingdifferent GCMs. Water Resources Research, 46(10):n/a–n/a. doi:10.1029/2009WR008932.

Bakker, K. (2012). Water Security : Research Challenges and Opportunities. Science, 337(August):914–915.

Bengtsson, J. & Boström, J. (2008). Prognostisering av höga grundvattennivåer med Chalmersmod-ellen. Examensarbete - Institutionen för bygg- och miljöteknik, Chalmers tekniska högskola;2008:103.

Bichler, A. & Fürst, J. (2012). Groundwater Flooding : Practical Methods for the Estimation ofExtreme Groundwater Levels. Geophysical Research Abstracts, 14:4671.

Chavez-Demoulin, V. & Davison, A.C. (2012). Modelling time series extremes. REVSTAT - StatisticalJournal, 10(1):109–133.

Cunnane, C. (1973). A particular comparison of annual maxima and partial duration series methodsof flood frequency prediction. Journal of hydrology, 18:257–271.

Davidson, A.C. & Smith, R.L. (1990). Models for Exceedances over High Thresholds. Journal of theRoyal Statistical Society Series B Methodological, 52(3):393–442.

Dufford, A.E. (1958). Quaternary geology and ground-water resources of Kansas River valley betweenBonner Springs and Lawrence, Kansas. Technical report, Kansas Geological Survey Bulletin 130,part 1, Lawrence, Kansas.

Flühler, H. & Roth, K. (2004). Physik der Ungesättigten. Heidelberg, winterseme edition, 374 pp.

Gilleland, E. & Katz, R.W. (2011). New software to analyze how extremes change over time. Eos,92(2):13–14.

Gilleland, E., Ribatet, M.A. & Stephenson, A.G. (2013). A Comparative Software Review for ExtremeValue Analysis. Extremes, 16(1):103–119.

Griffis, V. & Stedinger, J. (2007). The use of GLS regression in regional hydrologic analyses. Journalof Hydrology, 344(1-2):82–95. doi:10.1016/j.jhydrol.2007.06.023.

Grip, H. & Rohde, A. (1994). Vattnets väg från regn till bäck. Hallgren & Fallgren, Uppsala, 3:e revideedition.

Gumbel, E.J. (1957). Statistics of Extremes. Columbia University Press, New York, 375 pp.

Hayter, A. (2012). Probability and Statistics for Engineers and Scientists. Brooks/Cole, Boston, MA,fourth edi edition, 826 pp.

Hillel, D. (2004). Introduction to Environmental Soil Physics. Elsevier Science.

Hirsch, R.M., Slack, J.R. & Smith, R.A. (1982). Techniques of trend analysis for monthly waterquality data. Water Resources Research, 18(1):107–121. doi:10.1029/WR018i001p00107.

Hiscock, K.M. (2005). Hydrogeology Principles and Practice. Blackwell Science Ltd, 389 pp.

Hölting, B. & Coldeway, W.G. (2009). Hydrogeologie. Spektrum Akademischer Verlag, Heidelberg,7. auflage edition, 383 pp.

32

Page 45: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

Hosking, J.R.M. & Wallis, J.R. (1995). A comparison of unbiased and plotting-position estimators ofL-moments. Water Resources Research, 31(8):2019–2025.

Hosking, J. (1990). L-moments: analysis and estimation of distributions using linear combinations oforder statistics. Journal of the Royal Statistical Society. Series B ( . . . , 52(1):105–124.

Hosking, J., Wallis, J. & Wood, E. (1985). Estimation of the Generalized Extreme-Value Distributionby the Method of Probability- Weighted Moments. Technometrics, 27(3):251–261.

Huggenberger, P. & Epting, J. (2011). Urban Geology. Process-Oriented Concepts for Adaptive and Inte-grated Resource Management. Springer, Heidelberg, 216 pp. doi:10.1016/B0-12-369396-9/00231-8.

Katz, R.W., Parlange, M.B. & Naveau, P. (2002). Statistics of extremes in hydrology. Advances inWater Resources, 25(8-12):1287–1304.

Katz, R. (2004). Statistical methods for extremes in climate and health. In: NCAR Summer Colloquiumon Climate and Health, p. 21. Boulder, CO.

Kidmose, J., Refsgaard, J.C., Troldborg, L., Seaby, L.P. & Escrivà, M.M. (2012). Climate changeimpact on groundwater levels: ensemble modelling of extreme values. Hydrology and Earth SystemSciences Discussions, 9(6):7835–7875. doi:10.5194/hessd-9-7835-2012.

Kim, G.B., Lee, K.K., Lee, J.Y. & Yi, M.J. (2007). Case study for determination of a water level moni-toring frequency for nationwide groundwater monitoring networks in Korea. Journal of Hydrology,342(3-4):223–237. doi:10.1016/j.jhydrol.2007.05.034.

Knutsson, G. & Morfeldt, C.O. (1993). Grundvatten teori & tillämpning. AB Svensk Bygtjänst,Stockholm, 304 pp.

Kochanek, K., Strupczewski, W.G. & Markiewicz, I. (2010). On feasibility of l-moments methodfor distributions with cumulative distribution function and its inverse inexpressible in the explicitform. In: Advances in Statistical Hydrology, 2, pp. 1–10. Taormina, Italy.

Kottegoda, N. & Rosso, R. (2008). Applied Statistics for Civil and Environmental Engineers. BlackwellPublishing Ltd, New York, 2nd editio edition, 718 pp.

Lang, M., Ouarda, T. & Bobée, B. (1999). Towards operational guidelines for over-threshold modeling.Journal of Hydrology, 225:103–117.

Loucks, D.P., van Beek, E. & Stedinger, J.R. (2005). Water Resources Systems Planning and Managementand Applications. Studies and reports in hydrology. United Nations Educational, Scientific andCultural Organization, Paris, 680 pp.

Lundmark, A. & Olofsson, B. (2002). Analysis of groundwater levels in urban areas. In: NordicHydrological Conference, volume 47 of Nordic Hydrological Programme, NHP, Report, pp. 849–858.KTH, Land and Water Resources Engineering, Nordic Hydrological Programme.

Milly, P.C.D., Betancourt, J., Falkenmark, M., Hirsch, R.M., Zbigniew, W., Lettenmaier, D.P.& Stouffer, R.J. (2008). Stationarity Is Dead : Whither Water Management? Science,319(February):573–574.

Muenchen, R. (2013). R’s 2012 Growth in Capability Exceeds SAS’ All Time Total.http://r4stats.com/2013/03/19/r-2012-growth-exceeds-sas-all-time-total/ 2014-04-22.

Naturvardsverket (1999). Bedömningsgrunder för miljökvalitet: Grundvatten. Technical report,Stockholm.

33

Page 46: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

Peel, M.C. & Blöschl, G. (2011). Hydrological modelling in a changing world. Progress in PhysicalGeography, 35(2):249–261. doi:10.1177/0309133311402550.

Persson, H. (2008). Estimation of pore pressure levels in slope stability calculations : Analyses and mod-elling of groundwater level fluctuations in confined aquifers along the Swedish west coast. Thesis for thedegree of licentiate of engineering, Chalmers University of Technology.

Pickands III, J. (1971). The Two-Dimensional Poisson Process and Extremal Processes. Journal ofApplied Probability, 8(4):745–756.

Pickands III, J. (1975). Statistical inference using extreme order statistics. The Annals of Statistics,3(1):119–131.

Bedömningsgrunder för grundvatten, SGU-rapport 2013:01. Technical report, 238 pp.

Skredkommissionen (1995). Rapport 3:95 Anvisningar för släntstabilitetsutredningar. Technical re-port, Ingenjörsventenskapsakademien, Linköping.

SMHI (2012). Sveriges klimat har blivit varmare och blötare.http://www.smhi.se/kunskapsbanken/klimat/sveriges-klimat-har-blivit-varmare-och-blotare-1.216142014-05-13.

Stal, T. & Wedel, P. (1984). Geoteknik. LiberFörlag, Stockholm, 663 pp.

Svensson, C. (1984). Analys och användning av grundvattennivåobservationer. Phd-thesis, ChalmersTekniska Högskola.

Trenberth, K.E. (1998). Atmospheric moisture residence times and cycling: Implications for rainfallrates and climate change. Climatic Change, 39(4):667–694.

TK Geo, Vägverket 2009:46. Technical report, Borlänge.

Visser, H. & Petersen, A.C. (2012). Inferences on weather extremes and weather-related disasters: areview of statistical methods. Climate of the Past, 8(1):265–286. doi:10.5194/cp-8-265-2012.

de Vita, P. & Fabbroncino, S. (2007). Influence of the North Atlantic Oscillation (NAO) on the cli-matic variability and groundwater resources in carbonate aquifers of southern Italy. Italian Journalof Engineering Geology and Environment, 1:33–48. doi:10.4408/IJEGE.2007-01.O-03.

34

Page 47: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

BILAGA I - TESTADE MÄTSERIER

I tabellen nedan hittas alla grundvattennivåmätserier ur SGU:s nationella grundvattennät som haranalyserats i rapporten.

Omr stn Omr stn Omr stn Omr stn

16 26 34 4 20 1 13 252 2 34 6 20 2 13 552 8 34 10 21 2 14 352 9 34 12 23 2 14 652 13 37 1 23 4 14 1252 14 37 2 23 20 14 1353 6 37 10 23 23 15 853 11 37 12 23 21 15 954 1 37 18 23 24 14 1454 5 37 32 24 1 14 254 6 37 34 24 6 16 6754 10 37 45 26 2 16 1854 14 37 49 26 6 16 2855 3 37 14 1 4 16 2955 8 38 1 1 5 16 4255 9 38 3 1 6 17 155 11 38 6 1 7 17 655 12 38 7 1 8 17 755 7 38 9 3 2 17 855 13 38 10 3 3 17 955 17 39 1 3 4 17 255 5 41 1 3 1 19 355 1 41 2 4 3 19 955 14 41 5 4 9 19 1156 3 41 6 4 12 19 1356 4 41 7 4 13 19 1457 1 42 1 4 4 19 526 14 42 2 4 226 24 42 3 4 726 9 42 5 4 1026 29 42 8 5 126 7 42 10 5 329 3 43 1 5 429 5 43 5 6 2429 6 43 6 6 2529 1 43 9 10 133 4 43 4 6 2633 5 48 23 6 23

35

Page 48: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

BILAGA II - GRUNDVATTENNIVÅMÄTNINGAR

Rör 0108

22

24

26

28

1970 1980 1990 2000 2010tid

m.ö

.h

Grundvattennivåmätningar SGU:rör 0108. Tydlig förskjutning ungefär vid årsskifte 1997/1998.Antagligen förändrat referensnivå. Referensnivån anpassades genom att förskjuta referensnivån avserien mellan 1969 - 1998 till 1998 - 2013 medelvärde.

Rör 0802

10.0

12.5

15.0

17.5

1970 1980 1990 2000 2010tid

m.ö

.h

Grundvattennivåmätningar SGU:rör 0802. Röret är påverkat efter 1992, antagligen genom vat-tenurtag. Värden som är rödmarkerade har tagits bort .

36

Page 49: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

Rör 1905

150

152

154

156

1970 1980 1990 2000 2010tid

m.ö

.h

Omr_stn

19_17

19_5

Grundvattennivåmätningar SGU:rör 1905 och 1917, Röret 19-05 har förändrat referensnivå. Seriensreferensnivå från 1968 - 1992 har anpassats enligt senare mätvärden och enligt 19-17, se figur nedan.

153

154

155

1970 1980 1990 2000 2010tid

m.ö

.h

Omr_stn

19_17

19_5

Grundvattennivåmätningar SGU:rör 1905 efter bearbetning.

37

Page 50: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Ezra M. Haaf TRITA-LWR Examensarbete 14:12

Rör 3732

253

254

255

1970 1980 1990 2000 2010tid

m.ö

.h

Grundvattennivåmätningar SGU:rör 3732.

Medan rör som visade starka trender som i figur nedan behölls, togs rör 19-3 bort på grund av tydligpåverkan

149.5

150.0

150.5

151.0

1970 1980 1990 2000 2010tid

m.ö

.h Omr_stn

4_4

Station 4-4 normaliserad. Linjen visar en trend approximerad med lokal polynomisk regression och95 % konfidens. .

38

Page 51: EXTREMVÄRDESANALYS AV ...827017/FULLTEXT01.pdfF X(x): Fördelningsfunktion f X(x): Täthetsfunktion x: Medelvärde xi Ezra M. Haaf TRITA-LWR Examensarbete 14:12 xii Extremvärdesanalys

Extremvärdesanalys av grundvattennivåmätserier

155

160

165

170

1970 1980 1990 2000 2010tid

m.ö

.h

Station 19-3 visar tydlig påverkan, antagligen av hydrauliska tester samt en outliers. Serien ingårinte i analysen.

39