osnove teorije ekstremnih vrednosti · herga, s.: osnove teorije ekstremnih vrednosti magistrsko...

66
UNIVERZA V MARIBORU FAKULTETA ZA NARAVOSLOVJE IN MATEMATIKO Oddelek za matematiko in racunalnitvo Magistrsko delo OSNOVE TEORIJE EKSTREMNIH VREDNOSTI Mentor: Kandidatka: prof. dr. Dominik Benkovic Sabina Herga Maribor, 2014

Upload: others

Post on 04-Jan-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

UNIVERZA V MARIBORUFAKULTETA ZA NARAVOSLOVJE IN MATEMATIKO

Oddelek za matematiko in racunalništvo

Magistrsko delo

OSNOVE TEORIJEEKSTREMNIH VREDNOSTI

Mentor: Kandidatka:prof. dr. Dominik Benkovic Sabina Herga

Maribor, 2014

Page 2: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

ZAHVALA

Najprej se iskreno zahvaljujem svoji druzini, ki mi je omogocila študij, ter mepodpirala in stala ob strani ves cas tekom študija. Posebna zahvala za vso spodbudogre fantu Jerneju.

Zahvaljujem se tudi mentorju prof. dr. Dominiku Benkovicu za strokovno vo-denje in pomoc pri izdelavi magistrskega dela.

Page 3: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

UNIVERZA V MARIBORU

FAKULTETA ZA NARAVOSLOVJE IN MATEMATIKO

Oddelek za matematiko in racunalništvo

IZJAVA

Podpisana Sabina Herga, rojena 23. 2. 1990, študentka Fakultete za naravoslovje inmatematiko Univerze v Mariboru, študijskega programa Matematika, izjavljam, daje magistrsko delo z naslovom

Osnove teorije ekstremnih vrednosti

pri mentorju prof. dr. Dominiku Benkovicu avtorsko delo. V magistrskem delu souporabljeni viri in literatura korektno navedeni; teksti niso uporabljeni brez navedbeavtorjev.

Maribor, november 2014 Sabina Herga

Page 4: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Osnove teorije ekstremnih vrednosti

program magistrskega dela

V magistrskem delu naj bodo podane osnove teorije ekstremnih vrednosti. Podrob-neje naj bosta predstavljena temeljna pristopa, ki se uporabljata v teoriji ekstremnihvrednosti, in sicer model maksimumov skupin podatkov in model preseganja mejnevrednosti. Teorija naj bo podkrepljena z zgledi.

Osnovni viri:

• Coles, S. An Introduction to Statistical Modeling of Extreme Values, Springer-Verlag London 2001.

prof. dr. Dominik Benkovic

4

Page 5: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

HERGA, S.: Osnove teorije ekstremnih vrednosti

Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko in racunalništvo, 2014.

Izvlecek

V magistrskem delu so predstavljene osnove teorije ekstremnih vrednosti. Nazacetku dela so povzeti osnovni pojmi iz verjetnosti in statistike, ki so potrebniza razumevanje snovi. Osrednji del magistrskega dela je namenjen opisu glavnihdveh pristopov, ki se uporabljata v teoriji ekstremnih vrednosti. Kot prvi pristop jeto model maksimumov skupin podatkov in kot drugi je to model preseganja mejnihvrednosti. Pri vsakem pristopu je zapisana teoreticna izpeljava in podan še prakticenzgled, za lazje razumevanje. Na zgledih so tako obravnavani nekateri ekstremnidogodki v naravi, kot so kolicina dnevnih padavin, letne maksimalne morske gladine...

Kljucne besede: teorija ekstremnih vrednosti, model maksimumov skupin po-datkov, model preseganja mejnih vrednosti.

Math. Subj. Class. (2010): 62G32.

5

Page 6: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

HERGA, S.: Basics of the theory of extreme values.

Master Thesis, University of Maribor, Faculty of Natural Sciences andMathematics, Department of Mathematics and Computer Science, 2014.

Abstract

In this master thesis the basics of the theory of extreme values are presented.At the beginning of the thesis we summarize some basic concepts of probabilityand statistics. The central part of the master thesis is devoted to the descriptionof the two main approaches, which are used in the theory of extreme values. Thefirst approach is called block maxima model and the second one is called peakover threshold model. For each approach we give a theoretical derivation and for abetter understanding also a practical example. Through examples we consider someextreme events in nature such as daily rainfall levels, annual maximum sea-levels ...

Key words: the theory of extreme values, block maxima model, peak over thresh-old.

Math. Subj. Class. (2010): 62G32

6

Page 7: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Kazalo

Izvlecek 5

Abstract 6

Slike 8

1 Uvod 9

2 Osnovni pojmi 11

2.1 Osnove verjetnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.1.1 Zvezne nakljucne spremenljivke . . . . . . . . . . . . . . . . . 12

2.1.2 Številske karakteristike . . . . . . . . . . . . . . . . . . . . . . 15

2.1.3 Poissonov proces . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.2 Osnove statistike . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3 Delovni zgled . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3 Pristopi k teoriji ekstremnih vrednosti 33

3.1 Prvi pristop . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.1.1 Model maksimumov skupin podatkov . . . . . . . . . . . . . . 44

3.1.2 Zgled . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.2 Drugi pristop . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.2.1 Model preseganja mejne vrednosti . . . . . . . . . . . . . . . . 50

3.2.2 Zgled . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4 Drugi modeli 58

Literatura 65

7

Page 8: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Slike

2.1 Podatki za dele stroja . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.2 Funkcija stopnje korozije za dele stroja . . . . . . . . . . . . . . . . . 28

2.3 Profil logaritemske verjetnosti za parameter b . . . . . . . . . . . . . 30

2.4 Verjetnostni graf za primer sestavnih delov stroja . . . . . . . . . . . 31

2.5 Graf kvantilov za primer sestavnih delov stroja . . . . . . . . . . . . . 32

3.1 Gumbelova porazdelitvena funkcija . . . . . . . . . . . . . . . . . . . 36

3.2 Frechetova porazdelitvena funkcija . . . . . . . . . . . . . . . . . . . 37

3.3 Weibullova porazdelitvena funkcija . . . . . . . . . . . . . . . . . . . 37

3.4 Normalni porazdelitvi N (0, 1) in N(2, 1) . . . . . . . . . . . . . . . . 38

3.5 Normalna porazdelitev N(0, 3) . . . . . . . . . . . . . . . . . . . . . . 39

3.6 Normalna porazdelitev N(0, 1/3) . . . . . . . . . . . . . . . . . . . . 39

3.7 Weibullova porazdelitev za ξ = 0.5 in ξ = 1 . . . . . . . . . . . . . . . 40

3.8 Weibullova porazdelitev za ξ = 2 in ξ = 4 . . . . . . . . . . . . . . . . 41

3.9 Letne maksimalne morske gladine v Port Pirieu . . . . . . . . . . . . 47

3.10 Profil verjetnosti za ξ . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.11 Verjetnostni graf in graf kvantilov za Port Pirie . . . . . . . . . . . . 49

3.12 Verjetnostni graf in graf kvantilov za Gumbelovo porazdelitev . . . . 50

3.13 Dnevne padavine v JZ Angliji . . . . . . . . . . . . . . . . . . . . . . 55

3.14 Ocene parametrov v odvisnosti od mejne vrednosti . . . . . . . . . . 56

3.15 Profil verjetnosti za ξ . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.16 Verjetnostni graf in graf kvantilov . . . . . . . . . . . . . . . . . . . . 57

8

Page 9: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Poglavje 1

Uvod

Teorija ekstremnih vrednosti je ena najpomembnejših statisticnih metod v zadnjihletih. Gre za eno izmed vej v statistiki, ki se ukvarja z ekstremnimi odstopanji.Srecujemo se s problemom modeliranja vrednosti, ki so izjemno visoke in se zgodijole v redkih primerih. Njen namen je iz nekega danega vzorca oceniti slucajno spre-menljivko in verjetnost dogodkov, ki so ekstremni. Ta teorija se pogosto uporabljav številnih strokah, kot so finance, hidrologija, gradbeništvo, meteorologija in šebi lahko naštevali. Primer lahko navedemo iz hidrologije. Poplave so ena izmedekstremnih dogodkov v naravi. Izracunamo lahko verjetnost, da bi se v naslednjihletih zgodila ta naravna katastrofa.

Teorijo, po kateri je naslovljeno tudi to magistrsko delo, je odkril angleški statis-tik Leonard Henry Caleb Tippett (1902-1985). Bil je zaposlen v zdruzenju razisko-valcev bombazne industrije v Veliki Britaniji. Tam je raziskoval, kako bi naredilbombazne niti mocnejše. V svojih raziskavah je ugotovil, da so te bombazne nititako mocne, kot je mocno njeno najšibkejše vlakno. Nato mu je pomagal drugiangleški statistik Ronald Aylmer Fisher (1890-1962) in tako sta dobila tri asimp-toticne meje, ki sedaj opisujejo porazdelitev ekstremov. Te tri porazdelitve so tudiopisane v tem magistrskem delu.

V prvem delu magistrskega dela najprej opišemo osnovne pojme verjetnostiin statistike, ki jih uporabljamo v nadaljevanju. Pri osnovah verjetnosti opišemopojma kot sta slucajna spremenljivka in porazdelitvena funkcija. Nato opišemozvezne nakljucne spremenljivke in podamo nekaj pomembnih porazdelitev. Polegtega opišemo še osnovne številske karakteristike. Na kratko podamo tudi opis Pois-sonovega procesa. V osnovah statistike opišemo nekaj osnovnih pojmov, kot sokvantili, interval zaupanja, cenilke, in dve metodi, kako jih izracunamo. Pri opisihnekaterih osnovnih pojmov so podani tudi primeri. Omenimo še posebno obliko

9

Page 10: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

porazdelitve, to je vecrazsezna normalna porazdelitev. Na koncu podamo še delovnizgled za lazje razumevanje vseh opisanih pojmov.

Sledi osrednje poglavje magistrskega dela. V tem poglavju opišemo glavnadva pristopa v teoriji ekstremnih vrednosti. Najprej definiramo spremenljivko,ki se uporablja v teh dveh pristopih. Podamo glavni izrek, izrek o limitni po-razdelitvi, v katerem spoznamo ze prej omenjene tri porazdelitve, ki so poimen-ovane po samih pomembnih mozeh. Prva porazdelitev se imenuje po švedskeminzenirju in znanstveniku Waloddiju Weibullu (1887-1979), druga po francoskemmatematiku Renéju Fréchetu (1878-1973) in tretja po nemškem matematiku EmiluJuliusu Gumbelu (1891-1966). Za vsako od teh porazdelitev je podana tudi po-razdelitvena funkcija. Sledi skica dokaza glavnega izreka. Kot bomo videli, lahkote tri porazdelitve zdruzimo v eno. V tej porazdelitvi se pojavljajo trije parametri.To so lokacijski parameter µ, parameter višine σ in parameter oblike ξ. Vsi trijeparametri so bolj podrobno opisani. Pred opisom prvega pristopa smo opisali šemodel za minimume.Sledi opis prvega pristopa ali tako imenovanega modela maksimuma skupin po-

datkov. Ta metoda analizira podatke tako, da jih zdruzuje v skupine. Po navadijih zdruzujemo v skupine glede na neko casovno obdobje. Najveckrat je to mesec,še pogosteje je to leto. Ko podatke zdruzimo v skupine, v vsaki skupini poišcemopodatek z maksimalno vrednostjo. Za ta model zapišemo še funkcijo verjetja, loga-ritemsko funkcijo verjetja in profil verjetnosti. Sledi zgled te metode.Drugi pristop se imenuje model preseganja mejne vrednosti. V tem modelu se

osredotocimo na podatke, ki presegajo neko vnaprej doloceno mejno vrednost. V temdelu smo opisali tudi splošno Paretovo druzino. Zapišemo še logaritemsko funkcijoverjetja. Na koncu tudi za ta model podamo zgled.

V zadnjem poglavju smo opisali še enega izmed ostalih modelov, ki se pojavljajov teoriji ekstremnih vrednosti. Drugi modeli obstajajo predvsem zaradi podatkov.Podatki so namrec lahko zelo razlicni. Velikokrat so lahko v omejeni kolicini, ali nevsebujejo veliko ekstremov. Odlocili smo se za statisticno metodo r-tih najvecjihvrednosti. Tudi pri tem modelu najprej definiramo nakljucno spremenljivko. Slediposplošitev glavnega izreka, ki smo ga zapisali v prejšnjem poglavju, izreka o limitnihporazdelitvah. Podali smo tudi gostoto limitne porazdelitve. Za dokaz teh dvehizrekov smo potrebovali tudi tockovne procese, tako da smo na kratko opisali tudite. Za ta model podamo še verjetnost.

10

Page 11: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Poglavje 2

Osnovni pojmi

Na zacetku si za lazje razumevanje poglejmo nekaj pojmov, ki jih bomo uporabljaliv nadaljevanju.

2.1 Osnove verjetnosti

Naše uvodno poglavje zacnimo z osnovnimi pojmi. Najprej si bomo pogledali defini-cijo nakljucne spremenljivke.

Definicija 2.1 Naj bo (G,A, P ) verjetnostni prostor. Funkcija X : G → R jenakljucna spremenljivka, ce je za vsako Borelovo mnozico B praslika X−1(B) =

{e ∈ G|X(e) ∈ B} element σ-algebre A.

Primer 1 Recimo, da igralni kovanec vrzemo 3-krat zaporedoma. Potem bo našanakljucna spremenljivka X merila število cifer, ki se pri tem pojavijo. Naša mnozicaG, iz katere slikamo, je enaka

G = {e = (x1, x2, x3)|xi ∈ {0, 1}}.

Sestavljena je torej iz vektorjev dolzine 3, pri cemer je vsaka komponenta tegavektorja xi ∈ {0, 1}. To pomeni, da bo xi = 1, ce v i-tem poskusu pade cifra, vnasprotnem primeru bo xi = 0, kar pomeni, da v metu ni padla cifra. Tako lahkodefiniramo nakljucno spremenljivko X : G→ R, in sicer s predpisom

X(e) = x1 + x2 + x3

za vsak element e ∈ G.

Poglejmo si še, kdaj sta dve spremenljivki neodvisni.

11

Page 12: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Definicija 2.2 Nakljucni spremenljivkiX in Y sta neodvisni, ce za poljubni Borelovimnozici A,B ⊆ R velja, da sta dogodka [X ∈ A] in [Y ∈ B] neodvisna, kar pomeni

P [X ∈ A, Y ∈ B] = P [X ∈ A]P [Y ∈ B],

za vse A,B ∈ B.

Kot naslednje si oglejmo osnovo porazdelitvenega zakona, in sicer porazdelitvenofunkcijo.

Definicija 2.3 Naj bo X : G → R nakljucna spremenljivka. Porazdelitvenafunkcija nakljucne spremenljivke X je FX : R→ [0, 1]

FX(x) = P [X < x] = P [X ∈ (−∞, x)]

za vsak x ∈ R.

Izrek 2.4 Porazdelitvena funkcija ima naslednje lastnosti:

• FX je narašcajoca (FX(a) ≤ FX(b), ce je a < b),

• FX je zvezna z leve strani (limx↑a FX(x) = FX(a)),

• velja limx→∞ FX(x) = 0 in limx→∞ FX(x) = 1.

2.1.1 Zvezne nakljucne spremenljivke

Zvezne nakljucne spremenljivke so tiste, katerih porazdelitvena funkcija je zvezna.Zacnimo z definicijo.

Definicija 2.5 Naj bo X nakljucna spremenljivka in FX njena porazdelitvena fun-kcija. Pravimo, da je nakljucna spremenljivka X porazdeljena zvezno, ce obstajanenegativna integrabilna funkcija p : R→ R, da velja

FX(x) = P [X < x] =

x∫−∞

p(t)dt za vsak x ∈ R.

Funkcija p se imenuje gostota porazdelitve.

V nadaljevanju bomo navedli nekaj pomembnih porazdelitev.

12

Page 13: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

1. Enakomerna porazdelitev E(a, b)

Gledali bomo enakomerno porazdelitev na intervalu [a, b]. Njena funkcija gostote jeenaka

p(x) =

{1b−a , x ∈ [a, b]

0 , x /∈ [a, b].

Ce funkcijo gostote integriramo, dobimo porazdelitveno funkcijo kot :∫ xa

1b−adt =

1b−at |

xa=

1b−a(x − a). Sedaj lahko zapišemo porazdelitveno funkcijo za enakomerno

porazdelitev:

FX(x) =

x∫−∞

p(t)dt =

0 , x ≤ a

x−ab−a , a < x ≤ b

1 , x > b.

2. Normalna porazdelitev N (µ, σ)

Naslednja porazdelitev je normalna ali tudi Gaussova porazdelitev. Gre za najpo-membnejšo zvezno porazdelitev. V naravi je veliko kolicin porazdeljenih normalno.Tako so normalno porazdeljene na primer cloveška višina in masa, stopnja IQ ...Za koeficienta µ in σ velja, da sta µ ∈ R in σ > 0. Funkcija gostote je tako enaka

p(x) =1√2πσ

e−12(

x−µσ )

2

,

za vsak x ∈ R. Koeficient µ je pricakovana vrednost (povprecje), σ pa standardniodklon.

3. Eksponentna porazdelitev Exp(λ)

Ta porazdelitev opisuje casovne intervale med posameznimi dogodki pri Poissonovemprocesu. Za koeficient λ velja, da je λ > 0. Njena funkcija gostote je enaka

p(x) =

{λe−λx , x ≥ 0

0 , x < 0.

Ce to funkcijo integriramo, dobimo porazdelitveno funkcijo

FX(x) = P [X < x] =

∫ x

−∞p(t)dt.

Kadar je x ≤ 0 dobimo 0, v nasprotnem primeru pa je

FX(x) =

∫ x

0

λe−λxdt = λe−λt

−λ

∣∣∣∣x0

= 1− e−λx.

Sedaj lahko zapišemo porazdelitveno funkcijo

FX(x) =

{1− e−λx , x > 0

0 , x < 0.

13

Page 14: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Po eksponentni porazdelitvi se porazdeljuje cas, ki je potreben, da se nek dogodekzgodi prvic. To je lahko na primer razpad radioaktivnega atoma, cas prihoda prvegakupca v trgovino ali recimo cas, da se zgodi potres.

4. Gama porazdelitev Γ(α, λ)

Recemo, da je nakljucna spremenljivka X porazdeljena po gama porazdelitvi, ceima funkcijo gostote enako

p(x) =

{λα

Γ(α)xα−1e−λx , x ≥ 0

0 , x < 0.

Pri tem sta α, λ > 0 in Γ oznacuje Eulerjevo funkcija gama, ki je enaka

Γ(α) =

∫ ∞0

xα−1e−xdx.

V primeru, kadar je α = 1 dobimo eksponentno porazdelitev, Γ(1, λ) = Exp(λ).

5. Studentova porazdelitev S (n)

Kot zadnji primer zvezne porazdelitve bomo navedli Studentovo porazdelitev. Zakoeficient n velja, da je n ∈ N in to število v statistiki predstavlja stopnje prostosti.Njena funkcija gostote je enaka

pn(x) =1√

nβ(n2, 1

2

) (1 +x2

n

)−n−12

,

za vsak x ∈ R. Funkcija β(p, q) je Eulerjeva funkcija beta in je enaka

β(p, q) =

∫ 1

0

xp−1(1− x)q−1dx.

Gre za pomembno porazdelitev v statistiki pri ocenjevanju in testiranju popu-lacijskega povprecja.

6. Binomska porazdelitev b (n, p)

Recimo, da ima v nekem poskusu dogodek A verjetnost p. Ta poskus neodvisnon-krat ponovimo in dobimo Bernoullijevo zaporedje X1, X2, ..., Xn indikatorjev do-godka A. Naj bo Sn = X1 + X2 + ... + Xn ∈ {0, 1, ..., n} frekvenca dogodka A.Pravimo, da je nakljucna spremenljivka X porazdeljena binomsko, ce je njena ver-jetnostna funkcija enaka

pk = P [Sn = k] =

(n

k

)pk (1− p)n−k ; k = 0, 1, ..., n.

14

Page 15: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Primer 2 Število šestic pri metu 10 kock je porazdeljeno binomsko b(10, 1

6

),

7. Poissonova porazdelitev P (λ)

Pravimo, da je nakljucna spremenljivka X porazdeljena po Poissonovem zakonuP (λ), kjer je λ > 0 z zalogo vrednosti N0, ce je njena verjetnostna funkcija enaka

pk = P [X = k] =λk

k!e−λ, kjer je k = 0, 1, 2, ...

Gre za zelo pomembno porazdelitev, uporabljamo jo za aproksimacijo binomskeporazdelitve. Sluzi lahko kot model za število dogodkov, ki se zgodi v dolocenemcasovnem intervalu, kot je na primer število potresov na leto. Zato igra pomembnovlogo pri Poissonovem procesu.

2.1.2 Številske karakteristike

Osnovni številski karakteristiki nakljucnih spremenljivk sta matematicno upanje indisperzija. Obe sta posebna primera tako imenovanih momentov.

Matematicno upanje

Gre za osnovno mero osrednje tendence porazdelitve spremenljivke X. Poglejmo sidefinicijo.

Definicija 2.6 Naj bo X nakljucna spremenljivka. Ce obstaja integral∫R |x|dF ,

tedaj vrednost E(X) =∫R xdF imenujemo matematicno upanje spremenljivke X.

V primeru, da je

• X diskretna z verjetnostno funkcijo pi = P [X = xi], je E(X) =∑

i xipi,

• X zvezna z gostoto verjetnosti p(x), je E(X) =∫R xp(x)dx

Primer 3 Naj bo nakljucna spremenljivka X ∼ E(a, b). Torej je njena gostotaenaka

p(x) =

{1b−a , x ∈ [a, b]

0 , x /∈ [a, b].

Sedaj izracunajmo matematicno upanje, ki je enako

E(X) =

∫Rxp(x)dx =

∫ b

a

x1

b− adx

integriramo in dobimo

E(X) =1

b− a

[x2

2

]ba

=1

2(b− a)b2a2 =

a+ b

2.

15

Page 16: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Disperzija

Dana karakteristika je osnovna mera za razpršenost porazdelitve spremenljivke Xokoli matematicnega upanja. Poglejmo si njeno definicijo.

Definicija 2.7 Za vsako nakljucno spremenljivko X, ki ima matematicno upanjeE(X), definiramo disperzijo ali varianco, kot

V ar(X) = E((X − E(X))2) =

∫R(X − E(X))2dF.

Z σ(X) =√V ar(X) oznacimo standardni odklon.

Kako bi disperzijo definirali samo z matematicnim upanjem? Vzamemo levi delenacbe iz definicije 2.7 in preuredimo.

V ar(X) = E(X2 − 2E(X)X + E(X)2)

Ker je 2E(X) ∈ R lahko zapišemo, da je to enako

V ar(X) = E(X)2 − 2E(X)E(X) + E(X)2 = E(X2)− E(X)2.

Primer 4 Glede na to, da smo v prejšnjem primeru izracunali matematicno upanjespremenljivke, ki je porazdeljena enakomerno, si poglejmo še njeno disperzijo. Torej,za nakljucno spremenljivko X ∼ E(a, b) je E(X) = 1

2(a+ b). Izracunajmo še, koliko

je vrednosti E(X2).

E(X2) =

∫Rx2p(x)dx =

∫ b

a

1

b− ax2dx =

1

b− a1

3(b3 − a3) =

1

3(a2 + ab+ b2).

Sedaj izracunamo disperzijo.

V ar(X) = E(X2)− E(X)2 =1

3(a2 + ab+ b2)− 1

4(a2 + 2ab+ b2)

=1

12(a2 − 2ab+ b2) =

1

12(b− a)2.

Izracunajmo še standardni odklon, ki je enak

σ(X) =√V ar(X) =

√1

12(b− a)2 =

b− a√12.

16

Page 17: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Kovarianca

Kovarianca meri povezanost med nakljucnimi spremenljivkami.

Definicija 2.8 Kovarianca nakljucnih spremenljivk X in Y je definirana kot

Cov(X, Y ) = E((X − E(X))(Y − E(Y )) = E(XY )− E(X)E(Y ).

Ce je Cov(X, Y ) = 0, sta X in Y nekorelirani (nepovezani) nakljucni spremenljivki.

Zapišimo še kovariancno matriko, ki jo bomo uporabljali kasneje v delovnemzgledu. To je matrika, ki je definirana kot

V =

σ1,1 · · · · · · σ1,k...

. . . σi,j...

... σj,i. . .

...σk,1 · · · · · · σk,k

,kjer je σi,i = V ar(Xi) in σi,j = Cov(Xi, Xj) za i6= j.

Pri tem si poglejmo še poseben primer porazdelitve. Gre za tako imenovanovecrazsezno normalno porazdelitev. Nakljucna spremenljivka X = (X1, ..., Xk) sledivecrazsezni normalni porazdelitvi z vektorjem povprecij µ = (µ1, ..., µk) in kovari-ancno matriko V , ce ima njena funkcija gostote obliko

fX(x) =1

(2π)k2

√detV

e−12

(x−µ)TV −1(x−µ).

To oznacimo kot X ∼MNV (µ, V ).Momenti

Kot zadnjo številsko karakteristiko bomo predstavili momente. Spet zacnemo zdefinicijo.

Definicija 2.9 Naj bo X nakljucna spremenljivka in a ∈ R. Ce obstaja kolicinaE(|X − a|k), tedaj

mk (a) = E((X − a)k) =

∫R(x− a)kdF

imenujemo k-ti moment spremenljivke X glede na a ∈ R. V posebnem primeru zzk = mk(0) = E(Xk) oznacimo zacetni moment in mk = mk(E(X)) = E((X −E(x))k) je centralni moment.

Kot smo ze omenili, so posebni primeri momentov E(X) in V ar(X) ter tretji incetrti moment, ki se uporabita pri definiciji asimetrije in splošcenosti porazdelitvenakljucne spremenljivke X.

17

Page 18: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Definicija 2.10 Koeficient asimetrije nakljucne spremenljivke X je definiran kot

A(X) =m3√m3

2

=m3

σ(X)2.

Splošcenost (kurtozis) je enaka

K(X) =m4

m2

− 3 =m4

σ(X)4− 3.

Koeficient asimetrije nam pove, ali je porazdelitev simetricna, medtem ko kurtozispove, ali je porazdelitev bolj splošcena ali konicasta.

Na kratko si bomo še pogledali centralni limitni izrek. Imamo zaporedje spremenljivkX1, X2... in vsoto Sn = X1 +X2 + ...+Xn, kar je n-ta delna vsota. Standardiziranan-ta delna vsota je enaka

Zn =Sn − E(Sn)

σ(Sn),

pri tem sta E(Zn) = 0 in V ar(Zn) = 1.Centralni limitni izrek se glasi:

Izrek 2.11 Naj bodo X1, X2, ... neodvisne in enako porazdeljene nakljucne spremen-ljivke, ki imajo matematicno upanje enako µ in disperzijo σ2. Potem zaporedjestandardiziranih delnih vsot Zn = Sn−nµ√

nσporazdelitveno konvergira k nakljucni spre-

menljivki Z ∼ N(0, 1). To pomeni

limn→∞

[Sn − nµ√

nσ< x

]=

∫ x

−∞

1√2πe−

12t2dt.

2.1.3 Poissonov proces

Sedaj si bomo pogledali še nekaj osnov o Poissonovem procesu. Gre za nakljucniali stohasticni proces, ki je druzina {Xt, t ∈ T} nakljucnih spremenljivk Xt, kjerje T neka indeksna mnozica. Ce je T števna mnozica (obicajno N0) govorimo ostohasticnem procesu v diskretnem casu, kadar pa je mnozica T neštevna (obicaj-no R, [0,∞)) govorimo o stohasticnem procesu v zveznem casu. Zaloga vrednostispremenljivk Xt je prostor stanj S. Ce je S števen, je prostor stanj diskreten (Xt

so diskretne spremenljivke), v nasprotnem primeru, kadar je S ⊆ R in nešteven, jeprostor stanj zvezen (Xt so zvezne spremenljivke).Poissonov proces je proces v zveznem casu z diskretnim prostorom stanj. Gre

za proces štetja dogodkov (prihodov), ki so se zgodili v nekem zveznem casovnemobdobju in ima zalogo vrednosti enako N0. Oglejmo si primer.

18

Page 19: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Primer 5 Opazujemo število radioaktivnih razpadov radioaktivnega vira. V casut = 0 vklopimo Geigerjev števec, ki šteje razpade. Število N(t) predstavlja številorazpadov, ki so se zgodili v casu [0, t]. Torej dobimo proces {N(t)|t ≥ 0}. Pri temvelja:

• N(0) = 0,

• s < t⇒ N(s) ≤ N(t),

• ce je h majhen, potem se na intervalu [t, t + h] razpad zgodi, ali pa ne. Maloverjetno je, da bi se zgodilo vec razpadov,

• ce je s < t, je število razpadov na intervalu (s, t] (N(t)−N(s)) neodvisno odštevila razpadov na intervalu [0, s] (N(s)).

Sedaj si oglejmo definicijo Poissonovega procesa.

Definicija 2.12 Poissonov proces z jakostjo (intenziteto) λ je proces {N(t)|t ≥ 0},ki zavzame vrednosti v N0 in velja:

• N(0) = 0 in s < t⇒ N(s) ≤ N(t),

• P [N(t+ h) = n+m|N(t) = n] =

λh+ o1(h) , m = 1

1− λh+ o2(h) , m = 0o3(h) , m ≥ 2

,

• ce je s < t, potem je N(t)−N(s) neodvisna od N(s).

Opomnimo:

1. o(h) je funkcija, ki ima lastnost limn→∞o(h)h

= 0,

2. za majhne h velja aproksimacija

P [N(t+ h) = n+m|N(t) = n] =

λh , m = 1

1− λh , m = 00 , m ≥ 2

.

Poglejmo si še izrek, ki nam pove, kako je porazdeljena spremenljivka N(t).

Izrek 2.13 Nakljucna spremenljivka N(t) je porazdeljena po Poissonovem zakonuP (λt);

P [N(t) = k] =(λt)k

k!e−λt; k ∈ N0.

19

Page 20: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

2.2 Osnove statistike

Sedaj si poglejmo še nekaj osnovnih pojmov iz statistike.

Kvantili

Gre za vrstilne karakteristike statisticnih oziroma nakljucnih spremenljivk. Pred-postavimo, da je F (x) porazdelitvena funkcija nakljucne spremenljivkeX. Za številop naj velja p ∈ (0, 1). Realno število xp, ki ustreza zahtevam

P [X ≤ xp] = F [xp + 0] ≥ p

P [X ≥ xp] = 1− F (xp) ≥ 1− p,

imenujemo kvantil reda p ali p-ti kvantil nakljucne spremenljivke X.Najbolj znani in uporabni kvantili so:

• Mediana - Me = x 12, ki porazdelitev razdeli na dva enaka dela,

• Kvartili - q1 = x 14, q2 = x 1

2, q3 = x 3

4, ki porazdelitev razdelijo na štiri enake

dele,

• Decili - d1 = x 110, d2 = x 2

10, ..., d8 = x 8

10, d9 = x 9

10, ki porazdelitev razdelijo na

deset enakih delov.

Cenilke

Na mnozici G imejmo statisticno spremenljivko X. Statisticni vektor (X1, ..., Xn)

naj predstavlja vzorec n enot. q predstavlja populacijski parameter spremenljivkeX. Sedaj lahko definiramo cenilko.

Definicija 2.14 Cenilka parametra q je vzorcna statistika (simetricna funkcija)

Cq = f(X1, X2, ..., Xn),

ki je namenjena ocenjevanju parametra q.

Za cenilke zelimo, da so:(i) Nepristrane. Za nepristrano cenilko velja naslednja definicija.

Definicija 2.15 Cenilka Cq parametra q je nepristrana, ce velja E(Cq) = q.

(ii) Dosledne. Z Cn oznacimo cenilko parametra q na velikosti vzorca n (Cn = Cq).

20

Page 21: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Definicija 2.16 Cenilka Cq parametra q je dosledna, ce zaporedje C1, C2, ... verjet-nostno konvergira h q. To pomeni, da vsak ε > 0 velja

limn→∞

P [|Cn − q| < ε] = 1.

(iii) Ucinkovite. Za cenilke zelimo tudi, da so ucinkovite. Velja, da je boljša cenilkatista z manjšo disperzijo. Napaka, ki jo naredimo v povprecju, je standardni odkloncenilke in se imenuje standardna napaka. Oznacimo jo kot SE(Cq) = σ(q). Za lazjerazumevanje si oglejmo primer.

Primer 6 Imejmo podani vzorcno povprecje X in vzorcno disperzijo S2. Potemsta standardni napaki enaki SE(X) = σ√

nin SE(S2) =

√2σ2√n−1. Ker ne poznamo

vrednosti σ, lahko vzamemo oceni za napake. Torej imamo

SE(X) ≈ S√n

in SE(S2) ≈√

2S2

√n− 1

.

Naj bo velikost vzorca n = 100 in σ = 100. Sedaj izracunamo SE(X) = 10√100

= 1.To pomeni, da pri velikosti vzorca n = 100 pri oceni populacijskega povprecja znašastandardna napaka 1. Izracunajmo še drugo napako. SE(S2) ≈

√2100√100

=√

210 =

14.1. Kar pomeni, da pri velikosti vzorca n = 100 pri oceni populacijske disperzijeznaša standardna napaka 14.1.

Poznamo dve osnovni metodi za pridobivanje cenilk.

Metoda momentov

Recimo, da imamo statisticno spremenljivko X, katere porazdelitev je odvisna še odparametrov q1, q2, ..., qm. Zapišemo lahko

X ∼ FX(x, q1, ..., qm).

k-ti vzorcni moment oznacimo z Zk in ga izracunamo kot Zk = 1n

∑ni=1X

ki . Sedaj

imamo podan sistem enacb:

Z1 = f1(q1, ..., qm),

Z2 = f2(q1, ..., qm),

...

Zm = fm(q1, ..., qm).

Izrazimo q1, ..., qm kot funkcije vzorcnih momentov Z1, Z2, ...Zm, ki so neodvisne odvzorca X1, ..., Xn. Tako dobimo cenilke po metodi momentov.

C1 = Cq1 = q1(Z1, ..., Zm)

...

Cm = Cqm = qm(Z1, ..., Zm).

21

Page 22: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Primer 7 Spremenljivka X naj bo porazdeljena po enakomerni porazdelitvi, X ∼E(0, a). Kaj je cenilka za parameter a po metodi momentov?V tem primeru bomo imeli samo eno enacbo. Izracunamo z1: z1 = E(X) = a

2in

a = 2z1. Zato je cenilka parametra a enaka A = 2Z1 = 2X. Vidimo, da je cenilka vbistvu dvakratnik vzorcnega povprecja.

Metoda najvecjega verjetja

Naj bo spremenljivka X porazdeljena zvezno z gostoto

p(x, q1, ..., qm).

Ta je odvisna še od neznanih parametrov q1, ..., qm. Zvezni vektor (X1, X2, ..., Xn)

je slucajni vzorec. Njegova gostota je enaka

L(q1, ..., qm) = L(q1, ..., qm, x1, x2, ..., xn)

=

n∏i=1

p(xi, q1, ..., qm)

se imenuje funkcija verjetja vzorca. Funkcija L je funkcija parametrov q1, ..., qm.Išcemomaksimum te funkcije. Denimo, da je maksimum dosezen v tockah q1, q2, ..., qm

in je neodvisen od x1, ..., xn. Potem so

Ck = qk(X1, ..., Xn)

cenilke parametra qk po metodi najvecjega verjetja.

Primer 8 Denimo, da je spremenljivka X porazdeljena normalno, X ∼ N(µ, σ).Poišcimo cenilki za µ in σ2 po metodi najvecjega verjetja. Najprej zapišemo gostoto

p(x, µ, σ) =1√2πσ

e−12(

x−µσ )

2

.

Nato izracunamo funkcijo verjetja

L(µ, σ) = L(µ, σ, x1, ..., xn) =n∏i=1

p(xi, µ, σ)

=

(1√2πσ

)n n∏i=1

e−12σ2

(x−µ)2 =

(1√2πσ

)ne−

12σ2

∑ni=1(xi−µ)2 .

Sedaj funkcijo verjetja logaritmiramo

lnL(µ, σ) = −n(ln√

2π + lnσ)− 1

2σ2

n∑i=1

(xi − µ)2.

22

Page 23: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Na koncu še odvajamo po µ.

∂ lnL(µ, σ)

∂µ=

1

2σ2

n∑i=1

2(xi − µ) =1

σ2

(n∑i=1

xi −n∑i=1

µ

)

=1

σ2

(n∑i=1

xi − nµ).

Kar smo dobili, enacimo z 0 in izrazimo µ.

1

σ2

(n∑i=1

xi − nµ)

= 0 =⇒ nµ =n∑i=1

xi

µ =1

n

n∑i=1

xi = X.

Dobili smo, da je cenilka za µ vzorcno povprecje X.Sedaj logaritmirano funkcijo verjetja odvajajmo še po σ.

∂ lnL(µ, σ)

∂σ= −n 1

σ+

1

σ3

n∑i=1

(xi − µ)2

=1

σ3

(−nσ2 +

n∑i=1

(xi − µ)2

).

Kar smo dobili spet enacimo z 0 in izpostavimo σ2.

1

σ3

(−nσ2 +

n∑i=1

(xi − µ)2

)= 0 =⇒ nσ2 =

n∑i=1

(xi − µ)2

σ2 =1

n

n∑i=1

(xi − µ)2.

S tem smo dobili še cenilko za σ2.

Na koncu si poglejmo še definicijo intervala zaupanja. Imamo statisticno spre-menljivko X in vzorcne podatke velikosti n. X1, X2, ..., X. S q oznacimo parameterspremenljivke X in α ∈ (0, 1).

Definicija 2.17 Interval zaupanja za neznani parameter q s stopnjo zaupanja 1−αje urejen par statistik [L,D], pri cemer za q velja

P [L ≤ q ≤ D] ≥ 1− α.

23

Page 24: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Po navadi za α izberemo vrednosti α = 0.05, α = 0.01, α = 0.001.

Zapisali bomo še nekaj uporabnih rezultatov, kako izracunati standardne napake inintervale zaupanja. Rezultati bodo povzeti po knjigi [1]. Naj bodo X1, ..., Xn neod-visne realizacije nakljucne spremenljivkeX, ki imajo porazdelitev F . Porazdelitvenafunkcija je odvisna še od neznanih parametrov. Z θ0 oznacimo cenilko parametra θz metodo najvecjega verjetja. Zapišimo prvi izrek.

Izrek 2.18 ([1, poglavje 2.6, Izrek 2.2]) Naj bodoX1, ..., Xn neodvisne realizacijenakljucne spremenljivke X, katere porazdelitvena funkcija je enaka F . Naj lnL(·)in θ0 oznacujeta logaritem funkcije verjetja in cenilko dobljeno po metodi najvecjegaverjetja pri oceni parametra θ0 iz vecrazsezne normalne porazdelitve. Potem za veliken velja

θ0 ≈MVNd(θ0, IE(θ0)−1),

kjer je

IE(θ) =

e1,1(θ) · · · · · · e1,d(θ)...

. . . ei,j(θ)...

... ej,i(θ). . .

...ed,1(θ) · · · · · · ed,d(θ)

,matrika, ki se imenuje pricakovana informacijska matrika z

ei,j(θ) = E

(−∂

2 lnL(θ)

∂θi∂θj

).

Ta izrek potem uporabimo za izracun posameznih parametrov. Za posameznocenilko velja θ ≈ N(θi, ψi,i). Z ψi,i oznacimo elemente inverzne matrike I−1

E (θ). Cepoznamo te vrednosti, lahko (1− α) interval zaupanja za θi izracunamo kot[

θi − zα√ψi,i, θi + zα

2

√ψi,i

], (2.1)

kjer velja P [|Z| ≤ zα] = 1 − α. Ker v splošnem ne poznamo prave vrednosti para-metra θ po navadi IE zamenjamo z opazovano informacijsko matriko, definiranokot

I0(θ) =

−∂2 lnL(θ)

∂θ21· · · · · · −∂2 lnL(θ)

∂θ1∂θd...

. . . −∂2 lnL(θ)∂θi∂θj

...... −∂2 lnL(θ)

∂θj∂θi

. . ....

−∂2 lnL(θ)∂θd∂θ1

· · · · · · −∂2 lnL(θ)

∂θ2d

,

24

Page 25: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

ki jo ocenimo pri θ = θ0. Vrednosti inverzne matrike oznacimo z ψi,j. Iz tega sledi,da je priblizni interval zaupanja za θi enak[

θi − zα2

√ψi,j, θi + zα

2

√ψi,j

].

Kljub temu da smo delali dodatne priblizke, so takšni intervali bolj tocni kot tistipridobljeni z (2.1).

Naslednji izrek nam opisuje tako imenovano delta metodo.

Izrek 2.19 ([1, poglavje 2.6, izrek 2.4]) Naj bo θ0 cenilka parametra θ = (θ1, ..., θd)

dobljena z metodo najvecjega verjetja na velikem vzorcu z vzorcno kovariancno ma-triko Vθ. Ce je φ = g(θ) skalarna funkcija, potem cenilka φ parametrov φ = g(θ)

dobljena po metodi najvecjega verjetja zadošca

φ ≈ N(φ, Vφ),

kjer jeVφ = ∇φTVθ∇φ,

z vrednostjo

∇φ =

[∂φ

∂θ1

, ...,∂φ

∂θd

]Tizracunano v θ.

Naslednja je funkcija odklonskosti, ki je definirana kot

D(θ) = 2{lnL(θ0)− lnL(θ)}.

Vrednost parametra θ z majhno odklonskostjo pripada modelom z visoko verjetnos-tjo.Definirajmo tudi profil logaritemske verjetnosti za parameter θi kot

lnLp(θi) = maxθ−1

lnL(θi, θ−i).

To pomeni, da je za vsako vrednost parametra θi profil logaritemske verjetnostimaksimirana logaritemska verjetnost.Lastnosti, ki so povezane s profilom lahko bralec najde v knjigi [1] v poglavju

2.6.

25

Page 26: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

2.3 Delovni zgled

Sedaj bomo po delovnem zgledu, ki smo ga povzeli iz knjige [1] pokazali metode, kismo jih spoznali v uvodnih poglavjih. Vse slike, ki bodo uporabljene v tem poglavjuso iz knjige. Na Sliki 2.1 imamo prikazane podatke, ki predstavljajo simulirani casokvare vzorca 32 sestavnih delov stroja z razlicnimi stopnjami korozije. Vsak delje bil dodeljen ukrepu korozije in cilj te analize je, da ugotovimo, kako cas okvarevpliva na stopnjo korozije.

Slika 2.1: Podatki za dele stroja

Podatke oznacimo kot pare {(w1, t1), ..., (wn, tn)}, kjer nam prva komponenta tipredstavlja cas okvare in wi stopnjo korozije za del i. Ker so casi okvare nenegativni,nam verjetno normalna porazdelitev ne bo zagotovila dobrega modela. Kot alterna-tivo bomo vzeli eksponentno porazdelitev. Za nakljucno spremenljivko T pravimo,da sledi eksponentni porazdelitvi, T ∼ Exp(λ), ce ima njena funkcija gostote obliko

p(t) = λe−λt, t ≥ 0,

kjer je λ > 0. Preverimo kaj je matematicno upanje te spremenljivke. Po definicijije matematicno upanje enako

E(T ) =

∫Rtp(t)dt,

26

Page 27: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

kar je za eksponentno porazdelitev enako

=

∫ ∞0

tλe−λtdt.

Ce to integriramo po delih (per partes), dobimo

=

(−te−λt − 1

λe−λt

)∞0

=1

λ.

Torej smo zlahka preverili, da je E(T ) = 1λ, tako da je λ vzajemno povprecje.

Ker imamo razmerje med λ in povprecjem porazdelitve, je to ekvivalentno zanavedbo razmerja med povprecno zivljenjsko dobo in w. Parametre tega modelabomo lahko ocenili s pomocjo maksimalne verjetnosti. Sodec po podatkih, ki jihvidimo na Sliki 2.1, bi se naj povprecna zivljenjska doba monotono zmanjšala stem ko vrednost w narašca. V knjigi so kot mozen model navedli, da je nakljucnaspremenljivka T porazdeljena eksponentno

T ∼ Exp(λ),

kjer jeλ = awb, (2.2)

za neka parametra a in b. Ekvivalentno z enacbo (2.2) in s tem, kar smo ugotovilina zacetku delovnega zgleda, da je E(T ) = 1

λ, v tem primeru velja E(T ) = 1

awb,

tako da povprecna zivljenjska doba variira eksponentno z w, pri stopnji doloceni sparametrom b. V primeru, kadar je parameter b = 0 je matematicno upanje enakoE(T ) = 1

a.

Verjetnost za model dobimo iz enacbe (2.2), in sicer kot

L(a, b) =n∏i=1

awbie−awbi ti .

Iz tega je logaritemska verjetnost enaka

lnL(a, b) = n ln a+ bn∑i=1

lnwi − an∑i=1

wbi ti. (2.3)

Najvecjo verjetnostno cenilko bi iz tega dobili tako, da bi maksimizirali ta izraz gledena parametra a in b. To lahko naredimo tudi tako, da rešimo naslednji dve enacbi

∂ lnL

∂a=n

a−

n∑i=1

wbi ti = 0

∂ lnL

∂b=

n∑i=1

lnwi − an∑i=1

wbi ti lnwi = 0,

27

Page 28: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

vendar teh enacb ne znamo rešiti analiticno, potrebovali bi numericne tehnike. Vknjigi so to rešili z uporabo algoritmov.Enacbo (2.3) nato maksimiramo in tako dobimo rezultat za oceno cenilk a in b,

ki sta v tem primeru enaki

a = 1.133 in b = 0.479

z maksimirano logaritemsko verjetnostjo, ki je enaka −21.71. Pripadajoca casovnakrivulja okvare je enaka

E(T ) = 1.133−1 × w−0.479,

kar je relativno prikazano na Sliki 2.2. Ta slika nam prikazuje ocenjeno povprecnokomponento zivljenjske dobe, kot funkcijo stopnje korozije. Opazovano informaci-

Slika 2.2: Funkcija stopnje korozije za dele stroja

jsko matriko potem izracunamo kot[−∂2 lnL

∂a2−∂2 lnL

∂a∂b

−∂2 lnL∂a∂b

−∂2 lnL∂b2

]=

[na−2

∑wbi ti lnwi∑

wbi ti lnwi a∑wbi ti(lnwi)

2

].

Za ta model lahko ovrednotimo tudi pricakovano informacijsko matriko, saj jeE(Ti) =

a−1w−bi . Tako potem dobimo

IE(a, b) =

[na−2 a−1

∑lnwi

a−1∑

lnwi∑

(lnwi)2

].

28

Page 29: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

S substitucijo najvecje verjetnostne cenilke v opazovano informacijsko matriko, kisledi iz inverzne matrike, dobimo naslednjo kovariancno matriko

V =

[0.04682 −0.01442−0.01442 0.03104

].

Kvadratni koreni števil na diagonali nam dajo standardne napake za a in b. Stem smo dobili vrednosti 0.216 in 0.176. Zapisali bomo tudi priblizen 95% intervalzaupanja za parameter b. To je enako 0.479± 1.96× 0.176 = [0.134, 0.824]. Vidimo,da ta interval ne vsebuje števila 0, kar dokazuje, da je b 6= 0. S podatki, izracunanimido sedaj, lahko izracunamo tudi 95 % interval zaupanja za parameter a. To bi biloenako 1.133± 1.96× 0.216 = [0.7096, 1.5564].

Intervale zaupanja lahko dobimo tudi s t. i. delta metodo. Na primer, mogoceje potrebno oceniti tudi povprecni cas okvare za sestavne dele stroja, za katerega jekorozijska stopnja w = w0, za neko fiksno vrednost w0. Za ta primer bo parameterinteresa φ = E(T ) = a−1w−b0 , kar je invariantno lastnosti maksimalne verjetnosti

φ = a−1w−b0 ,

medtem ko je pri delta metodi to

V ar(φ) ≈ ∇TφV∇φ, (2.4)

kjer je

∇φT =

[∂φ

∂a,∂φ

∂b

]=[−a−2w−b0 ,−a−1w−b0 lnw0

], (2.5)

ovrednoteno pri (a, b). Kot primer podajmo sestavni del stroja s korozijsko stopnjow0 = 3 in za φ dobimo vrednost φ = 1.133×3−0.479 = 0.669. Ko to vrednost vstavimov enacbi (2.4) in (2.5), dobimo vrednost V ar(φ) = 0.0125. Nato lahko izracunamo95 % interval zaupanja povprecnega casa okvare in ga dobimo kot 0.669 ± 1.96 ×√

0.0125 = [0.450, 0.889].

Vecjo natancnost racunanja intervalov zaupanja dobimo s profili verjetnosti. Vtem delovnem zgledu je mogoce izrecno dobiti profil verjetnosti za parameter b.Parameter b obravnavamo kot fiksen. Logaritemsko verjetnost, ki je podana z enacbo(2.3), obravnavamo kot funkcijo parametra a. Funkcija je maksimirana s tem, korešimo enacbo

∂ lnL

∂a=n

a−

n∑i=1

wbi ti = 0.

Ce izpostavimo parameter a, dobimo enacbo

ab =n

n∑i=1

wbi ti

.

29

Page 30: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Ta izraz nato vstavimo v enacbo (2.3) in tako dobimo profil verjetnosti za parameterb

lnLp(b) = n ln ab + bn∑i=1

lnwi − abn∑i=1

wbi ti.

Graf logaritemske verjetnosti za te podatke je prikazan na Sliki 2.3.

Slika 2.3: Profil logaritemske verjetnosti za parameter b

Na tem grafu so narisali linijo na višini 0.5×c1,0.05 pod maksimumom tega grafa,kjer c1,0.05 predstavlja 95 % kvantil porazdelitve χ2

1. To nas pripelje do 95 % intervalazaupanja za b, ki je enak [0.183, 0.879]. Ce se spomnimo intervala, ki smo ga dobili poprejšnjem pristopu in je bil enak [0.134, 0.824], je interval profila verjetnosti podobenv širini, vendar je zamaknjen v desno.

V nadaljevanju naredimo še primerjavo dveh modelov. Kot prvi model vzamemo(2.2), ki ga oznacimo kotM1 in poenostavljen modelM0, za katerega predvidimo,da je Ti ∼ Exp(a) za vse sestavne dele stroja. Opazimo lahko, da jeM0 podmodelmodelaM1 z omejitvijo, da je b = 0. ModelM0 pripada homogenemu eksponent-nemu modelu, za katerega je logaritemska verjetnost enaka

lnL(a) = n ln a− an∑i=1

ti. (2.6)

Ta enacba je seveda podobna enacbi (2.3), s tem da pri tej velja b = 0. Ko enacbo(2.6) za dane podatke maksimiramo, dobimo rešitev a = n/

∑ti = 1.159. Ko to

30

Page 31: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

vrednost vstavimo v enacbo (2.6), dobimo maksimirano logaritemsko verjetnost zamodelM0, ki je enaka −27.29. Nato izracunamo statistiko odklonskosti za primer-javo teh dveh modelov kot

D = 2{−21.71− (−27.29)} = 11.16.

Z uporabo testa razmerja verjetnosti lahko nato ugotovimo, da je ta vrednost visokosignifikantna v primerjavi s porazdelitvijo χ2

1, kar je najverjetneje mocan dokaz vkorist modelaM1.Predpostavimo še en model

Ti ∼ Exp(awbi ),

ki bi bil tocen. Standardne spremenljivke so torej enake Ti = awbiTi takšne, daje Ti ∼ Exp(1), z uporabo standardnih lastnosti eksponentne porazdelitve. Zaprimerjavo teh modelov so uporabili verjetnostne in kvantilne grafe.

Slika 2.4: Verjetnostni graf za primer sestavnih delov stroja

Verjetnostni graf tako sestavljajo pari{(i

n+ 1, 1− e−ti

); i = 1, ..., n

},

31

Page 32: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

medtem ko graf kvantilov sestavljajo pari{(− ln

(1− in+ 1

), ti

); i = 1, ..., n

}.

Grafa lahko vidimo na Slikah 2.4 in 2.5. V obeh primerih je vidno, da so tockedovolj blizu linearnosti, kar bi izbralo prilagojen model.

Slika 2.5: Graf kvantilov za primer sestavnih delov stroja

32

Page 33: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Poglavje 3

Pristopi k teoriji ekstremnihvrednosti

Razvili bomo modela, ki nam bosta predstavljala temelje teorije ekstremnih vred-nosti. Pri teoriji ekstremnih vrednosti lahko uporabimo enako idejo, kot je v central-nem limitnem izreku. Razlika je le v tem, da v centralnem limitnem izreku gledamolastnosti normaliziranih in centraliziranih kumulativnih vsot, medtem ko pri teorijiekstremnih vrednosti uporabljamo lastnosti normaliziranih in centraliziranih kumu-lativnih maksimumov. Naša modela se bosta osredotocila na statisticno obnašanjespremenljivke Mn, ki je enaka

Mn = max{X1, ..., Xn},

kjer nam spremenljivke X1, ..., Xn predstavljajo zaporedje neodvisnih nakljucnihspremenljivk s skupno porazdelitveno funkcijo F . V razlicnih aplikacijah (postopkih)spremenljivka Xi predstavlja vrednost procesa, ki smo ga izmerili na neki casovnienoti. Kot casovno enoto lahko uporabimo na primer uro, dan, mesec ali sezono.Primer takega merjenja je lahko urno merjenje morske gladine, dnevno povprecjetemperatur, dnevno merjenje padavin ... Tako vidimo, daMn predstavlja maksimumprocesa na n-tih izmerjenih opazovanjih. Ce je na primer n število opazovanj v letu,potem Mn pripada letnemu maksimumu.Zelimo najti mozne omejitve porazdelitve za vzorce maksimumov neodvisnih

in enako porazdeljenih nakljucnih spremenljivk. Teoreticno lahko porazdelitvenofunkcijo spremenljivke Mn izrazimo s porazdelitveno funkcijo F za vsako naravno

33

Page 34: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

število n:

FMn (x) = P [Mn < x] = P [max{X1, ..., Xn} < x] (3.1)

= P [X1 < x, ..., Xn < x]

= P [X1 < x] · · ·P [Xn < x]

= F n(x).

Vendar nam to v praksi ne pomaga dosti, ker je obicajno naša porazdelitvena funkcijaF neznana. Kadar je porazdelitvena funkcija F neznana, lahko uporabimo eno odstandardnih statisticnih tehnik in ocenimo F iz podatkov, ki smo jih pridobili zopazovanji. Potem lahko to oceno uporabimo v (3.1). Pri tem se pojavi temeljniproblem, ker ze majhne razlike pri ocenjevanju porazdelitvene funkcije F vodijo doznatnih razlik pri oceni funkcije F n.Alternativni pristop, ki ga lahko uporabimo je, da sprejmemo F kot neznano

porazdelitveno funkcijo in v tem primeru pogledamo priblizne druzine modelov zafunkcijo F n, ki pa jo lahko ocenimo le na osnovi ekstremnih podatkov.

Išcemo limitno porazdelitev porazdelitvene funkcije F n, kadar gre n→∞. Ven-dar samo to ne bo dovolj. Oznacimo z x+ zgornjo koncno tocko porazdelitvenefunkcije F (x+ je najmanjša vrednost x, za katero velja F (x) = 1). Za vsak x < x+

vidimo, da velja limn→∞ Fn(x) = 0. S tem je limitna porazdelitev spremenljivk Mn

izrojena do tocke x+. Da bi se izognili tej tezavi, dovolimo linearno normalizacijospremenljivke Mn:

M∗n =

Mn − bnan

,

za dani realni zaporedji {an} in {bn}, kjer je an > 0 za vsak n ∈ N. To pomeni, daišcemo limitno porazdelitev za spremenljivkeM∗

n. Pri tem moramo primerno izbratizaporedji {an} in {bn}, da bo

limn→∞

F n(anx+ bn) = G(x). (3.2)

Našcilj je tako poiskati vse limitne porazdelitvene funkcije G, ki se lahko pojavijov (3.2). Te porazdelitve imenujemo porazdelitve ekstremnih vrednosti. Za vsako odteh limitnih porazdelitev bomo tudi našli potrebne in zadostne pogoje, da lahko iznje dolocimo zacetno porazdelitev F .

3.1 Prvi pristop

Pred temeljnim izrekom teorije ekstremnih vrednosti si poglejmo naslednjo defini-cijo.:

34

Page 35: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Definicija 3.1 Porazdelitveni funkciji F in F ∗ sta enakega tipa, ce obstajata kon-stanti a > 0 in b, da za vse x ∈ R velja

F ∗(ax+ b) = F (x).

V statistiki je naslednji izrek splošni rezultat v teoriji ekstremnih vrednosti.Velike zasluge za ta izrek ima Gnedenko (1948), pred tem sta svojo razlicico izrekapodala tudi Fisher in Tippett (1928). Poglejmo si ta pomemben izrek.

Izrek 3.2 (Izrek o limitni porazdelitvi) Ce obstajata realni zaporedji {an} in{bn}, kjer je an > 0, da velja

limn→∞

P

[Mn − bnan

< x

]= G(x)

in je G neizrojena porazdelitvena funkcija, potem je G ena izmed naslednjih po-razdelitev:

(G) : G(x) = e−e−x, x ∈ R;

(F ) : G(x) =

{e−x

−a, x > 0, α > 0

0 , x ≤ 0;

(W ) : G(x) =

{e−(−x)a , x < 0, α > 0

1 , x ≥ 0.

Posledicno se lahko vsaka od porazdelitvenih funkcij G pojavi kot limitna porazdelit-vena funkcija spremenljivk (Mn−bn)/an. To se tudi zgodi, kadar je G porazdelitvenafunkcija spremenljivke X.

Ce bi ta izrek zapisali z besedami, bi za zaporedje maksimumov (Mn − bn)/an

rekli, da porazdelitveno konvergira k spremenljivkam, ki imajo porazdelitveno funkcijoenako eni izmed druzin oznacenih z (G), (F) in (W). Ti trije tipi porazdelitvenihfunkcij se imenujejo tudi druzine ekstremnih vrednosti in so pogosto znani kot Gum-belova, Fréchetova inWeibullova druzina. Trije tipi limitnih porazdelitev, ki smo jihspoznali v izreku 3.2 imajo posebno obliko obnašanja. Pripadajo namrec razlicnimoblikam obnašanja v repnem delu porazdelitvene funkcije F .

Gumbelova porazdelitvena funkcija se imenuje po nemškem matematiku EmiluGumbelu (1891-1966). Uporabljamo jo lahko na vec podrocjih, tudi na hidrološkemza modeliranje ekstremnih dogodkov. Velja, da ce imajo opazovani podatki nor-malno ali eksponentno porazdelitev, lahko pokazemo, da se njihove maksimalnevrednosti porazdeljujejo po Gumbelovi porazdelitvi. Gumbel je teorijo ekstremnihvrednosti uporabljal na realnih problemih v inzenirstvu in meteoroloških pojavih,

35

Page 36: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

kot je na primer porazdelitev najvecje ravni reke v dolocenem letu, ce imamo podanseznam maksimalnih vrednosti za prejšnjih 10 let. Predvsem je koristen pri napove-dovanju moznosti, da se bo zgodil kakšen ekstremni dogodek kot so potres, poplavaali kakšna druga naravna katastrofa. Graf Gumbelove porazdelitvene funkcije silahko ogledamo na sliki 3.1.

­5 ­4 ­3 ­2 ­1 0 1 2 3 4 5

0.2

0.4

0.6

0.8

1.0

x

y

Slika 3.1: Gumbelova porazdelitvena funkcija

Fréchetova porazdelitvena funkcija se imenuje po francoskem matematiku Mau-riceusu Fréchetu (1878-1973). Tukaj velja, da ce imajo opazovani podatki debelirep, torej imajo Cauchyjevo ali Studentovo porazdelitev, se njene maksimalne vred-nosti porazdeljujejo po Fréchetovi porazdelitvi. Ta porazdelitvena funkcija je zelouporabna v financah. Primerna je za modeliranje trznih donosov, saj imajo tipogosto porazdelitev, ki ima t. i. debeli rep. Graf, ki nam ga prikazuje slika3.2 predstavlja Fréchetovo porazdelitveno funkcijo, kadar je α = 1.5.Tretja porazdelitvena funkcija se imenuje po švedskem inzenirju in znanstveniku

Waloddiju Weibullu (1887-1979), ki je zelo znan po svojem delu o trdnosti ma-terialov in analizi dinamicne trdnosti. Ce hocemo, da se bodo podatki porazdel-jevali po Weibullovi porazdelitvi, morajo imeti opazovani podatki suhi rep, torejimajo na primer enakomerno ali beta porazdelitev. Ceprav je bila Weibullova po-razdelitev prvotno razvita za reševanje problemov minimumov, ki izhajajo iz ma-terialnih znanosti, se lahko zaradi svoje fleksibilnosti uporablja na mnogih drugihpodrocjih. Na sliki 3.3 vidimo graf Weibullove porazdelitvene funkcije. Tudi v tem,tako kot v prejšnjem primeru, je α = 1.5.V zgodnjih postopkih teorije ekstremnih vrednosti smo po navadi sprejeli eno

od teh treh druzin, ter nato ocenili relevantne parametre te porazdelitve. Vendartukaj naletimo na dve šibki tocki. Prvic, pri tej tehniki je zahtevano, da izberemo

36

Page 37: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

0 1 2 3 4 50.0

0.2

0.4

0.6

0.8

x

y

Slika 3.2: Frechetova porazdelitvena funkcija

0 1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

x

y

Slika 3.3: Weibullova porazdelitvena funkcija

eno od teh druzin, ki je najbolj primerna za dane podatke; in drugic, ko bomoenkrat izbrali to porazdelitev, poznejša sklepanja predpostavljajo to porazdelitev zapravilno izbrano. S tem našizbor ne dovoljuje negotovosti, ceprav je lahko tudi tavelika. Ponujena nam je boljša analiza, ce se odlocimo preoblikovati našmodel izizreka 3.2. Preverimo, ce lahko vse tri druzine zdruzimo v eno druzino modelov, kiimajo porazdelitveno funkcijo oblike

G(x) = e−[1+ξ(x−µσ

)]− 1ξ. (3.3)

Ta porazdelitvena funkcija je definirana na obmocju {x ∈ R : 1 + ξ(x − µ)/σ >

0}, kjer so µ, ξ ∈ R in σ > 0 realni parametri. Druzina porazdelitvenih funkcij(3.3) se imenuje druzina porazdelitev posplošenih ekstremnih vrednosti (GEV ). Kot

37

Page 38: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

lahko opazimo, se v tem modelu pojavijo trije parametri: lokacijski parameter µ,parameter višine σ in parameter oblike ξ.

Lokacijski parameter µ

V statistiki je druzina lokacij razred verjetnostnih porazdelitev, ki so parametriziranis skalarno ali vektorsko vrednotenim parametrom µ, ki doloca lokacijo ali premikvrha porazdelitvene funkcije. To formalno pomeni, da imajo funkcije gostot verjet-nosti obliko

fµ(x) = f(x− µ).

Parameter µ imenujemo lokacijski parameter. Ce to opišemo z drugimi besedami;kadar rišemo funkcijo, nam lokacijski parameter doloca, kje se bo nahajal vrh. Ceje µ pozitiven, se bo vrh premaknil na desno, ce bo µ negativen, se bo premaknil nalevo.Najlazje si bomo to ogledali na primeru normalne porazdelitve. V tem primeru

nam lokacijski parameter predstavlja povprecje.

­3 ­2 ­1 0 1 2 3 4 5 6

0.1

0.2

0.3

0.4

x

y

Slika 3.4: Normalni porazdelitvi N (0, 1) in N(2, 1)

Slika 3.4 nam predstavlja funkciji gostote dveh normalnih porazdelitev, kadar jestandardni odklon σ = 1 in lokacijski parameter enak µ = 0 in µ = 2. Kot lahkovidimo, se je vrh v primeru na Sliki 3.4 res premaknil za dve enoti v desno, saj jelokacijski parameter enak dva, torej pozitiven.

Parameter višine σ

V teoriji verjetnosti in statisticni teoriji je parameter višine poseben primer nu-mericnega parametra parametricne druzine verjetnostnih porazdelitev. V druzini

38

Page 39: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

verjetnostnih porazdelitev imamo parameter s (ali θ), za katerega porazdelitvenafunkcija zadostuje

F (x; s, θ) = F (x

s; 1, θ).

Potem parametru s recemo parameter višine, saj njegova vrednost doloca višinoali statisticno disperzijo verjetnostne porazdelitve. Ce je parameter s velik, se boporazdelitvena funkcija razširila, v nasprotnem primeru se bo skrcila.V normalnemmodelu nam ta parameter predstavlja standardni odklon. Mi bomo

v tem delu parameter višine oznacevali z σ.

­10 ­8 ­6 ­4 ­2 0 2 4 6 8 10

0.05

0.10

0.15

x

y

Slika 3.5: Normalna porazdelitev N(0, 3)

­2.0 ­1.5 ­1.0 ­0.5 0.0 0.5 1.0 1.5 2.0

0.2

0.4

0.6

0.8

1.0

1.2

x

y

Slika 3.6: Normalna porazdelitev N(0, 1/3)

Na slikah 3.5 in 3.6 imamo grafa, ki predstavljata normalno porazdelitev, v temprimeru, kadar je lokacijski parameter µ = 0. Na sliki 3.5 ima graf parameter višine

39

Page 40: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

enak σ = 3, vrednost parametra višine grafa na sliki 3.6 pa je enaka σ = 13. Kot

lahko vidimo, se je v drugem primeru funkcija skrcila. Poleg tega je graf postal višji.

Parameter oblike ξ

Tudi ta parameter je primer numericnega parametra. Ta, kot ze samo ime pove,vpliva na obliko porazdelitvene funkcije in ne na to, v katero stran se premaknevrh, kot lokacijski parameter. Ali na to, kako se funkcija razteza/krci kot parametervišine.Obstaja tudi cenilka tega parametra, kot tudi za ostala dva. To cenilko lahko

ocenimo kot visok moment z metodo momentov, kot sta asimetrija ali splošcenost.Cenilke oblike pogosto vkljucujejo višje statisticne rede, kot so višji momenti.Parameter oblike dovoljuje, da porazdelitev pogledamo glede na razlicne oblike,

to je glede na njegovo vrednost. Te porazdelitve so še posebej uporabne za modeli-ranje, saj so dovolj fleksibilne za modeliranje razlicnih podatkovnih nizov.Ta parameter si bomo pogledali na primeruWeibullove porazdelitve. CeWeibullovo

porazdelitveno funkcijo odvajamo, dobimo funkcijo gostote, ki je enaka

p(x) = ξxξ−1e−xξ

.

Narisali bomo grafe, kadar je ξ = 0.5, 1, 2 in 5. Tako bomo videli, kako se spreminjajooblike grafov.

0 1 2 3 4 50.0

0.2

0.4

0.6

0.8

1.0

x

y

Slika 3.7: Weibullova porazdelitev za ξ = 0.5 in ξ = 1

Na sliki 3.7 vidimo, da sta si grafa Weibullovih porazdelitev za ξ = 0.5 (crnabarva) in za ξ = 1 (rdeca barva) dokaj podobna. Drugi graf, ξ = 1, je graf ekspo-nentne funkcije.

40

Page 41: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

0.0 0.5 1.0 1.5 2.0 2.5 3.00.0

0.5

1.0

1.5

x

y

Slika 3.8: Weibullova porazdelitev za ξ = 2 in ξ = 4

Grafiso s povecanjem parametra oblike ξ popolnoma spremenili obliko. Medtemko je vrh grafa na sliki 3.8 za ξ = 2 (crna barva) nagnjen v levo, vidimo, da je grafpri ξ = 4 (rdeca barva) ze bolj simetricne oblike.

Glede na parameter oblike lahko dolocimo h katerim prej omenjenim primerompripadajo porazdelitve:

• ξ > 0 pripada Fréchetovemu primeru,

• ξ < 0 pripada Weibullovemu primeru,

• ξ = 0 pripada standardnemu Gumbelovemu primeru s porazdelitveno funkcijo

G(x) = e−e−x, za vsak x ∈ R.

S tem smo poenostavili prvotne tri druzine ekstremnih vrednosti v eno. Sedaj lahkospremenimo zapis izreka 3.2.

Izrek 3.3 Ce obstajata realni zaporedji {an} in {bn}, kjer je an > 0, da velja

limn→∞

P

[Mn − bnan

< x

]= G(x) (3.4)

in je G neizrojena porazdelitvena funkcija, potem je ta funkcija clan druzine pos-plošenih ekstremnih vrednosti

G(x) = e−(1+ξx)− 1ξ,

ki je definirana na obmocju {x ∈ R : 1 + ξ(x − µ)/σ > 0}, kjer za parametre veljaµ, ξ ∈ R in σ > 0.

41

Page 42: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Izrek 3.3 za priblizek pri modeliranju porazdelitve maksimuma predlaga uporabodruzine porazdelitev posplošenih ekstremnih vrednosti. Predpostavimo, da za danizaporedji {an} in {bn} velja aproksimacija

P

[Mn − bnan

< x

]≈ G(x),

ali ekvivalentno

P [Mn < x] ≈ G

(x− ba

)= G∗(x),

kjer je G∗ enakega tipa kot G, torej clan druzine porazdelitev posplošenih ekstrem-nih vrednosti. Torej lahko za velike vrednosti n z izrekom 3.3 omogocimo prib-lizevanje porazdelitev spremenljivk M∗

n clanu druzine porazdelitev posplošenih ek-stremnih vrednosti. S tem se lahko tudi porazdelitvena funkcija spremenljivke Mn

aproksimira z nekim drugim clanom iz iste druzine. Kljub temu moramo ocenitiparametre porazdelitvene funkcije, vendar v praksi ni tako pomembno, ce se para-metri porazdelitvenih funkcij G in G∗ razlikujejo.

V nadaljevanju bo predstavljena skica dokaza izreka 3.3. V ta namen bomo sedajvpeljali koncept maksimalne stabilnosti funkcije.

Definicija 3.4 Porazdelitveni funkciji G recemo, da je maksimalno stabilna, ce zavsak n > 1 obstajajo konstante αn > 0 in βn, da velja

Gn(αnx+ βn) = G(x).

Funkcija Gn je porazdelitvena funkcija spremenljivke Mn = max{X1, ..., Xn}.Za spremenljivke Xi velja, da so neodvisne in da ima vsaka od teh porazdelitvenofunkcijo G. Lastnost maksimalne stabilnosti je s tem izpolnjena. To nas vodi doidenticne porazdelitve, ki se loci le po spremembi lokacijskega parametra in parame-tra višine. Povezava z ekstremnimi vrednostmi je ta, da je porazdelitvena funkcijamaksimalno stabilna natanko tedaj, ko je enaka posplošeni porazdelitvi ekstremnihvrednosti.

Skica dokaza izreka 3.2. Denimo, da je limitna porazdelitvena funkcija spre-menljivk (Mn− bn)/an enaka G. S tem za dovolj velike n v izreku 3.2 velja aproksi-macija

P

[Mn − bnan

< x

]≈ G(x)

za vsak x ∈ R. Zato za katerikoli k ∈ N, kjer je nk veliko število, velja

P

[Mnk − bnk

ank< x

]≈ G(x).

42

Page 43: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Ampak, ker spremenljivka Mnk predstavlja maksimum nakljucnih k spremenljivk zenako porazdelitveno funkcijo kot spremenljivka Mn, velja tudi

P

[Mnk − bn

an< x

]=

(P

[Mn − bnan

< x

])k.

Z dvema podanima izrazoma za porazdelitveno funkcijo spremenljivke Mn dobimo

P [Mnk < x] ≈ G

(x− bnkank

)in

P [Mnk < x] ≈(G

(x− bnan

))k.

Sedaj vidimo, da sta porazdelitveni funkciji G in Gk enaki, razlicna imata le koefi-cienta lokacije in višine. Iz tega sledi, da je porazdelitvena funkcija G maksimalnostabilna in s tem clanica druzine posplošenih ekstremnih vrednosti. �

Primer 1 Denimo, da je X1, X2, ... zaporedje neodvisnih standardiziranih ekspo-nentnih spremenljivk, Exp(1), porazdelitvena funkcija naj bo F (x) = 1 − e−x zax > 0. V tem primeru naj bosta an = 1 in bn = n. Potem je verjetnost enaka

P [(Mn − bn)/an < x] = F n(x+ lnn)

= [1− e−(x+lnn)]n = [1− n−1e−x]n,

kar konvergira k e−e−x, kadar gre n→∞, za vsak fiksen x ∈ R. Vidimo, da je s tako

izbranima an in bn limitna porazdelitev spremenljivke Mn v bistvu Gumbelova po-razdelitev, ki pripada druzini porazdelitev posplošenih ekstremnih vrednosti, kadarje ξ = 0.

Primer 2 Naj bo X1, X2, ... zaporedje standardnih neodvisnih Fréchetovih spre-menljivk s porazdelitveno funkcijo F (X) = e−

1x , kadar je x > 0. Sedaj naj bosta

an = n in bn = 0. Potem je verjetnost enaka

P [(Mn − bn)/an < x] = F n(nx)

= [e−1nx ]n = e−

1x ,

kadar gre n→∞, za vsak fiksen x > 0. Zato je v tem primeru, zaradi maksimalnestabilnosti funkcije F , to prav tako standardna Fréchetova porazdelitev iz druzineporazdelitev posplošenih ekstremnih vrednosti, kadar je ξ = 1.

Nekateri primeri zahtevajo modele za ekstremno malo opazovanj. Zato si bomopogledali še model za minimume. V tem primeru lahko rezultate dobimo takoj iz us-treznih rezultatov za spremenljivkoMn, saj sta modela za maksimume in minimumepovezana.

43

Page 44: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Naj bo spremenljivka Yi = −Xi, kjer je i = 1, ..., n. Pri tem sprememba predz-naka pomeni, da male vrednosti spremenljivke Xi pripadajo velikim vrednostimspremenljivke Yi. Tako vidimo, da za spremenljivki Mn = min{X1, ..., Xn} inMn = max{Y1, ..., Yn} velja Mn = −Mn. Sedaj lahko podobno kot za maksimumeza velike n zapišemo

P [Mn < x] = P [−Mn < x]

= P [Mn > −x]

= 1− P [Mn < −x]

≈ 1− e−[1+ξ(−x−µσ )]− 1ξ

= 1− e−[1−ξ(x−µσ )]− 1ξ

,

na obmocju {x ∈ R : 1−ξ(x−µ)/σ > 0}, kjer je µ = −µ. Tej druzini porazdelitvenihfunkcij pravimo druzina posplošenih ekstremnih vrednosti za minimume. Podobnokot izrek 3.3, lahko sedaj formuliramo še naslednji izrek:

Izrek 3.5 Ce obstajata zaporedji {an > 0} in {bn}, da velja

limn→∞

P

[Mn − bnan

< x

]= G(x)

in je G neizrojena porazdelitvena funkcija, potem je G clanica druzine posplošenihekstremnih vrednosti za minimume:

G(x) = 1− e−[1−ξ(x−µσ )]− 1ξ

,

definirana na obmocju {x ∈ R : 1− ξ(x− µ)/σ > 0}, kjer je µ, ξ ∈ R in σ > 0.

3.1.1 Model maksimumov skupin podatkov

Druzina posplošenih porazdelitev ekstremnih vrednosti nam zagotavlja, da si lahkopridobimo porazdelitev za model maksimumov skupin podatkov. Gre za prvi pristopv teoriji ekstremnih vrednosti. Ta pristop je najstarejši model analize ekstremnihvrednosti. Ekstremne neodvisne spremenljivkeX1, ..., Xn zdruzimo v skupine enakihdolzin, recimo dolzine n. Te skupine pogosto izberemo tako, da ustrezajo nekemucasovnemu obdobju, na primer mesecu ali najpogosteje letu. V tem primeru binam n predstavljal število opazovanj v enem letu. Metoda poišce najvišjo vred-nost v posamezni skupini. Nato analiziramo podatke, ki smo jih dobili po opisanempostopku. Vendar je za pridobitev tega modela, ne glede na nabor podatkov, ki

44

Page 45: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

jih imamo na voljo, izbira skupine lahko kriticna. Ce izberemo premajhno skupino,je lahko priblizna porazdelitvena funkcija slaba, kar vodi do pristranskosti v oce-nah in ekstrapolaciji. Medtem ko z izbiro velikih skupin ustvarimo le nekaj skupinmaksimumov, kar lahko vodi do velike ocene variance.Skupino porazdelitev maksimumov nato dobimo s preurejanjem enacbe (3.3). V

duhu kvantilov izberemo 0 < p < 1 in nato definiramo

xp = µ− σ

ξ

(1− y−ξp

),

kjer je G(xp) = 1− p. Zgornje parametre ocenimo z uporabo tehnik najvecje verjet-nosti in zamenjavo parametrov ξ, σ, in µ z njihovimi cenilkami ξ, σ in µ, da dobimoxp. Razberemo lahko, da ce narišemo graf xp v odvisnosti od ln yp, v primeru, koje ξ = 0, dobimo linearen graf. Ce je ξ < 0 dobimo konveksen graf, v nasprotnemprimeru, kadar je ξ > 0 pa konkaven graf, ki nima koncne meje. V terminologijiekstremne vrednosti xp imenujemo povratna stopnja, ki je povezana s povratnimobdobjem.Ce za druzino porazdelitev posplošenih ekstremnih vrednosti uporabljamo ver-

jetnostne metode, ki se nanašajo na pogoje pravilnosti, lahko naletimo na tezave.Te so povezane z ocenjevanjem po metodi najvecjega verjetja (cenilka najvecjegaverjetja). To cenilko izracunamo glede na to, kako pogosto se pojavljajo maksimumiin po tem, ko smo izracunali opisne statistike.Glede ekstremnih modelov imamo potencialno tezavo o koncni tocki porazde-

litvene funkcije (ce je seveda ta koncna), ki je funkcija parametrov. Pri tem ninujno, da obicajni asimptoticni rezultati drzijo. Smith [5] je obravnaval limitnoobnašanje cenilke najvecjega verjetja, glede na vrednost parametra oblike ξ. Pritem je ugotovil:

• kadar je ξ > −1/2 so cenilke najvecjega verjetja regularne, in sicer v temsmislu, da imajo obicajne asimptoticne lastnosti;

• kadar je −1 < ξ < −1/2 so cenilke najvecjega verjetja pridobljene na splošno,vendar te nimajo obicajnih asimptoticnih lastnosti;

• kadar je ξ < −1 je malo verjetno, da bomo sploh dobili cenilke najvecjegaverjetja.

Kadar je ξ < −1/2 cenilka najvecjega verjetja konvergira h koncni tocki hitrejekot v primeru, ko je ξ > −1/2 s stopnjo konvergence, ki je odvisna od parametraoblike ξ. Drugi parametri konvergirajo po obicajni stopnji. Pri vecini okoljskih

45

Page 46: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

problemov je parameter oblike med −1 < ξ < 1 (pogosto je ξ ≈ 0), tako da nammaksimalna verjetnost ne dela tezav.

V nadaljevanju bomo poskušali oceniti maksimalno verjetnost. Za zacetek vze-mimo niz spremenljivk X1, ..., Xn, ki so neodvisne in imajo porazdelitveno funkcijoiz druzine porazdelitev posplošenih ekstremnih vrednosti. To bo naša predpostavka.Najprej se spomnimo enacbe porazdelitvene funkcije, ki je enaka:

G(x) = e−[1+ξ(x−µσ )]− 1ξ

.

Izpeljimo logaritemsko funkcijo verjetja za parametre porazdelitvene funkcije, kipripada druzini posplošenih ekstremnih vrednosti, kadar je ξ 6= 0. Najprej poišcemofunkcijo gostote p(x). Odvajamo porazdelitveno funkcijo in dobimo:

p(x) = G(x) = e−[1+ξ(x−µσ )]− 1ξ 1

ξ

[1 + ξ

(x− µσ

)]ξ

1

σ,

kar je enako

=1

σe−[1+ξ(x−µσ )]

− 1ξ

[1 + ξ

(x− µσ

)].

Sedaj lahko zapišemo funkcijo verjetja

L(x1, ..., xn, µ, σ, ξ) =1

σn

n∏i=1

[1 + ξ

(xi − µσ

)]−ξ+1ξ

e−∑ni=1[1+ξ(xi−µσ )]

− 1ξ

.

To funkcijo sedaj še logaritmiramo in tako dobimo logaritemsko funkcijo verjetja

lnL = −n lnσ −(

1 +1

ξ

) n∑i=1

ln

[1 + ξ

(xi − µσ

)]−

n∑i=1

[1 + ξ

(xi − µσ

)]− 1ξ

,

(3.5)pri tem mora veljati

1 + ξ

(xi − µσ

)> 0, za i = 1, ..., n. (3.6)

Naslednji primer, ko je ξ = 0, zahteva loceno obravnavo. Pri tem moramo upora-biti Gumbelove meje porazdelitvene funkcije iz druzine porazdelitev posplošenih ek-stremnih vrednosti. To nas privede v naslednjo logaritemsko funkcijo verjetja:

lnL(µ, σ) = −n lnσ −n∑i=1

(xi − µσ

)−

n∑i=1

e−(xi−µσ

). (3.7)

Ce enacbi (3.5) in (3.7) maksimiramo, pridemo do cenilke najvecjega verjetja.Pri tem nimamo analiticne rešitve, vendar za katerikoli niz podatkov numericno

46

Page 47: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

poišcemo rešitev. Za to uporabimo standardne numericne optimizacijske algoritme.Seveda moramo paziti, da ne zahajamo v tezave zaradi pogoja (3.6). Bolj pozornimoramo biti, kadar je ξ v blizini nicle. Sicer lahko to tezavo rešimo tako, da namestoenacbe (3.5) uporabimo enacbo (3.7).

Sedaj poglejmo še profil verjetnosti. Tega lahko ovrednotimo za kateregakoli odparametrov µ, σ ali ξ. Na primer, profil verjetnosti za parameter ξ dobimo tako,da ta parameter fiksiramo kot ξ = ξ0 in maksimiramo enacbo (3.5), in sicer gledena ostala dva parametra, µ in σ. To ponovimo za cel niz vrednosti parametra ξ0.Ta maksimirana vrednost logaritemske verjetnosti predstavlja profil logaritemskeverjetnosti za parameter ξ, iz katerega lahko kasneje dobimo priblizen interval zau-panja.

3.1.2 Zgled

Našprvi zgled je povzet iz knjige [1]. Temelji na podatkih, ki predstavljajo letnemaksimume morske gladine. Ti podatki so bili zabelezeni v pristanišcu Port Pirie vjuzni Avstraliji. Gre za obdobje med leti 1923 in 1987. Podatke imamo prikazanena Sliki 3.9.

Slika 3.9: Letne maksimalne morske gladine v Port Pirieu

47

Page 48: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Maksimiranje logaritemske verjetnosti porazdelitve posplošenih ekstremnih vred-nosti za te podatke so dale ocene za cenilke(

µ, σ, ξ)

= (3.87, 0.198,−0.050).

Za te podatke je bilo izracunano, da je logaritemska verjetnost enaka 4.34. Nato jebila izracunana priblizna kovariancna matrika ocenjenih parametrov, ki je enaka

V =

0.000780 0.000197 −0.001070.000197 0.000410 −0.000778−0.00107 −0.000778 0.00965

.Diagonale te kovariancne matrike pripadajo variancam posameznih parametrov µ,σ, ξ. Ce pogledamo kvadratne korene teh vrednosti, dobimo standardne napakecenilk µ, σ in ξ, ki so tako enake 0.028, 0.020 in 0.098. Sedaj lahko izracunamopriblizni 95 % interval zaupanja. Ta je za parameter µ enak 3.87 ± 1.96 × 0.028 =

[3.82, 3.93], za parameter σ 0.198 ± 1.96 × 0.020 = [0.158, .0238] in za parameter ξ−0.050± 1.96× 0.098 = [−0.242, 0.142].

Slika 3.10: Profil verjetnosti za ξ

Vecjo natancnost dobimo spet s profilom verjetnosti. Na Sliki 3.10 imamoprikazan profil logaritemske verjetnosti za ξ, iz katerega dobimo 95 % interval za-upanja, ki je izracunan kot [−0.21, 0.17]. Spet vidimo, da je izracunan interval

48

Page 49: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

podoben tistemu, ki smo ga izracunali po prejšnjem postopku. Na Sliki 3.11 imamoprikazan verjetnostni graf in graf kvantilov za naše podatke. Vidimo, da sta oba

Slika 3.11: Verjetnostni graf in graf kvantilov za Port Pirie

grafa blizu linearnosti, kar potrjuje, da je našmodel posplošenih ekstremnih vred-nosti dobro izbran.Kot smo navedli na zacetku v izreku 3.2, imamo tri mozne porazdelitve. Ce bi

poznali samo ta izrek, bi si pred ocenitvijo parametrov morali predhodno izbratimodel. Sedaj si bomo pogledali primerjavo, ce bi ta model zamenjali z Gumbelovodruzino, ki ustreza eni izmed podmodelov druzine posplošenih ekstremnih vrednosti.V tem primeru je parameter ξ = 0. Za podatke pristanišca Pirie je bila izracunanaocena za (µ, σ) = (3.87, 0.195) s standardnima napakama 0.03 in 0.019. Maksimiranalogaritemska verjetnost je v tem primeru enaka −4.22. Sedaj lahko izracunamotestno statistiko, ki je enaka

D = 2 {−4.22− (−4.34)} = 0.24.

Dobili smo dokaj malo vrednost. Ce to vrednost primerjamo s porazdelitvijo χ2,vidimo, da je Gumbelov model ustrezen za te podatke. Ce na Sliki 3.12 pogledamoverjetnostni graf in graf kvantilov, vidimo, da tudi tokrat dobimo linearne grafe. Potem, ko smo izracunali vrednosti parametrov Gumbelovega modela in videli, da sovrednosti s prejšnjim modelom podobne, je bilo to pricakovano.

49

Page 50: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Slika 3.12: Verjetnostni graf in graf kvantilov za Gumbelovo porazdelitev

3.2 Drugi pristop

Modeliranje maksimumov skupin podatkov je skoraj potraten pristop za analizoekstremnih vrednosti, ce so prisotni tudi drugi podatki. V primeru, ko imamodosegljivo celotno casovno vrsto urnih ali dnevnih opazovanj, je bolje, da uporabimopodatke tako, da se izognemo postopkom zdruzevanja podatkov v skupine.Bolj novodobni pristop imenujemo model preseganja mejne vrednosti. Ta model

je primeren za veliko število opazovanj, ki presegajo neko dano mejno vrednost.Model je v splošnem bolj uporaben za prakticne primere, in sicer iz dveh razlogov.Prvic, s tem ko bomo vzeli vse presezke nad neko primerno visoko mejno vrednostjo,bodo podatki bolj ucinkovito uporabljeni. Drugic, lazje jo uporabimo za primere,kadar hocemo preuciti ekstremno stopnjo spremenljivke Y , ki je odvisna od nekedruge spremenljivke X. Kot primer, spremenljivka Y lahko predstavlja stopnjotroposfernega ozona na nek dolocen dan in X vektor meteoroloških spremenljivk zatisti dan. Ta primer je skoraj nemogoce rešiti s pomocjo modela maksimuma skupinpodatkov.Model preseganja mejne vrednosti je povezan s splošno Paretovo porazdelitvijo.

3.2.1 Model preseganja mejne vrednosti

Naj bodo X1, X2, ... neodvisne in enako porazdeljene nakljucne spremenljivke s po-razdelitveno funkcijo F . Povsem normalno je, da so med ekstremnimi dogodki tistiXi-ji, ki presegajo neko doloceno mejno vrednost u. Z X oznacimo neko zaporedjepoljubnega izraza v Xi. Iz tega sledi, da je opis stohasticnega vedenja ekstremnih

50

Page 51: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

dogodkov podan s pogojno verjetnostjo

P [X > u+ y | X > u] =1− F (u+ y)

1− F (u), y > 0. (3.8)

Ce bi poznali prvotno porazdelitev F , bi poznali tudi presezene mejne vrednosti venacbi (3.8).

Izrek 3.6 Naj bodo X1, X2, ... neke neodvisne nakljucne spremenljivke s skupno po-razdelitveno funkcijo F in naj bo spremenljivka

Mn = max{X1, ..., Xn}.

Z X oznacimo poljuben izraz v zaporedju Xi in recimo, da F izpolnjuje izrek 3.3,tako da za velike n velja

P [Mn < x] ≈ G(x),

kjer je

G(x) = e−(1+ξx)− 1ξ

za nek ξ. Potem je za dovolj velike n porazdelitvena funkcija X−u pogojena z X > u

priblizno

H(y) = 1−(

1 +ξy

σ

)− 1ξ

, (3.9)

ki je definirana na obmocju {y; y > 0,(1 + ξy/σ) > 0}, kjer je

σ = σ + ξ(u+ µ). (3.10)

Dokaz. Naj ima spremenljivka X porazdelitveno funkcijo F . Po enacbi (3.3) lahkotrdimo, da za dovolj velike n velja

F n(x) ≈ e−[1+ξ(x−µσ

)]− 1ξ

za neke parametre µ, σ > 0 in ξ. Ce enacbi logaritmiramo dobimo

n lnF (x) ≈ −[1 + ξ(x− µσ

)]−1ξ . (3.11)

Pri tem nam Taylorjeva širitev za velike vrednosti x da

lnF (x) ≈ −(1− F (x)).

Sedaj preuredimo enacbo (3.11) in za velike u dobimo

1− F (u) ≈ 1

n[1 + ξ(

u− µσ

)]−1ξ .

51

Page 52: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Podobno velja, ce dodamo y > 0,

1− F (u+ y) ≈ 1

n[1 + ξ(

u+ y − µσ

)]−1ξ .

Sledi izpeljava porazdelitvene funkcije spremenljivke X − u pogojene z X > u.Najprej uporabimo aproksimacijo.

P [X > u+ y | X > u] ≈ 1− F (u+ y)

1− F (u)≈ n−1[1 + ξ(u+ y − µ)/σ]−

n−1[1 + ξ(u− µ)/σ]−1ξ

.

Kar je naprej enako

=

[1 + ξ(u+ y − µ)/σ

1 + ξ(u− µ)/σ

]− 1ξ

=

[(σ + ξ(u+ y − µ))/σ

(σ + ξ(u− µ))/σ

]− 1ξ

=

[σ + ξ(u+ y − µ)

σ + ξ(u− µ)

]− 1ξ

=

[σ + ξ(u− µ) + ξy

σ + ξ(u− µ)

]− 1ξ

=

[1 +

ξy

σ

],

kjer jeσ = σ + ξ(u− µ),

kot je zahtevano. �

Druzino porazdelitev, ki smo jo definirali z enacbo (3.9) imenujemo splošnaParetova druzina. Prejšnji izrek nam je pokazal, da ce ima skupina maksimu-mov priblizno porazdelitveno funkcijo G, potem imajo presezki mejnih vrednostipriblizno porazdelitev znotraj splošne Paretove druzine. Poleg tega so parametri teporazdelitve enolicno doloceni s pomocjo tistih iz druzine posplošenih ekstremnihvrednosti. Zlasti velja to za parameter oblike ξ iz enacbe (3.9).

Primer 3 Imejmo eksponentni model s porazdelitveno funkcijo F (x) = 1 − e−x,kadar je x > 0. Neposredno lahko izracunamo pogojno verjetnost

1− F (u+ y)

1− F (u)=e−(u+y)

e−u= e−y,

za vse y > 0. Posledicno je limitna porazdelitev prekoracitve mejnih vrednostieksponentna porazdelitev, ki pripada splošni Paretovi porazdelitvi, ko sta ξ = 0 inσ = 1. Poleg tega je to natancen rezultat za vse mejne vrednosti u > 0.

Primer 4 Denimo, da imamo standarden Fréchetov model s porazdelitveno funkcijoF (x) = e−

1x , za vse x > 0. Potem je pogojna verjetnost enaka

1− F (u+ y)

1− F (u)=

1− e−(u+y)−1

1− e−u−1 ∼(

1 +y

u

)−1

.

52

Page 53: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

To velja, kadar gre u → ∞, in sicer za vse y > 0. To pripada splošni Paretoviporazdelitvi z ξ = 1 in σ = u.

Dvojnost med splošno Paretovo druzino in druzino porazdelitev posplošenih ek-stremnih vrednosti pomeni, da je parameter oblike ξ glaven pri dolocanju kvalita-tivnega vedenja splošne Paretove porazdelitve. Enako velja za porazdelitve iz druzinposplošenih ekstremnih vrednosti. Ce je parameter ξ < 0, potem ima porazdelitevpresezek v zgornji meji u− σ/ξ, ce je ξ > 0, pa porazdelitev nima zgornje meje. Vprimeru, ko je ξ = 0 je porazdelitev neomejena. To si lahko v enacbi (3.9) razlagamo,kot da velja ξ → 0, kar pa nas pripelje do

H(y) = 1− e−yσ , y > 0, (3.12)

kar pripada eksponentni porazdelitvi s parametrom 1σ.

S pomocjo izreka 3.6 bomo sedaj podali naslednji okvir za modeliranje ekstrem-nih vrednosti. Naši neobdelani podatki so sestavljeni iz neodvisnih in enako po-razdeljenih meritev x1, ..., xn. Ekstremne dogodke dolocimo glede na neko mejnovrednost u. Za presezke velja {xi;xi > u}. Tako imenovane nalepke teh presezkovoznacimo z x(1), ..., x(k). Presezke mejnih vrednosti pa definiramo kot yj = x(j) − u,kjer je j = 1, ..., k. Po izreku 3.6 lahko recemo, da so yj neodvisne realizacijenakljucnih spremenljivk. Porazdelitve le-teh so lahko priblizno enake tistim izsplošne Paretove druzine.Vprašanje glede izbire mejne vrednosti je podobno kot izbira velikosti skupine,

kar pomeni ravnovesje med varianco in pristranostjo. Ce izberemo nizko mejnovrednost, se lahko zgodi, da bomo kršili asimptoticno osnovo modela. To vodi vpristranost. Po drugi strani, ce bomo izbrali previsoko mejno vrednost, nas lahkoprivede do visoke variance. Za namen izbire mejne vrednosti sta mozni dve metodi.Prvic lahko pred oceno modela opravimo raziskovalno tehniko; kot drugo pa lahkoocenimo stabilnost ze ocenjenih parametrov.Ce pogledamo bolj podrobno, prva metoda temelji na povprecju splošne Paretove

porazdelitve. Spremenljivka Y ima splošno Paretovo porazdelitev s parametromaσ in ξ. S tem je pricakovana vrednost spremenljivke Y v primeru, kadar je ξ ≤ 1

enakaE(Y ) =

σ

1− ξ . (3.13)

Kadar je ξ ≥ 1, je povprecje neskoncno. Sedaj predpostavimo, da je splošna Pare-tova porazdelitev veljaven model za presezke mejne vrednosti u0. Po enacbi (3.13)velja, da kadar je parameter ξ < 1 je pricakovana vrednost enaka

E(X − u0 | X > u0) =σu0

1− ξ .

53

Page 54: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Pri tem σu0 oznacuje parameter višine, ki pripada presezkom mejne vrednosti u0.Ampak v tem primeru enako velja za vse mejne vrednosti u > u0. Zato zaradipogoja (3.10) velja

E(X − u | X > u) =σu

1− ξ =σu0 + ξu

1− ξ . (3.14)

Tako je za u > u0 pricakovana vrednost E(X − u | X > u) linearna funkcija. Poenacbi (3.14) pricakujemo, da se bodo te ocene spreminjale linearno skupaj z u.Poleg tega je E(X − u|X > u) povprecje presezkov mejne vrednosti u, za katerevzorcno povprecje presezkov te mejne vrednosti zagotavlja empiricno oceno. Gledena enacbo (3.12) pricakujemo, da se bodo te ocene spreminjale linearno glede na u.

Ko enkrat ugotovimo mejno vrednost, lahko parametre splošne Paretove po-razdelitve ocenimo z maksimalno verjetnostjo. Denimo, da imamo vrednosti y1, ..., yk,kar je k preseganj mejne vrednosti u. Kadar je ξ 6= 0, logaritemska verjetnost izviraiz enacbe (3.9) in je

lnL(σ, ξ) = −k lnσ −(

1 +1

ξ

k∑i=1

ln(

1 + ξyiσ

)), (3.15)

kadar je(1 + ξ yi

σ

)> 0 za ∀i = 1, ..., k. V nasprotnem primeru je lnL(σ, ξ) = −∞.

V primeru, kadar je ξ = 0, dobimo logaritemsko verjetnost s pomocjo enacbe (3.12)in je

lnL(σ) = −k lnσ − 1

σ

k∑i=1

yi.

Tudi tukaj ni mogoce maksimirati logaritemske verjetnosti analiticno, spet moramouporabiti numericne tehnike.

Na koncu tega poglavja si bomo ogledali, kako lahko ponovno izberemo mejnovrednost.V izreku 3.6 smo videli, da ce je splošna Paretova porazdelitev primeren model za

presezke mejnih vrednosti u0, potem bi lahko tudi presezki višjih mejnih vrednosti usledili splošni Paretovi porazdelitvi. Z σu oznacimo vrednost splošnega Paretovegaparametra višine za mejno vrednost u > u0, potem iz (3.10) sledi

σu = σu0 + ξ(u− u0), (3.16)

tako da parameter višine spreminja u, razen, ko je ξ = 0. To tezavo lahko odpravimotako, da spremenimo splošen parameter višine

σ∗ = σu − ξu,

54

Page 55: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

kar je konstantno glede na u zaradi (3.16). Posledicno bi morale biti ocene obehparametrov σ∗ in ξ konstantne nad u, ce je u0 veljavna mejna vrednost za presezke,ki sledijo splošni Paretovi porazdelitvi.Zato se predlaga risanje obeh parametrov σ∗ in ξ v odvisnosti od u, skupaj z

intervali zaupanja za vsako od teh kolicin. Intervale zaupanja za ξ dobimo takoj izkovariancne matrike V . Interval zaupanja za σ∗ zahteva delta metodo z uporabo

V ar (σ∗) ≈ ∇σ∗TV∇σ∗,

kjer je

∇σ∗T =

[∂σ∗

∂σu,∂σ∗

∂ξ

]= [1,−u].

3.2.2 Zgled

Tudi naslednji zgled bo povzet po knjigi [1]. Na Sliki 3.13 imamo prikazane dnevnepodatke o padavinah v jugozahodni Angliji, ki so bili zabelezeni v obdobju medletoma 1914 in 1962.

Slika 3.13: Dnevne padavine v JZ Angliji

Ce bi v tem primeru poznali primeren statisticni model, bi lahko uporabili vsepodatke, da bi ocenili ta model. Sedaj podatkov ne bomo dajali v skupine, ampak

55

Page 56: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

si bomo izbrali neko mejno vrednost in rekli, da je neki dogodek ekstremen, ce jerecimo na dan padlo vsaj 30 mm padavin. Na Sliki 3.14 imamo prikazana grafaparametrov σ∗ in ξ v odvisnosti od mejne vrednosti u.

Slika 3.14: Ocene parametrov v odvisnosti od mejne vrednosti

Za mejno vrednost smo izbrali u = 30. Za dane podatke so bile izracunanemaksimalne verjetnostne cenilke(

σ, ξ)

= (7.44, 0.184)

s pripadajoco maksimalno logaritemsko verjetnostjo −485.1. Kovariancna matrikaje podana kot

V =

[0.9188 −0.0655−0.0655 0.0102

],

kar nam da standardni napaki za σ in ξ, ki sta enaki 0.959 in 0.101. Iz teh podatkovnato dobimo, da je 95 % interval zaupanja za parameter ξ enak 0.184±1.96×0.101 =

[−0.014, 0.383].Boljšo natancnost dosezemo spet s profilom verjetnosti. Na Sliki 3.15 imamo

graf profila logaritemske verjetnosti za parameter ξ. Po izreku iz knjige [1, poglavje

56

Page 57: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Slika 3.15: Profil verjetnosti za ξ

2.6.6, izrek 2.6] lahko dobimo priblizen 95 % interval zaupanja za parameter ξ, ki jeenak [0.019, 0.418]. S tem dobimo potrditev, da je ξ > 0.Na koncu imamo na Sliki 3.16 prikazan verjetnostni graf in graf kvantilov. Spet

vidimo, da sta grafa dokaj linearna, kar nam da potrditev, da je model dober.

Slika 3.16: Verjetnostni graf in graf kvantilov

57

Page 58: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Poglavje 4

Drugi modeli

Tezava, s katero se srecujemo pri kakršnikoli analizi ekstremnih vrednosti, so po-datki, ki jih imamo na voljo za oceno nekega modela. Ti podatki so velikokratv omejeni kolicini in v vecini primerov so ekstremi zelo redki. Zaradi tega imajoocene modelov veliko varianco. S tem se nam je odprlo novo vprašanje, in sicer,kako karakterizirati vedenje ekstremnih vrednosti, ki hkrati onemogocajo modeli-ranje podatkov vseh vrst. Modeliramo lahko samo maksimume skupin podatkov.

Statisticna metoda r-tih najvecjih vrednosti

Poznamo dve splošni karakterizaciji. Prva temelji na preseganjih visokih mejnihvrednosti, medtem ko druga temelji na r-tih najvecjih vrednosti vrstnih statistikznotraj neke skupine. Pri tem je vrednost r majhna.

Kot v vseh prejšnjih delih, tudi v tem predpostavimo, da je X1, X2, ... zaporedjeneodvisnih in enako porazdeljenih nakljucnih spremenljivk. Te spremenljivke bomouporabili za karakterizacijo ekstremnega vedenja. Najprej bomo razširili rezultat izizreka 3.2 za druge ekstremne vrstilne statistike. Pri tem definiramo

M (k)n = k-ta najvecja vrednost izmed spremenljivk {X1, ..., Xn},

za fiksen k. Posebej nas zanima limitna porazdelitev, kadar gre n → ∞. Najprejposplošimo izrek 3.2.

Izrek 4.1 Ce obstajata zaporedji {an}, kjer je vsak an > 0, in {bn}, da velja

limn→∞

P

[Mn − bnan

< x

]= G(x)

58

Page 59: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

za neko neizrojeno funkcijo G, tako da je G porazdelitvena funkcija iz druzine po-razdelitev posplošenih ekstremnih vrednosti, oblike (3.3), potem za fiksen k velja:

limn→∞

P

[M

(k)n − bnan

< x

]= Gk(x),

na obmocju {x; 1 + ξ x−µσ

> 0}, pri tem je

Gk(x) = e−τ(x)

k−1∑s=0

τ(x)s

s!(4.1)

in

τ(x) =

[1 + ξ

(x− µσ

)]− 1ξ

.

Ta izrek nam pove, da ce je k-ti najvecji vrstni red statistik normaliziran v skupiniv natanko enaki obliki kot maksimum, potem je enacba porazdelitvene funkcije vtakšni obliki, kot je enacba (4.1). Parametri znotraj te porazdelitvene funkcijepripadajo tudi parametrom druzine posplošenih ekstremnih vrednosti skupine mak-simumov. Ce imamo v modelu lokacijski parameter in parameter višine, sledi, da jeaproksimirana porazdelitev spremenljivkeM (k)

n za veliko vrednost n znotraj druzineporazdelitev (4.1).Ce druzino porazdelitev (4.1) uporabimo kot model, lahko naletimo na tezave.

Denimo, da imamo popoln vektor r-tega najvecjih vrstnih redov statistik

M (r)n =

(M (1)

n , ...,M (r)n

)za vsakega od vec skupin. Izrek 4.1 nam da druzino za priblizne porazdelitve vsakeod komponent vektorja M (r)

n , vendar ne natancne porazdelitve. Poleg tega te kom-ponente med seboj ne morejo biti neodvisne. Na primer M (2)

n ni vecji od M (1)n . S

tem vidimo, da rezultat vsakega posameznega dela vpliva na porazdelitev drugega.Iz tega sledi, da sam izrek 4.1 ne vodi do modela za M (r)

n . Potrebujemo namreckarakterizacijo skupne limitne porazdelitve vektorja M (r)

n . Ce bomo spremenljivkospet normirali, lahko to tudi dosezemo. V naslednjem izreku bomo dobili gostotolimitne porazdelitve.

Izrek 4.2 Ce obstajata zaporedji {an > 0} in {bn}, da velja

limn→∞

P

[Mn − bnan

< x

]= G(x)

59

Page 60: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

za neko neizrojeno porazdelitveno funkcijo G, potem ima za fiksen r limitna po-razdelitev, kadar gre n→∞ nakljucnega vektorja

M (r)n =

(M

(1)n − bnan

, ...,M

(r)n − bnan

)gostoto verjetnosti

p(x(1), ..., x(r)) = e−[1+ξ

(x(r)−µ

σ

)]− 1ξ

·r∏

k=1

1

σ

[1 + ξ

(x(k) − µ

σ

)]− 1ξ−1

, (4.2)

kjer za parametre velja σ > 0 in µ, ξ ∈ R; x(r) ≤ x(r−1) ≤ ... ≤ x(1) in{x(k); 1 + ξ

(x(k) − µ

σ

)> 0

}za k = 1, ..., r.

Preden dokazemo zgornja dva izreka, si na kratko poglejmo še tockovne procese.Tockovni proces oznacimo kot P. Najbolj znan tockovni proces je ze v osnovnihpoglavjih opisan Poissonov proces.Definirajmo mnozico nenegativnih celoštevilskih nakljucnih spremenljivk, N(A),

za vsak A iz mnozice A, na katerem je definiran tockovni proces P. Število N(A)

nam predstavlja število tock v mnozici A. Intenzivnost mere definiramo kot

Λ(A) = E (N(A)) ,

kar predstavlja pricakovano število tock v podmnozici A ⊂ A. Ob predpostavki,da je mnozica A = [a1, x1] × ... × [ak, xk] ⊂ Rk, je intenzivnostna funkcija gostoteprocesa enaka

λ(x) =∂Λ(A)

∂x1...∂xk.

Potrebovali bomo še pojem konvergence, ki je analogen konvergenci nakljucnih spre-menljivk.

Definicija 4.3 Naj bo N1, N2, ... zaporedje tockovnih procesov na mnozici A. Za-poredje pravimo, da konvergira k porazdelitvi N , oznacimo z

Nnd→ N,

ce za vse izbirem in za vse omejene mnozice A1, ..., Am velja P [N(∂Aj) = 0] = 1, j =

1, ...,m, kjer ∂Aj oznacuje mejo od Aj, porazdelitev vektorja (Nn(A1), ..., Nn(Am))

konvergira k porazdelitvi vektorja (N(A1), ..., N(Am)).

60

Page 61: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Sedaj si poglejmo limitno porazdelitev Poissonovega procesa za ekstreme. Kot vprejšnjih primerih predpostavimo, da so X1, X2, ... neodvisne in enako porazdeljenespremenljivke s porazdelitveno funkcijo F . Definirajmo še zaporedje tockovnih pro-cesov Nn na R2 z

Nn =

{(i

n+ 1,Xi − bnan

); i = 1, ..., n

}.

Upoštevajmo, da imamo obmocje oblike A = [0, 1]× (u,∞) za neko veliko vrednostu. Potem ima vsaka od n tock iz Nn verjetnost za lego v mnozici A enako p, kjer je

p = P

[Xi − bnan

> u

]≈ 1

n

[1 + ξ

(u− µσ

)]− 1ξ

.

Ker so Xi med seboj neodvisne, ima Nn(A) binomsko porazdelitev

Nn(A) ∼ b(n, p).

Zaradi homogenosti procesa v casovni smeri sledi, da je za katerokoli obmocje oblikeA = [t1, t2] × (u,∞), kjer je [t1, t2] ⊂ [0, 1], mejna porazdelitev Nn(A) PoissonovaP (Λ(A)), kjer je

Λ(A) = (t2 − t1)

[1 + ξ

(u− µσ

)]− 1ξ

.

Poglejmo si naslednji izrek, v katerem smo povzeli, kar smo zapisali do sedaj.

Izrek 4.4 Naj bo X1, X2, ... zaporedje neodvisnih in enako porazdeljenih nakljucnihspremenljivk, za katere sta zaporedji {an > 0} in {bn} taki, da

P [(Mn − bn)/an ≤ x]→ G(x),

kjer je

G(x) = e−[1+ξ(u−µσ )]− 1ξ

in naj bosta x− in x+ spodnja in zgornja koncna tocka funkcije G. Potem zaporedjetockovnih procesov

Nn =

{(i

n+ 1,Xi − bnan

): i = 1, ..., n

}konvergira na obmocju oblike (0, 1) × [u,∞) za katerikoli u > x−, za Poissonovproces z intenzivno mero na obmocju A = [t1, t2]× [x, x+) dano z

Λ(A) = (t2 − t1)

[1 + ξ

(x− µσ

)]− 1ξ

. (4.3)

61

Page 62: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Poglejmo si dva primera.

Primer 1 Ce je X1, X2, ... zaporedje neodvisnih standardnih eksponentnih spre-menljivk, je limitna porazdelitevG standardna Gumbelova porazdelitev z (x−, x+) =

(−∞,∞). Zato zaporedje tockovnih procesov

Nn =

{(i

n+ 1, Xi − n

); i = 1, ..., n

}konvergira k Poissonovem procesu z intenzivno mero na obmocju A = [t1, t2]×[x,∞)

za x > −∞, dano kotΛ(A) = (t2 − t1)e−x.

To je enako enacbi (4.3) v primeru, kadar so parametri µ = 0, σ = 1 in kadar ξ → 0.

Primer 2 Ce je X1, X2, ... zaporedje neodvisnih standardnih Fréchetovih spre-menljivk, je limitna porazdelitev G standardna Fréchetova porazdelitev z (x−, x+) =

(0,∞). V tem primeru je zaporedje tockovnih procesov enako

Nn =

{(i

n+ 1,Xi

n

); i = 1, ..., n

}in konvergira k Poissonovemu procesu z intenzivno mero na obmocju A = [t1, t2]×[x,∞) za x > 0, dano kot

Λ(A) = (t2 − t1)x−1.

To je enako enacbi (4.3) s parametri µ, σ, ξ = 1.

Sedaj preuredimo izrek 4.4.

Izrek 4.5 Naj bo X1, X2, ... zaporedje neodvisnih in enako porazdeljenih nakljucnihspremenljivk in naj bo zaporedje tockovnih procesov

Nn =

{(i

n+ 1, Xi

); i = 1, ..., n

}.

Potem za dovolj velike u, na obmocju oblike (0, 1)× [u,∞), lahko Nn aproksimiramos Poissonovim procesom z intenzivno mero na obmocju A = [t1, t2]× (x,∞) podanoz

Λ(A) = (t2 − t1)

[1 + ξ

(x− µσ

)]− 1ξ

. (4.4)

Enacbo (4.4) lahko zamenjamo z naslednjo enacbo

Λ(A) = ny(t2 − t1)

[1 + ξ

(x− µσ

)]− 1ξ

, (4.5)

62

Page 63: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

kjer je ny število let opazovanj. V tem primeru ocenjeni parametri (µ, σ, ξ) takojpripadajo parametrom druzine porazdelitev posplošenih ekstremnih vrednosti letnihmaksimalnih porazdelitev opazovanih procesov.V enacbi (4.5) zamenjamo [t1, t2] z [0, 1] in tako dobimo novo funkcijo verjetnosti

LA(µ, σ, ξ;x1, ..., xn) = e−Λ(A)N(A)∏i=1

λ(ti, xi) (4.6)

∝ e−ny[1+ξ(u−µσ )]− 1ξN(A)∏i=1

1

σ

[1 + ξ

(xi − µσ

)]− 1ξ−1

.

Dokaz izreka 4.1. Izreka 4.1 in 4.2 lahko dokazemo direktno iz predstavitvetockovnega procesa. Spomnimo se, da je M (k)

n k-ti najvecji vrstni red spremenljivkizmed neodvisnih in enako porazdeljenih spremenljivk X1, ..., Xn. Naj bo

Nn =

{(i

n+ 1,Xi − bnan

): i = 1, ...n

}in Ax = (0, 1)× [x,∞). Potem velja

P

[M

(k)n − bnan

≤ x

]= P [Nn(Ax) ≤ k − 1] (4.7)

=k−1∑s=0

P [Nn(Ax) = s] .

Limita Poissonovega procesa limn→∞Nn(Ax) konvergira, in sicer k Poissonovi spre-menljivki s povprecjem

Λ(Ax)

[1 + ξ

(x− µσ

)]− 1ξ

.

Ob limitah v enacbi (4.7) velja

P

[M

(k)n − bnan

≤ x

]→

k−1∑s=0

e−τ(x)τ(x)s

s! ,

kjer je funkcija τ(x) = Λ(Ax). To je izrek 4.1. �

Dokaz izreka 4.2. Izrek 4.2 dokazemo s pomocjo verjetnosti limitnega Pois-sonovega procesa. Naj vektor

(X(1), ..., X(r)

)oznacuje opazovane vrednosti spre-

menljivkeMn. Ce v enacbi (4.6) u = x(r) in xi zamenjamo z x(i), bo s tem verjetnostza r najvecjih redov statistik enacba (4.2) iz izreka 4.2. �Kadar je r = 1 se druzina (4.2) zmanjša na funkcije gostot druzin porazdelitev

posplošenih ekstremnih vrednosti. Kot primer, kadar je v (3.3) ξ = 0, to vodi do

63

Page 64: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

druzine funkcij gostot

p(x(1), ..., x(r)) = e−(x(r)−µ

σ

r∏k=1

1

σe−(x(k)−µ

σ

).

V tem primeru se gostota Gumbelove druzine zmanjša.

Sedaj poskušajmo ta model uporabiti. Spet imamo neodvisne in enako porazdel-jene spremenljivke. Dane podatke damo v m skupin. Med temi skupinami so vskupini i evidentirana najvecja opazanja ri. Ta opazanja nas privedejo do nizaM

(ri)i =

(x

(1)i , ..., x

(ri)i

), kjer je i = 1, ...,m. Po navadi dolocimo r1 = ... = rm = r,

kjer je r neka dolocena vrednost, razen v primeru, ko imamo na voljo manj po-datkov. Tudi v tem primeru po navadi kot velikost skupine izberemo dolzino enegaleta. Medtem ko nas majhna vrednost r-ja pripelje do visoke variance, po drugistrani visoka vrednost r-ja vodi do pristranskosti. Po navadi za vrednost ri izber-emo najvecjo mozno, saj to ustreza modelu.Sedaj si za ta model oglejmo verjetnost, ki jo dobimo iz enacb (4.2) in (4.7).

Na obicajen nacin moramo absorbirati neznane normirane koeficiente v lokacijskiparameter in parameter višine, kadar je ξ 6= 0. Iz tega dobimo

L(µ, σ, ξ) =m∏i=1

e−[

1+ξx(ri)i

−µσ

]− 1ξ

·ri∏k=1

1

σ

[1 + ξ

x(k)i − µσ

]− 1ξ−1 , (4.8)

pri tem mora veljati pogoj 1 + ξ(x(k)−µσ

)> 0, k = 1, ..., ri, i = 1, ...,m. Ce ne velja

ta pogoj, je verjetnost enaka nic. Kadar pa je ξ = 0, je verjetnost enaka

L(µ, σ, ξ) =m∏i=1

e−e−(x(ri)−µ

σ

)·ri∏k=1

1

σe−(x(k)i

−µσ

). (4.9)

Da bi dobili najvišjo oceno verjetnosti, lahko verjetnosti (4.8) in (4.9), ali tudipogosteje pripadajoco logaritemsko verjetnost, maksimiramo numericno. Tudi sstandardno asimptoticno verjetnostno teorijo lahko aproksimiramo standardno na-pako in interval zaupanja. Ce pogledamo bolj splošno, nam model r-tih najvecjihredov da verjetnost, katere parametri pripadajo tistim iz druzine porazdelitev pos-plošenih ekstremnih vrednosti, vendar ti vkljucujejo vec opazovanih ekstremnih po-datkov.

64

Page 65: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

Literatura

[1] Coles, S. An Introduction to Statistical Modeling of Extreme Values, Springer-Verlag London 2001

[2] Cepon P., Aplikacija teorije ekstremnih vrednosti na donosih delnice izbranegapodjetja, Magistrsko delo, Ljubljana 2013

[3] de Haan L., Ferreira A., Extreme Value Theory An Introduction, Springer 2006

[4] Jamnik R., Verjetnostni racun, DMFA, Ljubljana 1987

[5] Smith, R. L. Maximum Likelihood estimation in a class of nonregular cases,Biometrika 72, 67-90 1985

65

Page 66: OSNOVE TEORIJE EKSTREMNIH VREDNOSTI · HERGA, S.: Osnove teorije ekstremnih vrednosti Magistrsko delo, Univerza v Mariboru, Fakulteta za naravoslovje in ma-tematiko, Oddelek za matematiko

UNIVERZA V MARIBORU

FAKULTETA ZA NARAVOSLOVJE IN MATEMATIKO

Oddelek za matematiko in racunalništvo

MAGISTRSKO DELO

Sabina Herga

Maribor, 2014