تحلیل فراوانی سیل

Post on 29-Jan-2016

97 Views

Category:

Documents

4 Downloads

Preview:

Click to see full reader

DESCRIPTION

تحلیل فراوانی سیل. موسوی ندوشنی مهر 1390. تحلیل فراوانی. این تحلیل شامل موارد زیر است: داشتن یک سری آماری مشخص بر حسب تعریف متغیر مورد نظر یافتن یک توزیع مناسب آماری برای برازش بر سری آماری مورد نظر محاسبه دبی یا بارندگی، با دوره بازگشت. - PowerPoint PPT Presentation

TRANSCRIPT

1

تحلیل فراوانی سیل

موسوی ندوشنی1390مهر

2

تحلیل فراوانی:این تحلیل شامل موارد زیر است

داشتن یک سری آماری مشخص بر حسبتعریف متغیر مورد نظر

یافتن یک توزیع مناسب آماری برای برازش برسری آماری مورد نظر

محاسبه دبی یا بارندگی، با دوره بازگشت

3

سری های آماری

ها به دو بخش عمده سری های آماری در دبی تقسیم می شوند:

دبی های لحظه ایسری دبی های لحظه ای حداکثر

دبی های متوسطسری دبی های متوسط حداکثر روزانهسری دبی های متوسط ماهانه روزانه2/سری دبی های متوسط ساالنه روزانه

/2

( ) ( )t d

t d

vol t f u du

/2

/2

1( ) ( )

t d

t d

ave t f u dud

4

انواع دبي هاي حداكثر در هيدرولوژي

5

روش ساختن سری های آماریای استفاده های لحظه برای تحلیل فراوانی سیل از داده

های می شود و در صورت عدم دسترسی به آنها از دبیمتوسط روزانه استفاده می گردد.

از تمام داده M های موجود برای ساخت سری های معموالآماری استفاده نمی شود )به استثنای سری های زمانی( و باید به روش گزینشی عمل نمود. برای این کار دو روش

موجود است. بلوک حداکثرهاB l o c k M a x i m a روش ساختن بلوک ها به این صورت است که کل داده ها به

M اندازه های یکسان شامل توده ای از داده ها می باشند. مثالنمونه های حداکثر ساالنه )سال آبی و یا سال تقویمی(

.در این روش برای هر سال یک داده حداکثر انتخاب می شودهای باالتر از یک آستانه معین استفاده از دادهPeak over

threshold )POT( در این روش برای هر سال یک یا بیش از یک داده اختیار می گردد. البته

ای اخذ نشود. در سال های بسیار خشک ممکن است داده

6

های باالتر از یک آستانه استفاده از دادهمعین

7

POT و AMمقایسه روش

8

POTمفاهیم اولیه در روش فراترهاExceedences:

اگر سری زمانیx1,x2 را در نظر بگیرید و …, xi>u را برای x-u باشد، آنگاه uمقدار آستانه

مقادیر فراتر یافته نامند. خوشهcluster:

به گروهی از مقادیر فراتر یافته متوالی خوشهگویند.

دورهcycle length:.زمان بین دو فرود متوالی را دوره گویند

طول اجراrun length: پریودی از دوره است که مقادیر باالتر از آستانه

وجود ندارد.

9

POTشکل شماتیک تعاریف اولیه روش

10

مقادیر حدیتوزیعآشنایی با نظریه مقادیر حدی

در تحلیل فراوانی اگر از توزیع های کالسیک و استفاده شود، برای برآورد پارامترهایی نظیر

از تمام داده های مشاهده شده استفاده می شود و نه از داده های حدی. مقادیر مرکزی

روی برآورد پارامترها تاثیر می گذارند. اما اگر تحلیل داده های حدی مورد توجه است

لزومی به استفاده از تمام داده ها نیست و فقط از مقادیر حدی استفاده می گردد. نظریه

داده های حدی، توزیع های احتمال مورد نظر را به دست می دهد.

11

توزیع مقادیر حدی فرض کنید کهX1,X2,…,Xn متغیرهای

تصادفی مستقل و دارای توزیع یکسان می باشند.Fها یک تابع توزیع Xهستند و

فرض کنید کهMn=max{X1,X2,…,Xn}.است

در اینجا باید مقدارF.برآورد گردد

1

1

[ ] [ , , ]

[ ] [ ]

[ ( )]

n n

n

n

P M x P X x X x

P X x P X x

F x

( )n n

n

M bP x G x n

a

12

انواع توزیع مقادیر حدی توزیع عمومی مقادیر حدیGeneralize Extreme

Values (GEV).به صورت زیر است

.که دارای سه پارامتر است ،پارامتر مکان پارامتر مقیاس که پارامتر شکل است و رفتار انتهای نشان دهنده پراکندگی است و

توزیع را نشان می دهد. اگر=0 باشد توزیع گامبل و اگر >0 باشد توزیع فرشه و باالخره

باشد، توزیع ویبول است.<0اگر اگر<0، xG=+ باشد، آنگاه G.از طرف چپ کران دارد

اگر=0 تابع xGR.است

اگر>0، xG<+ باشد، آنگاه تابع G .دارای کران طرف چپ نیست

1/

( ) exp 1x

G x

13

GEVنمودار توزیع های

14

Rشبیه سازی توسط داده های توزیعGEV را می توان با نرم افزار R شبیه سازی

نمود. با توجه بهN)0,1( عدد تصادفی تولید می شود.365 تعداد.از اعداد تولید شده حداکثر آن بدست می آید برای بدست آوردن مقادیر حدی دیگر، گام های اول تا دوم صد

بار تکرار می گردد. نمونه حداکثر دارید که توزیع 100در خاتمهGEV بر آن قابل

برازش است. اکنون به کدهای آن توجه کنید.y = numeric(100)for(i in 1:100) {z = rnorm(365)y[i] = max(z)}

15

Paretoتابع چگالی پرتو

فرض کنید کهX1,X2,…,Xn متغیرهای تصادفیها Xمستقل و دارای توزیع یکسان هستند و

می باشند.Fیک تابع توزیع فرض کنید کهMn=max{X1,X2,…,Xn} .است

.از رابطه فوق لگاریتم گرفته می شود

1/

( ) exp 1n xF x

1/

log ( ) 1x

n F x

16

دنباله تابع ... با استفاده از بسط تیلورlog F)x(-[1-

F)x(] است و با جایگذاری در رابطه باالنتیجه می شود.

اکنون اگرX|X>u مقدار حدی را مشخص ها که بقدر کافی بزرگ باشند. uکند، برای

داریم:

1/1

1 ( ) 1x

F xn

17

دنباله تابع ... اگرY=X-u باشد، به طوری که X>u ،باشد

/1آنگاه داریم:

1/

1/

1/

1 ( )1

Pr( | )1 ( )

1

1( )

1

1

u yn

X u y X uu

n

yu

y

18

دنباله تابع ... که در آنuپارامتر آستانه پارامتر مقیاس پارامتر مقیاس تغییر یافته که برابر است *

با پارامتر شکل است که رفتار انتهای توزیع

را مشخص می کند. اگر<0 .باشد، مشاهده دارای کران هستند

باشد، توزیع نمایی خواهد بود. اگر =0اگر >0.باشد، توزیع دارای انتهای کشیده است

* ( )1

u

19

دنباله تابع ...

20

Rشبیه سازی توسط با توجه بهN)0,1( عدد تصادفی تولید 5000تعداد

می شود.داده ها به صورت نزولی مرتب می گردد100.مقدار حداکثر انتخاب می شود نمونه وجود دارد که از آستانه 100در اینجاx[101]

Generalize Paretoبزرگتر می باشند و با تابع

Distribution )GPD( برازش می یابد. اکنون بهکدهای مورد نظر توجه کنید.

x=rnorm(5000)x=sort(x,decreasing=T)y=x[1:100]

21

تعیین مقدار آستانه برای یافتن مقدارu بهینه ابزارهایی وجود دارد که شرح آن

در ادامه خواهد آمد. ابتدا باید توجه داشت که تعداد افزایش ها باالتر از یک آستانه

متغیر تصادفی است که باید آنقدر بزرگ باشد )آستانه بزرگ( تا تابع احتمال این متغیر تصادفی دارای تابع احتمال پواسون

باشد )اریب اندک(. اگر فرض اخیر محقق نگردد، آنگاه توزیع برای مقادیر باالتر از آستانه رخ نخواهد داد. G P Dحدی

از طرفی تعداد داده های باالتر از آستانه باید بقدر کافی را G P Dبزرگ باشد )آستانه کوچک( که بتوان پارامترهای تابع

برآورد نمود )واریانس اندک(. بنابراین مقدار آستانه باید به گونه ای صورت گیرد که توازنی

بین اریب و واریانس برقرار گردد. بهر روی رویکرد تعیین مقدار آستانه یک رویکرد چند جانبه است.

22

اگر X GPD(u0,,) آنگاه باشد،

رابطهE[X-u|X>u] بر حسب u خطی است و متوسط مقادیر باالتر از یک آستانه را نشان

می دهد. ابزار آزمون

برای عملی شدن آزمون اخیر باید رابطه خطیباال در حالت نمونه محاسبه نمود.

plot Mean Residual lifeآزمون

0[ | ] for1

uX u X u u u

E

1

1ˆ( ) ( )

un

iiu

e u x un

23

دنباله آزمون ... پس از محاسبه، در یک دستگاه مختصات زوج های}u,e)u(:

u<xmax { رسم کنید. قسمت خطی گراف فوق را مشخص دهای زیر توجه کنید. کنید. به عنوان مثال به ک

library(POT) data(ardieres) ardieres <- clust(ardieres, 4, 10 / 365, clust.max =

TRUE) flows <- ardieres[, "obs"] mrlplot(flows, u.range=c(4,15),lty=c(3,1,3),col =

c("red","black","red")) segments(5.8,4.7,10,4.7,lwd=2,col="blue",lty='dashed') text(10.5,3.5,"linear") arrows(9.7,3.4,8.4,4.5,angle=20,length=0.1)

24

دنباله آزمون ...

25

معیار پارامترها برای انتخاب مقدار آستانه اگر X GPD(u0,,) ،آنگاه برای کلیه مقادیر باشد

u>u0 و X|X>u برای توزیع G P D :داریم مقدار پارامتر شکل(u) مستقل از مقادیر

است.uآستانه ها مقدار پارامتر مقیاس*(u) مستقل از مقادیر

است. uآستانه ها :ابزار آزمون

.نقاط زیر را نمایش دهید

.قسمت ثابت را مشخص کنید

max max, ( ) : and , *( ) :u u u x u u u x

26

کدهای مربوط به تغییرات پارامترها بر حسب آستانه

library)POT(data)ardieres(ardieres <- clust)ardieres, 4, 10 / 365,

clust.max = TRUE(flows <- ardieres[, "obs"]par)mfrow=c)1,2((tcplot)flows, u.range = c)0, 15(, which=1 (segments)5,-0.05,15,-0.05,

lwd=2,col='red'(tcplot)flows, u.range = c)0, 15(, which=2 (segments)5,0.25,15,0.25, lwd=2,col='red'(

27

دنباله معیار پارامترها ...

28

دنباله معیار پارامترها ...

29

اندیس پراکندگی ذکر شد، متغیر شمارش تعداد M همان طور که قبال

نقاط حداکثر باالی آستانه دارای توزیع پواسون است. در این توزیع مقدار میانگین و واریانس یکسان است. بنابراین نسبت آنها برابر واحد

است. البته مقدار واحد، مقداری نظری است و مقدار نمونه ای این نسبت حول عدد واحد در

نوسان است. فاصله اطمینان این نوسان با توزیع مربع خی با

تعداد M تعریف می گردد. که M-1درجه آزادی کل سال های داده های مشاهده شده است.

فاصله اطمینان به صورت زیر تعریف می گردد.

2 2/2, 1 1 /2, 1,

1 1M M

M M

30

ابزار آزمون اندیس پراکندگی.ابتدا باید نقاط زیر را رسم نمود

library)POT(data)ardieres(ardieres <- clust)ardieres, 1.5, 10 / 365,

clust.max = TRUE(diplot)ardieres,xlim=c)1,22(,ylim=c)0.5,2.0((abline)h=1,lty=2,col='red'(

2

max

ˆ, :

ˆu

u

u u x

31

نمودار اندیس پراکندگی

32

جمع بندی تعیین مقدار آستانه library(POT) data(ardieres) events0 <- clust(ardieres, u = 1.5,

tim.cond = 8/365, clust.max = TRUE) par(mfrow = c(2, 2)) mrlplot(events0[, "obs"]) abline(v = 6, col = "green") diplot(events0) abline(v = 6, col = "green") tcplot(events0[, "obs"], which = 1) abline(v = 6, col = "green") tcplot(events0[, "obs"], which = 2) abline(v = 6, col = "green")

33

جمع بندی نمودارها

34

عدم قطعیت در مدلسازی در مدلسازی عدم قطعیت مربوط به موارد

زیر می گردد. داده های ورودی به مدل )نمونه گیری، خطای

اندازه گیری و تعداد کم داده ها بخصوص در حالت حدی(

عدم قطعیت در برآورد پارامترهای مدل عدم قطعیت در مدلسازی: ساختار مدل به

گونه ای است که ممکن است نتواند پدیده مورد نظر را مدل نماید.

35

برآورد پارامترهای مدل اگرX متغیر تصادفی با مقادیر حقیقی باشد. تابع تجمعی آن

به صورت زیر است.

در حالتی کهF یک تابع پیوسته باشد و تابع معکوس ).( نامند.X).( را تابع چندک متغیر xداشته باشد

0برای>u<1 مقدار x(u).یکتا و در رابطه زیر صدق می کند

در ادبیات محیط زیست و مهندسی چندک ها بر حسب دورهبازگشت بیان می شود.

در عمل وقتی توزیع یک پدیده مشخص شد، آنگاه با یکمجموعه ای از پارامترها روبرو هستیم.

.بنابراین تابع چندک برای پارمترها به صورت زیر است

( ) Pr[ ] 0 ( ) 1F x X x F x

( ( ))F x u u

1, p

1( ; , )px u

36

نکویی برآوردگرها .پارامترهای مجهول از روی داده ها برآورد می شوند

برای یک سری از داده ها برآوردگر تابعی از داده ها است.

برآوردگر یک متغیر تصادفی است و دارای توزیعاحتمال می باشد.

نکویی برآوردگر بستگی به این دارد که چقدر به نزدیک شده است. انحراف این از یکدیگر را

می توان به دو بخش تقسیم نمود. اریب یا سویه: میزان تمایل برآوردگر به کوچکتر و یا

بزرگتر شدن از مقدار واقعی پارامتر میزان پراکندگی: انحراف تصادفی تخمین از مقدار

واقعی حتی اگر برآوردگر سویه نداشته باشد.

37

دنباله نکویی برآوردگرها برای بیان نکویی دو شاخص سویه و واریانس

به شرح زیر فرموله می گردد. :سویه وقتی برآوردگر سویه ندارد که یعنی

باشد. اما ممکن است چند برآوردگر برای یک پارامتر

همه بدون سویه باشند. لذا برای مقایسه آنها از معیار واریانس استفاده می شود. هر چقدر

واریانس کمتر باشد، برآوردگر کاراتر (efficiency.است )

ˆ ˆbias( ) ( )E ˆbias( )=0ˆ( )E

38

روش های برآورد پارامترهای آماری در آمار روشهای مختلفی برای برآورد

پارامترها وجود دارد. که به شرح زیر است.روش گشتاورها Mehtod of Moments روش حداکثر درستنماییMethod of

Maximum Likelihood روش گشتاورهای وزنی احتمالprobability

weighted moments روش گشتاورهای خطیL-moments Method

of

39

روش گشتاورهادر این روش گشتاور مقدار مرکزی:برای گشتاورهای مرتبه باالتر داریم

انحراف معیار که پراکندگی را اندازهمی گیرد.

گشتاورهای بدون بعد مرتبه های باالتر چولگیskewness کشیدگیkurtosis

( )E x

( ) 2,3,rr E X r

1/21/2 22 ( )E X

/22/ r

r 3/2

3 2/

24 2/

40

دنباله روش گشتاورها اگر تابع معکوسu=F(x).در نظر بگیرید

یک تابع از یک متغیر تصادفی، خود یک متغیرتصادفی است و امید ریاضی آن به شکل زیر

محاسبه می شود.

1

0

( ) ( )E X x u du

1

0

[ ( )] ( ) ( ) ( ) ( ) ( ( ))E g X g x dF x g x f x dx g x u du

41

روش حداکثر درستنمایی از منظر آماری برداری از داده هاy=(y1,…,yn) یک نمونه

تصادفی است که از جامعه ی آماری نامعلوم استخراج شده است. هدف از تحلیل داده ها این است که جامعه ی مذکور

معلوم گردد. در آمار هر جامعه ای با یک توزیع احتمال مشخص می شود.

هر توزیع دارای پارامتر و یا پارامترهایی است که مقدارمنحصر به فرد دارند.

فرض کنید کهf(y|w) تابع چگالی احتمالی است که احتمال را به دست می دهد. w را به ازاء پارامتر yهر داده از بردار

طبیعی است که توزیع ها می توانند دارای بیش از یک پارامتر منظور نمود. اگر w=(w1,…,wk)باشند، بنابراین می توان

را f(y|w)داده ها از هم مستقل باشند می توان رابطه به صورت زیر نوشت:

1 1 1( ) ( , , | ) ( | ) ( | )n n nf y f y y w f y w f y w

42

دنباله روش حداکثر درستنمایی اکنون ایده فوق برای ساده ترین حالت که

n=k=1 است، بیان می گردد. فرض کنید که y آزمون برنولی را 10تعداد موفقیت ها در

نشان می دهد و احتمال پیروزی در هر آزمون را نشان w است که مقدار پارامتر 0.2برابر

می دهد. :بنابراین

:و به طور کلی می توان نوشت

1010!( | , ) (0.2) (1 0.2) 0,1, ,10

!(10 )!y yf y n w y

y y

!( | , ) (1 ) 0 1; 0,1, ,

!( )!y n yn

f y n w w w w y ny n y

43

تابع درستنمایی برای مجموعه ای از مقادیر پارامترها بعضی از داده ها

محتمل تر از داده های دیگر هستند. برای مثال در مساله قبلی y=2 محتمل تر از y=5 برای w=0.2( 0.302 در مقابل

M با داده ها روبرو هستیم، لذا با 0.026 ( است. در عمل ابتداعکس مساله مواجه خواهیم شد. یعنی به ازاء داده های

مشاهده شده و مدل مورد نظر در بین توابع چگالی احتمال به دنبال بیشترین شباهت داده ها تولید شده با داده های

.مشاهده شده هستیم .برای حل مساله معکوس از تابع درستنمایی استفاده می شود یعنی

که در آنL(w|y) نشان دهنده درستنمایی پارامتر w بر حسب داده های مشاهده شده است.

( | ) ( | )L w y f y w

44

تابع درستنمایی.اگر مثال قبلی را در نظر بگیرید

اختالف مهمی بین تابع چگالی احتمالf(y|w) وجود دارد. L(w|y)و تابع درستنمایی

7 310!( | 10, 7) ( 7 | 10, ) (1 ) 0 1

7!3!L w n y f y n w w w w

45

تابع درستنمایی

46

کدهای شکل قبل rm)list=ls)((;p=seq)0,1,.01( w <- 4 n <- 10 y=dbinom)x=w,size=n,prob=p( par)mfrow=c)1,2(( plot)p,y,typ="l", lwd=2, xlab="parameter w",

ylab="L)w|n=10,y=4(", main="", ylim=c)0,0.275(,col='blue'(

max_x <- which.max)y( text)p[max_x],max)y(+0.01,"MLE"( plot)0:10,dbinom)0:10, size=n,

prob=0.5(,type='h', xlab="x", ylab="p)y|w=0.5(", col='red'(

47

دنباله تابع درستنمایی برآورد به روشM L E می تواند موجود و یکتا

نباشد. در اینجا فرض می شود که شرط وجود برقرار است. M L Eویکتایی برای محاسبه

برای محاسبه، لگاریتم تابع درستنمایی حداکثرمی گردد. لگاریتم و خود تابع درستنمایی همنوا هستند و دارای نتایج مرتبطی می باشند. دلیل

لگاریتم گرفتن این است که حاصل ضرب به دلیل توابع حاشیه ای مستقل داده ها به

M کوچک حاصل جمع تبدیل می گردد و مقدار احتمال غالباهست و کارکردن با حاصل ضرب، همراه با اعداد

کوچک در حل مسایل عددی اشکاالتی را باعث می شود.

48

دنباله تابع درستنماییفرض کنید که تابعl n L(w|y) مشتق پذیر است، اگر

wM L E موجود باشد، باید معادله دیفرانسیل زیر برقرار باشد.

که در آنwi=wi,M L E به ازاء تمام مقادیر i=1,…,k .است در مشتق مرتبه اول ممکن است هم مقدار حداکثر و

هم مقدار حداقل حاصل شود. برای اطمینان از محاسبه l n L(w|y)حداکثر بودن مشتق مرتبه دوم

به ازاء تمام wi=wi,M L Eمی شود که باید برای مقادیر باشد.i=1,…,kمقادیر منفی

ln ( | )

i

L w y

w

49

دنباله تابع درستنمایی:مشتق مرتبه دوم عبارتست از

اکنون برای مثال به تابع درستنماییL(w|n=10,y=7) توجه کنید. اگر لگاریتم منظور گردد.

.اکنون مشتق آن محاسبه می گردد

که پس از حل معادله اخیر مقدارwM L E=0.7 .می شود

2 ln ( | )0

i

L w y

w

10!ln ( | 10, 7) ln 7 ln 3ln(1 )

7!3!L w n y w w

ln ( | 10, 7) 7 3 7 100

1 (1 )

d L w n y w

dw w w w w

50

دنباله تابع درستنمایی برای اطمینان از این که مقدار مورد نظر

حداکثر است و نه حداقل، مشتق مرتبه دوم محاسبه می شود و مقدار آن به ازاء

w=wM L E.محاسبه می گردد

در عمل، برای برآوردM L E راه حل تحلیلی دارای P D Fوجود ندارد. باالخص وقتی که

پارامترهای متعددی باشد. لذا با توجه به روش های عددی و بهینه سازی باید برآورد

انجام گردد.

2

2 2 2

ln ( | 10, 7) 7 347.62 0

(1 )

d L w n y

dw w w

51

دنباله تابع درستنمایی فرض کنید کهX یک متغیر تصادفی نرمال

مجهول است و باشد که میانگینش یک X1,X2,…,Xnواریانس آن یک است. اگر

باشد تابع درستنمایی Xنمونه تصادفی عبارتست از:

:لگاریتمش عبارتست از

2

2

( ) /2

1 1

/2( ) /2

1( ) ( )

2

1

2

i

i

n nx

Xi i

nx

L f x e

e

2( )( ) ln ( ) ln(2 )

2 2ixn

K L

52

دنباله تابع درستنمایی:مشتق مرتبه اول و دوم عبارتست از

فرض کنید کهX یک متغیر تصادفی یکنواخت پارامتر مثبت ( که در آن ,0در فاصله )

مجهولی است، باشد. بنابراین

2

2

( )

0

i i

dKx x n

d

d Kn

d

1( ) 0Xf x x

53

دنباله تابع درستنمایی تابع درستنمایی آن برای یک نمونه به اندازهn عبارت

است از:

منحنی نمایش آن به گونه ای است که شیب در هیچ جاصفر نمی شود. لذا احتیاجی به مشتق گرفتن و مساوی

صفر قرار دادن نیست. اما توجه داسته باشید که هر قدر به صفر نزدیکتر شود تابع درستنمایی از نظر مقدار

به ازاء کوچکترین مقداری که L()افزایش می یابد. پس می تواند قبول کند حداکثر می شود. واضح است که

نمی تواند کوچکتر از بزرگترین مقداری باشد که در نمونه ما رخ دهد )زیرا فرض این است که هر عضو نمونه همان

دارد(.Xتوزیعی را داردکه .بنابراین است

1( )

nL

( )ˆ nx

54

دنباله تابع درستنمایی مثال: نمونه های زیر از یک توزیع یکنواخت در

( اخذ شده است.,0)فاصله 0.5,0.6,0.1,2,0.9,1.6,0.7,0.8,1,1.5

با استفاده از روش گشتاور تخمین پارامتر اما 20.94=1.88دو برابر میانگین است.

همانطور که مشاهده می شود. نمونه با از آن بزرگتر است و در فاصله 2مقدار

(0,.قرار نمی گیرد ) با استفاده از روش حداکثر درستنمایی

است که مشکل 2 برابر تخمین پارامتر روش گشتاورها را ندارد.

55

گشتاورهای خطی این روش جانشینی برای بیان شکل توزیع احتمال

است. به لحاظ تاریخی از تغییر گشتاورهای وزنی احتمال حاصل شده است.

با تابع گشتاورهای وزنی احتمال یک متغیر تصادفی و همکاران Greenwoodتوزیع تجمعی، توسط

( به صورت کمیت های1979)

،تعریف شدند. به طور خاص، موارد ویژه ی مفیدگشتاورهای وزنی احتمال و

هستند. برای یک توزیع که تابع چندک دارد، روابط زیر رانتیجه می شود.

, , ( ) 1 ( )r sp

p r sM E X F X F X

1,0,s sM 1, ,0r rM

56

دنباله گشتاورهای خطی اگر احتمال تجاوز(Exceedance.در نظر باشد )

( اگر احتمال عدم تجاوز Non-Exceedance در )نظر باشد.

گشتاورهای وزنی احتمال و به عنوان اساسروش های برآورد پارامترهای توزیع های احتمال مورد استفاده قرار گرفته اند. با این حال تفسیر مستقیم

آنها به عنوان شاخص های مقیاس و شکل توزیع احتمال دشوار است.

1,0,

1

0

(( )(1 )1 )sp s

s s sM E x u u uF dX X

,

1

0

1, 0 ( ) ( )r rp

r r r x u u uF dM E X X

57

دنباله گشتاورهای خطی برای مثال، برآوردهایی از پارامترهای مقیاس

توزیع ها، مضاربی از یا هستند. این ترکیبات خطی از انتگرال های وزن یافته

با مجموعه ای از چند جمله ای های متعامد پدید می آیند.

ما چند جمله ای های را تعریف می کنیم و از شرایط زیر پیروی که در آنها

می کنند: یک چند جمله ای r درجه بر u حسب

است.

0 12 1 02

*(1) 1rp 1

* *

0

( ) ( ) 0r sp u p u du r s

58

دنباله گشتاورهای خطی گشتاورهای وزنیs و r توسط روابط زیر با هم

مرتبط می شوند.

گشتاور خطی که ترکیب خطی از 1990در سال گشتاورهای وزنی احتمال است، توسط هاسکینگ

معرفی شد. گشتاورهای خطی مناسب تر از گشتاورهای وزنی

احتمال هستند، زیرا به صورت مستقیم می تواند اندازه هایی مثل مقیاس و شکل توزیع احتمال را تبیین

کنند.

0

0

( 1)

( 1)

si

s ii

ri

r ii

s

i

r

i

59

دنباله گشتاورهای خطی گشتاورهای خطی بر حسب گشتاورهای

به صورت زیر معرفی و وزنی احتمال شد.

که در آن

در گشتاورهای خطی نیز مثل گشتاورهایعادی نسبت هایی معرفی می شود، که به صور

زیر است.

0 0

* *1 , ,1

r

r r k r

r

k

r

r

kk rp p

*, 2

( 1) !( 1)

! ( )!

r kr k

r k

r r k r kp

k k k r k

2

1 2

3rr r

60

دنباله گشتاورهای خطی1 ،اندازه مکان اندازه مقیاس یا پراکندگی

است.LCv گشتاورهای باالتر خطی را نشان می دهد

که نباید با نماد ضریب تغییرات اشتباه شود. 3 اندازه چولگی LCs و 4 اندازه کشیدگی

LCk.بیان می کند نسبت گشتاورهای خطی نمونه را باt و tr

نشان داده می شود که با قرار دادن برآورد r.بدست می آید

اگرr3 باشد آنگاه قدر مطلق r کمتر از واحد است.

61

دیاگرام نسبت گشتاورهای خطی

62

شرح دیاگرام نسبت گشتاورهای خطی نمودار نسبت های گشتاور خطی. توزیع های دو و سه پارامتری به

ترتیب با نقاط و خطوط نشان داده شده اند. نشانه های اختصاری به کار رفته برای توزیع های مختلف عبارتند از:

E،برای توزیع نمایی G،برای توزیع گامبل L،برای توزیع لجستیک N،برای توزیع نرمال U،برای توزیع یکنواخت GPA،برای پرتو تعمیم یافته GEV،برای مقادیر حدی تعمیم یافته GLO،برای لجستیک تعمیم یافته LN3،برای لوگ نرمال سه پارامتری PE3 3 برای پیرسون نوع.

ناحیه ی هاشور خورده شامل مقادیر ممکن است که از رابطه ی زیر به دست می آیند.

64

برحسب توزیع های PGDبرآورد پارامترهای توزیع خطی

پارامترهای این توزیع بر حسب گشتاورهایخطی به صورت زیر است.

در اینجا.نشان دهنده ی تابع گاما است ).(

1 1 Γ 1 /

2 1 2 Γ(1 ) /

3

2 1 33

1 2

4

5 1 4 10 1 3 6(1 2 )

1 2

1

0

Γ x tx t e dt

65

راجع به گشتاورهای خطی و تحلیل Rبسته های نرم افزاری منطقه ای

بستهlmom  :نویسندهJ. R. M. Hosking .این بسته شامل توابع مربوط به گشتاورهای خطی است

محاسبه ی گشتاورهای خطی توزیع ها، برآورد پارامترها، ترسیم نمودار نسبت های گشتاور خطی و ...، از جمله

امکاناتی است که این بسته برای کاربران فراهم می کند.بسته lmomco

:نویسندهWilliam H. Asquith این بسته جهت اجرای گشتاورهای خطی، شامل برآورد

گشتاورهای خطی، برآورد گشتاورهای وزنی احتمال، برآورد پارامترهای توزیع های آشنا و نه چندان آشنای

متعدد، و برآورد گشتاورهای خطی این توزیع ها از روی پارامترهای آن ها نوشته شده است.

66

راجع به Rدنباله بسته های نرم افزاری گشتاور...

بسته RFA :نویسندهMathieu Ribatet این بسته شامل چندین تابع جهت اجرای یک تحلیل فراوانی

منطقه ای است. چند نمونه داده نیز در این بسته ارائه شده است.

بسته nsRFA :نویسندهAlberto Viglione این بسته شامل مجموعه ای از ابزارهای آماری برای

کاربردهای عملی روش های تحلیل فراوانی منطقه ای در هیدرولوژی است. این بسته بیش تر با تمرکز روی روش

مقدار )سیالب( نمایه، هیدرولوگ ها را در جهت منطقه بندی مقدار نمایه، تشکیل مناطق همگن با منحنی های رشد مشابه

و برازش توابع توزیع بر منحنی های رشد منطقه ای تجربی یاری می دهد.

67

راجع به Rدنباله بسته های نرم افزاری گشتاور...

بستهlomomRFA :نویسندهJ. R. M. Hosking این بسته دارای توابعی برای تحلیل فراوانی

Wallis و Hoskingمنطقه ای منطبق با روش Regional Frequency در »)1997(

Analysis: An Approach Based on L-moments.است »

68

GPDبرآورد پارامترهای توزیع تابع درستنماییGPD.به صورت زیر است

L(,)=f(y1,…,yk|,).تابع لگاریتم درستنمایی به صورت زیر است

اگر=0باشد. آنگاه

1

( , ) log ( , )

log (1 1 / ) log(1 / )k

ii

l L

k y

1

1( ) log

k

ii

l k y

دانشگاه صنعت آب و برق 69

برآورد بطور کلی برآوردها به دو دسته تقسیم

می شوند.ای برآورد نقطهای برآورد فاصله

ای همانطور که از اسمش برآورد نقطهپیداست، نشان از یک نقطه دارد. مانند:

ها در میزان در این نوع برآورد، اثر تغییر نمونهبرآورد مشهود نیست.

.این نوع برآورد دارای احتمال متناظر نیست

X

S

m

s

;

;

دانشگاه صنعت آب و برق 70

ای برآورد فاصله برای این برآورد یک نوع فاصله در نظر

گرفته می شود.

:به عنوان مثال

1احتمال متناظر این فاصله برابر با-.است usually 90%, 95%, or 99%

( = 10%( ,) = 5%( ,) = 1%)

Lower # < population parameter < Upper#

P)Lower # < µ< Upper # (=1-α

71

MLEتکمیل و بسط بیشتر روش همان طور که مالحظه شد در حالتی که با

( curve)پارامتر مواجه بودیم و از منحنی درستنمایی صحبت شد.

اکنون اگر تعداد پارامترها بیش از یکی باشد( درستنمایی صحبت surfaceراجع به سطح )

می شود. برای تعدد پارامترها الزم است که تعاریف و

قضیه هایی را مرور نمود.

72

تعریف ماتریس واریانس-کوواریانس اگر بردارX=(X1,…Xn)T در نظر باشد. ماتریس

مذکور به شرح زیر است.

که در آنi,i=var(Xi) و i,j=cov(Xi,Xj) که ij.است اگر متغیر فوق از تابع احتمال چند متغیره نرمال

و =(1,…,n)Tپیروی کند بردار میانگین به صورت ماتریس واریانس-کوواریانس پارامتر دوم آن

است.

1,1 1,

,

,

,1 ,

n

i j

j i

n n n

( , )TX MVN

73

تابع نرمال چند متغیره تابع احتمال توام نرمال به صورت زیر تعریف

مي شود.

که در آن|-دترمینان ماتریس واریانس |کوواریانس است و هر تابع حاشیه ای آن خود

تابع نرمال می باشد. ماتریس اطالعات مورد انتظارexpected

information matrix که با IE() نشان می دهند میزان مقدار مورد انتظار سطح

لگاریتم درستنمایی را نشان می دهد.

1121/2/2

1( ) exp ( ) ( )

(2 )T n

X kf x x x x

74

(Fisher)ماتریس اطالعات مورد انتظار

1,1 1,

,

,

,1 ,

( ) ( )

( )( )

( )

( ) ( )

d

i j

Ej i

d d d

e e

eI

e

e e

2

, ( ) ( )i ji j

e E l

1

( ) log ( ) log ( ; )n

i ii

l L f x

75

(Fisher)ماتریس اطالعات مشاهده این ماتریس برای تخمین جمالت ماتریسIE

عموما مجهول است. =oبه کار می رود زیرا بنابر تعریف ماتریس مذکور عبارت است از:

برای تابع چند متغیره، معکوس ماتریساطالعات معادل ماتریس-کوواریانس است.

2 2

211

2

2

2 2

2

( ) ( )

( )( )

( )

( ) ( )

d

i j

j i

d i d

O

l l

lI

l

l l

76

فاصله اطمینان قضیه: اگرx1,…xn مقادیر محقق شده از یک توزیع

).( تابع درستنمایی و l )دارای چند پارامتر( باشد و بزرگ n باشد، آنگاه برای MLEبرآورد به روش

داریم:

با استفاده از این قضیه می توان فاصله اطمینان را )o(IE بدست آورد. اگر معکوس )o=)1,…,nبرای

بزرگ داریم:n نشان دهیم، آنگاه برای i,jبا

1اگر برای-α ،فاصله اطمینان در نظر گرفته شود داریم:

1ˆ ( , ( ) )d EMVN I

,ˆ ( , )i i i iN

2,i i iz

77

دنباله فاصله اطمینان قضیه: برای اندازه بزرگn اگر برآوردگر

با o=(1,…,d) پارامتر MLEبه روش باشد، آنگاه Vماتریس واریانس-کوواریانس

از MLE یک تابع اسکالر باشد، =g()اگر o=g(o):داریم

کهبا

شهرت دارد.روش دلتا این قضیه به

ˆ ( , )oN V

TV V

1

, ,d

78

Rکد مربوط در :برای روش دلتا داریم

library(POT) data(ardieres) ardieres <- clust(ardieres, 4, 10 / 365, clust.max =

TRUE) fitted <- fitgpd(ardieres[,"obs"], 5, 'mle') rbind(gpd.fishape(fitted),gpd.fiscale(fitted))

:نتیجه می شود که conf.inf.shape conf.sup.shape [1,] -0.01491947 0.5846731 [2,] 1.79820282 3.8749015

79

روش پروفیل درستنمایی اگر پارامتر=(1,…,n) باشد و برآورد آن به

لگاریتم تابع l(x;) باشد و فرض کنید که MLEروش درستنمایی باشد، آنگاه

بنابراین اگر یک پارامتر داشته باشیم تابع حدی21

خواهد بود. دو ویژگی را می توان برای پروفیل درستنمایی در

نظر گرفت..غالبا روش دلتا فاصله اطمینان بزرگتری را ایجاد می کند فاصله اطمینان نامتقارن است )عدم قطعیت روی کران

باال بیشتر است.(

2ˆ2 ( ; ) 2 ( ; ) nl x l x n

80

Rکدهای مربوط به set.seed(6)x <- rgpd(100, 0, 5, 0.3)mle <- fitgpd(x, 0) ic.delta <- gpd.firl(mle, p = 0.8, conf = 0.9) ic.prof <- gpd.pfrl(mle, p = 0.8, conf = 0.9, range = c(5, 15)) rbind(ic.delta, ic.prof)

.نتیجه به صورت زیر است conf.inf conf.sup ic.delta 7.326755 10.59160 ic.prof 7.474747 10.70707

81

تعریف تابع برازش توزیع پرتو عمومی fitgpd

fitgpd(data, threshold, est = "mle", corr...)data.داده های مورد نظر است :thresholdآستانه مورد نظر :estروش برآورد پارامترها : این آرگومان منطقی، ماتریس همبستگی را :

نشان می دهد.

82

confintتعریف تابع فاصله اطمینان confint(object, parm, level = 0.95, ..., range, prob,

prof = TRUE)object شی است که قرار فاصله اطمینان آن تعیین :

گردد.parm پارامتری که قرار است فاصله اطمینان برای :

آن محاسبه گردد.levelسطح فاصله اطمینان :range.دامنه است که حد باال و پایین را نشان می دهد :prob احتمال عدم تجاوز :Non-Exceedanceprof پروفیل درستنمایی که نامتقارن است. اگر مقدار :

باشد، روش دلتا اعمال می گردد.FALSEآن

83

Fisherتوابع فاصله اطمینان روش فیشر برای تعیین فاصله اطمینان پارامترshape

gpd.fishape(object, conf)object.شی است که قرار فاصله اطمینان آن تعیین گردد :confسطح اطمینان : روش فیشر برای تعیین فاصله اطمینان پارامترscale

gpd.fiscale(fitted, conf)object.شی است که قرار فاصله اطمینان آن تعیین گردد :confسطح اطمینان : روش فیشر برای تعیین فاصله اطمینان سطح دروه بازگشتreturn

level (rl) gpd.firl(fitted, prob, conf )

object.شی است که قرار فاصله اطمینان آن تعیین گردد : احتمال عدم تجاوز :Non-Exceedanceconfسطح اطمینان :

84

profile likelihoodتوابع فاصله اطمینان روش پروفیل درستنمایی برای تعیین فاصله اطمینان

shapeپارامتر gpd.pfshape(object, range, xlab, ylab, conf , nrang,

vert.lines = TRUE, ...)object شی است که قرار فاصله اطمینان آن تعیین :

گردد.range.دامنه است که حد باال و پایین را نشان می دهد :ylab,xlab نام محور طولها و نام محور عرضها را :

مشخص می کند.confسطح اطمینان :nrange.دامنه است که حد باال و پایین را نشان می دهد :vert.linesترسیم کننده خطوط عمودی :

85

profileدنباله توابع فاصله اطمینان likelihood

روش پروفیل درستنمایی برای تعیین فاصله اطمینانscaleپارامتر

gpd.pfscale(object, range, xlab, ylab, conf , nrang, vert.lines = TRUE, ...)

object شی است که قرار فاصله اطمینان آن تعیین :گردد.

range.دامنه است که حد باال و پایین را نشان می دهد :ylab,xlab نام محور طولها و نام محور عرضها را :

مشخص می کند.confسطح اطمینان :nrange.دامنه است که حد باال و پایین را نشان می دهد :vert.linesترسیم کننده خطوط عمودی :

86

profileدنباله توابع فاصله اطمینان likelihood

روش پروفیل درستنمایی برای تعیین فاصله اطمینانreturn levelپارامتر

gpd.pfsrl(object, range, xlab, ylab, conf , nrang, vert.lines = TRUE, ...)

object شی است که قرار فاصله اطمینان آن تعیین :گردد.

range.دامنه است که حد باال و پایین را نشان می دهد :ylab,xlab نام محور طولها و نام محور عرضها را :

مشخص می کند.confسطح اطمینان :nrange.دامنه است که حد باال و پایین را نشان می دهد :vert.linesترسیم کننده خطوط عمودی :

87

profile و fisherکدهای مربوط به برآورد پارامترها و فاصله اطمینان آنها به روش likelihood

library(POT) x <- rgpd(500, 0, 1, 0.25) mle <- fitgpd(x, 0, corr=T) mle$param[1:2] mle$std.err mle$exceed mle$corr par(mfrow=c(1,2)) profile_shape <- confint(mle, parm = "shape") profile_scale <- confint(mle, parm = "scale") rbind(profile_shape,profile_scale) fisher_shape <- gpd.fishape(mle) fisher_scale <- gpd.fiscale(mle) rbind(fisher_shape,fisher_scale)

89

مناسب بودن مدل برازش یافته.با سه نمودار این مطلب را مورد بررسی قرار می دهیم

نمودار احتمال-احتمال(PP-Plot)( نمودار چندک-چندکQQ-Plot)منحنی چگالی احتمال

library(POT) data(ardieres) ardieres <- clust(ardieres, 4, 10 / 365, clust.max =

TRUE) fitted <- fitgpd(ardieres[, "obs"], 6, 'mle') plot(fitted,which=1)

برای بدست آوردن نمودار دوم و سوم باید پارامترwhich=2 which=4 گردد. باالخره نمودار چهارم which=3و

90

(PP-Plot)نمودار احتمال-احتمال برای ترسیم نمودار به روش زیر عمل شده

است.

که در آنn.تعداد نمونه ها است اکنون در یک دستگاه مختصات نقاط زیر را

رسم می کنیم.

برای برازش مناسب باید نقاط حول نیمسازربع اول قرار گیرند.

( ) ( )

( ) 0.5( )

theo i i

iobs i

P x F x

rank xP x

n

( ( ), ( )) : 1, ,obs i theo iP x P x i n

91

PP-Plotنمودار

92

(QQ-Plot)نمودار چندک-چندک برای ترسیم نمودار به روش زیر عمل شده

است.

که در آنn.تعداد نمونه ها است اکنون در یک دستگاه مختصات نقاط زیر را

رسم می کنیم.

برای برازش مناسب باید نقاط حول نیمسازربع اول قرار گیرند.

( )

( ) 0.5theo i

ii

x F p

rank xp

n

( , ( )) : 1, ,i theox x i i n

93

QQ-Plotنمودار

94

library(POT)data(ardieres)

ardieres <- clust(ardieres, 4, 10 / 365, clust.max = TRUE)

fitted <- fitgpd(ardieres[, "obs"], 6, 'mle')

plot(fitted,which=4)

95

نمودار بازگشت ها مورد نظر

top related