تحلیل فراوانی سیل

95
ل ی س ی ن راوا ف ل ی ل ح ت ی ن س دو وی ن س و م ر مه1390 1

Upload: tilden

Post on 29-Jan-2016

97 views

Category:

Documents


4 download

DESCRIPTION

تحلیل فراوانی سیل. موسوی ندوشنی مهر 1390. تحلیل فراوانی. این تحلیل شامل موارد زیر است: داشتن یک سری آماری مشخص بر حسب تعریف متغیر مورد نظر یافتن یک توزیع مناسب آماری برای برازش بر سری آماری مورد نظر محاسبه دبی یا بارندگی، با دوره بازگشت. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: تحلیل فراوانی سیل

1

تحلیل فراوانی سیل

موسوی ندوشنی1390مهر

Page 2: تحلیل فراوانی سیل

2

تحلیل فراوانی:این تحلیل شامل موارد زیر است

داشتن یک سری آماری مشخص بر حسبتعریف متغیر مورد نظر

یافتن یک توزیع مناسب آماری برای برازش برسری آماری مورد نظر

محاسبه دبی یا بارندگی، با دوره بازگشت

Page 3: تحلیل فراوانی سیل

3

سری های آماری

ها به دو بخش عمده سری های آماری در دبی تقسیم می شوند:

دبی های لحظه ایسری دبی های لحظه ای حداکثر

دبی های متوسطسری دبی های متوسط حداکثر روزانهسری دبی های متوسط ماهانه روزانه2/سری دبی های متوسط ساالنه روزانه

/2

( ) ( )t d

t d

vol t f u du

/2

/2

1( ) ( )

t d

t d

ave t f u dud

Page 4: تحلیل فراوانی سیل

4

انواع دبي هاي حداكثر در هيدرولوژي

Page 5: تحلیل فراوانی سیل

5

روش ساختن سری های آماریای استفاده های لحظه برای تحلیل فراوانی سیل از داده

های می شود و در صورت عدم دسترسی به آنها از دبیمتوسط روزانه استفاده می گردد.

از تمام داده M های موجود برای ساخت سری های معموالآماری استفاده نمی شود )به استثنای سری های زمانی( و باید به روش گزینشی عمل نمود. برای این کار دو روش

موجود است. بلوک حداکثرهاB l o c k M a x i m a روش ساختن بلوک ها به این صورت است که کل داده ها به

M اندازه های یکسان شامل توده ای از داده ها می باشند. مثالنمونه های حداکثر ساالنه )سال آبی و یا سال تقویمی(

.در این روش برای هر سال یک داده حداکثر انتخاب می شودهای باالتر از یک آستانه معین استفاده از دادهPeak over

threshold )POT( در این روش برای هر سال یک یا بیش از یک داده اختیار می گردد. البته

ای اخذ نشود. در سال های بسیار خشک ممکن است داده

Page 6: تحلیل فراوانی سیل

6

های باالتر از یک آستانه استفاده از دادهمعین

Page 7: تحلیل فراوانی سیل

7

POT و AMمقایسه روش

Page 8: تحلیل فراوانی سیل

8

POTمفاهیم اولیه در روش فراترهاExceedences:

اگر سری زمانیx1,x2 را در نظر بگیرید و …, xi>u را برای x-u باشد، آنگاه uمقدار آستانه

مقادیر فراتر یافته نامند. خوشهcluster:

به گروهی از مقادیر فراتر یافته متوالی خوشهگویند.

دورهcycle length:.زمان بین دو فرود متوالی را دوره گویند

طول اجراrun length: پریودی از دوره است که مقادیر باالتر از آستانه

وجود ندارد.

Page 9: تحلیل فراوانی سیل

9

POTشکل شماتیک تعاریف اولیه روش

Page 10: تحلیل فراوانی سیل

10

مقادیر حدیتوزیعآشنایی با نظریه مقادیر حدی

در تحلیل فراوانی اگر از توزیع های کالسیک و استفاده شود، برای برآورد پارامترهایی نظیر

از تمام داده های مشاهده شده استفاده می شود و نه از داده های حدی. مقادیر مرکزی

روی برآورد پارامترها تاثیر می گذارند. اما اگر تحلیل داده های حدی مورد توجه است

لزومی به استفاده از تمام داده ها نیست و فقط از مقادیر حدی استفاده می گردد. نظریه

داده های حدی، توزیع های احتمال مورد نظر را به دست می دهد.

Page 11: تحلیل فراوانی سیل

11

توزیع مقادیر حدی فرض کنید کهX1,X2,…,Xn متغیرهای

تصادفی مستقل و دارای توزیع یکسان می باشند.Fها یک تابع توزیع Xهستند و

فرض کنید کهMn=max{X1,X2,…,Xn}.است

در اینجا باید مقدارF.برآورد گردد

1

1

[ ] [ , , ]

[ ] [ ]

[ ( )]

n n

n

n

P M x P X x X x

P X x P X x

F x

( )n n

n

M bP x G x n

a

Page 12: تحلیل فراوانی سیل

12

انواع توزیع مقادیر حدی توزیع عمومی مقادیر حدیGeneralize Extreme

Values (GEV).به صورت زیر است

.که دارای سه پارامتر است ،پارامتر مکان پارامتر مقیاس که پارامتر شکل است و رفتار انتهای نشان دهنده پراکندگی است و

توزیع را نشان می دهد. اگر=0 باشد توزیع گامبل و اگر >0 باشد توزیع فرشه و باالخره

باشد، توزیع ویبول است.<0اگر اگر<0، xG=+ باشد، آنگاه G.از طرف چپ کران دارد

اگر=0 تابع xGR.است

اگر>0، xG<+ باشد، آنگاه تابع G .دارای کران طرف چپ نیست

1/

( ) exp 1x

G x

Page 13: تحلیل فراوانی سیل

13

GEVنمودار توزیع های

Page 14: تحلیل فراوانی سیل

14

Rشبیه سازی توسط داده های توزیعGEV را می توان با نرم افزار R شبیه سازی

نمود. با توجه بهN)0,1( عدد تصادفی تولید می شود.365 تعداد.از اعداد تولید شده حداکثر آن بدست می آید برای بدست آوردن مقادیر حدی دیگر، گام های اول تا دوم صد

بار تکرار می گردد. نمونه حداکثر دارید که توزیع 100در خاتمهGEV بر آن قابل

برازش است. اکنون به کدهای آن توجه کنید.y = numeric(100)for(i in 1:100) {z = rnorm(365)y[i] = max(z)}

Page 15: تحلیل فراوانی سیل

15

Paretoتابع چگالی پرتو

فرض کنید کهX1,X2,…,Xn متغیرهای تصادفیها Xمستقل و دارای توزیع یکسان هستند و

می باشند.Fیک تابع توزیع فرض کنید کهMn=max{X1,X2,…,Xn} .است

.از رابطه فوق لگاریتم گرفته می شود

1/

( ) exp 1n xF x

1/

log ( ) 1x

n F x

Page 16: تحلیل فراوانی سیل

16

دنباله تابع ... با استفاده از بسط تیلورlog F)x(-[1-

F)x(] است و با جایگذاری در رابطه باالنتیجه می شود.

اکنون اگرX|X>u مقدار حدی را مشخص ها که بقدر کافی بزرگ باشند. uکند، برای

داریم:

1/1

1 ( ) 1x

F xn

Page 17: تحلیل فراوانی سیل

17

دنباله تابع ... اگرY=X-u باشد، به طوری که X>u ،باشد

/1آنگاه داریم:

1/

1/

1/

1 ( )1

Pr( | )1 ( )

1

1( )

1

1

u yn

X u y X uu

n

yu

y

Page 18: تحلیل فراوانی سیل

18

دنباله تابع ... که در آنuپارامتر آستانه پارامتر مقیاس پارامتر مقیاس تغییر یافته که برابر است *

با پارامتر شکل است که رفتار انتهای توزیع

را مشخص می کند. اگر<0 .باشد، مشاهده دارای کران هستند

باشد، توزیع نمایی خواهد بود. اگر =0اگر >0.باشد، توزیع دارای انتهای کشیده است

* ( )1

u

Page 19: تحلیل فراوانی سیل

19

دنباله تابع ...

Page 20: تحلیل فراوانی سیل

20

Rشبیه سازی توسط با توجه بهN)0,1( عدد تصادفی تولید 5000تعداد

می شود.داده ها به صورت نزولی مرتب می گردد100.مقدار حداکثر انتخاب می شود نمونه وجود دارد که از آستانه 100در اینجاx[101]

Generalize Paretoبزرگتر می باشند و با تابع

Distribution )GPD( برازش می یابد. اکنون بهکدهای مورد نظر توجه کنید.

x=rnorm(5000)x=sort(x,decreasing=T)y=x[1:100]

Page 21: تحلیل فراوانی سیل

21

تعیین مقدار آستانه برای یافتن مقدارu بهینه ابزارهایی وجود دارد که شرح آن

در ادامه خواهد آمد. ابتدا باید توجه داشت که تعداد افزایش ها باالتر از یک آستانه

متغیر تصادفی است که باید آنقدر بزرگ باشد )آستانه بزرگ( تا تابع احتمال این متغیر تصادفی دارای تابع احتمال پواسون

باشد )اریب اندک(. اگر فرض اخیر محقق نگردد، آنگاه توزیع برای مقادیر باالتر از آستانه رخ نخواهد داد. G P Dحدی

از طرفی تعداد داده های باالتر از آستانه باید بقدر کافی را G P Dبزرگ باشد )آستانه کوچک( که بتوان پارامترهای تابع

برآورد نمود )واریانس اندک(. بنابراین مقدار آستانه باید به گونه ای صورت گیرد که توازنی

بین اریب و واریانس برقرار گردد. بهر روی رویکرد تعیین مقدار آستانه یک رویکرد چند جانبه است.

Page 22: تحلیل فراوانی سیل

22

اگر X GPD(u0,,) آنگاه باشد،

رابطهE[X-u|X>u] بر حسب u خطی است و متوسط مقادیر باالتر از یک آستانه را نشان

می دهد. ابزار آزمون

برای عملی شدن آزمون اخیر باید رابطه خطیباال در حالت نمونه محاسبه نمود.

plot Mean Residual lifeآزمون

0[ | ] for1

uX u X u u u

E

1

1ˆ( ) ( )

un

iiu

e u x un

Page 23: تحلیل فراوانی سیل

23

دنباله آزمون ... پس از محاسبه، در یک دستگاه مختصات زوج های}u,e)u(:

u<xmax { رسم کنید. قسمت خطی گراف فوق را مشخص دهای زیر توجه کنید. کنید. به عنوان مثال به ک

library(POT) data(ardieres) ardieres <- clust(ardieres, 4, 10 / 365, clust.max =

TRUE) flows <- ardieres[, "obs"] mrlplot(flows, u.range=c(4,15),lty=c(3,1,3),col =

c("red","black","red")) segments(5.8,4.7,10,4.7,lwd=2,col="blue",lty='dashed') text(10.5,3.5,"linear") arrows(9.7,3.4,8.4,4.5,angle=20,length=0.1)

Page 24: تحلیل فراوانی سیل

24

دنباله آزمون ...

Page 25: تحلیل فراوانی سیل

25

معیار پارامترها برای انتخاب مقدار آستانه اگر X GPD(u0,,) ،آنگاه برای کلیه مقادیر باشد

u>u0 و X|X>u برای توزیع G P D :داریم مقدار پارامتر شکل(u) مستقل از مقادیر

است.uآستانه ها مقدار پارامتر مقیاس*(u) مستقل از مقادیر

است. uآستانه ها :ابزار آزمون

.نقاط زیر را نمایش دهید

.قسمت ثابت را مشخص کنید

max max, ( ) : and , *( ) :u u u x u u u x

Page 26: تحلیل فراوانی سیل

26

کدهای مربوط به تغییرات پارامترها بر حسب آستانه

library)POT(data)ardieres(ardieres <- clust)ardieres, 4, 10 / 365,

clust.max = TRUE(flows <- ardieres[, "obs"]par)mfrow=c)1,2((tcplot)flows, u.range = c)0, 15(, which=1 (segments)5,-0.05,15,-0.05,

lwd=2,col='red'(tcplot)flows, u.range = c)0, 15(, which=2 (segments)5,0.25,15,0.25, lwd=2,col='red'(

Page 27: تحلیل فراوانی سیل

27

دنباله معیار پارامترها ...

Page 28: تحلیل فراوانی سیل

28

دنباله معیار پارامترها ...

Page 29: تحلیل فراوانی سیل

29

اندیس پراکندگی ذکر شد، متغیر شمارش تعداد M همان طور که قبال

نقاط حداکثر باالی آستانه دارای توزیع پواسون است. در این توزیع مقدار میانگین و واریانس یکسان است. بنابراین نسبت آنها برابر واحد

است. البته مقدار واحد، مقداری نظری است و مقدار نمونه ای این نسبت حول عدد واحد در

نوسان است. فاصله اطمینان این نوسان با توزیع مربع خی با

تعداد M تعریف می گردد. که M-1درجه آزادی کل سال های داده های مشاهده شده است.

فاصله اطمینان به صورت زیر تعریف می گردد.

2 2/2, 1 1 /2, 1,

1 1M M

M M

Page 30: تحلیل فراوانی سیل

30

ابزار آزمون اندیس پراکندگی.ابتدا باید نقاط زیر را رسم نمود

library)POT(data)ardieres(ardieres <- clust)ardieres, 1.5, 10 / 365,

clust.max = TRUE(diplot)ardieres,xlim=c)1,22(,ylim=c)0.5,2.0((abline)h=1,lty=2,col='red'(

2

max

ˆ, :

ˆu

u

u u x

Page 31: تحلیل فراوانی سیل

31

نمودار اندیس پراکندگی

Page 32: تحلیل فراوانی سیل

32

جمع بندی تعیین مقدار آستانه library(POT) data(ardieres) events0 <- clust(ardieres, u = 1.5,

tim.cond = 8/365, clust.max = TRUE) par(mfrow = c(2, 2)) mrlplot(events0[, "obs"]) abline(v = 6, col = "green") diplot(events0) abline(v = 6, col = "green") tcplot(events0[, "obs"], which = 1) abline(v = 6, col = "green") tcplot(events0[, "obs"], which = 2) abline(v = 6, col = "green")

Page 33: تحلیل فراوانی سیل

33

جمع بندی نمودارها

Page 34: تحلیل فراوانی سیل

34

عدم قطعیت در مدلسازی در مدلسازی عدم قطعیت مربوط به موارد

زیر می گردد. داده های ورودی به مدل )نمونه گیری، خطای

اندازه گیری و تعداد کم داده ها بخصوص در حالت حدی(

عدم قطعیت در برآورد پارامترهای مدل عدم قطعیت در مدلسازی: ساختار مدل به

گونه ای است که ممکن است نتواند پدیده مورد نظر را مدل نماید.

Page 35: تحلیل فراوانی سیل

35

برآورد پارامترهای مدل اگرX متغیر تصادفی با مقادیر حقیقی باشد. تابع تجمعی آن

به صورت زیر است.

در حالتی کهF یک تابع پیوسته باشد و تابع معکوس ).( نامند.X).( را تابع چندک متغیر xداشته باشد

0برای>u<1 مقدار x(u).یکتا و در رابطه زیر صدق می کند

در ادبیات محیط زیست و مهندسی چندک ها بر حسب دورهبازگشت بیان می شود.

در عمل وقتی توزیع یک پدیده مشخص شد، آنگاه با یکمجموعه ای از پارامترها روبرو هستیم.

.بنابراین تابع چندک برای پارمترها به صورت زیر است

( ) Pr[ ] 0 ( ) 1F x X x F x

( ( ))F x u u

1, p

1( ; , )px u

Page 36: تحلیل فراوانی سیل

36

نکویی برآوردگرها .پارامترهای مجهول از روی داده ها برآورد می شوند

برای یک سری از داده ها برآوردگر تابعی از داده ها است.

برآوردگر یک متغیر تصادفی است و دارای توزیعاحتمال می باشد.

نکویی برآوردگر بستگی به این دارد که چقدر به نزدیک شده است. انحراف این از یکدیگر را

می توان به دو بخش تقسیم نمود. اریب یا سویه: میزان تمایل برآوردگر به کوچکتر و یا

بزرگتر شدن از مقدار واقعی پارامتر میزان پراکندگی: انحراف تصادفی تخمین از مقدار

واقعی حتی اگر برآوردگر سویه نداشته باشد.

Page 37: تحلیل فراوانی سیل

37

دنباله نکویی برآوردگرها برای بیان نکویی دو شاخص سویه و واریانس

به شرح زیر فرموله می گردد. :سویه وقتی برآوردگر سویه ندارد که یعنی

باشد. اما ممکن است چند برآوردگر برای یک پارامتر

همه بدون سویه باشند. لذا برای مقایسه آنها از معیار واریانس استفاده می شود. هر چقدر

واریانس کمتر باشد، برآوردگر کاراتر (efficiency.است )

ˆ ˆbias( ) ( )E ˆbias( )=0ˆ( )E

Page 38: تحلیل فراوانی سیل

38

روش های برآورد پارامترهای آماری در آمار روشهای مختلفی برای برآورد

پارامترها وجود دارد. که به شرح زیر است.روش گشتاورها Mehtod of Moments روش حداکثر درستنماییMethod of

Maximum Likelihood روش گشتاورهای وزنی احتمالprobability

weighted moments روش گشتاورهای خطیL-moments Method

of

Page 39: تحلیل فراوانی سیل

39

روش گشتاورهادر این روش گشتاور مقدار مرکزی:برای گشتاورهای مرتبه باالتر داریم

انحراف معیار که پراکندگی را اندازهمی گیرد.

گشتاورهای بدون بعد مرتبه های باالتر چولگیskewness کشیدگیkurtosis

( )E x

( ) 2,3,rr E X r

1/21/2 22 ( )E X

/22/ r

r 3/2

3 2/

24 2/

Page 40: تحلیل فراوانی سیل

40

دنباله روش گشتاورها اگر تابع معکوسu=F(x).در نظر بگیرید

یک تابع از یک متغیر تصادفی، خود یک متغیرتصادفی است و امید ریاضی آن به شکل زیر

محاسبه می شود.

1

0

( ) ( )E X x u du

1

0

[ ( )] ( ) ( ) ( ) ( ) ( ( ))E g X g x dF x g x f x dx g x u du

Page 41: تحلیل فراوانی سیل

41

روش حداکثر درستنمایی از منظر آماری برداری از داده هاy=(y1,…,yn) یک نمونه

تصادفی است که از جامعه ی آماری نامعلوم استخراج شده است. هدف از تحلیل داده ها این است که جامعه ی مذکور

معلوم گردد. در آمار هر جامعه ای با یک توزیع احتمال مشخص می شود.

هر توزیع دارای پارامتر و یا پارامترهایی است که مقدارمنحصر به فرد دارند.

فرض کنید کهf(y|w) تابع چگالی احتمالی است که احتمال را به دست می دهد. w را به ازاء پارامتر yهر داده از بردار

طبیعی است که توزیع ها می توانند دارای بیش از یک پارامتر منظور نمود. اگر w=(w1,…,wk)باشند، بنابراین می توان

را f(y|w)داده ها از هم مستقل باشند می توان رابطه به صورت زیر نوشت:

1 1 1( ) ( , , | ) ( | ) ( | )n n nf y f y y w f y w f y w

Page 42: تحلیل فراوانی سیل

42

دنباله روش حداکثر درستنمایی اکنون ایده فوق برای ساده ترین حالت که

n=k=1 است، بیان می گردد. فرض کنید که y آزمون برنولی را 10تعداد موفقیت ها در

نشان می دهد و احتمال پیروزی در هر آزمون را نشان w است که مقدار پارامتر 0.2برابر

می دهد. :بنابراین

:و به طور کلی می توان نوشت

1010!( | , ) (0.2) (1 0.2) 0,1, ,10

!(10 )!y yf y n w y

y y

!( | , ) (1 ) 0 1; 0,1, ,

!( )!y n yn

f y n w w w w y ny n y

Page 43: تحلیل فراوانی سیل

43

تابع درستنمایی برای مجموعه ای از مقادیر پارامترها بعضی از داده ها

محتمل تر از داده های دیگر هستند. برای مثال در مساله قبلی y=2 محتمل تر از y=5 برای w=0.2( 0.302 در مقابل

M با داده ها روبرو هستیم، لذا با 0.026 ( است. در عمل ابتداعکس مساله مواجه خواهیم شد. یعنی به ازاء داده های

مشاهده شده و مدل مورد نظر در بین توابع چگالی احتمال به دنبال بیشترین شباهت داده ها تولید شده با داده های

.مشاهده شده هستیم .برای حل مساله معکوس از تابع درستنمایی استفاده می شود یعنی

که در آنL(w|y) نشان دهنده درستنمایی پارامتر w بر حسب داده های مشاهده شده است.

( | ) ( | )L w y f y w

Page 44: تحلیل فراوانی سیل

44

تابع درستنمایی.اگر مثال قبلی را در نظر بگیرید

اختالف مهمی بین تابع چگالی احتمالf(y|w) وجود دارد. L(w|y)و تابع درستنمایی

7 310!( | 10, 7) ( 7 | 10, ) (1 ) 0 1

7!3!L w n y f y n w w w w

Page 45: تحلیل فراوانی سیل

45

تابع درستنمایی

Page 46: تحلیل فراوانی سیل

46

کدهای شکل قبل rm)list=ls)((;p=seq)0,1,.01( w <- 4 n <- 10 y=dbinom)x=w,size=n,prob=p( par)mfrow=c)1,2(( plot)p,y,typ="l", lwd=2, xlab="parameter w",

ylab="L)w|n=10,y=4(", main="", ylim=c)0,0.275(,col='blue'(

max_x <- which.max)y( text)p[max_x],max)y(+0.01,"MLE"( plot)0:10,dbinom)0:10, size=n,

prob=0.5(,type='h', xlab="x", ylab="p)y|w=0.5(", col='red'(

Page 47: تحلیل فراوانی سیل

47

دنباله تابع درستنمایی برآورد به روشM L E می تواند موجود و یکتا

نباشد. در اینجا فرض می شود که شرط وجود برقرار است. M L Eویکتایی برای محاسبه

برای محاسبه، لگاریتم تابع درستنمایی حداکثرمی گردد. لگاریتم و خود تابع درستنمایی همنوا هستند و دارای نتایج مرتبطی می باشند. دلیل

لگاریتم گرفتن این است که حاصل ضرب به دلیل توابع حاشیه ای مستقل داده ها به

M کوچک حاصل جمع تبدیل می گردد و مقدار احتمال غالباهست و کارکردن با حاصل ضرب، همراه با اعداد

کوچک در حل مسایل عددی اشکاالتی را باعث می شود.

Page 48: تحلیل فراوانی سیل

48

دنباله تابع درستنماییفرض کنید که تابعl n L(w|y) مشتق پذیر است، اگر

wM L E موجود باشد، باید معادله دیفرانسیل زیر برقرار باشد.

که در آنwi=wi,M L E به ازاء تمام مقادیر i=1,…,k .است در مشتق مرتبه اول ممکن است هم مقدار حداکثر و

هم مقدار حداقل حاصل شود. برای اطمینان از محاسبه l n L(w|y)حداکثر بودن مشتق مرتبه دوم

به ازاء تمام wi=wi,M L Eمی شود که باید برای مقادیر باشد.i=1,…,kمقادیر منفی

ln ( | )

i

L w y

w

Page 49: تحلیل فراوانی سیل

49

دنباله تابع درستنمایی:مشتق مرتبه دوم عبارتست از

اکنون برای مثال به تابع درستنماییL(w|n=10,y=7) توجه کنید. اگر لگاریتم منظور گردد.

.اکنون مشتق آن محاسبه می گردد

که پس از حل معادله اخیر مقدارwM L E=0.7 .می شود

2 ln ( | )0

i

L w y

w

10!ln ( | 10, 7) ln 7 ln 3ln(1 )

7!3!L w n y w w

ln ( | 10, 7) 7 3 7 100

1 (1 )

d L w n y w

dw w w w w

Page 50: تحلیل فراوانی سیل

50

دنباله تابع درستنمایی برای اطمینان از این که مقدار مورد نظر

حداکثر است و نه حداقل، مشتق مرتبه دوم محاسبه می شود و مقدار آن به ازاء

w=wM L E.محاسبه می گردد

در عمل، برای برآوردM L E راه حل تحلیلی دارای P D Fوجود ندارد. باالخص وقتی که

پارامترهای متعددی باشد. لذا با توجه به روش های عددی و بهینه سازی باید برآورد

انجام گردد.

2

2 2 2

ln ( | 10, 7) 7 347.62 0

(1 )

d L w n y

dw w w

Page 51: تحلیل فراوانی سیل

51

دنباله تابع درستنمایی فرض کنید کهX یک متغیر تصادفی نرمال

مجهول است و باشد که میانگینش یک X1,X2,…,Xnواریانس آن یک است. اگر

باشد تابع درستنمایی Xنمونه تصادفی عبارتست از:

:لگاریتمش عبارتست از

2

2

( ) /2

1 1

/2( ) /2

1( ) ( )

2

1

2

i

i

n nx

Xi i

nx

L f x e

e

2( )( ) ln ( ) ln(2 )

2 2ixn

K L

Page 52: تحلیل فراوانی سیل

52

دنباله تابع درستنمایی:مشتق مرتبه اول و دوم عبارتست از

فرض کنید کهX یک متغیر تصادفی یکنواخت پارامتر مثبت ( که در آن ,0در فاصله )

مجهولی است، باشد. بنابراین

2

2

( )

0

i i

dKx x n

d

d Kn

d

1( ) 0Xf x x

Page 53: تحلیل فراوانی سیل

53

دنباله تابع درستنمایی تابع درستنمایی آن برای یک نمونه به اندازهn عبارت

است از:

منحنی نمایش آن به گونه ای است که شیب در هیچ جاصفر نمی شود. لذا احتیاجی به مشتق گرفتن و مساوی

صفر قرار دادن نیست. اما توجه داسته باشید که هر قدر به صفر نزدیکتر شود تابع درستنمایی از نظر مقدار

به ازاء کوچکترین مقداری که L()افزایش می یابد. پس می تواند قبول کند حداکثر می شود. واضح است که

نمی تواند کوچکتر از بزرگترین مقداری باشد که در نمونه ما رخ دهد )زیرا فرض این است که هر عضو نمونه همان

دارد(.Xتوزیعی را داردکه .بنابراین است

1( )

nL

( )ˆ nx

Page 54: تحلیل فراوانی سیل

54

دنباله تابع درستنمایی مثال: نمونه های زیر از یک توزیع یکنواخت در

( اخذ شده است.,0)فاصله 0.5,0.6,0.1,2,0.9,1.6,0.7,0.8,1,1.5

با استفاده از روش گشتاور تخمین پارامتر اما 20.94=1.88دو برابر میانگین است.

همانطور که مشاهده می شود. نمونه با از آن بزرگتر است و در فاصله 2مقدار

(0,.قرار نمی گیرد ) با استفاده از روش حداکثر درستنمایی

است که مشکل 2 برابر تخمین پارامتر روش گشتاورها را ندارد.

Page 55: تحلیل فراوانی سیل

55

گشتاورهای خطی این روش جانشینی برای بیان شکل توزیع احتمال

است. به لحاظ تاریخی از تغییر گشتاورهای وزنی احتمال حاصل شده است.

با تابع گشتاورهای وزنی احتمال یک متغیر تصادفی و همکاران Greenwoodتوزیع تجمعی، توسط

( به صورت کمیت های1979)

،تعریف شدند. به طور خاص، موارد ویژه ی مفیدگشتاورهای وزنی احتمال و

هستند. برای یک توزیع که تابع چندک دارد، روابط زیر رانتیجه می شود.

, , ( ) 1 ( )r sp

p r sM E X F X F X

1,0,s sM 1, ,0r rM

Page 56: تحلیل فراوانی سیل

56

دنباله گشتاورهای خطی اگر احتمال تجاوز(Exceedance.در نظر باشد )

( اگر احتمال عدم تجاوز Non-Exceedance در )نظر باشد.

گشتاورهای وزنی احتمال و به عنوان اساسروش های برآورد پارامترهای توزیع های احتمال مورد استفاده قرار گرفته اند. با این حال تفسیر مستقیم

آنها به عنوان شاخص های مقیاس و شکل توزیع احتمال دشوار است.

1,0,

1

0

(( )(1 )1 )sp s

s s sM E x u u uF dX X

,

1

0

1, 0 ( ) ( )r rp

r r r x u u uF dM E X X

Page 57: تحلیل فراوانی سیل

57

دنباله گشتاورهای خطی برای مثال، برآوردهایی از پارامترهای مقیاس

توزیع ها، مضاربی از یا هستند. این ترکیبات خطی از انتگرال های وزن یافته

با مجموعه ای از چند جمله ای های متعامد پدید می آیند.

ما چند جمله ای های را تعریف می کنیم و از شرایط زیر پیروی که در آنها

می کنند: یک چند جمله ای r درجه بر u حسب

است.

0 12 1 02

*(1) 1rp 1

* *

0

( ) ( ) 0r sp u p u du r s

Page 58: تحلیل فراوانی سیل

58

دنباله گشتاورهای خطی گشتاورهای وزنیs و r توسط روابط زیر با هم

مرتبط می شوند.

گشتاور خطی که ترکیب خطی از 1990در سال گشتاورهای وزنی احتمال است، توسط هاسکینگ

معرفی شد. گشتاورهای خطی مناسب تر از گشتاورهای وزنی

احتمال هستند، زیرا به صورت مستقیم می تواند اندازه هایی مثل مقیاس و شکل توزیع احتمال را تبیین

کنند.

0

0

( 1)

( 1)

si

s ii

ri

r ii

s

i

r

i

Page 59: تحلیل فراوانی سیل

59

دنباله گشتاورهای خطی گشتاورهای خطی بر حسب گشتاورهای

به صورت زیر معرفی و وزنی احتمال شد.

که در آن

در گشتاورهای خطی نیز مثل گشتاورهایعادی نسبت هایی معرفی می شود، که به صور

زیر است.

0 0

* *1 , ,1

r

r r k r

r

k

r

r

kk rp p

*, 2

( 1) !( 1)

! ( )!

r kr k

r k

r r k r kp

k k k r k

2

1 2

3rr r

Page 60: تحلیل فراوانی سیل

60

دنباله گشتاورهای خطی1 ،اندازه مکان اندازه مقیاس یا پراکندگی

است.LCv گشتاورهای باالتر خطی را نشان می دهد

که نباید با نماد ضریب تغییرات اشتباه شود. 3 اندازه چولگی LCs و 4 اندازه کشیدگی

LCk.بیان می کند نسبت گشتاورهای خطی نمونه را باt و tr

نشان داده می شود که با قرار دادن برآورد r.بدست می آید

اگرr3 باشد آنگاه قدر مطلق r کمتر از واحد است.

Page 61: تحلیل فراوانی سیل

61

دیاگرام نسبت گشتاورهای خطی

Page 62: تحلیل فراوانی سیل

62

شرح دیاگرام نسبت گشتاورهای خطی نمودار نسبت های گشتاور خطی. توزیع های دو و سه پارامتری به

ترتیب با نقاط و خطوط نشان داده شده اند. نشانه های اختصاری به کار رفته برای توزیع های مختلف عبارتند از:

E،برای توزیع نمایی G،برای توزیع گامبل L،برای توزیع لجستیک N،برای توزیع نرمال U،برای توزیع یکنواخت GPA،برای پرتو تعمیم یافته GEV،برای مقادیر حدی تعمیم یافته GLO،برای لجستیک تعمیم یافته LN3،برای لوگ نرمال سه پارامتری PE3 3 برای پیرسون نوع.

ناحیه ی هاشور خورده شامل مقادیر ممکن است که از رابطه ی زیر به دست می آیند.

Page 63: تحلیل فراوانی سیل
Page 64: تحلیل فراوانی سیل

64

برحسب توزیع های PGDبرآورد پارامترهای توزیع خطی

پارامترهای این توزیع بر حسب گشتاورهایخطی به صورت زیر است.

در اینجا.نشان دهنده ی تابع گاما است ).(

1 1 Γ 1 /

2 1 2 Γ(1 ) /

3

2 1 33

1 2

4

5 1 4 10 1 3 6(1 2 )

1 2

1

0

Γ x tx t e dt

Page 65: تحلیل فراوانی سیل

65

راجع به گشتاورهای خطی و تحلیل Rبسته های نرم افزاری منطقه ای

بستهlmom  :نویسندهJ. R. M. Hosking .این بسته شامل توابع مربوط به گشتاورهای خطی است

محاسبه ی گشتاورهای خطی توزیع ها، برآورد پارامترها، ترسیم نمودار نسبت های گشتاور خطی و ...، از جمله

امکاناتی است که این بسته برای کاربران فراهم می کند.بسته lmomco

:نویسندهWilliam H. Asquith این بسته جهت اجرای گشتاورهای خطی، شامل برآورد

گشتاورهای خطی، برآورد گشتاورهای وزنی احتمال، برآورد پارامترهای توزیع های آشنا و نه چندان آشنای

متعدد، و برآورد گشتاورهای خطی این توزیع ها از روی پارامترهای آن ها نوشته شده است.

Page 66: تحلیل فراوانی سیل

66

راجع به Rدنباله بسته های نرم افزاری گشتاور...

بسته RFA :نویسندهMathieu Ribatet این بسته شامل چندین تابع جهت اجرای یک تحلیل فراوانی

منطقه ای است. چند نمونه داده نیز در این بسته ارائه شده است.

بسته nsRFA :نویسندهAlberto Viglione این بسته شامل مجموعه ای از ابزارهای آماری برای

کاربردهای عملی روش های تحلیل فراوانی منطقه ای در هیدرولوژی است. این بسته بیش تر با تمرکز روی روش

مقدار )سیالب( نمایه، هیدرولوگ ها را در جهت منطقه بندی مقدار نمایه، تشکیل مناطق همگن با منحنی های رشد مشابه

و برازش توابع توزیع بر منحنی های رشد منطقه ای تجربی یاری می دهد.

Page 67: تحلیل فراوانی سیل

67

راجع به Rدنباله بسته های نرم افزاری گشتاور...

بستهlomomRFA :نویسندهJ. R. M. Hosking این بسته دارای توابعی برای تحلیل فراوانی

Wallis و Hoskingمنطقه ای منطبق با روش Regional Frequency در »)1997(

Analysis: An Approach Based on L-moments.است »

Page 68: تحلیل فراوانی سیل

68

GPDبرآورد پارامترهای توزیع تابع درستنماییGPD.به صورت زیر است

L(,)=f(y1,…,yk|,).تابع لگاریتم درستنمایی به صورت زیر است

اگر=0باشد. آنگاه

1

( , ) log ( , )

log (1 1 / ) log(1 / )k

ii

l L

k y

1

1( ) log

k

ii

l k y

Page 69: تحلیل فراوانی سیل

دانشگاه صنعت آب و برق 69

برآورد بطور کلی برآوردها به دو دسته تقسیم

می شوند.ای برآورد نقطهای برآورد فاصله

ای همانطور که از اسمش برآورد نقطهپیداست، نشان از یک نقطه دارد. مانند:

ها در میزان در این نوع برآورد، اثر تغییر نمونهبرآورد مشهود نیست.

.این نوع برآورد دارای احتمال متناظر نیست

X

S

m

s

;

;

Page 70: تحلیل فراوانی سیل

دانشگاه صنعت آب و برق 70

ای برآورد فاصله برای این برآورد یک نوع فاصله در نظر

گرفته می شود.

:به عنوان مثال

1احتمال متناظر این فاصله برابر با-.است usually 90%, 95%, or 99%

( = 10%( ,) = 5%( ,) = 1%)

Lower # < population parameter < Upper#

P)Lower # < µ< Upper # (=1-α

Page 71: تحلیل فراوانی سیل

71

MLEتکمیل و بسط بیشتر روش همان طور که مالحظه شد در حالتی که با

( curve)پارامتر مواجه بودیم و از منحنی درستنمایی صحبت شد.

اکنون اگر تعداد پارامترها بیش از یکی باشد( درستنمایی صحبت surfaceراجع به سطح )

می شود. برای تعدد پارامترها الزم است که تعاریف و

قضیه هایی را مرور نمود.

Page 72: تحلیل فراوانی سیل

72

تعریف ماتریس واریانس-کوواریانس اگر بردارX=(X1,…Xn)T در نظر باشد. ماتریس

مذکور به شرح زیر است.

که در آنi,i=var(Xi) و i,j=cov(Xi,Xj) که ij.است اگر متغیر فوق از تابع احتمال چند متغیره نرمال

و =(1,…,n)Tپیروی کند بردار میانگین به صورت ماتریس واریانس-کوواریانس پارامتر دوم آن

است.

1,1 1,

,

,

,1 ,

n

i j

j i

n n n

( , )TX MVN

Page 73: تحلیل فراوانی سیل

73

تابع نرمال چند متغیره تابع احتمال توام نرمال به صورت زیر تعریف

مي شود.

که در آن|-دترمینان ماتریس واریانس |کوواریانس است و هر تابع حاشیه ای آن خود

تابع نرمال می باشد. ماتریس اطالعات مورد انتظارexpected

information matrix که با IE() نشان می دهند میزان مقدار مورد انتظار سطح

لگاریتم درستنمایی را نشان می دهد.

1121/2/2

1( ) exp ( ) ( )

(2 )T n

X kf x x x x

Page 74: تحلیل فراوانی سیل

74

(Fisher)ماتریس اطالعات مورد انتظار

1,1 1,

,

,

,1 ,

( ) ( )

( )( )

( )

( ) ( )

d

i j

Ej i

d d d

e e

eI

e

e e

2

, ( ) ( )i ji j

e E l

1

( ) log ( ) log ( ; )n

i ii

l L f x

Page 75: تحلیل فراوانی سیل

75

(Fisher)ماتریس اطالعات مشاهده این ماتریس برای تخمین جمالت ماتریسIE

عموما مجهول است. =oبه کار می رود زیرا بنابر تعریف ماتریس مذکور عبارت است از:

برای تابع چند متغیره، معکوس ماتریساطالعات معادل ماتریس-کوواریانس است.

2 2

211

2

2

2 2

2

( ) ( )

( )( )

( )

( ) ( )

d

i j

j i

d i d

O

l l

lI

l

l l

Page 76: تحلیل فراوانی سیل

76

فاصله اطمینان قضیه: اگرx1,…xn مقادیر محقق شده از یک توزیع

).( تابع درستنمایی و l )دارای چند پارامتر( باشد و بزرگ n باشد، آنگاه برای MLEبرآورد به روش

داریم:

با استفاده از این قضیه می توان فاصله اطمینان را )o(IE بدست آورد. اگر معکوس )o=)1,…,nبرای

بزرگ داریم:n نشان دهیم، آنگاه برای i,jبا

1اگر برای-α ،فاصله اطمینان در نظر گرفته شود داریم:

1ˆ ( , ( ) )d EMVN I

,ˆ ( , )i i i iN

2,i i iz

Page 77: تحلیل فراوانی سیل

77

دنباله فاصله اطمینان قضیه: برای اندازه بزرگn اگر برآوردگر

با o=(1,…,d) پارامتر MLEبه روش باشد، آنگاه Vماتریس واریانس-کوواریانس

از MLE یک تابع اسکالر باشد، =g()اگر o=g(o):داریم

کهبا

شهرت دارد.روش دلتا این قضیه به

ˆ ( , )oN V

TV V

1

, ,d

Page 78: تحلیل فراوانی سیل

78

Rکد مربوط در :برای روش دلتا داریم

library(POT) data(ardieres) ardieres <- clust(ardieres, 4, 10 / 365, clust.max =

TRUE) fitted <- fitgpd(ardieres[,"obs"], 5, 'mle') rbind(gpd.fishape(fitted),gpd.fiscale(fitted))

:نتیجه می شود که conf.inf.shape conf.sup.shape [1,] -0.01491947 0.5846731 [2,] 1.79820282 3.8749015

Page 79: تحلیل فراوانی سیل

79

روش پروفیل درستنمایی اگر پارامتر=(1,…,n) باشد و برآورد آن به

لگاریتم تابع l(x;) باشد و فرض کنید که MLEروش درستنمایی باشد، آنگاه

بنابراین اگر یک پارامتر داشته باشیم تابع حدی21

خواهد بود. دو ویژگی را می توان برای پروفیل درستنمایی در

نظر گرفت..غالبا روش دلتا فاصله اطمینان بزرگتری را ایجاد می کند فاصله اطمینان نامتقارن است )عدم قطعیت روی کران

باال بیشتر است.(

2ˆ2 ( ; ) 2 ( ; ) nl x l x n

Page 80: تحلیل فراوانی سیل

80

Rکدهای مربوط به set.seed(6)x <- rgpd(100, 0, 5, 0.3)mle <- fitgpd(x, 0) ic.delta <- gpd.firl(mle, p = 0.8, conf = 0.9) ic.prof <- gpd.pfrl(mle, p = 0.8, conf = 0.9, range = c(5, 15)) rbind(ic.delta, ic.prof)

.نتیجه به صورت زیر است conf.inf conf.sup ic.delta 7.326755 10.59160 ic.prof 7.474747 10.70707

Page 81: تحلیل فراوانی سیل

81

تعریف تابع برازش توزیع پرتو عمومی fitgpd

fitgpd(data, threshold, est = "mle", corr...)data.داده های مورد نظر است :thresholdآستانه مورد نظر :estروش برآورد پارامترها : این آرگومان منطقی، ماتریس همبستگی را :

نشان می دهد.

Page 82: تحلیل فراوانی سیل

82

confintتعریف تابع فاصله اطمینان confint(object, parm, level = 0.95, ..., range, prob,

prof = TRUE)object شی است که قرار فاصله اطمینان آن تعیین :

گردد.parm پارامتری که قرار است فاصله اطمینان برای :

آن محاسبه گردد.levelسطح فاصله اطمینان :range.دامنه است که حد باال و پایین را نشان می دهد :prob احتمال عدم تجاوز :Non-Exceedanceprof پروفیل درستنمایی که نامتقارن است. اگر مقدار :

باشد، روش دلتا اعمال می گردد.FALSEآن

Page 83: تحلیل فراوانی سیل

83

Fisherتوابع فاصله اطمینان روش فیشر برای تعیین فاصله اطمینان پارامترshape

gpd.fishape(object, conf)object.شی است که قرار فاصله اطمینان آن تعیین گردد :confسطح اطمینان : روش فیشر برای تعیین فاصله اطمینان پارامترscale

gpd.fiscale(fitted, conf)object.شی است که قرار فاصله اطمینان آن تعیین گردد :confسطح اطمینان : روش فیشر برای تعیین فاصله اطمینان سطح دروه بازگشتreturn

level (rl) gpd.firl(fitted, prob, conf )

object.شی است که قرار فاصله اطمینان آن تعیین گردد : احتمال عدم تجاوز :Non-Exceedanceconfسطح اطمینان :

Page 84: تحلیل فراوانی سیل

84

profile likelihoodتوابع فاصله اطمینان روش پروفیل درستنمایی برای تعیین فاصله اطمینان

shapeپارامتر gpd.pfshape(object, range, xlab, ylab, conf , nrang,

vert.lines = TRUE, ...)object شی است که قرار فاصله اطمینان آن تعیین :

گردد.range.دامنه است که حد باال و پایین را نشان می دهد :ylab,xlab نام محور طولها و نام محور عرضها را :

مشخص می کند.confسطح اطمینان :nrange.دامنه است که حد باال و پایین را نشان می دهد :vert.linesترسیم کننده خطوط عمودی :

Page 85: تحلیل فراوانی سیل

85

profileدنباله توابع فاصله اطمینان likelihood

روش پروفیل درستنمایی برای تعیین فاصله اطمینانscaleپارامتر

gpd.pfscale(object, range, xlab, ylab, conf , nrang, vert.lines = TRUE, ...)

object شی است که قرار فاصله اطمینان آن تعیین :گردد.

range.دامنه است که حد باال و پایین را نشان می دهد :ylab,xlab نام محور طولها و نام محور عرضها را :

مشخص می کند.confسطح اطمینان :nrange.دامنه است که حد باال و پایین را نشان می دهد :vert.linesترسیم کننده خطوط عمودی :

Page 86: تحلیل فراوانی سیل

86

profileدنباله توابع فاصله اطمینان likelihood

روش پروفیل درستنمایی برای تعیین فاصله اطمینانreturn levelپارامتر

gpd.pfsrl(object, range, xlab, ylab, conf , nrang, vert.lines = TRUE, ...)

object شی است که قرار فاصله اطمینان آن تعیین :گردد.

range.دامنه است که حد باال و پایین را نشان می دهد :ylab,xlab نام محور طولها و نام محور عرضها را :

مشخص می کند.confسطح اطمینان :nrange.دامنه است که حد باال و پایین را نشان می دهد :vert.linesترسیم کننده خطوط عمودی :

Page 87: تحلیل فراوانی سیل

87

profile و fisherکدهای مربوط به برآورد پارامترها و فاصله اطمینان آنها به روش likelihood

library(POT) x <- rgpd(500, 0, 1, 0.25) mle <- fitgpd(x, 0, corr=T) mle$param[1:2] mle$std.err mle$exceed mle$corr par(mfrow=c(1,2)) profile_shape <- confint(mle, parm = "shape") profile_scale <- confint(mle, parm = "scale") rbind(profile_shape,profile_scale) fisher_shape <- gpd.fishape(mle) fisher_scale <- gpd.fiscale(mle) rbind(fisher_shape,fisher_scale)

Page 88: تحلیل فراوانی سیل
Page 89: تحلیل فراوانی سیل

89

مناسب بودن مدل برازش یافته.با سه نمودار این مطلب را مورد بررسی قرار می دهیم

نمودار احتمال-احتمال(PP-Plot)( نمودار چندک-چندکQQ-Plot)منحنی چگالی احتمال

library(POT) data(ardieres) ardieres <- clust(ardieres, 4, 10 / 365, clust.max =

TRUE) fitted <- fitgpd(ardieres[, "obs"], 6, 'mle') plot(fitted,which=1)

برای بدست آوردن نمودار دوم و سوم باید پارامترwhich=2 which=4 گردد. باالخره نمودار چهارم which=3و

Page 90: تحلیل فراوانی سیل

90

(PP-Plot)نمودار احتمال-احتمال برای ترسیم نمودار به روش زیر عمل شده

است.

که در آنn.تعداد نمونه ها است اکنون در یک دستگاه مختصات نقاط زیر را

رسم می کنیم.

برای برازش مناسب باید نقاط حول نیمسازربع اول قرار گیرند.

( ) ( )

( ) 0.5( )

theo i i

iobs i

P x F x

rank xP x

n

( ( ), ( )) : 1, ,obs i theo iP x P x i n

Page 91: تحلیل فراوانی سیل

91

PP-Plotنمودار

Page 92: تحلیل فراوانی سیل

92

(QQ-Plot)نمودار چندک-چندک برای ترسیم نمودار به روش زیر عمل شده

است.

که در آنn.تعداد نمونه ها است اکنون در یک دستگاه مختصات نقاط زیر را

رسم می کنیم.

برای برازش مناسب باید نقاط حول نیمسازربع اول قرار گیرند.

( )

( ) 0.5theo i

ii

x F p

rank xp

n

( , ( )) : 1, ,i theox x i i n

Page 93: تحلیل فراوانی سیل

93

QQ-Plotنمودار

Page 94: تحلیل فراوانی سیل

94

library(POT)data(ardieres)

ardieres <- clust(ardieres, 4, 10 / 365, clust.max = TRUE)

fitted <- fitgpd(ardieres[, "obs"], 6, 'mle')

plot(fitted,which=4)

Page 95: تحلیل فراوانی سیل

95

نمودار بازگشت ها مورد نظر