İstatistik ve olasılıkmuhserv.atauni.edu.tr/makine/ikaymaz/istatistik/lecture...atatürk...
Post on 26-Jan-2020
5 Views
Preview:
TRANSCRIPT
Atatürk Üniversitesi
Anakütle Dağılımları
Prof. Dr. İrfan KAYMAZ
İstatistik ve OlasılıkDers 5: Rastgele Değişkenlerin
Dağılımları II
Atatürk Üniversitesi
Anakütle DağılımlarıSık Kullanılan Dağılımlar
Kesikli Anakütle Dağılımları Sürekli Anakütle Dağılımları
Kesikli düzgün dağılım
Bernoulli dağılımı
Binom dağılımı
Poisson dağılımı
Hipergeometrik dağılım
Negatif binom dağılımı
....................
....................
Sürekli düzgün dağılım
Normal dağılım
Üstel dağılım
Lognormal dağılım
Gamma dağılımı
Ki-kare dağılımı
....................
....................
Frekans tablolarına dayalı histogram ve frekans poligonları, verilerindağılımı hakkında genel bilgiler vermektedir.Yapılan araştırmalardan elde edilen verilere ait dağılımın şeklinin vedağılım fonksiyonunun ampirik olarak belirlenmesi kolay değildir.Bu nedenle, verilerin özelliklerine göre uygunluk gösterecekleri bazıanakütle dağılımları teorik olarak geliştirilmiştir.
Bazı önemli anakütle dağılımları:
Atatürk Üniversitesi
Anakütle DağılımlarıBinom Dağılımı
Kesikli dağılımların en yaygın kullanılanıdır.
Atılan bir paranın yazı veya tura gelmesi,
Montajdaki parçanın toleransa uygunluğu ve uygunsuzluğu
öğrencinin bir dersten başarılı veya başarısız olması
gibi iki sonuçlu olayların olasılığının hesaplanmasında kullanılır.
Binom dağılımına uyması için aşağıdaki şartları sağlaması gerekir:
Deneme belirli sayıda (n) tekrarlanır.
Her deneyin başarılı ve başarısız olmak üzere iki sonucu vardır.
Deneyler birbirinden bağımsızdır.
Başarı olasılığı (p) ve başarısızlık olasılığı q=1-p dir.
n deneyde elde edilen başarılı sonuçlar x değişkenine atanır.
Atatürk Üniversitesi
Anakütle DağılımlarıBinom Dağılımı
Binom dağılımın olasılık fonksiyonu:
Binom dağılımının ortalaması ve varyansı ise aşağıdaki formüllerle hesaplanır.
Atatürk Üniversitesi
Anakütle Dağılımları
Örnek 1:a)10 yazı/tura atmada 4 yazı gelme olasılığını hesaplayınızb)Bir zarın 20 kez atılması durumunda tam 12 kez altı gelme olasılığını hesaplayınız.
Örnek 1 ÇÖZÜM:
Binom Dağılımı
a) Binom dağılımın uygun olduğu rastgele olaylarda başarılı ve başarısız olarak iki durumun olduğu olaylarla ilgilenildiğinden:başarılı: yazı gelmesi (p=0.5)başarısız: yazı gelmemesi (q=0.5)Olarak tanımlama yapılabilir. n=10;X=4 olduğundan istenilen olasılık:
Atatürk Üniversitesi
Anakütle Dağılımları
Örnek 1 ÇÖZÜM:
Binom Dağılımı
b) başarılı: 6 gelmesi (p=1/6)başarısız: yazı gelmemesi (q=5/6)Olarak tanımlama yapılabilir. n=20;X=12 olduğundan istenilen olasılık:
Atatürk Üniversitesi
Anakütle DağılımlarıPoisson Dağılımı
İlgilenilen zaman aralığı, uzunluk veya hacimde sık sık karşılaşılmayan olayların özel durumları için geliştirilen dağılımdır.
Örneğin:belirli bir trafik noktasında meydana gelen trafik kazası sayısı, 1 m2 kumaştaki kusur sayısı, 1 cm3 kandaki anormal hücre sayısı,......vb sayılabilir.
2np olarak ifade edildiğinden dağılımın tek parametresi olduğu
söylenebilir.
Poisson dağılımının olasılık fonksiyonu aşağıda verilmiştir.
Atatürk Üniversitesi
Anakütle DağılımlarıPoisson Dağılımı
Örnek 2:Bir sınıftaki öğrenciler üzerine yapılan bir araştırmada dersi dinlemeyen öğrenci sayısının ortalama olarak 3 kişi olduğu belirlenmiştir. Herhangi bir derste;a) En az bir kişinin dersi dinlememesi olasılığını hesaplayınız.b) En fazla iki kişinin dersi dinlememesi olasılığını hesaplayınız
Örnek 2 Çözüm:Dersi dinlememek nadiren karşılaşılan bir olay! olduğu için poisson dağılımı kullanılmalıdır. olup bu olaya ait poisson olasılık fonksiyonu : np 3
P Xe
X
X
( )!
.
33
Atatürk Üniversitesi
Anakütle DağılımlarıSürekli Rastgele Değişken Dağılım
Sürekli Anakütle Dağılımları
Sürekli düzgün dağılım
Normal dağılım
Üstel dağılım
Lognormal dağılım
Gamma dağılımı
Ki-kare dağılımı
....................
....................
En sık kullanılan sürekli rastgele değişkenlere ait Anakütle Dağılımları
Atatürk Üniversitesi
Anakütle DağılımlarıDüzgün (Üniform) Dağılım
X sürekli rastgele değişken belirli bir aralıktaki her değerinin meydana gelme olasılığı eşit ise bu rastgele değişkenin dağılım düzgün (Ünifrom) dağılımdır.
Ünifrom dağılıma ait olasılık fonksiyonu:
Atatürk Üniversitesi
Anakütle DağılımlarıDüzgün (Üniform) Dağılım
Örnek 3 :Süper marketteki kasaya 30 dakikalık periyotta bir müşteri gelmiştir. Bu müşterinin son 5 dakikada gelmiş olma ihtimalini hesaplayınız.
Örnek 3 ÇÖZÜM :
Olasılık yoğunluk fonksiyonu:
Atatürk Üniversitesi
Anakütle DağılımlarıDüzgün (Üniform) Dağılım
ÜNİFORM DAĞILIM İLE İLGİLİ MATLAB KOMUTLARI
[a, b] aralığında üniform dağılmış rasgele değişkenin bu aralık içerindeki herhangi bir x değerini alma ihtimali unifcdf komutu ile hesaplanır.
Örneğin bir önceki örnek aşağıda verilen MATLAB komutu yardımıyla kolaylıkla hesaplanabilir:
prob=unifcdf(5,0,30)
Atatürk Üniversitesi
Anakütle DağılımlarıNormal Dağılım
Sürekli olasılık dağılımlarının en önemlisi ve en çok kullanılanı normal dağılımdır. Normal dağılıma, bu dağılımı geliştiren kişilerin isimlerine atfen
Gauss-Laplace dağılımı,
Eğrinin biçimine izafeten de çan eğrisi de denilmektedir.
Evrendeki birçok olay normal dağılıma uygunluk gösterdiğinden yapılan araştırmalarda elde edilen verilerin değerlendirilmesinde çok yaygın olarak kullanılmaktadır.
Atatürk Üniversitesi
Anakütle DağılımlarıNormal Dağılım
Normal dağılımın olasılık yoğunluk fonksiyonu
Normal yoğunluk fonksiyonu iki parametreye sahiptir:ortalama
standart sapma Normal dağılım fonksiyonu ve kümülatif dağılım fonksiyonu grafiksel olarak aşağıda verilmiştir.
Atatürk Üniversitesi
Anakütle DağılımlarıNormal Dağılım
Ortalama ve Standart sapma değerlerine bağlı olarak Normal dağılımın yeri ve biçimi değişmektedir.
Örneğin:Aşağıda şekilleri verilen A, B ve C normal dağılmış rastgele değişkenler arasında:
Atatürk Üniversitesi
Anakütle Dağılımları
Normal dağılımın süreklilik özelliğinden dolayı X rastgele değişkeninin sadece belirli bir aralıkta değer alması söz konusudur. İlgilenilen aralıkta değer alma olasılığı, olasılık yoğunluk fonksiyonunun entegrali ile elde edilir.
Normal Dağılım
P a X b( )
işlemi yapılmalıdır.
Görüleceği üzere oldukça fazla işlem yükü gelmektedir.
İşlem yükünü azaltmak için bu dağılım yerine geliştirilen standart normal
dağılım kullanılmaktadır.
X N~ ( ; ). 2
Örneğin:olasılığını hesaplamak için
X rastgele değişkeni normal dağılıyorsa aşağıdaki şeklinde gösterilir:
Atatürk Üniversitesi
Anakütle DağılımlarıStandart Normal Dağılım
belirli entegraline eşit olur.
X normal değişkeni sonsuz değer alabileceğinden nümerik olarak çözüm elde edilebilmesi için normal dağılmış rastgele fonksiyon standart normal dağılmış rastgele değişkene dönüştürülür:
Bu ifade normal rastgele değişkenin olasılık yoğunluk fonksiyonun yazılırsa standart normal değişkene ait olasılık yoğunluk fonksiyonu elde edilir:
Standart normal dağılım: ortalaması 0 ve varyansı 1 olacak şekilde dönüşüm yapılır:
Atatürk Üniversitesi
Anakütle DağılımlarıStandart Normal Dağılım
integralleri hesaplanarak standart normal dağılımla ilgili tablolar hazırlanmıştır.
Dağılımın genel özellikleri dikkate alınarak standart normal değişken (Z) için
Atatürk Üniversitesi
Anakütle DağılımlarıStandart Normal Dağılım
Z tablosu olarak adlandırılan bu tablolar farklı şekillerde düzenlenmektedir.
Bu ders kapsamında kullanılacak olan tablo P(Z > z0) olasılığını vermektedir.
Verilen tablo yardımıyla normal dağılıma ait her türlü olasılık
hesaplanabilmektedir.
Ayrıca, dağılım simetrik olup dağılımın tepe noktasının yatay ekseni kestiği
noktanın koordinatı sıfırdır (dağılımın ortalamasıdır) ve eğri altında kalan alanın
değeri 1’e eşittir.
Dağılım simetrik olduğu için P(Z > 0) = P(Z < 0)= 0.5 dir.
Bu nedenle, ortalamanın sağında kalan kısmı tablolarda verilmekte, diğer
yarısının aynı olduğu bilinmektedir.
Atatürk Üniversitesi
Anakütle Dağılımları
İstenen X rastgele değişkeninin belirli aralıkta değer alma olasılığını hesaplamak için izlenecek yaklaşımlar şöyle özetlenebilir:
1. Verilen a < X < b aralığı m < Z < n aralığına dönüştürülür. Yani,
ZX
Bu amaçla
dönüşümü kullanılır.
Standart Normal Dağılım
2. Karşı gelen P(m<Z<n) değeri tablo yardımıyla belirlenir. Öyle ise P(A<X>b):
hesaplanır.
Atatürk Üniversitesi
Anakütle DağılımlarıOlasılık Tabloların okunuşu
Z tablosundan istenilen olasılık değeri bulunulurken verilen değer;
tamsayı kısmı ile birinci ondalık kısmı
ikinci ondalık kısmı
olmak üzere iki parçaya ayrılır
1. tamsayı kısmı ile birinci ondalık kısmı düşey eksende işaretlenir.2. ikinci ondalık kısmı için yatay eksende eksende işaretlenir.3. Bu değerlere yatay ve düşey eksende karşı gelen değerlerin kesiştiği hücredeki değer aranan olasılık değeridir.
Z tablosundan bir olasılık değeri okumak için aşağıdaki adımlar takip edilir:
Atatürk Üniversitesi
Anakütle DağılımlarıNormal Dağılım-MATLAB
NORMAL DAĞILIM İLE İLGİLİ MATLAB KOMUTLARI
Normal dağılmış bir rastgele değişkenin belirli bir X değerine karşılık olasılık yoğunluk fonksiyonu değeri aşağıdaki komut yardımıyla hesaplanır:
P = normpdf(X,MU,SIGMA)
Burada MU ve SIGMA sırasıyla normal dağılmış rastgele değişkenin ortalamasını ve standart sapma değerini göstermektedir.
Normal dağılmış rastgele değişkenin – ile belirli bir x değerini alma olasılığı
P(X<x) = normcdf(X,MU,SIGMA)
P olasılığını veren - dan X’e olasılık hesabında X rastgele değişkeni belirlemek
X = norminv(P,MU,SIGMA)
Atatürk Üniversitesi
Anakütle DağılımlarıNormal Dağılım-MATLAB
Standart normal dağılmış bir fonksiyona ait olasılık hesaplamaları için normcdf komutu aşağıdaki şekilde verilmedir.
P = normcdf([Z])
Verilen iki sınır değer arasında normal rastgele değişkene ait olasılık dağılım fonksiyonunu çizmek için:
[p,h] = normspec(specs, mu, sigma)
Burada specs: limit değerleri göstermektedir. p: olasılık değerini göstermektedir. -4 -3 -2 -1 0 1 2 3 4
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4Probability Between Limits is 0.81859
Density
Critical Value
Atatürk Üniversitesi
Anakütle DağılımlarıÖrnekler
Örnek 4 :Eğer Z standart normal dağılmış bir rastgele değişken ise aşağıdaki olasılıkları grafiksel olarak gösterip hesaplayınız.
a) P(0<=Z<=2)
b) P(-2<=Z<=2)
c) P(0<=Z<=1.53)
d) P(0.28 < Z < 1.28)
Atatürk Üniversitesi
Anakütle DağılımlarıÖrnekler
Örnek 4 ÇÖZÜM:
a) P(0<=Z<=2)
-4 -3 -2 -1 0 1 2 3 40
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4Probability Between Limits is 0.47725
Density
Critical Value
MATLAB komutu:
normspec([0,2],0,1)
Atatürk Üniversitesi
Anakütle DağılımlarıÖrnekler
Örnek 4 ÇÖZÜM:
b) P(-2<=Z<=2)
MATLAB komutu:
normspec([-2,2],0,1)
-4 -3 -2 -1 0 1 2 3 40
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4Probability Between Limits is 0.9545
Density
Critical Value
Atatürk Üniversitesi
Anakütle DağılımlarıÖrnekler
Örnek 4 ÇÖZÜM:
c) P(0<=Z<=1.53)
MATLAB komutu:
normspec([0,1.53],0,1)
-4 -3 -2 -1 0 1 2 3 40
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4Probability Between Limits is 0.43699
Density
Critical Value
Atatürk Üniversitesi
Anakütle DağılımlarıÖrnekler
Örnek 4 ÇÖZÜM:
d) P(0.28 < Z < 1.28)
MATLAB komutu:
normspec([0.28,1.28],0,1)
-4 -3 -2 -1 0 1 2 3 40
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4Probability Between Limits is 0.28947
Density
Critical Value
Atatürk Üniversitesi
Anakütle Dağılımları
Örnek 5 :P(Z > z1)=0.025 ise z1=?
Örnekler
-4 -3 -2 -1 0 1 2 3 40
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4Probability Greater than Lower Bound is 0.024998
Density
Critical Value
Örnek 5 ÇÖZÜM:Önceki problemlerde eksen değerlerinden hareketle olasılık değeri bulunurken bu problemde olasılık değerinden hareketle eksen değerleri bulunmaktadır. Yani tabloya bakış yönteminde değişiklik var.
Tablodan 0.025 olasılık değerine karşı gelen z değeri araştırılırsa bunun 1.96 (yani z1=1.96) olduğu görülür.
z1=norminv(0.975,0,1)
MATLAB komutu
Atatürk Üniversitesi
Anakütle Dağılımları
Örnek 6:P(-z1 < Z < z1)=0.90 ise z1=?
Örnekler
Örnek 6 ÇÖZÜM:değer çift taraflı olduğundan (her iki kuyruğu kapsadığından) her parçanın olasılığı (1-0.90)/2=0.05 dir.
Tablodan 0.05 olasılık değerine karşı gelen z değeri araştırılırsa bunun 1.64 (yani z1=1.64) olduğu görülür.
Atatürk Üniversitesi
Anakütle DağılımlarıÖrnekler
Örnek 7:Bir imalathanede üretilen millerin çaplarının ortalaması 3.0005 inç ve standartsapmalarının ise 0.001 inç olan normal dağılıma uyduğu tespit edilmiştir. Üretilenmiller eğer 3.0000.002 inç aralığının dışında iseler bu miller hatalı üretim kabuledilmektedir.Buna göre toplam üretimdeki hatalı ürün miktarını bulunuz.
Atatürk Üniversitesi
Anakütle DağılımlarıÖrnekler
Örnek 7 ÇÖZÜM:
İstenilen olasılık ifadesi:
Bu olasılık değerini hesaplamak için X sürekli normal değişkeni standart normal hale dönüştürülür:
Atatürk Üniversitesi
Anakütle DağılımlarıDağılım Tipinin Belirlenmesi
Ham olarak elde edilen rasgele değişkene ait dataların dağılım tipini(Normal, exponensiyal, Log-nomal v.b. ) belirlemek rasgele değişkenkullanılarak yapılacak analizler için çok önemlidir.
Bu işlemlerde rasgele değişkenin nasıl bir dağılım davranışı gösterdiği ve budağılımın parametreleri kullanılmaktadır.
Ham olarak elde edilen bu datalara bir dağılım uydurmak (distirbutionfitting) için aşağıda verilen adımlar takip edilir:
Dağılım tipini grafiksel olarak belirlemek Belirlenen bu dağılım tipine ait parametreleri tahmin etmek Belirlenen bu dağılım tipinin uygunluğunu test etmek.
Atatürk Üniversitesi
Anakütle DağılımlarıDağılım Tipinin Belirlenmesi
Dağılım tipini grafiksel olarak belirleme:
Ham olarak elde edilmiş rasgele değişkene ait dataların hangi dağılım tipineuygun olduğunu belirlemede genellikle bu dataların grafiksel olarakgösterimi ile birlikte uygunluk testi (goodness-of-fit) uygulanarak elde edilir.
Atatürk Üniversitesi
Anakütle DağılımlarıDağılım Tipinin Belirlenmesi
Dağılım parametrelerinin Tahmini:
Belirlenen dağılıma ait parametrelerin (ortalama, standart sapma, çarpıklık,basıklık gibi) için başlıca iki metot kullanılır:
• Momentler metodu (method of moments)• Maksimum olabilirlik metodu (method of maximum likelihood)
Bu metotlar vasıtasıyla edilen parametreler daha sonra gerçekleştirilecekanalizlerde rasgele değişkenlerin kullanılmasını sağlar.
Atatürk Üniversitesi
Anakütle DağılımlarıDağılım Tipinin Belirlenmesi
Seçilen dağılım fonksiyonun uygunluk testi:
Son adım olarak, rasgele değişkenlere ait belirlenmiş dağılım tipininuygunluk testi yapılarak istatistiksel olarak ne kadar uygun olduğu tespitedilir. Bu adımda kullanılan belli başlı uygunluk testi yöntemleri:
• Ki-kare uygunluk testi (Chi Square test)• Kolmogorov Smirnov test• Anderson Darling test
Bu testlerden sadece ilk ikisine ait teorik bilgiler verilecektir.
Atatürk Üniversitesi
Anakütle DağılımlarıDağılım Tipinin Belirlenmesi
Kİ-KARE UYGUNLUK TESTİ:
Ki-kare istatistik değerini hesaplamak için öncelikle datalar belirli sayıdaaralıklara (intervals) ayrılır ve bu aralıkların beklenen değeri (Expectedvalue) uydurulan dağılımdan hesaplanır. Sonra Chi-square istatistik değeriaşağıdaki bağıntı yardımıyla hesaplanır:
Atatürk Üniversitesi
Anakütle DağılımlarıGelecek Dersin Konusu
Örnekleme Planları ve Dağılımları …
top related