uygulamalari ders 2w3.balikesir.edu.tr/~ocaktan/yli_hafta2.pdf · değişim aralığı frekans...
TRANSCRIPT
ENM 5210
İSTATİSTİK VE YAZILIMLA
UYGULAMALARI
Ders 2
Merkezi Eğilim Ölçüleri
Basit Seriler
2
Elde edilecek ham verilerin küçükten büyüğe doğru
sıralanması ile elde edilen serilere basit seri denir
4,0,1,3,3,2,1,0,8,4,2,3,2,5,0,6,3,5,4,1,3,2,2,3,1
ÖRNEK: Bir işletmede 25 işçiye verilecek çocuk paraları ile ilgili
bir araştırma yapılmaktadır. İşçilerin çocuk sayıları aşağıda
verilmiştir.
Verilen değerleri basit seri şeklinde düzenleyelim:
8,6,5,5,4,4,4,3,3,3,3,3,3,2,2,2,2,2,1,1,1,1,0,0,0
Frekans Serileri
Düzenlenen bir frekans serisi iki sütundan
oluşur: Birinci Sütun: Değişkenin aldığı farklı değerler yer
alır
İkinci Sütun: fi ile gösterilir ve değişkenin aldığı
değerlerin tekrar sayısı gösterilir
ii fX X1 f1
X2 f2
X3 f3
. .
. .
. .
Xk fk
Değişkenin k sayıda farklı değer
aldığı bir frekans serisi 3
Frekans Serileri
Örnekteki basit serinin frekans serisi
olarak düzenlenmiş hali:
ii fX
0 3
1 4
2 5
3 6
4 3
5 2
6 1
8 1
25 4
Grupandırılmış Seriler
Gruplandırılmış seriler iki sütundan
oluşur: Birinci Sütun: Sınıflar sütunudur
İkinci Sütun: frekans sütunudur
5
Sınıf sayısının az olması serinin verdiği bilgilerin kaybına yol
açacağından sınıf sayısının dörtten az olmaması
Diğer yandan, çok fazla sınıf sayısının ise işlem zorluğu ve serinin
yorumlanmasını zorlaştıracağı için sekizden fazla olmaması tavsiye
edilir
Önerilen kurallardan biri, sınıf sayısının birim serideki sayısının kare
kökü olarak seçilmesidir
Gruplandırılmış Seriler
(Sınıflı Seriler)
ÖRNEK: Daha önce frekans serisi olarak
düzenlenen örneği 2 eşit aralıklı sınıflı
seri olarak düzenleyiniz
ii fX
0 3
1 4
2 5
3 6
4 3
5 2
6 1
8 1
25
Frekans Serisi
Sınıflar if Sınıflandırılmış Seri
0 -2 7
2-4 11
4-6 5
6-8 1
8-10 1
Sınıflardaki frekanslar belirlenirken alt
Sınıf değeri dahil üst sınıf değeri hariç
tutulur
*** 6
Ortalamalar
Ortalamalar hesaplanmalarında kullanılan birimlere göre iki ana gruba ayrılabilir.
1.Grup (Analitik)
Aritmetik Ortalama
Kareli Ortalama
Geometrik Ortalama
Harmonik Ortalama
2.Grup(Analitik Olmayan)
Mod
Medyan
1.Gruptaki ortalamaların değeri, serinin herhangi bir biriminin
değeri değiştiğinde değişir.
2. gruptaki ortalamaların değerinin değişmesi için bu ortalamaların
hesabında kullanılan birimlerin değerinin değişmesi gerekir. 7
Aritmetik Ortalama
Tanım: Serideki gözlem değerleri toplamının, toplam gözlem
sayısına oranı şeklinde hesaplanır.
N
XXX N ...........21
N
XN
i
i1
k
i
i
k
i
i
fi
Xf
1
1
k
kk
fff
XfXfXf
....
....
21
2211
k
kk
fff
mfmfmf
....
....
21
2211
k
i
i
k
i
ii
f
mf
1
1
Basit seride X = =
Frekans serisinde X = =
Gruplandırılmış seride X = =
Xi : i. gözlem değeri,
fi : i. gözlemin tekrar sayısı (frekansı)
mi : i. sınıfın sınıf orta noktası 8
Aritmetik Ortalamanın
Bazı Özellikleri
• Aritmetik ortalama hassas (diğer ortalamalara nazaran)
bir ortalama olup serideki aşırı değerlerden etkilenir ve aşırı
değere doğru kayma gösterir.
• Serideki gözlem değerlerinin aritmetik ortalamadan
sapmaları toplamı sıfır olur.
(Xi -X) = 0
• Serideki değerlerin aritmetik ortalamadan sapmalarının
kareleri toplamı minimum olur.
9
2( ) MinimumiX X
Aritmetik Ortalama
10
SELECT ONE √
Under $10,000 1
$10,000 and under $20,000 2
$20,000 to less than $35,000 3
$35,000 to less than $50,000 4
$50,000 to less than $75,000 5
$75,000 to less than $100,000 6
$100,000 to less than $150,000 7
$150,000 or more 8
35. Which of the following categories best describes your annual household income?
Transportation.mtw, soru 35.
Ankete katılanların hane gelir ortalamasını hesaplayın
Mod Tanım: Bir seride en çok tekrarlanan değere mod adı verilir.
İstatistikte nispeten az kullanılan bu ölçü özellikle verilerin
simetrik bir dağılış göstermediği durumlarda iyi bir ölçü olarak
düşünülebilir.
Örnek:
Yanda basit ve
tasnif edilmiş iki
seri verilmiştir.
Bu serilerin
modlarını bulunuz
Xi (fi)
10 1
12 1
14 1
15 3
16 2
18 1
20 1
Xi
10
12
14
15
15
15
16
16
18
20
Mod
Örneğin bir perakende mağazası yöneticisinin ilgisi en çok satılan
ürün üzerinedir.
Ulaşım planlamada trafik sıkışıklığı, genellikle haftanın hangi
günleri sıkışıklığın zirveye ulaştığı ve sabah ve akşam saatlerinde
sıkışıklığın yoğun olduğu terimleriyle ölçülür.
Modun Özellikleri
Ortalamalar oranında en temsili alanıdır.
Pratik hayatta çok kullanılan ortalamalardandır
Özellikle kalitatif (niteliksel) serilerin ortalaması mod ile
ifade edilir.
Mod serideki aşırı değerlere karşı hassas değildir.
Yukarıdaki avantajlarının yanında analitik olmaması
sebebi ile matematik işlemlere elverişli değildir.
J, ters J ve U tipi serilerde mod temsili alma özelliğini
kaybeder. Böyle serilerde mod ya en küçük veya en
büyük değere karşılık gelir.
Medyan (Ortanca) Tanım: Serideki değerler küçükten büyüğe sıralandığında tam
ortaya düşen ve seriyi iki eşit parçaya bölen değere medyan adı
verilir.
Örnek: Xi:15,8,12,23,45,32,5,18,16,28,39,51
Yukarıdaki serinin medyanını bulunuz.
Önce seri büyüklük sırasına göre dizilir
Xi : 5,8,12,15,16,18, 23,28,32,39,45,51
Verilerin % 50 si Verilerin diğer % 50 si
Medyan=(18+23)/2
Medyan= 20.5
Kartil: Bir serinin
elemanları küçükten
büyüğe doğru
sıralandığında,
seriyi dört eşit
parçaya bölen
değerlere kartil adı
verilir.
Medyanın Özellikleri
1. Pratik bir ortalamadır, sadece basit bir sıralama işlemi gerektirir.
2. Özellikle açık sınıflı seriler için medyan daha bir önem kazanır.
Medyan böyle serilerin ortalamasında problemsiz olarak
hesaplanabilir.
3. Serideki aşırı değerlere karşı hassas değildir. Çünkü medyan
serinin ortasına rastladığında, uçlarda oluşan aşırı değerler
medyanı etkilemez.
4. Serideki değerlerin medyandan mutlak farkları toplamı minimum
olur. Xi-medyan minimum
5. Medyanın zayıf tarafı serideki bütün değerleri dikkate almaması
sebebi ile matematik işlemlere elverişli değildir.
Mod, Medyan ve Aritmetik
Ortalama Arasındaki İlişkiler
1- Simetrik serilerde her üç ortalama birbirine eşit olur.
X=medyan=mod
Mod, Medyan ve Aritmetik
Ortalama Arasındaki İlişkiler
2- Sağa çarpık serilerde X > Medyan > Mod olur.
Simetrik eğri
Sağa çarpık
eğri
M
o
d
X
M
e
d
y
a
n
Mod, Medyan ve Aritmetik
Ortalama Arasındaki İlişkiler
3- Sola çarpık seride X < Medyan < Mod olur.
M
e
d
y
a
n
X
M
o
d
4- Asimetrisi hafif seriler için yaklaşık olarak aşağıdaki eşitlik
geçerlidir.
(X - Mod ) 3(X - Medyan)
Değişkenlik
Ortalamalar, serilerin karşılaştırılmasında her
zaman yeterli ölçüler değildir. Aynı ortalamayı
sahip seriler farklı dağılım gösterebilirler.
Bu nedenle serilerin karşılaştırılmasında,
değişkenlik ve asimetri ölçülerine bakılır.
Değişkenlik
Xi ve Yi aşağıdaki gibi
iki seri verilmiş olsun:
1 153
5
n
i
i
X
Xn
Xi Yi
0 2
1 2
2 3
3 4
9 4
Serilerin aritmetik ortalamaları:
1 153
5
N
i
i
Y
YN
Aynı ortalamaya sahip seriler farklı dağılım gösterebilirler. Bu
nedenle serilerin karşılaştırılmasında, değişkenlik ve asimetri
ölçülerine de bakılır.
Değişkenlik Ölçüleri
Değişkenliği az olan serilerin ortalamaları daha temsili
oldukları halde, değişkenliği fazla olanların ortalamaları
seriyi daha az temsil eder .
Değişkenlik Ölçüleri
Mutlak Değişkenlik Ölçüleri
• Değişim Aralığı
• Kartil ve Desil Aralığı
• Standart Sapma
Nisbi Değişkenlik Ölçüleri
• Değişim Katsayısı
Değişim Aralığı
Tanım: Gözlem değerlerinin maksimum ve minimumu arasındaki
fark olup, verilerin ne kadarlık bir aralıkta değiştiğini gösterir.
Değişim aralığı frekans serilerinde Xi sütununun maksimum ve
minimum değerleri arasındaki farka, gruplandırılmış serilerde ise ilk
grubun alt sınır değeri ile, son sınıfın üst sınır değeri arasındaki
farka eşittir.
R = Xmax - Xmin
Örnek: Xi : 12,15,20,30,50,52,58,70,90 olan bir serinin değişim aralığı
R=90-12 =78
Yani gözlem değerleri 78 birimlik bir aralıkta değişim göstermektedir .
Standart Sapma
Tanım: Seri değerlerinin aritmetik ortalamadan
farklarının kareli ortalamasına standart sapma denir.
Standart sapma σ ile gösterilir.
Tanım: Standart sapmanın karesine varyans adı verilir.
Varyans V(X) yada σ2 ile ifade edilir.
Standart Sapma
Varyans serideki değişimi nasıl ölçer?
her zaman sıfır olacağından xxi farkların karelerini alırız
2( )Xi X
N
Değişim Katsayısı
Tanım: Standart sapmanın ortalamanın bir yüzdesi olarak ifade
edilmesine değişim katsayısı adı verilir . Bu tanıma göre
standart sapmanın büyüklüğü ortalamaya göre ifade
edilmektedir .
Bu hesaplama ile ölçü birimlerinin etkisi giderilmiş
olmaktadır. Bu nedenle bu karşılaştırılmak istenen serilerin
değerleri farklı ölçü birimleri ile ifade edildiği durumlarda
değişim katsayısı kullanılabilir.
Değişim katsayısı küçük olan serilerde, birimlerin ortalama
etrafında daha uygun dağıldıkları sonucuna varılır.
100..X
KD
Değişim Katsayısı
Elekt.
Tük.(kw/h)
Konut Say. mi fi.mi fi.mi2
50-100 10 75 750 56250
100-150 20 125 2500 312500
150-200 30 175 5250 918750
200-300 15 250 3750 937500
300-500 5 400 200 800000
80 14250 9025000
Örnek: Konutlarda tüketilen aylık elektrik ve su miktarları için
aşağıdaki veriler elde edilmiştir . Değişim katsayılarını bularak hangi
grupta değişkenliğin daha fazla olduğunu araştırın.
Su Tük.(ton/h) Konut Say. mi fi.mi fi.mi2
5-15 10 10 100 1000
15-25 30 20 600 12000
25-35 40 30 1200 36000
35-45 20 40 800 32000
45-65 10 55 550 30250
110 3250 111250
125,17880
14250X 5,37812
80
30250002 K
7898,6083125,1785,37812 222 XK
8,44100.125,178
78.100.. KD
XKD
55,29110
3250X 4,1011
110
1112502 K
75,1116,13855,294,1011 222 XK
76,39100.55,29
75,11.100.. KD
XKD
Değişim Katsayısı
Elektrik Tüketimi İçin
Su Tüketimi İçin
125,17880
14250X 5,37812
80
30250002 K
7898,6083125,1785,37812 222 XK
8,44100.125,178
78.100.. KD
XKD
55,29110
3250X 4,1011
110
1112502 K
75,1116,13855,294,1011 222 XK
76,39100.55,29
75,11.100.. KD
XKD
Asimetri Ölçüleri
Tanım: Serilerin dağılım şekillerini belirlemek için
hesaplanan ölçülere asimetri ölçüleri denir.
Değişkenlik ölçüleri serilerin değişkenliğini
ölçebilmesine rağmen, onların dağılma şekilleri hakkında
bilgi vermez. Oysa ortalamaları ve değişkenlik ölçüleri
birbirine eşit veya yakın olan serilerin dağılımları
birbirinden farklı olabilir. Bu nedenle serilerin sadece
değişkenli ölçüleri değil, dağılma şekilleri de
araştırılmalıdır.
Asimetri Ölçüleri
Dağılımı çan eğrisine benzeyen, tek maksimumlu ve simetrik
olan dağılım istatistikte önemli bir yere sahiptir ve bazı
yöntemlerin uygulanması dağılımların normal dağılım olduğu
varsayımına dayanmaktadır.
Bir dağılımın normal dağılım olarak kabul edilebilmesi için
simetri durumunun bulunması ve basıklık ölçüsünün
hesaplanması gerekir. Basıklık ölçüsü ile bir dağılımın
basıklığının, normal dağılımın basıklığından farklı olup olmadığı
belirlenmektedir.
Ortalamalar Arası Farklar ile
Hesaplanan Asimetri Ölçüleri
oe MMX
Simetrik dağılım gösteren tek modlu serilerde aritmetik
ortalama, mod ve medyan birbirine eşittir.
ise seri simetriktir. Bu değerler arasındaki
fark arttıkça serinin eğikliği artar.
Ortalamalar Arası Farklar ile
Hesaplanan Asimetri Ölçüleri
oe MMX
ise seri sola çarpıktır.
oe MMX
ise seri sağa
çarpıktır.
Asimetri Ölçüleri
Sola Eğik Seri Simetrik Seri Sağa Eğik Seri
Kutu Diyagramları
Kutu diyagramı, bir serinin ortalaması, simetrik olup olmadığını, verilerdeki değişkenliği ve aşırı uç değerler olup olmadığını görsel olarak belirlemek için kullanılan bir diyagramdır.
Bir kutu diyagramı
Alt ve Üst Çizgiler
Uç değerler
Aşırı Uç değerler
in belirlenmesinde çok yararlı bir çizgedir
Kutu Diyagramları
Uç değerler Uç değerler Aşırı Uç değerler
Q1 Q2 Q3
Alt çizgi, Q1’den, 1,5 çeyrekler
arası değişim aralığı kadar uzatılır
Üst çizgi, Q3’den, 1,5 çeyrekler
arası değişim aralığı kadar uzatılır
ÇAD
Çeyrekler Arası Değişim Aralığı (ÇAD)=Q3-Q1
1,5ÇAD 1,5ÇAD 1,5ÇAD 1,5ÇAD
Kutu Diyagramları
Şekil Bir metale ait kopma kuvveti verilerinin kutu
diyagramı
Kutu Diyagramları
Şekil Üç fabrikadaki
kalite indeksinin
karşılaştırmalı kutu
çizgeleri
Fabrika
Kali
te İn
deksi
Skewness Asimetri Ölçüsü
Minitab’da Descriptive Statistics menüsünde Skewness Simetri
ölçüsü hesaplanabilmektedir.
Skewness =0 ise seri simetrik
Skewness<0 ise seri sola çarpık
Skewness >0 ise seri sağa çarpıktır
0 Negatif Pozitif
Kurtosis Basıklık Ölçüsü
Minitab’da Descriptive Statistics menüsünden Kurtosis Basıklık ölçüsü
hesaplanabilmektedir.
Kurtosis=0 ise seri normal dağılım
ile aynı sivriliğe sahip.
Kurtosis <0 ise seri normal
dağılıma göre daha basık
Kurtosis >0 ise seri normal
dağılıma göre daha sivri
Tanımlayıcı İstatistikler
Stat >>Basic Statistics >>>Display Descriptive Statistics