uygulamalari ders 2w3.balikesir.edu.tr/~ocaktan/yli_hafta2.pdf · değişim aralığı frekans...

Post on 25-Jul-2020

1 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

ENM 5210

İSTATİSTİK VE YAZILIMLA

UYGULAMALARI

Ders 2

Merkezi Eğilim Ölçüleri

Basit Seriler

2

Elde edilecek ham verilerin küçükten büyüğe doğru

sıralanması ile elde edilen serilere basit seri denir

4,0,1,3,3,2,1,0,8,4,2,3,2,5,0,6,3,5,4,1,3,2,2,3,1

ÖRNEK: Bir işletmede 25 işçiye verilecek çocuk paraları ile ilgili

bir araştırma yapılmaktadır. İşçilerin çocuk sayıları aşağıda

verilmiştir.

Verilen değerleri basit seri şeklinde düzenleyelim:

8,6,5,5,4,4,4,3,3,3,3,3,3,2,2,2,2,2,1,1,1,1,0,0,0

Frekans Serileri

Düzenlenen bir frekans serisi iki sütundan

oluşur: Birinci Sütun: Değişkenin aldığı farklı değerler yer

alır

İkinci Sütun: fi ile gösterilir ve değişkenin aldığı

değerlerin tekrar sayısı gösterilir

ii fX X1 f1

X2 f2

X3 f3

. .

. .

. .

Xk fk

Değişkenin k sayıda farklı değer

aldığı bir frekans serisi 3

Frekans Serileri

Örnekteki basit serinin frekans serisi

olarak düzenlenmiş hali:

ii fX

0 3

1 4

2 5

3 6

4 3

5 2

6 1

8 1

25 4

Grupandırılmış Seriler

Gruplandırılmış seriler iki sütundan

oluşur: Birinci Sütun: Sınıflar sütunudur

İkinci Sütun: frekans sütunudur

5

Sınıf sayısının az olması serinin verdiği bilgilerin kaybına yol

açacağından sınıf sayısının dörtten az olmaması

Diğer yandan, çok fazla sınıf sayısının ise işlem zorluğu ve serinin

yorumlanmasını zorlaştıracağı için sekizden fazla olmaması tavsiye

edilir

Önerilen kurallardan biri, sınıf sayısının birim serideki sayısının kare

kökü olarak seçilmesidir

Gruplandırılmış Seriler

(Sınıflı Seriler)

ÖRNEK: Daha önce frekans serisi olarak

düzenlenen örneği 2 eşit aralıklı sınıflı

seri olarak düzenleyiniz

ii fX

0 3

1 4

2 5

3 6

4 3

5 2

6 1

8 1

25

Frekans Serisi

Sınıflar if Sınıflandırılmış Seri

0 -2 7

2-4 11

4-6 5

6-8 1

8-10 1

Sınıflardaki frekanslar belirlenirken alt

Sınıf değeri dahil üst sınıf değeri hariç

tutulur

*** 6

Ortalamalar

Ortalamalar hesaplanmalarında kullanılan birimlere göre iki ana gruba ayrılabilir.

1.Grup (Analitik)

Aritmetik Ortalama

Kareli Ortalama

Geometrik Ortalama

Harmonik Ortalama

2.Grup(Analitik Olmayan)

Mod

Medyan

1.Gruptaki ortalamaların değeri, serinin herhangi bir biriminin

değeri değiştiğinde değişir.

2. gruptaki ortalamaların değerinin değişmesi için bu ortalamaların

hesabında kullanılan birimlerin değerinin değişmesi gerekir. 7

Aritmetik Ortalama

Tanım: Serideki gözlem değerleri toplamının, toplam gözlem

sayısına oranı şeklinde hesaplanır.

N

XXX N ...........21

N

XN

i

i1

k

i

i

k

i

i

fi

Xf

1

1

k

kk

fff

XfXfXf

....

....

21

2211

k

kk

fff

mfmfmf

....

....

21

2211

k

i

i

k

i

ii

f

mf

1

1

Basit seride X = =

Frekans serisinde X = =

Gruplandırılmış seride X = =

Xi : i. gözlem değeri,

fi : i. gözlemin tekrar sayısı (frekansı)

mi : i. sınıfın sınıf orta noktası 8

Aritmetik Ortalamanın

Bazı Özellikleri

• Aritmetik ortalama hassas (diğer ortalamalara nazaran)

bir ortalama olup serideki aşırı değerlerden etkilenir ve aşırı

değere doğru kayma gösterir.

• Serideki gözlem değerlerinin aritmetik ortalamadan

sapmaları toplamı sıfır olur.

(Xi -X) = 0

• Serideki değerlerin aritmetik ortalamadan sapmalarının

kareleri toplamı minimum olur.

9

2( ) MinimumiX X

Aritmetik Ortalama

10

SELECT ONE √

Under $10,000 1

$10,000 and under $20,000 2

$20,000 to less than $35,000 3

$35,000 to less than $50,000 4

$50,000 to less than $75,000 5

$75,000 to less than $100,000 6

$100,000 to less than $150,000 7

$150,000 or more 8

35. Which of the following categories best describes your annual household income?

Transportation.mtw, soru 35.

Ankete katılanların hane gelir ortalamasını hesaplayın

Mod Tanım: Bir seride en çok tekrarlanan değere mod adı verilir.

İstatistikte nispeten az kullanılan bu ölçü özellikle verilerin

simetrik bir dağılış göstermediği durumlarda iyi bir ölçü olarak

düşünülebilir.

Örnek:

Yanda basit ve

tasnif edilmiş iki

seri verilmiştir.

Bu serilerin

modlarını bulunuz

Xi (fi)

10 1

12 1

14 1

15 3

16 2

18 1

20 1

Xi

10

12

14

15

15

15

16

16

18

20

Mod

Örneğin bir perakende mağazası yöneticisinin ilgisi en çok satılan

ürün üzerinedir.

Ulaşım planlamada trafik sıkışıklığı, genellikle haftanın hangi

günleri sıkışıklığın zirveye ulaştığı ve sabah ve akşam saatlerinde

sıkışıklığın yoğun olduğu terimleriyle ölçülür.

Modun Özellikleri

Ortalamalar oranında en temsili alanıdır.

Pratik hayatta çok kullanılan ortalamalardandır

Özellikle kalitatif (niteliksel) serilerin ortalaması mod ile

ifade edilir.

Mod serideki aşırı değerlere karşı hassas değildir.

Yukarıdaki avantajlarının yanında analitik olmaması

sebebi ile matematik işlemlere elverişli değildir.

J, ters J ve U tipi serilerde mod temsili alma özelliğini

kaybeder. Böyle serilerde mod ya en küçük veya en

büyük değere karşılık gelir.

Medyan (Ortanca) Tanım: Serideki değerler küçükten büyüğe sıralandığında tam

ortaya düşen ve seriyi iki eşit parçaya bölen değere medyan adı

verilir.

Örnek: Xi:15,8,12,23,45,32,5,18,16,28,39,51

Yukarıdaki serinin medyanını bulunuz.

Önce seri büyüklük sırasına göre dizilir

Xi : 5,8,12,15,16,18, 23,28,32,39,45,51

Verilerin % 50 si Verilerin diğer % 50 si

Medyan=(18+23)/2

Medyan= 20.5

Kartil: Bir serinin

elemanları küçükten

büyüğe doğru

sıralandığında,

seriyi dört eşit

parçaya bölen

değerlere kartil adı

verilir.

Medyanın Özellikleri

1. Pratik bir ortalamadır, sadece basit bir sıralama işlemi gerektirir.

2. Özellikle açık sınıflı seriler için medyan daha bir önem kazanır.

Medyan böyle serilerin ortalamasında problemsiz olarak

hesaplanabilir.

3. Serideki aşırı değerlere karşı hassas değildir. Çünkü medyan

serinin ortasına rastladığında, uçlarda oluşan aşırı değerler

medyanı etkilemez.

4. Serideki değerlerin medyandan mutlak farkları toplamı minimum

olur. Xi-medyan minimum

5. Medyanın zayıf tarafı serideki bütün değerleri dikkate almaması

sebebi ile matematik işlemlere elverişli değildir.

Mod, Medyan ve Aritmetik

Ortalama Arasındaki İlişkiler

1- Simetrik serilerde her üç ortalama birbirine eşit olur.

X=medyan=mod

Mod, Medyan ve Aritmetik

Ortalama Arasındaki İlişkiler

2- Sağa çarpık serilerde X > Medyan > Mod olur.

Simetrik eğri

Sağa çarpık

eğri

M

o

d

X

M

e

d

y

a

n

Mod, Medyan ve Aritmetik

Ortalama Arasındaki İlişkiler

3- Sola çarpık seride X < Medyan < Mod olur.

M

e

d

y

a

n

X

M

o

d

4- Asimetrisi hafif seriler için yaklaşık olarak aşağıdaki eşitlik

geçerlidir.

(X - Mod ) 3(X - Medyan)

Değişkenlik

Ortalamalar, serilerin karşılaştırılmasında her

zaman yeterli ölçüler değildir. Aynı ortalamayı

sahip seriler farklı dağılım gösterebilirler.

Bu nedenle serilerin karşılaştırılmasında,

değişkenlik ve asimetri ölçülerine bakılır.

Değişkenlik

Xi ve Yi aşağıdaki gibi

iki seri verilmiş olsun:

1 153

5

n

i

i

X

Xn

Xi Yi

0 2

1 2

2 3

3 4

9 4

Serilerin aritmetik ortalamaları:

1 153

5

N

i

i

Y

YN

Aynı ortalamaya sahip seriler farklı dağılım gösterebilirler. Bu

nedenle serilerin karşılaştırılmasında, değişkenlik ve asimetri

ölçülerine de bakılır.

Değişkenlik Ölçüleri

Değişkenliği az olan serilerin ortalamaları daha temsili

oldukları halde, değişkenliği fazla olanların ortalamaları

seriyi daha az temsil eder .

Değişkenlik Ölçüleri

Mutlak Değişkenlik Ölçüleri

• Değişim Aralığı

• Kartil ve Desil Aralığı

• Standart Sapma

Nisbi Değişkenlik Ölçüleri

• Değişim Katsayısı

Değişim Aralığı

Tanım: Gözlem değerlerinin maksimum ve minimumu arasındaki

fark olup, verilerin ne kadarlık bir aralıkta değiştiğini gösterir.

Değişim aralığı frekans serilerinde Xi sütununun maksimum ve

minimum değerleri arasındaki farka, gruplandırılmış serilerde ise ilk

grubun alt sınır değeri ile, son sınıfın üst sınır değeri arasındaki

farka eşittir.

R = Xmax - Xmin

Örnek: Xi : 12,15,20,30,50,52,58,70,90 olan bir serinin değişim aralığı

R=90-12 =78

Yani gözlem değerleri 78 birimlik bir aralıkta değişim göstermektedir .

Standart Sapma

Tanım: Seri değerlerinin aritmetik ortalamadan

farklarının kareli ortalamasına standart sapma denir.

Standart sapma σ ile gösterilir.

Tanım: Standart sapmanın karesine varyans adı verilir.

Varyans V(X) yada σ2 ile ifade edilir.

Standart Sapma

Varyans serideki değişimi nasıl ölçer?

her zaman sıfır olacağından xxi farkların karelerini alırız

2( )Xi X

N

Değişim Katsayısı

Tanım: Standart sapmanın ortalamanın bir yüzdesi olarak ifade

edilmesine değişim katsayısı adı verilir . Bu tanıma göre

standart sapmanın büyüklüğü ortalamaya göre ifade

edilmektedir .

Bu hesaplama ile ölçü birimlerinin etkisi giderilmiş

olmaktadır. Bu nedenle bu karşılaştırılmak istenen serilerin

değerleri farklı ölçü birimleri ile ifade edildiği durumlarda

değişim katsayısı kullanılabilir.

Değişim katsayısı küçük olan serilerde, birimlerin ortalama

etrafında daha uygun dağıldıkları sonucuna varılır.

100..X

KD

Değişim Katsayısı

Elekt.

Tük.(kw/h)

Konut Say. mi fi.mi fi.mi2

50-100 10 75 750 56250

100-150 20 125 2500 312500

150-200 30 175 5250 918750

200-300 15 250 3750 937500

300-500 5 400 200 800000

80 14250 9025000

Örnek: Konutlarda tüketilen aylık elektrik ve su miktarları için

aşağıdaki veriler elde edilmiştir . Değişim katsayılarını bularak hangi

grupta değişkenliğin daha fazla olduğunu araştırın.

Su Tük.(ton/h) Konut Say. mi fi.mi fi.mi2

5-15 10 10 100 1000

15-25 30 20 600 12000

25-35 40 30 1200 36000

35-45 20 40 800 32000

45-65 10 55 550 30250

110 3250 111250

125,17880

14250X 5,37812

80

30250002 K

7898,6083125,1785,37812 222 XK

8,44100.125,178

78.100.. KD

XKD

55,29110

3250X 4,1011

110

1112502 K

75,1116,13855,294,1011 222 XK

76,39100.55,29

75,11.100.. KD

XKD

Değişim Katsayısı

Elektrik Tüketimi İçin

Su Tüketimi İçin

125,17880

14250X 5,37812

80

30250002 K

7898,6083125,1785,37812 222 XK

8,44100.125,178

78.100.. KD

XKD

55,29110

3250X 4,1011

110

1112502 K

75,1116,13855,294,1011 222 XK

76,39100.55,29

75,11.100.. KD

XKD

Asimetri Ölçüleri

Tanım: Serilerin dağılım şekillerini belirlemek için

hesaplanan ölçülere asimetri ölçüleri denir.

Değişkenlik ölçüleri serilerin değişkenliğini

ölçebilmesine rağmen, onların dağılma şekilleri hakkında

bilgi vermez. Oysa ortalamaları ve değişkenlik ölçüleri

birbirine eşit veya yakın olan serilerin dağılımları

birbirinden farklı olabilir. Bu nedenle serilerin sadece

değişkenli ölçüleri değil, dağılma şekilleri de

araştırılmalıdır.

Asimetri Ölçüleri

Dağılımı çan eğrisine benzeyen, tek maksimumlu ve simetrik

olan dağılım istatistikte önemli bir yere sahiptir ve bazı

yöntemlerin uygulanması dağılımların normal dağılım olduğu

varsayımına dayanmaktadır.

Bir dağılımın normal dağılım olarak kabul edilebilmesi için

simetri durumunun bulunması ve basıklık ölçüsünün

hesaplanması gerekir. Basıklık ölçüsü ile bir dağılımın

basıklığının, normal dağılımın basıklığından farklı olup olmadığı

belirlenmektedir.

Ortalamalar Arası Farklar ile

Hesaplanan Asimetri Ölçüleri

oe MMX

Simetrik dağılım gösteren tek modlu serilerde aritmetik

ortalama, mod ve medyan birbirine eşittir.

ise seri simetriktir. Bu değerler arasındaki

fark arttıkça serinin eğikliği artar.

Ortalamalar Arası Farklar ile

Hesaplanan Asimetri Ölçüleri

oe MMX

ise seri sola çarpıktır.

oe MMX

ise seri sağa

çarpıktır.

Asimetri Ölçüleri

Sola Eğik Seri Simetrik Seri Sağa Eğik Seri

Kutu Diyagramları

Kutu diyagramı, bir serinin ortalaması, simetrik olup olmadığını, verilerdeki değişkenliği ve aşırı uç değerler olup olmadığını görsel olarak belirlemek için kullanılan bir diyagramdır.

Bir kutu diyagramı

Alt ve Üst Çizgiler

Uç değerler

Aşırı Uç değerler

in belirlenmesinde çok yararlı bir çizgedir

Kutu Diyagramları

Uç değerler Uç değerler Aşırı Uç değerler

Q1 Q2 Q3

Alt çizgi, Q1’den, 1,5 çeyrekler

arası değişim aralığı kadar uzatılır

Üst çizgi, Q3’den, 1,5 çeyrekler

arası değişim aralığı kadar uzatılır

ÇAD

Çeyrekler Arası Değişim Aralığı (ÇAD)=Q3-Q1

1,5ÇAD 1,5ÇAD 1,5ÇAD 1,5ÇAD

Kutu Diyagramları

Şekil Bir metale ait kopma kuvveti verilerinin kutu

diyagramı

Kutu Diyagramları

Şekil Üç fabrikadaki

kalite indeksinin

karşılaştırmalı kutu

çizgeleri

Fabrika

Kali

te İn

deksi

Skewness Asimetri Ölçüsü

Minitab’da Descriptive Statistics menüsünde Skewness Simetri

ölçüsü hesaplanabilmektedir.

Skewness =0 ise seri simetrik

Skewness<0 ise seri sola çarpık

Skewness >0 ise seri sağa çarpıktır

0 Negatif Pozitif

Kurtosis Basıklık Ölçüsü

Minitab’da Descriptive Statistics menüsünden Kurtosis Basıklık ölçüsü

hesaplanabilmektedir.

Kurtosis=0 ise seri normal dağılım

ile aynı sivriliğe sahip.

Kurtosis <0 ise seri normal

dağılıma göre daha basık

Kurtosis >0 ise seri normal

dağılıma göre daha sivri

Tanımlayıcı İstatistikler

Stat >>Basic Statistics >>>Display Descriptive Statistics

top related