dağılım ölçüleri(fazlası için )

Post on 12-Jul-2015

797 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

6 DAĞILIM ÖLÇÜLERİ

Dağılım• Toplum ya da bir örnek grubu içindeki verilerin değerlerini

tanımlamak için ortalamalar kullanılır.

• Verilerin dağılımı hakkında bilgi sahibi olunurken ortalamalar yalnız başlarına yeterli olamazlar.

• Ortalamalar yalnız verilerin yığılım yaptıkları yeri gösterirler. • Yığılma noktasına olan uzaklıklar ve yığılma derecesi hakkında bir

bilgi veremezler.

• Yığılmaya ilişkin bilgileri ölçmek için dağılım ölçüleri adı verilen ayrı ölçüler kullanılmaktadır.

• örneklerden elde edilen veriler aynı değere eşit olmayıp grubun aritmetik ortalaması etrafında bir dağılım gösterirler.

• Verilerden söz edilirken, onların aritmetik ortalaması ile birlikte dağılımının da bilinmesinde yarar vardır.

• Her iki grupta aritmetik ortalama 25 yıldır. Ortalamalara bakarak gruplar hakkında karar vermek yanıltıcı olur.

• Yaş ortalaması ikisinde de eşit olmasına karşın A grubunda yaş 22-29 arası değişirken diğerinde 5-70 aralığına yayılmıştır.

• Dağılımın fazla olması, hatayı artırmasından dolayı istenmeyen bir etkendir.

• Bir gruptaki dağılımı ölçmek için değişik dağılım ölçüleri kullanılmaktadır.

• Bunlar dağılım aralığı, ortalama sapma, variyans, standart sapma, değişme katsayısı ve kuartil sapmadır.

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun

Dağılım Aralığı• Verilerin dağıldığı aralığın büyüklüğünü

gösteren bir dağılım ölçüsüdür. • Yalnız iki uç değere göre hesaplanır. Diğer

verilerin bir katkısı olmaz. • Aşırı uçlardan etkilendiği ve yalnız uç

değerlere göre hesaplandığı için kaba bir ölçüdür. Bu nedenle, gerçek dağılımı belirleyemez.

• Gruptaki en büyük değerden en küçük değerin çıkarılmasıyla bulunur.

• Dağılım aralığı,

A grubu için 29-22= 7

B grubu için 70-5= 65

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun

Ortalama Sapma • Gruptaki verilerin hepsinin katkısıyla bulunan bir

dağılım ölçüsüdür.

• Verilerin aritmetik ortalamadan olan sapmalarının mutlak büyüklüklerinin aritmetik ortalaması olarak tanımlanır.

• Verilerin aritmetik ortalamadan olan farkları toplamı sıfır olduğu için farkların mutlak değerleri alınmaktadır.

• n, veri sayısını ve x de verileri göstermek üzere ortalama sapma

O Sx x

n. .=

−∑

Örnek 6.2: A ve B grubundaki verilerin O.S. değerlerini bulalım.

A grubu için:

x

O S x

= == ∑ − = =250 10 25

25 10 18 10 1 8

/

. . ( ) / / .

B grubu için:

5.1110/11510/)25(..

2510/250

==−∑===

xSO

x

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun

Varyans

• Verilerin aritmetik ortalamadan olan fark karelerinin aritmetik ortalaması varyans olarak adlandırılır.

• Varyans, fark kareleri toplamının serbestlik derecesi olan (n-1)'e bölünmesiyle bulunan bir değerdir. Yani fark karelerinin ortalamasıdır.

• x, verileri ve n de veri sayısını göstermek üzere varyans değeri ,

Formülde geçen, n tane farktan (n-1) tanesi bağımsız olup 1 tanesi, toplamı sıfır yapacak şekilde bağımlı olarak değişir. Bu nedenle, aritmetik ortalama tanımına göre, fark kareleri toplamı n yerine serbest oluşan (n-1)'e bölünür.

(n-1)'in kullanılmasının başka bir nedeni de, toplum değerine göre daima küçük çıkan örnek varyansını büyülterek gerçek değere yaklaştırmaktır.

1

)( 22

−−

= ∑n

xxS i

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

Örnek 6.3: B grubundaki verilerin varyans değerini bulalım.

5 -20 400 10 -15 225 15 -10 100 20 -5 25 22 -3 9 30 5 25 23 -2 4 27 2 4 28 3 9 70 45 2025

Toplam: 2826 n=10

Standart Sapma • Varyansın karekökünün alınmış hali standart

sapmadır

• Standart sapma İstatistiki hesaplamalarda dağılım ölçüsü olarak kullanılır.

• Aynı ölçü birimine sahip grupların dağılımlarının karşılaştırılmasında önemli bir yeri olan standart sapma, normal dağılımdaki birimlerin dağılımını da oransal olarak belirleyen bir istatistiktir.

1

2

−−

= ∑n

)xx(s i

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun Örnek 6.4: İki gruba ait standart sapma değerlerini bulalım. A grubu için:

, n=10

B grubu için:

, n=10

Sınıflandırılmış frekans tablosundan standart sapma değerlerinin

hesaplanması,

Sfu

fun

nC=

∑ − ∑

−⋅

22

1

( )

f : frekans

u : sınıflara verilen ve A ve C'ye bağlı olarak .....-3, -2, -1, 0, 1, 2, 3...... değerlerini alan bir kodlama

n : veri sayısı

C : sınıf aralığı

Örnek: Sınıflandırılmış frekans tablosundan standart sapma değerlerini bulalım.

fu = -12, fu²=1256, n=100, C=2

S =− −

⋅ =1256

12100

992 7 1

2( )

.

Sfu

fun

nC=

∑ − ∑

−⋅

22

1

( )

f : frekans

u : sınıflara verilen ve A ve C'ye bağlı olarak .....-3, -2, -1, 0, 1, 2, 3...... değerlerini alan bir kodlama

n : veri sayısı

C : sınıf aralığı

Değişme Katsayısı • Standart sapma değerleri, ölçü birimi aynı olan

dağılımların karşılaştırılmasında iyi bir istatistiktir.

• Değişik ölçü birimlerine sahip dağılımların karşılaştırılmasında kullanılamaz.

• Bir grup insanın kan basıncı değerleri dağılımı ile nabız sayısı değerleri dağılımı D.K. ile karşılaştırılabilir

• Standart sapma değeri grupların aritmetik ortalamalarına göre orantılı olarak değişkenlik gösteriyorsa, karşılaştırma için standart sapma kullanılması hatalı sonuç verir.

• Bir grubun standart sapmasının aritmetik ortalamasına göre yüzde değeri, değişme katsayısı olarak adlandırılır

• Değişme katsayısının başka bir yararı, verilerin sonuca olan etkilerinin güvenilirliği hakkında karar vermededir.

• Verilerin değişme katsayısı ne kadar küçük olursa, bunlardan elde edilecek sonuç da o denli güvenilir olur.

• Sağlık bilimlerindeki veriler için D.K.<10 olması, gerçeği tahmin bakımından çok iyidir.

• D.K. 30'dan büyük olduğu zaman doğruyu tahmin etme derecesi kötüdür.

• Bu değer 10-20 arası için normal ve 20 - 30 arası için kritik olarak kabul edilir.

D KS

A O. .

. .= ⋅100

Örnek 6.6: iki gruba ait değişme katsayılarını bulalım.

xA = 25, SA = 2.3, xB = 25, SB = 17.7

A grubu için, D K. ..

% .= ⋅ =2 3

25100 9 2

B grubu için, D K. ..

% .= ⋅ =17 7

25100 70 8

Örnek 6.1: A ve B olmak üzere 10'ar kişilik iki grup düşünelim. Bunların yaşları yıl olarak,

A: 23, 24, 29, 28, 22, 24, 25, 23, 27, 25 x A= 25

B: 5, 10, 15, 20, 22, 30, 23, 27, 28, 70 x B = 25

şeklinde olsun

Kuartil Sapma • Aritmetik ortalama yerine ortanca değerin kullanıldığı dağılımlar için

geçerli olan bir dağılım ölçüsüdür. • Üçüncü ve birinci çeyrek değerleri farkının ikiye bölünmesiyle

bulunur.

K SÇ Ç

. .= −3 1

2

Örnek 6.7: Sınıflandırılmış frekans tablosunda verilen verilerin kuartil sapma değerlerini bulalım.

Ç1=25.7 ve Ç3=36 olarak bulunmuşlardı

K S. ..

.= − =36 25 7

25 15

Standart Hata

• Ortalamalar bölümünde tanımları verilen aritmetik ortalama ve oran değerleri, örnekten bulunan istatistik değerleri olup, ait oldukları örneğin alındığı toplumdaki aritmetik ortalama (µ ) ve oranın (P) tahmini değerleridir.

• Çeşitli etkenlere bağlı olarak, örnekten bulunan bu istatistik değerleri toplumdaki tahmini yapılacak parametre değerlerine tam eşit olmayıp bir sapma gösterirler. Ortaya çıkan sapmanın ölçüsü standart hata ile belirtilir.

• Standart hata, bir toplumdan seçilmiş örneklerden bulunan istatistik değerlerinin toplum parametresinden olan sapmalarının bir ölçüsüdür.

• Standart hata sıfır olduğu zaman, örnekten bulunan aritmetik ortalama ve oran değerleri toplumdaki parametre değerlerine eşit olurlar.

• Standart hata sıfırdan farklı olduğu zaman, örnekteki değerin gerçek değere eşit olmadığı anlaşılır.

• Bu durumda, toplumdaki parametre değerinin belirli bir olasılıkla hangi değerler arasında bulunacağı hesaplanabilir.

• Bu nedenle, toplum parametrelerinin tahmininin yapılabilmesi için bir örnekten bulunan aritmetik ortalama ve oran değerinin önüne ± işareti ile birlikte onun standart hatası da verilir.

• Bu sayede toplum parametresinin belirli bir olasılıkla hangi aralıkta olacağı tahmin edilebilir.

• Bir istatistiğin standart hatası, bir toplumdan n birimli çok sayıda seçilen örneğe ait istatistik değerlerinin oluşturduğu dağılımın standart sapması olarak tanımlanır.

• İstatistik değeri eğer aritmetik ortalama ise, standart hata aritmetik ortalamaya ve istatistik değeri eğer oran ise o zaman da standart hata orana ait olur.

• Standart hata, örnekteki birim sayısı arttıkça ve örneğin standart sapması azaldıkça azalır, aksi halde artar.

• Bir toplumdan seçilen örneklerin istatistik değerlerinin dağılımı örnekteki birim sayısına göre değişir.

• Değişim, dağılımın standart sapmasında ve aynı zamanda standart hata değerinde olur.

• n büyüdükçe dağılım sivrileşir ve standart hata değeri küçülür. Aksi olduğunda dağılım basıklaşır ve standart hata değeri büyür.

• Belirsiz toplumlarda n =∞ ve belirli toplumlarda n = N durumunda standart hata sıfır ve örneğin istatistik değerleri de toplum parametrelerine eşit olurlar.

• Örnekten bulunan her istatistik değerinin bir standart hatası vardır.

• Toplumdaki parametre değerlerini tahmin bakımından bu hata değerlerinin, istatistik değeri ile birlikte verilmeleri çok uygun olur.

• Aritmetik ortalama ve oran için bu hataları gösterme işi,

x SH x± ve P

SHP ˆˆ ±

Örnek Ortalamalarının Standart Hatası

Bir toplumdan seçilen n birimli örneklerin

aritmetik ortalamalarının dağılımının standart sapmasının,

n büyüdükçe σ/ n değerine yaklaşmaktadır

Bu nedenle aritmetik ortalamanın standart hatası,

SHn

x = σ

σ : Topluma ait standart sapma

n : Örnekteki birim sayısı

Çoğu uygulamalarda toplumun standart sapması bilinemez.

Bunun yerine, standart hatayı bulurken

örnekten bulunan standart sapma (S) değeri kullanılır.

ise

ya da

Örnekleme iadeli bir şekilde yapılmışsa,

aritmetik ortalamanın standart hatası

ise

Standart hata formülüne bir düzeltme faktörü

eklemek gerekir. Bu koşullarda standart hata,

Örnek 6.8: 100 annenin yaşı için standart sapma S=7.1 , x = 30 26.

aritmetik ortalama değerinin standart hatasını bulalım.

Örneğin seçildiği toplumdaki anne sayısı bilinmediği için

düzeltme faktörü kullanılmadan standart hatayı bulmak zorundayız.

Formülde geçen σ yerine de örnekten bulunan

standart sapma değeri kullanılacaktır.

XSH

S

n− = = =

7 1

1000 71

..

Örnek 6.9: Örnek 6.8'de belirtilen örneğin,

bölgede yaşayan 800 anne arasından seçildiğini varsayalım.

Bu durumda n> (1/10) N olacağı için standart hatayı

düzeltme faktörünü ilave ederek bulalım.

XSH

S

n

N n

N− = ⋅ −

−= ⋅ ⋅ − =

1

7 1

100

800 100

7990 66.

Örnek Oranlarının Standart Hatası

Belirli bir özelliği gösteren birimlerin oranının P olduğu

bir binomial toplumdan

n birimli çok sayıda örnekler alındığını varsayalım.

Bu örneklerdeki aynı özelliği gösteren birimlerin oranlarını da P̂ şeklinde belirtelim.

n≥30 durumunda ya da np, nq>5 durumunda P̂ 'lerin dağılımı bir normal dağılım olur.

Bu normal dağılım, ortalaması P

ve

standart sapması da pq n/ 'e yaklaşır.

Dağılımın standart sapması o dağılımı oluşturan istatistik değerinin standart hatası olduğuna göre,

örnek oranı P̂ 'nin standart hatası,

pqn

pqSH p

−=

=

1

ˆ

n≥(1/10)N durumunda, düzeltme faktörü ilave edilerek hesaplama yapmak gerekir.

1ˆ −−⋅=

N

nN

n

pqSH p

Formülde geçen p, topluma ait bir orandır. Bu bilinmediği zaman yerine örnekten bulunan oran kullanılır.

Örnek 6.10: Bir ilçeden seçilen 2000 kişilik bir örnekte tüberkülozluların sayısı 10 olarak bulunuyor.

a) İlçe nüfusu belli olmadığına göre,

b) İlçe nüfusu 18000 olduğuna göre,

örnekten bulunan oranın standart hata değerlerini bulalım.

a) P̂ =10/2000=0.005, n=2000, q=1-0.005= 0.995

0016.02000

995.0005.0SH

=×=

b) N=18000 ve n>(1/10) N olduğuna göre,

0015.0118000

200018000

2000

995.0005.0SH P̂

=−

−⋅×=

top related