istatistik

227
İstatistik Araştırmalar, Bilimsel Çalışmalar ve Günlük Olaylardan sistemli bir biçimde veri toplama ve bilgilerin incelenmesi, özetlenmesi, ölçülmesi, sınıflandırılması, çözümlenmesi, neden sonuç ilişkilerinin belirlenmesi, karşılaştırılması, aralarındaki ilişkilerin ortaya konması, elde edilen sonuçların kitlelere anlayabilecekleri ve etkili bir şekilde sunulmasının tüm evrelerini kapsayan bilim dalıdır. Teorik İstatistik Uygulamalı İstatistik

Upload: buraksolak

Post on 24-Dec-2014

11.964 views

Category:

Investor Relations


10 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Istatistik

İstatistik Araştırmalar, Bilimsel Çalışmalar ve Günlük Olaylardan

sistemli bir biçimde veri toplama ve bilgilerin incelenmesi, özetlenmesi, ölçülmesi, sınıflandırılması, çözümlenmesi, neden sonuç ilişkilerinin belirlenmesi, karşılaştırılması, aralarındaki ilişkilerin ortaya konması, elde edilen sonuçların kitlelere anlayabilecekleri ve etkili bir şekilde sunulmasının tüm evrelerini kapsayan bilim dalıdır.

• Teorik İstatistik• Uygulamalı İstatistik

Page 2: Istatistik

Herhangi bir konu hakkındaHerhangi bir konu hakkında

►Bilgi toplamak,►Bilgi toplamak,

►Toplanan bilgileri düzenlemek,►Toplanan bilgileri düzenlemek,

►Çözümlemek►Çözümlemek

►Yorumlamak►Yorumlamak

►için gerekli yöntemler topluluğudur. ►için gerekli yöntemler topluluğudur.

veve

Page 3: Istatistik

Tanımlayıcı İstatistik

(Descriptive Statistics)

Tanımlayıcı İstatistik

(Descriptive Statistics)

olarak iki ana gruba ayrılır.

Çıkarımsal İstatistik

(Inferential Statistics)

Çıkarımsal İstatistik

(Inferential Statistics)

Page 4: Istatistik

Tablo ve grafiklerle

sunulmasını içerir.

Verilerin özetlenmesi,

Sınıflandırılması,

Page 5: Istatistik

Karara varmaKarara varma

Örneklemden elde edilen bulgular yardımıylaÖrneklemden elde edilen bulgular yardımıyla

Evren hakkında kestirimde bulunma,Evren hakkında kestirimde bulunma,

Hipotezleri test etme Hipotezleri test etme

İşlemlerini içerirİşlemlerini içerir

Page 6: Istatistik

Evren(population): Belirli özellikleri gösteren bireylerin ya da nesnelerin oluşturduğu topluluktur.

Türkiye’deki spor yüksekokullarındaki öğrencilerin evreni, tüm spor yüksekokullarındaki tüm bölümlerdeki öğrencileri kapsar.

Örnek(sample): Evrenin tüm özelliklerini taşıyan, onu tanımlama yeteneğine sahip bir parçasıdır.

Parametre(parameter): Evrende incelenen değişkenleri tanımlamak için kullanılan ölçütlerdir ortalama(), varyans(2), oran(p) v.b.

İstatistik: örneklemi tanımlamak için kullanılan ölçütlerdir. Örneklem ortalaması (X) standart sapma (s) v.b.

Denek(subject): Bilimsel çalışmanın yapıldığı birim (insan, hayvan, nesne v.s.)

Page 7: Istatistik

Evren ve örneklemde gösterim

Tanımlayıcı ölçüt Örneklemde (istatistik)

Evrende (parametre)

Ortalama X

Oran p P

Standart sapma S

Varyans S2 2

Gözlem sayısı N N

Değişken(variable): İncelenen faktör ya da karakter, farklı bireylerde farklı değerler alabiliyorsa buna değişken denir

Page 8: Istatistik

Veri (data): Herhangi bir konuda bilinmeyeni ortaya çıkarmak amacıyla yapılan araştırma, deney, gözlem, uğraşı veya olay sonucu elde edilen nicel ya da nitel ham materyaldır.

VERİDE BULUNMASI GEREKEN ÖZELLİKLER

• DOĞRULUK• GÜNCELLİK• GÜVENİLİRLİK• EKSİKSİZLİK• KULLANILABİLİRLİK• AMACA UYGUNLUK

Bilgi (information): Verilerin ve önceki bilgilerin işlenmesiyle elde edilen anlamlı mesaj veren kavramlardır.

Page 9: Istatistik

VERİBİLGİ

VERİ BİLGİ

VERİLERİN İŞLENMESİ

Page 10: Istatistik

Nicelik belirten (ölçü-lerek yada sayılarak elde edilen) verilerdir.

Örneğin, yaş, ağırlık, boy gibi.

Bireylerin sahip olduğu belli özelliklerin sınıflara ayrılarak belirtildiği verilerdir.

Örneğin, cinsiyet, medeni durum, başarılı-başarısız gibi.

Niceliksel (Quantitative) Niteliksel (Qualitative)

Page 11: Istatistik

Sıralanabilir(Ordered)

Sıralanabilir(Ordered)

Sınıflanabilir(Nominal)

Sınıflanabilir(Nominal)

Nitelik verilerde belli bir sıralama söz konusu ise (kötü-orta-iyi-mükemmel gibi ya da Okur yazar olmayan, okur yazar, ortaokul, lise, üniversite mezunu) bu tür verilere sıralanabilir nitelik veriler denir.

Nitelik verilerde belli bir sıralama yoksa bu tür verilere sınıflanabilir nitelik veriler denir Örneğin cinsiyet, medeni durum gibi.

İki Sınıflıİki Sınıflı Çok SınıflıÇok Sınıflı

Page 12: Istatistik

Kesikli SayısalDiscrete numeric variable

Kesikli SayısalDiscrete numeric variable

Sürekli SayısalContinuous numeric variableSürekli SayısalContinuous numeric variable

Belirli bir aralıktaki tam sayıları alan veri türüdür. Örnek: Sınıftaki öğrenci sayısı, çocuk sayısı gibi

Ölçümle belirtilirler ve bir aralıktaki bütün değerleri alırlar. Örnek: Boy uzunluğu, yaş, günlük kalsiyum tüketim miktarı (mg) gibi.

Aralık ÖlçekliInterval Scale

Aralık ÖlçekliInterval Scale

Oran ÖlçekliRatio Scale

Oran ÖlçekliRatio Scale

Page 13: Istatistik

ÖLÇME-ÖLÇEK KAVRAMLARI

• Gözlenen olayları sınıflandırma, değer verme ile sonuçlanan işlem

• Gözlenen olaylara sayısal bir değer verme, ya da olayları belli kurallara göre sayısallaştırma işlemidir

Page 14: Istatistik

ÖLÇEK TÜRLERİ• Sınıflandırma ölçeği

– Erkek=1, Kadın=2• Sıralama ölçeği

– Ölçümler sadece sıra dizisini gösterir, ama aralarındaki uzaklık kesin değildir

– Doktora, yüksek lisans, lisans, önlisans• Aralık ölçeği

– Eşit bölme aralığına sahiptir– Başlangıç noktasının sıfır olma zorunluluğu yoktur,

varsa da yokluğu göstermez– Zeka testinden sıfır almak zekasız olmayı göstermez

• Oran ölçeği– Puanlar değişkenin gerçek miktarını yansıtır, eşit

ölçme birimi vardır– Sıfır değeri sıfır olma halini gösterir, (uzunluk, ağırlık

ölçümleri gibi)

Page 15: Istatistik

Dağılım(distribution): Verilerin oluşturduğu yığınların biçimine dağılım denir.

Kesikli Dağılım: Dağılım aralığı içinde her değeri alamayan verilerin dağılımı kesikli dağılımdır. (Hiçbir zaman 3.7 bebek olamaz). Hasta-sağlam gibi.

Sürekli Dağılım: Sürekli verilerin (ölçüm ve tartımla belirtilen) oluşturduğu dağılımlardır.

Sürekli veriler sınıflandırılarak kesikli hale getirilebilirler.

Örneğin kişileri boylarına göre uzun boylu, orta boylu ve kısa boylu olarak sınıflandırabiliriz.

Sınılandırma yaparken objektif olmaya çalışmak gerekmektedir.

Page 16: Istatistik

VERİLERİN SINIFLANDIRILMASI

Page 17: Istatistik

Sınıflandırma

• Bir kitlenin veya grubun özelliklerine göre yapısını ortaya çıkarabilmek amacıyla, elde edilen bilgileri bir özellik ya da özellikler bakımından çeşitli seçeneklere ayırarak aynı seçeneğe ait birimleri kümeler halinde bir araya getirmedir

• Veri sayısı sınırlıyken yapılır

Page 18: Istatistik

Sınıflandırmaya örnek

Yaş Frekans (sıklık)

18 21

19 25

20 30

21 18

22 6

TOPLAM 100

Page 19: Istatistik

Gruplama

• Eğer sınıflandırılacak veri sayısı çok fazla ise bunları sınıflandırma yoluyla kümelere ayırmak mümkün olsa bile anlamlı ve işlemlere elverişli olmayabilir

• Böyle durumlarda bir özelliğin birbirine yakın olana seçenekleri gruplar halinde toplanır ve yeni gruplamalara başvurulur

Page 20: Istatistik
Page 21: Istatistik
Page 22: Istatistik

Frekans Dağılımları (Frequency Distributions)

• Verilerin her bir sınıf aralığına düşen gözlem sayısını (frekans) gösterecek şekilde gruplandırılması işlemi

Page 23: Istatistik

Frekans Dağılımları ile İlgili Temel Kavramlar• Dağılım genişliği = Verilerin minimum

ile maksimum değerleri arasındaki fark• Sınıf sayısı= O dağılımın incelemek

istenen sınıf sayısı• Sınıf sınırları= Sınıfa ait minimum ve

maksimum sınır değerleri• Sınıf aralığı= Sınıfın alt ve üst sınırları

arasındaki fark• Sınıf orta noktası=Sınıfın alt ve üst

sınırlarının ortalaması

Page 24: Istatistik
Page 25: Istatistik
Page 26: Istatistik

Sınıf aralığının belirlenmesi

• Sınıf aralığı = Dağılım GenişliğiSınıf Sayısı

Maksimum değer-minimum değer sınıf sayısı33.625 – 12.546 = 21.079 = 3011 7

Page 27: Istatistik

Frekans Dağılım Tablosunun Hazırlanması

Sınıflar Alt sınırlar Üst Sınırlar

1 12.546

(12.546 + 3.011)= 15.55715.557 – 1 = 15.55615.556

2 15.557

(15.557 + 3.011) = 18.56818.568 – 1 = 18.56718.567

3 18.568

(18.568 + 3.011) = 21.57921.579– 1 =21.57821.578

4 21.579

(21.579 + 3.011) = 24.59024.590 – 1 = 24.58924.589

Page 28: Istatistik

Frekans Dağılım Tablosunun Hazırlanması

Sınıflar Alt sınırlar Üst Sınırlar

5 24.590

(24.590 + 3.011) = 27.60127.601 – 1 = 27.60027.600

6 27.601

(27.601 + 3.011) = 30.61230.612 – 1 = 30.61130.611

7 30.612 33.625

Page 29: Istatistik

Frekans dağılım tablosu

Page 30: Istatistik

HİSTOGRAM

Page 31: Istatistik

Frekans Dağılımlarının Oluşturulmasında Dikkat Edilecek Noktalar

• Mümkün olduğu kadar eşit sınıf aralıkları seçilmelidir

• Eşit olmayan sınıf aralıkları frekansların grafiksel gösterimlerinde yanlış algılamalara yol açabilir

Page 32: Istatistik

SUNU YÖNTEMLERİ

•METİN•TABLO•GRAFİK

Page 33: Istatistik

TABLO

•TEK BOYUTLU

• İKİ BOYUTLU

•ÇOK BOYUTLU

Page 34: Istatistik

TABLO YAPIMINDA DİKKAT EDİLECEK NOKTALAR

• BAŞLIK– Başlık kısa, özlü olmalıdır. – Genelde tablonun üstüne yazılır– Başlığın bölüm ve sıra no’ su yazılır

• Kolon ve satır başlıkları,ölçekler,birimler yazılır

• Değerlere ek olarak yüzdeler de verilir• Üçten çok değişken aynı tabloda

verilmez, verilirse çizgilerle ayrılır

Page 35: Istatistik

TEK BOYUTLU TABLO

n %

voleybol 15 30

judo 10 20

tenis 15 30

basketbol 5 10

yüzme 5 10

TOPLAM 50 100

Tablo 1.1 Sporcuların Branşlarına Göre Dağılımı

Page 36: Istatistik

İKİ BOYUTLU TABLO

E K TOPLAM

n % n %

voleybol 10 20 5 10 15

judo 8 16 2 4 10

tenis 5 10 10 20 15

basketbol 2 4 3 6 5

yüzme 1 2 4 8 5

TOPLAM 26 52 24 48 50

Tablo 1.2 Sporcuların Branşlarına ve Cinsiyetlerine Göre Dağılımları

Page 37: Istatistik

ÇOK BOYUTLU TABLO

Erkek Kadın Toplam

Yaş Yaş

<20 20-22 22> <20 20-22 22>

voleybol 2 3 5 1 1 3 15

judo 1 3 4 0 1 1 10

tenis 2 1 2 1 1 8 15

basketbol 0 0 2 0 1 2 5

yüzme 0 0 1 0 2 2 5

TOPLAM 5 7 14 2 6 16 50

Tablo 1.3 Sporcuların Branşlarına Cinsiyetlerine ve Yaşlarına Göre Dağılımları

Page 38: Istatistik

GRAFİK ÇEŞİTLERİ• SÜTUN GRAFİK• ÇUBUK GRAFİK• ÇİZGİ GRAFİK• PASTA-DAİRE DİLİMLERİ GRAFİĞİ• ALAN GRAFİĞİ• HİSTOGRAM, DAĞILIM POLİGONU• KUTU VE ÇİZİGİ GRAFİĞİ• DAL VE YAPRAK GRAFİĞİ• ORTALAMA STANDART SAPMA GRAFİĞİ• SAÇILIM (NOKTA GRAFİĞİ)

Page 39: Istatistik

GRAFİK YAPIMINDA DİKKAT EDİLECEK NOKTALAR

• BAŞLIK– Her grafiğin bir başlığı olmalıdır– Grafiğin altına veya üstüne yazılabilir– Başlığın bölüm ve sıra no’ su yazılır.(Grafik 3.2)

• Eksenlerin neyi ifade ettiği ve değişkenlerin birimleri belirtilir.

• Kullanılan alan ve çizgi türleri çeşitlilik gösteriyorsa grafiğin iç sağ üstünde ya da dış sol altında açıklanmalıdır

• Başlıktaki ölçeklendirme ve kısaltmalar belirtilmelidir.

Page 40: Istatistik

SÜTUN GRAFİK

Grafik 1.1 Sporcuların Branşlarına Göre Dağılımı

10

8

5

21

5

2

10

34

0

2

4

6

8

10

12

Basketbol Tenis Yüzme Judo Okçuluk

BRANŞLAR

Spor

cu S

ayıs

ı

ErkekKadin

Page 41: Istatistik

Sütun Grafik

Çoğunlukla nitelik verilerde kullanılır.

Her bir kategori birbirinden ayrı çubuklarla gösterilir.

Çubukların eni birbirine eşittir ve bitişik değildir.

Yatay eksende incelenen değişkene ilişkin kategoriler dikey eksene

bu kategorilere ilişkin sayı ya da yüzde değerleri konulur.

105Şişman10050Toplam

2010Hafif Şişman

4020Normal

3015Zayıf

%SayıVücut Ağırlığı

Page 42: Istatistik

Öğrencilerinin Ağırlıklarına Göre Dağılımı

0

5

10

15

20

25

Zayıf Normal Hafif Şişman Şişman

Öğrencilerin Ağırlıkları

Sayı

Page 43: Istatistik

ÇUBUK GRAFİK

Grafik 1.1 Sporcuların Branşlarına Göre Dağılımı

10

8

5

2

1

5

2

10

3

4

0 2 4 6 8 10 12

Voleybol

Judo

Okçuluk

Tenis

Hentbol

Bra

nşla

r

Sporcu Sayısı

KadinErkek

Page 44: Istatistik

0

20

40

60

80

100

Okur YazarDeğil

İlkolul Ortaokul Lise Üniversite

Öğrenim Durumu

Yüz

de (%

)

Kullanmayan

Kullanan

Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu

Aile P.

Page 45: Istatistik

ALAN GRAFİK

Grafik 1.1 Sporcuların Branşlarına ve Cinsiyetlerine Göre Dağılımı

25

812

155

2

10 3

4

0

5

10

15

20

Voleybol Tenis Basketbol Judo Okçuluk

Branşlar

Spor

cu S

ayıs

ı

KadınErkek

Page 46: Istatistik

3B SÜTUN GRAFİK

VoleybolHentbol

JudoOkçuluk

Tenis

Erkek

Kadın0

2

4

6

8

10

Spo

rcu

Say

ısı

Branşlar

Grafik 1.1 Sporcuların Branşlarına ve Cinsiyetlerine Göre Dağılımı

ErkekKadın

Page 47: Istatistik

ÇİZGİ GRAFİK

Grafik 1.1 Spor Yüksekokulu Öğrencilerinin Başarı Durumlarının Yıllara Göre Dağılımı

0

20

40

60

80

100

1.yıl 2.yıl 3.yıl 4.yıl

Yıllar

Not

Ort

alam

ası

ErkekKadın

Page 48: Istatistik

Z AM A N (ay)

6543Başlangıç1

Ort

ala

ma (

S.s

apm

a)

8

7

6

5

4

3

İ L A Ç

A

B

C

Page 49: Istatistik

PASTA GRAFİKGrafik 1,1 Sporcuların Branşlarına GöreDağılımı

14%

37%

8%

14%

27%

Tenis

Voleybol

Basketbol

Yüzme

Judo

Page 50: Istatistik

Pasta-Daire Dilimleri Grafiği

Nitelik verilerde kullanılan bir grafik yöntemidir.

105Şişman10050Toplam

2010Hafif Şişman

4020Normal

3015Zayıf

%SayıVücut Ağırlığı

Zayıf için:

Normal için:

Hafif Şişman için:

Şişman için:

derece

derece

derece

derece

Page 51: Istatistik

Zayıf30%

Normal40%

Hafif Şişman20%

Şişman10%

Öğrencilerinin Ağırlıklarına Göre Dağılımı

Page 52: Istatistik

X-Y DAĞILIMI

YAS(AY)

121086420

AG

IRLI

K(k

g)

9

8

7

6

5

4

3

Grafik 1.2 Çocuklarda Yaşa Göre Ağırlık

Page 53: Istatistik

Gebelik Haftası

44

42

40

38

36

34

32

Do

ğu

m A

ğır

lığ

ı

3600

3400

3200

3000

2800

2600

2400

Sigara

İçiyor

İçmiyor

Doğum Ağırlığı Gebelik Haftası Sigara 2940 38 içiyor3130 38 İçmiyor2420 36 içiyor2450 34 İçmiyor

Annenin Sigara İçme ve Gebelik Haftası

Durumuna Göre Çocukların Doğum Ağırlığı Dağılımı

Page 54: Istatistik

Histogram

Sürekli değişkenler için kullanılan grafik türüdür.

Çubuklar birbirine bitişik olarak çizilir.

Sayı ya da yüzde kullanmak grafiğin şeklini değiştirmez.

Yatay eksende sınıf değeri dikey eksende sayı ya da yüzde bulunur. (Yatay eksene alt sınır ve üst sınır değerleri de yazılabilir)

Page 55: Istatistik

ANTREMAN SONRASI 10. DAKİKA NABIZ ÖLÇÜMLERİ

Std. Dev = 17,70 Mean = 92,4N = 26,00

NABIZ 10.DK

130,0120,0110,0100,090,080,070,060,0

6

5

4

3

2

1

0

HİSTOGRAM

Page 56: Istatistik

Öğrencilerin BoyUzunluklarına Göre Dağılımı

0

5

10

15

20

25

30

35

147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182

Boy Uzunlukları (cm)

Fre

kansSimetrik Dağılım

Page 57: Istatistik

Öğrencilerin BoyUzunluklarına Göre Dağılımı

0

10

20

30

40

50

60

147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178

Boy Uzunlukları (cm)

Fre

kans

Sağa Çarpık (Pozitif Çarpık) Dağılım

Page 58: Istatistik

Sola Çarpık (Negatif Çarpık) Dağılım

Öğrencilerin Boy Uzunluklarına Göre Dağılımı

0

10

20

30

40

50

60

70

147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182

Boy Uzunlukları (cm)

Frek

ans

Page 59: Istatistik

Dağılım PoligonuHistogramdaki çubukların en üst orta noktalarının çizgilerle

birleştirilmesiyle elde edilir.

Öğrencilerin Boy Uzunlıklarına Göre Dağılımı

0

5

10

15

20

25

30

35

147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182

Boy Uzunlukları

Fre

kans

Page 60: Istatistik

5. Kutu ve Çizgi Grafiği

Yüzdelikler yardımıyla veriyi özetlemekte kullanılan basit ve çok kullanışlı bir grafik yöntemidir.

Grafikte 25., 50., 75., Yüzdelikler en küçük değer ve en büyük değer bulunmaktadır.

Daha çok dağılım çarpık olduğunda kullanılır.

Dağılımdaki aşırı gözlemlerin varlığı konusunda da bilgi verir.

Page 61: Istatistik

25.Yüzdelik

Sola Çarpık (Negatif Çarpık) Dağılım

Ortanca

*21 Çok Aşırı Değer

o22 Aşırı Değer

Aşırı değer Olmayan En Büyük Değer

Aşırı değer Olmayan En Küçük Değer

75.Yüzdelik

175

170

165

160

155

150

145

140

Öğr

enci

leri

n B

oy U

zunl

uğu

(cm

)

Page 62: Istatistik

Ortanca

*21 Çok Aşırı Değer

o22 Aşırı Değer

Aşırı değer Olmayan En Büyük Değer

Aşırı değer Olmayan En Küçük Değer

75.Yüzdelik

Sağa Çarpık (Pozitif Çarpık) Dağılım

25.Yüzdelik

175

170

165

160

155

150

145

140

Öğr

enci

leri

n B

oy U

zunl

uğu

(cm

)

Page 63: Istatistik

Simetrik Dağılım

175

170

165

160

155

150

145

140

Öğr

enci

leri

n B

oy U

zunl

uğu

(cm

) Ortanca

Aşırı değer Olmayan En Büyük Değer

Aşırı değer Olmayan En Küçük Değer

75.Yüzdelik

25.Yüzdelik

Page 64: Istatistik

Tepe Değeri

Ortanca

Ortalama

Tepe DeğeriOrtanca

Ortalama

Tepe DeğeriOrtanca

Ortalama

Sola ÇarpıkSağa Çarpık Simetrik

Page 65: Istatistik

Öğrenim Durumu

ÜNİVERSTELİSEORTAOKULİLKOKULOYD

Ço

cu

k B

ak

ım B

ilg

i P

uan

ı 100

90

80

70

60

50

40

30

20

100

46111

27

34

2921

14

Annelerin Öğrenim Düzeylerine Göre

Çocuk Bakım Bilgi Puanlarının Dağılımı

Page 66: Istatistik

Dal ve Yaprak Grafiği

Dal ve yaprak grafik yöntemi veri kümesini özetlemek için çok basit ve kullanışlı bir grafik yöntemidir.

Bu grafikte hem grafiğin şeklini hem de dağılımdaki gözlem değerlerini görmek olanaklıdır.

Dal ve Yaprak grafiği her sınıfın karşısına doğrudan frekansı yazmak yerine bu aralıktaki değerlerin son haneleri yazılır.

Page 67: Istatistik

45 5 6 7 22 3

80 1 2 2 3 4 4 4 135 6 6 7 7 8 8 8 9 9 9 9 980 2 2 2 3 4 4 4 36 6 920 4

65-6970-74

60-6455-5950-5445-4940-44

SayıYapraklarDallar

Dal ve Yaprak Grafiği

Veriler: 40, 44, 46, 46, 49, 50, 52, 52, 52, 53, 54, 54, 54, 55, 56, 56, 57, 57,

58, 58, 58, 59, 59, 59, 59, 59, 60, 61, 62, 63, 64, 64, 64,65, 66, 66, 67, 72, 73

Page 68: Istatistik

1 7 7 8 8

2 11 2 2 4 5 5 7

3 0 3 3 3 3 3 6 6 6 6 8

4 0 1 3 4 4 5 8 8 9

5 1 2 2 5 5 6 8

Dallar Yapraklar

Dal ve Yaprak Grafiği

Veriler: 17, 17, 18, 18, 21, 21, 22, 22, 24, 25, 25, 27, 30, 33, 33, 33, 33, 33, 36, 36, 36, 36, 38, 40, 41, 43, 44, 44, 45, 48, 48, 49, 51, 52, 52, 55, 55, 56, 58

Page 69: Istatistik

Ortalama ve Standart Sapma Grafiği

Sürekli değişkenler için kullanılan grafik türüdür.

Dağılım simetrik olduğunda kullanılır.

Grafikte ortalama 1 x (standart sapma değeri) bulunur

Bazen ortalama 2 x (standart sapma değeri) de kullanılabilir.

Page 70: Istatistik

Ortalama ve Standart Sapma Grafiği

170

160

150

140

Öğr

enci

leri

n B

oy U

zunl

uğu

(cm

) (O

rtal

ama

S. S

apm

a

Ortalama

+ 1 Standart Sapma

- 1 Standart Sapma

Ortalama=158.3

Standart Sapma=9.9

Page 71: Istatistik

Saçılım (Nokta) Grafiği

Sınıftan Rasgele Seçilen 10 Öğrencinin Boy Uzunluğu Dağılımı

150

155

160

165

170

175

180

185

Öğr

enci

leri

n B

oy U

zunl

uğu

(cm

)

Page 72: Istatistik

A Ğ I R L I K (Kg)

1009080706050

G L U K O Z (mg/100 ml)

130

120

110

100

90

80

70

Ağırlık Glukoz(x) (y)64.0 9075.3 10973.0 10482.1 10276.2 10595.7 121. .. .

77.6 87

Görünüşte Sağlıklı Bireylerin Ağırlık ve Glikoz Değerlerinin Saçılım Grafiği

Page 73: Istatistik

MATRİS SAÇILIM GRAFİĞİ

GTOP

MAXVO2

SPORYAS

Page 74: Istatistik

Tanımlayıcı İstatistikler

Yer Gösteren Ölçüler Yaygınlık Ölçüleri

Tanımlayıcı İstatistikler bir değerler dizisinin istatistiksel olarak genel özelliklerini tanımlayan ölçülerdir

Page 75: Istatistik

Yer Gösteren Ölçütler• Bir dağılımı tanımlayabilmek

için gereklidiriler• İki grupta incelenmektedir:

– Merkezi ölçütler-ortalama ölçütler•Ortalama, ortanca, tepe değeri

– Merkezi olmayan ölçütler-konum bildiren ölçütler•Çeyrekler, yüzdeler

Page 76: Istatistik

Ortalama Ölçütleri • Dağılımdaki değerlerin en fazla yoğunlaştığı

bir merkezi referans değeri verirler• Frekans dağılımları ve grafiklerle gösterilen

değişkenlerin karşılaştırılmasında daha somut olarak bilgi veren ölçütlerdir.

• En yaygın olarak kullanılanları– Aritmetik ortalama– Ortanca (medyan)– Tepe değeri (mod)– Geometrik ortalama

Page 77: Istatistik

Aritmetik ortalama

• Çoğunlukla simetrik bir yapıya sahip olan sürekli sayısal verilerde kullanılan bir ortalama ölçüsüdür.

• Büyüklük belirtmesi açısından kesikli sayısal verilerde de kullanılabilir. (Örneğin ortalama şut sayısı gibi)

• Sınıflandırılmış ve sınıflandırılmamış veriler için ayrı ayrı hesaplanır.

• X ile gösterilir• Sınıflandırılmamış verilerde her bir

gözleme ilişkin değerlerin toplamı denek sayısına bölünerek elde edilir:

Page 78: Istatistik

Aritmetik OrtalamaÇoğunlukla sayısal verilerde kullanılan bir merkezi eğilim ölçüsüdür. Her bir gözleme ilişkin değerlerin toplamının denek sayısına bölünmesi ile elde edilir.

N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere

KitleA.Ortalaması

ÖrneklemA. Ortalaması

N

1ii

x

nx

n

1ii

x

Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir.

Page 79: Istatistik

Aritmetik ortalama

• Sınıflandırılmamış verilerde:

xi

X = i=1,2,3...n n

5 kişinin yaşları: 20, 25, 22, 21, 18 olarak verilmiş olsun

X = (20+25+22+21+18)/5 = 21,2 olarak bulunur

İ=1

n

Page 80: Istatistik

Aritmetik ortalama

• Sınıflandırılmış verilerde:

fi . si

X = i=1,2,3...k (sınıf sayısı) n

fi = i.sınıfın frekansı,

si=i.sınıfın sınıf değeri olmak üzere

İ=1

k

Page 81: Istatistik

Aritmetik ortalamaMaxVO2 fi si fisi

40-44 2 42 84

45-49 3 47 141

50-54 8 52 416

55-59 13 57 741

60-64 8 62 494

65-69 4 67 268

70-74 2 72 144

Toplam 40 2290

X = 2290 /40 = 57.25 ml/kg/dk

Page 82: Istatistik

Ortanca (medyan) • Bir dağılımdaki değerleri iki eşit parçaya bölen

ve uç değerlerin bulunduğu durumlarda kullanılan bir ortalama ölçüsüdür.

• Verileri küçükten büyüğe doğru dizdiğimizde gözlem sayısı tek sayılı bir değerse ortanca (n+1)/2. gözlem değeridir

• Verileri küçükten büyüğe doğru dizdiğimizde gözlem sayısı çift sayılı bir değerse ortanca n/2 ile (n+2)/2. gözlem değeridir

• Dağılımdaki aşırı değerlerden etkilenmediği için dağılımın çarpık olduğu durumlarda kullanılması gerekir.

• Ortalamaya göre zayıf olan tarafı dağılımdaki her değerin dikkate alınmamış olmasıdır.

Page 83: Istatistik

Ortanca (medyan)

• 9 adet sporcunun milli olma sayıları şu şekilde verilmiş olsun:

5,6,4,7,5,8,38,7,4Medyanı bulmak için değerler önce

küçükten büyüğe dizilir:4,4,5,5,6,7,7,8,38 , ortanca (n+1)/2’den (9+1)/2=5. değer olan 6 olurDağılımın aritmetik ortalaması ise 9.3’tür aşırı değer olan 38’den

etkilenmiştir.

Page 84: Istatistik

Ortanca (medyan) • 6 adet sporcunun şut sayıları şu şekilde

verilmiş olsun:15 21 17 42 18 19Medyanı bulmak için değerler önce

küçükten büyüğe dizilir:15 17 18 19 21 42 , ortanca (n)/2’den (6)/2=3. gözlem ile (6+2)/2= 4.gözlem

değerinin ortalamasıdır. yani: (18+19)/2= 18.5 olarak gerçekleşir.

Yani gözlemlerin %50’si 18.5’in altında %50’si ise üstündedir.

Page 85: Istatistik

Tepe Değeri (mod) • Dağılımda en fazla tekrarlanan değerdir.Örneğin şu şekilde bir dağılımda:13 26 19 16 19 18 19 19 tepe değeri 19 olurSınıflandırılmış verilerde en yüksek frekansa

sahip sınıfın sınıf değeri tepe değeridir.Burada tepe değeri 57 dir

MaxVo2 Frekans %

40-44 2 5

45-49 3 7.5

50-54 8 20

55-59 13 32,5

60-64 8 20

65-69 4 10

70-74 2 5

Toplam 40 100

Page 86: Istatistik

Tepe değeri (mod)

• Tek tepe değeri olan dağılımlar olabildiği gibi birbirine çok yakın frekansa sahip iki sınıf olabilir.

• Böyle dağılımlara bimodal dağılım denir• İkiden fazla tepe değeri görüldüğü de olabilmektedir. • Aritmetik ortalama ve ortancaya göre daha az kullanılan

bir ortalama ölçüsüdür• Hesaplaması kolay olduğu için dağılım ortalamasının

kestiriminde yaklaşık bilgi verebilir• Dezavantajları ise

– Yapılan sınıflamaya göre tepe değeri değşmektedir– Bazı dağılımlarda tepe değeri olmayacağı gibi bazı

dağılımlarda birden fazla tepe değeri olabilir– Tepe değeri sonuç bir istatistiktir, daha ileri hesaplamalar

için pek kullanılmaz

Page 87: Istatistik

KONUM ÖLÇÜTLERİ

Çeyrekler: dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar,

Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür.

Değerlerin %50’si Ç2’ye eşit ya da ondan küçüktür. Bu değer aynı zamanda ortancadır.

Değerlerin %75’i Ç3’e eşit ya da ondan küçüktür.

1. Çeyrek (Ç1)1. Çeyrek (Ç1)1. Çeyrek (Ç1)1. Çeyrek (Ç1) 2. Çeyrek (Ç2)2. Çeyrek (Ç2)2. Çeyrek (Ç2)2. Çeyrek (Ç2) 3. Çeyrek (Ç3)3. Çeyrek (Ç3)3. Çeyrek (Ç3)3. Çeyrek (Ç3)

Yüzdelikler

Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler.Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler.

Örneğin verilerin ilk %30’u 30. Yüzdeliğe Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y30)(Y30) eşit ya da ondan küçüktür. eşit ya da ondan küçüktür.

Page 88: Istatistik

• ÇEYREKLER: Dağılımdaki gözlemler büyüklüklerine göre sıralandıklarında %25' inci değer 1. çeyrek, %75.değer 3. çeyrektir. %50' nci değer 2. çeyrek olup, bu değer aynı zamanda ortancadır

•  • Q1 = n/4' üncü gözlemin aldığı değer• Q2 = n/2' inci gözlemin aldığı değer• Q3 = 3n/4' üncü gözlemin aldığı

değer•  • eşitlikleriyle hesaplanır.

Page 89: Istatistik

• Yüzücülerin %25’i hangi değerden az değeri almıştır?(25. yüzdelik nedir? sorusudur) 0.25 x 40 = 10.

gözlemin değeri olan 53’tür

Sıra Gözlem Sıra Gözlem Sıra Gözlem Sıra Gözlem

1 40 11 54 21 58 31 63

2 44 12 54 22 59 32 64

3 46 13 54 23 59 33 64

4 46 14 55 24 59 34 64

5 49 15 56 25 59 35 65

6 50 16 56 26 59 36 66

7 52 17 57 27 60 37 66

8 52 18 57 28 61 38 67

9 52 19 58 29 62 39 72

10 53 20 58 30 62 40 73

Yüzdeliklerin hesaplanması

Page 90: Istatistik

YAYGINLIK GÖSTEREN ÖLÇÜTLER

• Dağılım içindeki değerler ortalamaya ne kadar yakınsa ortalama o dağılım için o denli iyi bir ölçüttür. Dağılım içindeki her bir değerin ortalamaya olan uzaklığı dağılımın yaygınlığını belirler. Ortalamadan ayrılışlar ne kadar küçükse dağılım o denli dik, ne kadar büyükse o denli yaygındır.

• VARYANS ( 2 , s 2 )• STANDART SAPMA ( , s )• STANDART HATA ( , sx)• VARYASYON KATSAYISI (v)

Page 91: Istatistik

Standart Sapma• Bir dağılımın yaygınlığını gösteren en

önemli yaygınlık ölçütlerinden biridir• Dağılımdaki tüm değerlerin aritmetik

ortalamaya olan uzaklıklarının ortalamasıdır• Standart sapma büyüdükçe dağılımın

yaygınlığı artar• Dağılımda değerler aynı olduğunda

yaygınlık yoktur ve standart sapma sıfır olur• Hesaplanırken dağılımdaki tüm değerler

dikkate alınır• Aritmetik ortalamayla birlikte kullanılır X ±

s

Page 92: Istatistik

• VARYANS (2, S2) : Bir dağılıma ilişkin gözlemlerin ortalamadan ayrılışlarının kareleri ortalamasına VARYANS denir.

•  • s2 = (Xi - X)2 / (n - 1) i=1, 2 … , n•  • eşitliği ile ya da bu eşitliğin değişik şekilde ifadesi

olan,•  • n

• Xi2 - ( Xi)

2 / n• i=1

• s2 =• n-1• ile hesaplanır

Page 93: Istatistik

 

s2 = (Xi - X)2 / (n - 1)i=1, 2 … , n

eşitliği ile hesaplanır. 

Şu şekilde bir dağılımımız olsun: 2, 1, 4, 3, 5. Bu dağılımın ortalaması (2+1+4+3+5)/5=3. Her bir gözlemin ortalamadan ayrılışlarını bulalım, bunların karesini alalım ve toplayalım

Ortalamadan ayrılış Kareler varyans

2- 3 = -1 1 10 / (5-1) = 2,5

1-3 = -2 4

4-3 = 1 1

3-3 = 0 0

5-3 = 2 + 4

Toplam 10

Page 94: Istatistik

Varyansın sınıflandırılmamış verilerde hesaplanması

• Dağılımımızın şu şekilde olduğunu varsayalım:• 2, 6, 1, 15, 6• n

• Xi2 - ( Xi)

2 / n• i=1

• s2 =• n-1

• Xi2 = 22+62+12+152+62 =302

• ( Xi)2 / n = (2+6+1+15+6)=30

• s2 = 302 – (30)2/5 = 30,5002 5-1

Page 95: Istatistik

• Sınıflandırılmış veriler için varyans aşağıdaki eşitlikle hesaplanır.

•  • n

• fibi2 - ( fibi)

2 / n• i=1

• s2 =• n-1 • Buradaki fi, i.sınıfın frekansı, bi i.

sınıfın sınıf değeridir.

Page 96: Istatistik

Varyansın sınıflandırılmış verilerde hesaplanması

s2 = 133100 – (2290)2 /40 =51,12 39

MaxVo2 fi si si2 fisi fisi

2

40-44 2 42 1764 4 3528

45-49 3 47 2209 141 6627

50-54 8 52 2704 416 21632

55-59 13 57 3249 741 42237

60-64 8 62 3844 496 30752

65-69 4 67 4489 268 17956

70-74 2 72 5184 144 10368

Toplam 40 2290 133100

Page 97: Istatistik

• STANDART SAPMA (, S): varyansın kareköküdür. Varyans ve Standart Sapma dağılımın yaygınlığına ilişkin genel bir bilgi veriri. Bu değerlerin büyük mü, küçük mü olduğu ya da dağılımın homojenliği konusunda yargıya varabilmek için ortalaması ile kıyaslamak gerekir.

• Sınıflandırılmamış verilerdeki örneğimizde varyansımız s2 = 30,5002 standart sapmamız

s= 30,5002 = 5,5227• Sınıflandırılmış verilerdeki örneğimizde

varyansımız s2 = 51,1225, standart sapmamız

s= 51,1225 = 7,15 olur

Page 98: Istatistik

• STANDART HATA (, SX): Standart hata, gözlem başına düşen sapma miktarıdır. Aritmetik ortalama genellikle standart hatası ile birlikte X Sx biçiminde verilir. STANDART HATA,

•  • Sx = (S2 / n) 1/2 eşitliği ya da

s/n eşitliği ile hesaplanır. • Örneğimizde s= 30,5002 = 5,5227,

n=5 olduğuna göre

• Sx = 5,5227 / 5 olur

Page 99: Istatistik

• VARYASYON KATSAYISI(v) : Standart Sapmanın ortalamaya göre yüzdesine VARYASYON KATSAYISI denir.

•  • V = S 100• X• eşitliği ile hesaplanır. Bu değerin % 50'

den büyük olması durumunda dağılım heterojendir denilir. Bu ölçüt aynı zamanda iki ya da daha çok dağılımın yaygınlıklarını kıyaslamada kullanılır.

Page 100: Istatistik

TEORİK DAĞILIŞLAR Verilerin oluşturduğu yığınlara dağılım demiştik. Verinin ölçüm biçimi gözlemlerin aldığı olası değerlerdir. Bu değerlerin birbirine göre konumu (büyüklük, küçüklük) dağılım aralığının sınırları v.b. gibi özelliklerden dolayı farklı yığınlar farklı dağılım yapısı gösterir. Spor ve sağlık bilimlerinde elde edilen verilerin oluşturduğu yığınlar daha çok şu üç dağılım tipine uyarlar:        Normal dağılım        Binom dağılım        Poisson dağılım

Bunlardan ilki sürekli, diğer ikisi ise kesikli dağılımdır.

Page 101: Istatistik

Normal Dağılım Fonksiyonunun Grafiksel Formülü:

biçimindedir. Bu eğriye çan eğrisi denir. Bu dağılım fonksiyonu Alman bilim adamı C.F. Gauss tarafından bulunmuştur. Bu nedenle eğriye Gauss eğrisi de denir.

Page 102: Istatistik

NORMAL DAĞILIM

X X

X X

Page 103: Istatistik

Normal dağılım fonksiyonunda herhangi bir deneğin ortalamadan uzaklığının standart sapmaya oranı Z' ye standart normal dağılım denir.

Z = Xi - X

SBu frekans dağılımının normal dağılım gösterip göstermediğini saptamada kullanılır. Ortalaması 0 varyansı 1 olan normal dağılımı aynı standart normal dağılım denir.

-4 -3 -2 -1 0 1 2 3 4

-3 -2 -1 0 1 2 3

Page 104: Istatistik

Normal Dağılımın Özellikleri:

Teorik normal dağılımda deneklerin aldığı değerler birbirinden bağımsız ve rasgeledir.

Teorik normal dağılım ortalamaya göre simetriktir. Gözlemler ortalamaya yakın değerler alırsa homojen, ortalamalardan uzak değerler alırsa dağılıma heterojen denir. Aynı ortalamaya sahip üç dağılımın dik ya da yayvan olması durumundaki eğriler aşağıda verilmiştir.

Page 105: Istatistik

Normal Dağılımın Özellikleri:

        Teorik normal dağılımda veriler süreklidir ve dağılım aralığı içinde her değeri alabilirler, yani - < x < +

Page 106: Istatistik

Normal Dağılımın Özellikleri:

•     Teorik normal dağılımda; • X S sınırları arasına gözlemlerin

% 68.26' sı• X 2S sınırları arasına

gözlemlerin % 95.44' ü• X 3S sınırları arasına gözlemlerin

% 99.74' ü girer.

-3s -2s -1s X 1s 2s 3s

Page 107: Istatistik

ÇARPIKLIK VE DİKLİK Normal dağılıma uyan gerçek veriler her

zaman ortalamaya göre simetrik olmazlar sola (negatif) ya da sağa (pozitif) çarpık olabilirler ama bu çarpıklık kabul edilebilir sınırlar arasında olmalıdır.

 Standart normal dağılımda ortalama,

ortanca, tepe değeri birbirine eşit ve üstüste çakışır. Dağılımın çarpıklığının ölçüsü çarpıklık katsayısı (Ç) ile ölçülür.

Page 108: Istatistik

Tepe Değeri

Ortanca

Ortalama

Tepe DeğeriOrtanca

Ortalama

Tepe DeğeriOrtanca

Ortalama

Sola ÇarpıkSağa Çarpık Simetrik

Page 109: Istatistik

ÇARPIKLIK VE DİKLİK 

(Xi - X)3

nÇ =

S3

ile hesaplanır. Bu değer; Ç = 0 ise dağılım simetrik,Ç < 0 ise dağılım sola (-) çarpıkÇ > 0 ise dağılım sağa (+) çarpık

Page 110: Istatistik

ÇARPIKLIK VE DİKLİK

Dağılım ortalamaya göre simetrik olabilir. Aynı ortalamaya sahip dağılımların görünümleri, varyansları farklı olabilir. Bu farklılık

Basıklık Katsayısı ile belirlenir. B>0 (Xi - X)4

nB =

S4

Page 111: Istatistik

• B>0• B=0• B<0

Burada; B=0 ise dağılım normalB<0 ise dağılım basıkB>0 ise dağılım dik denir.

Page 112: Istatistik

Sağa (pozitif) çarpık dağılım• TD < ortanca<X

TD

ortanca

X

Ç = 0 ise dağılım simetrik,Ç < 0 ise dağılım sola (-) çarpıkÇ > 0 ise dağılım sağa (+) çarpık

Page 113: Istatistik

Sola (negatif) çarpık dağılım• X< ortanca<Tepe değeri

TD

ortanca

X

Simetrik normal dağılımda ise ortalama, ortanca ve TD birbirine eşittir.Sağa çarpık dağılımlarda büyük değerler sayısı daha fazla, sola çarpık dağılımlarda da küçük değerlerin sayısı daha fazladır.

Page 114: Istatistik

BİNOM (İKİ TERİMLİ) DAĞILIMI 

Herhangi bir olayın gerçekleşmesi ya da gerçekleşmemesi inceleniyorsa yani iki olası sonuç varsa bu verilerin dağılımı binom dağılıma uyar. Örnek olarak:

Yapılan antrenman tekniğinin başarılı olup olmaması gibi

POISSON DAĞILIMIÇok sayıda olası durum içerisinde aranan olayın

gerçekleşme olasılığı küçükse ve veriler kesikli sayısalsa x=0, 1, 2, 3… v.b bu verilerin dağılımı poisson dağılımına uyar.

Page 115: Istatistik

Verilerde Standartlaştırma

Page 116: Istatistik

STANDARTLAŞTIRMA• Elde edilen puanlar veya veriler karşılaştırılırken

kullanılır• Örneğin bir öğrencinin sınav sonuçları şu şekilde

olsun:Ders İng Mat Psikol

Öğrencinin puanları

80 65 75

Öğrencinin sınıfa göre en başarılı olduğu dersi belirlerken sadece almış olduğu notlara bakarak karar veremeyiz. Sınıf ortalaması ve sınıf standart sapmasına göre yapılacak bir standartlaştırma yani yeni bir ölçeğe dönüştürme işlemi sayesinde daha rahat karşılaştırma yapabiliriz.

Page 117: Istatistik

STANDARTLAŞTIRMA• Öğrencinin bulunduğu sınıfa ait değerler de

eklenmiş olsun

Ders İng Mat Psikol

Öğrencinin puanları

80 65 75

Sınıfın ortalaması 85 55 60

Sınıfın standart sapması

10 5 15

Aslında öğrencinin en başarılı dersi gibi görünen İngilizce’de sınıf ortalamasının altında not aldığı başarısız gibi göründüğü matematik ve psikolojide sınıf ortalamasının üzerinde aldığı görülmektedir.

Page 118: Istatistik

Standartlaştırmada Z Skoru

• Verilerin standartlaştırılmasında en çok kullanılan yöntemlerden biridir

• Orijinal verileri ortalaması 0, standart sapması 1 olan yeni bir skora dönüştürür

Page 119: Istatistik

STANDARTLAŞTIRMADers İng Mat Psikol

Öğrencinin puanları

80 65 75

Sınıfın ortalaması 85 55 60

Sınıfın standart sapması

10 5 15

Bu veriler yardımıyla z-skorlarını hesaplayalım;

z = (Xi – X) / s

Page 120: Istatistik

STANDARTLAŞTIRMADers İng Mat Psikol

Öğrencinin puanları

80 65 75

Sınıfın ortalaması 85 55 60

Sınıfın standart sapması

10 5 15

Z (80-85)/10= - 0,50

(65-55)/5= +2

(75-60)/15= +1

Öğrenci İngilizce’de ortalamanın 0,50 standart sapma altında bir z skoruna sahipken, matematik dersinde ortalamanın 2 standart sapma üzerinde bir z skoruna sahiptir.

Page 121: Istatistik

Standartlaştırmada T Skoru

• Standart z skorlarının küçük ondalıklı sayıları içermesi ve de negatif ve pozitif değerler alabilmesi (genellikle –3 ve +3 arasında) , z skoruna dayalı ancak daha kolay anlaşılan t skorlarını ortaya koymuştur

• T skorları ortalaması 50, standart sapması 10 olan bir skorlar kümesidir.

• Genelde 20 ile 80 arasında değer alırlar

Page 122: Istatistik

STANDARTLAŞTIRMA

T skorunu elde etmek için her bir z skoru 10 ile çarpılarak 50 puan eklenir. En yüksek t skoru 80, en düşük t skoru 20 olabilir.

Ders İng Mat Psikol

Öğrencinin puanları

80 65 75

Z (80-85)/10= - 0,50

(65-55)/5= +2

(75-60)/15= +1

T (10*-0,50)+50= 45

(10*2)+50= 70

(10*1)+50=60

Page 123: Istatistik

Güven Aralıkları

Page 124: Istatistik

• Kitle dağılımına ilişkin parametreleri elde etmek çok zor, çoğu kez de olanaksızdır. Böyle durumlarda o kitleden çekilen örnekleme ilişkin istatistikler (X, S2, pq…vb) hesaplanır.

• Aynı kitleden aynı koşullarda çekilen farklı örneklemlerden elde edilen istatistikler farklı değerler alabilirler. Bu farklı değerdeki istatistikler belirli bir dağılım aralığı içinde değer alırlar ki bu değerlerin kitle parametreleri olan ve 2 değerlerine yakın değerler olması beklenir.

• Bu şekilde aynı kitleden çekilen örneklem değerlerinin alabileceği değerlerin oluşturduğu dağılım aralığına Güven Aralıkları denir.

Page 125: Istatistik

• KİTLE ORTALAMASI GÜVEN ARALIĞI

• Kitle Varyansı Bilindiğinde2 varyansına sahip bir kitlenin

ortalamasının (), güven sınırları, bu kitleden rasgele olarak çekilen bir örneklemin ortalaması (X), kitle standart hatası kullanılarak

• X- Z X + Z biçiminde hesaplanır.

• Burada = / n olarak hesaplanır.

Page 126: Istatistik

• KİTLE ORTALAMASI GÜVEN ARALIĞI

• Kitle Varyansı Bilinmediğinde• Kitle varyansı 2 'nin bilinmediği

durumda kitle ortalaması, 'nın güven aralığı, bu kitleden çekilen ve ortalaması X, varyansı S2 olan bir örnekleme ilişkin istatistiklerle,

• X - t Sx X + t Sx biçimimde hesaplanır. Burada Sx örneklem standart hatasıdır.

• Sx = s / n olarak hesaplanır.

Page 127: Istatistik

Hipotez ve Hipotez testleri

Page 128: Istatistik

Hipotez nedir?• Hipotez örneklem yardımıyla evren parametreleri

hakkında kestirimde bulunma sürecidir. • Herhangi bir konudaki doğruluğu bilimsel olarak

kanıtlanmamış düşünce, görüş ya da varsayımlardır.

Hipotezin amacı nedir?• Evrenden çekilen örneklemler yardımıyla evren

hakkında bir karara varma konusunda yardımcı olmaktır.

Hipotezimizin doğruluğunu nasıl kanıtlarız?• Hipotezimizin doğruluğunu kanıtlayabilmek

için veri yapımıza uygun bir hipotez testi uygulamamız gerekir. Hipotez testlerine önemlilik ya da anlamlılık testleri de denir.

Page 129: Istatistik

Hangi hipotez testini uygulayacağımız;

• Araştırma planına• Veri tipine• Denek sayısına• Verilerin dağılım yapısına göre, farklılık

gösterir.

Hipotezler iki türlüdür:

• H0 farksızlık hipotezi ya da sıfır hipotezi• H1 alternatif hipotezdir

Page 130: Istatistik

• H0 farksızlık hipotezi örnekleri:– Voleybol ve basketbol oynayan sporcularda

vücut yağ yüzdeleri arasında fark yoktur.– Kızlarla erkeklerin istatistik dersi notları

arasında fark bulunmaz– Spor yöneticiliğini kazanan öğrencilerle beden

eğitimi öğretmenliğini kazanan öğrencilerin ÖSS puan ortalamaları arasında anlamlı bir farklılık bulunmaz

• H1 alternatif hipotezi örnekleri:– Voleybol ve basketbol oynayan sporcularda

vücut yağ yüzdeleri arasında farklılık bulunur.– Kızlarla erkeklerin istatistik dersi notları

farklıdır– Spor yöneticiliğini kazanan öğrencilerle beden

eğitimi öğretmenliğini kazanan öğrencilerin ÖSS puan ortalamaları arasında anlamlı bir farklılık bulunur

Page 131: Istatistik

• Hipotezler tek yönlü ve çift yönlü olarak kurulmaktadır:

• TEK YÖNLÜ H0 : 1 - 2 = 0

H1 : 1 - 2 > 0

H0 : 1 - 2 = 0

H1 : 1 - 2 < 0

• ÇİFT YÖNLÜH0 : 1 - 2 = 0

H1 : 1 - 2 0

Page 132: Istatistik

• H0 farksızlık hipotezi örnekleri:– Voleybol ve basketbol oynayan sporcularda

vücut yağ yüzdeleri arasında fark yoktur.– Kızlarla erkeklerin istatistik dersi notları

arasında fark bulunmaz– Spor yöneticiliğini kazanan öğrencilerle beden

eğitimi öğretmenliğini kazanan öğrencilerin ÖSS puan ortalamaları arasında anlamlı bir farklılık bulunmaz

• H1 alternatif tek yönlü hipotez örnekleri:– Voleybol oynayan sporcularda basketbol

oynayanlara göre vücut yağ yüzdesi daha düşüktür.

– Kızların istatistik dersi notları erkeklerinkinden yüksektir.

– Spor yöneticiliğini kazanan öğrencilerin ÖSS puan ortalamaları beden eğitimi öğretmenliğini kazanan öğrencilerinkine göre yüksektir.

Page 133: Istatistik

Anlamlılık (yanılma ya da hata düzeyi nedir?

• Anlamlılık düzeyi araştırmacı tarafından testten önce belirlenen bir değerdir. ( ile gösterilir)

• H0 hipotezi doğru iken onu reddetme olasılığını ifade eder.

• Yani; gerçekte karşılaştırdığımız iki evren arasında fark yokken yanılıp fark varmış gibi farksızlık hipotezini reddetme olasılığıdır.

• Yanılma düzeyi ya da olarak en çok 0.05 kullanılır. Araştırmanın daha hassas olarak yapılması isteniyorsa olarak 0,01 ve 0,001 de kullanılabilir.

Page 134: Istatistik

Red etme ve kabul etme neye göre olur?

• Bir istatistiksel test uyguladığımızda karşımıza bir test istatistiği ve p değeri ortaya çıkacaktır.

• Biz ortaya koyduğumuz H0 veya H1’i bu sonuçlara göre kabul veya reddederiz.

• Hesaplamış olduğumuz test istatistikleri teorik tablolardaki değerlere eşit ya da büyük ise H0 reddedilir.

• Aynı şekilde elde ettiğimiz p değerleri 0.05’ten küçükse H0’ı reddederiz ve H1’i kabul ederiz.

• İstatistiksel paket programlarda elde edilen test istatistiklerine karşılık gelen p değerleri verilmekte olduğundan ayrıca teorik tablo değerlerine bakılmadan da bir hipotezin reddedilip kabul edileceğine karar verebiliriz.

Page 135: Istatistik

Hipotez testlerinde ne tür hatalar ortaya çıkar?

• Hipotez testlerinde karar verirken iki tür hata yapabiliriz.

• Bunlar:– 1. tip hata ( türü hata)– 2. tip hata ( türü hata) olarak adlandırılmaktadır

• H0 hipotezini gerçekte doğruyken reddetmek 1. tip hatadır

• H0 hipotezini gerçekte yanlışken kabul etmek de 2. tip hatadır.

Page 136: Istatistik

Hipotez testlerindeki doğru kararlar ve hatalar

H0 doğru iken

H0 yanlış iken

H0 ‘ı kabul etmek

Doğru karar 2.tip hata()

H0 ‘ı reddetmek

1.Tip hata () Doğru karar

Page 137: Istatistik

Hipotez Testlerinde İzlenecek Adımlar:

• Hipotezler kurulur yanılgı düzeyi belirlenir. • Verinin özelliklerine göre (dağılım yapısı

homojen, heterojen, sürekli, kesikli, denek sayısı v.b.) ve hipoteze bakılarak uygun test seçilir.

• Test yapılır. • i)Hesaplama bilgisayarda bir paket

program kullanılarak yapılıyorsa hesaplanan anlamlılık düzeyi p , yanılgı düzeyi ile karşılaştırılır.

• p > ise H0 kabul,• p ise H0 reddedilir.

Page 138: Istatistik

Hipotez Testlerinde İzlenecek Adımlar• ii)Hesaplama elle yapılıyorsa hesaplanan test

istatistiği, yanılgı düzeyinde ve o test için hesaplanan Serbestlik Derecesindeki (SD) çizelge değeri ile karşılaştırılır. Hesapla bulunan test istatistiği çizelgeden bulunandan büyükse H0 yokluk hipotezi reddedilir ve p < yazılır. Aksi durumda H0 hipotezi kabul edilir ve p> yazılır.

= 0.05 alınma durumunda p<0.05 ise bunun anlamı şudur: Ben bu çalışmada H0 hipotezini reddettim farkı anlamlı buldum, benim bu kararım 0.95 olasılıkla doğrudur. (H0' ı kabul etme) Yanılma olasılığım 0.05' ten küçüktür.

Page 139: Istatistik

• Hipotez testleri verilerin yapısına ve dağılım özelliklerine göre iki ana grupta toplanır:– Parametrik Hipotez Testleri– Parametrik Olmayan Hipotez

Testleri

Hipotez testleri

Page 140: Istatistik

• Bu iki ana gruptan her biri kendi içinde çok sayıda hipotez testi içerir. Bunların seçimi örneklem dağılımlarının özeliklerine ve gözlemlerin skalasına göre belirlenir.

• Bu iki tip hipotez testinden parametrik olanların uygulanabilmesi için test edilecek verilerde bazı koşullar aranır.

• Bu koşullardan en az birinin gerçekleşmemesi durumunda parametrik testlerin kullanılması sakıncalı olur.

• Bu durumda parametrik test yerine o testin karşıtı olan parametrik olmayan test kullanılır. Parametrik testlerin çoğunun parametrik olmayan karşıtı vardır.

Hipotez testleri

Page 141: Istatistik

Parametrik testler ve parametrik olmayan karşılıkları

PARAMETRİK PARAMETRİK OLMAYAN

İki Ortalama Arası Fark Mann Whitney U Testi

İki Eş Arasındaki Fark Wilcoxon İki Örnek Testi

Bağımsız İki Oran Arası Fark 2x2 Düzende Ki-Kare Testi

Bağımlı İki Oran Arası Fark Bağımlı Örneklerde Ki-Kare Testi

Tek Yönlü Varyans Çözümlemesi Kruskal Wallis Varyans Çözümlemesi

Tekrarlı Denemelerde Varyans Analizi

Freidman Testi

Page 142: Istatistik

PARAMETRİK TESTLERİN VARSAYIMLARI

• Normal dağılıma sahip olma• İkiden çok kitle olduğunda varyansların

homojen olması• Verilerin sürekli dağılım gösteren

karakterlerden oluşması• Her bir dağılımdaki gözlem sayılarının yeterli

sayıda olması (nj10)• İki ya da daha çok dağılım birbiri ile

karşılaştırılıyorsa dağılımlardaki gözlem sayıları birbirlerine eşit ya da yakın sayıda olmalıdır. Bu koşul küçük n' ler için daha da anlamlıdır.

• Örnekler birbirinden bağımsız ve rasgele seçilmelidir.

Page 143: Istatistik

PARAMETRİK TESTLERİN VARSAYIMLARI

• Bu varsayımlardan en az birisi yerine gelmezse parametrik testler kullanılmaz, bunun yerine parametrik olmayan karşıtı kullanılır. Parametrik olmayan testlerin varsayımları ise;

• -Örnekler rasgele ve birbirinden bağımsız olarak seçilecek

• -Her bir grupta en az 3 (n3) denek olacak

Page 144: Istatistik

Parametrik test varsayımları

• Normal Dağılıma Uyum:• Eldeki verilerin çekildiği kitlenin dağılımının normal

dağılıma uyup uymadığını test etmek için istatistik paket programlarındaki normallik testlerinden yararlanılabileceği gibi aşağıda verilen ölçütlerle de belirlenebilir.

• Bir dağılımın normal dağılıma uyabilmesi için dağılım ortalaması ( X) ile standart sapması (S) kullanılarak

•xS sınırları içine gözlemlerin %68.2nin aldığı değer girmelidir.

•x2S sınırları içine gözlemlerin %95.44nün aldığı değer girmelidir

•x3S sınırları içine gözlemlerin %99.74nün aldığı değer girmelidir

Page 145: Istatistik

Parametrik test varsayımları• Varyansların Homojenliği:• Varyansların homojenliği iki yönden ele

alınmalıdır. Birincisi her bir grubun küçük varyanslı olması(varyasyon katsayısı <%50)bunun anlamı standart sapma ortalamanın yarısından küçük olmalı , ikincisi ise birden fazla grup varsa varyanslarının birbirine oranı 1'e yakın olmalıdır. Normallik testinde olduğu gibi homojenlik testide istatistik paket programlarında vardır. Bunlar kullanılarak test edilebilirler.

Page 146: Istatistik

• Dağılımın Sürekli Olması: Bu varsayım için temel özellik önce veriler ölçüm mü yoksa sayımla belirlenen veriler mi? Bakılır.Ölçüm olması dağılımın sürekli olması için yeterli değildir. Dağılımda uç değerler (çok küçük yada çok büyük)varsa ölçüm olmasına karşın kesikli olabilir.

• Örneğin 20 denekten 19 tanesinin kan şekeri düzeyi 9-100 arasında değişirken bir tanesi 400 ise bu değer dağılımın süreklilik yapısını bozar ve bu değer dağılımdan çıkartılmalıdır.(Yanlış ölçüm ya da yanlış denek) Buna benzer birkaç değer varsa, dağılımdan atılamıyorsa bu durumda sürekliliği sağlayacak bir transformasyon yöntemi uygulanmalıdır. (Log, karekök, vb.)

Page 147: Istatistik

• Denek Sayıları:• Herbir dağılımdaki denek sayısı n10 olmalıdır.

n10 olmasının nedeni bu değerin rasgeleliğin dağılımı etkileme altsınırıdır.

• İstatistikteki Büyük Sayılar Kanunu'na göre n büyüdükçe rasgeleliğin dağılım üzerindeki etkisi azalır, gerçeğe ulaşma olasılığı artar. İşte bu kural için alt sınır 10'dur. n30 olduğunda rasgeleliğin etkisi yok denecek kadar azdır. Bunu bir örnekle açıklayalım:Dünyadaki kadın erkek oranı 0.50'dir.Bu doğan her bebekten 1 kız 1 erkek olacağı anlamına gelir. Doğum kliniği önüne gidelim, doğan bebeklerin cinsiyetine bakalım. Hiçbir zaman 1 kız 1 erkek doğmaz. Çünkü her doğum birbirinden bağımsızdır ve olasılığı 0.50'dir. Bazen arka arkaya 3 kız ya da 2 erkek ya da farklı oranlarda doğabilir. Hiçbir zaman arka arkaya 10 kız yada 10 erkek doğmaz.Bu oran 3 kız 7 erkek yada 4 erkek 6 kız yada 5 kız 5 erkek vb. olabilir. Doğum sayısı 30'a ulaştığında rasgeleliğin etkisi tamamen ortadan kalkar, oran 0.50 ulaşır.

Page 148: Istatistik

• İki yada daha çok grup karşılaştırılacaksa gruplardaki denek sayıları birbirine eşit yada yakın olmalıdır. bunun amacı herbir gruptaki rasgeleliğin etkisini eşit tutmaktır.Örneğin bir grupta 10 denek diğerinde 25 denek varsa birinci grupta rasgeleliğin etkisi 25 denekli ikinci gruptan daha fazladır. bu da farklı koşullarda kıyaslama yapmaya ve hatalı sonuç bulunmasına yol açar. Herbir gruptaki denek sayısının 30'un üzerinde olması durumunda eşitlik önemini yitirir. Bir grupta 30 diğerinde 50 denek olabilir.

Page 149: Istatistik

• UYGUN TEST SEÇİMİ• Eldeki veriye uygun test seçmek çok

önemlidir. Araştırma ne kadar iyi planlansa ne kadar iyi uygulansa tüm aşamaları ne kadar iyi yürütülse de sonuçta değerlendirme aşamasında yanlış test uygulanırsa o aşamaya kadar harcanan tüm emekler boşa gider. Peki elimizdeki veriye çok sayıda testten hangisini seçeceğiz. Doğru kararı nasıl vereceğiz. İşte bu iş için istatistikteki karar ağacı yöntemini bu amaçla kullanabiliriz. Bu aşamada önce verinin ölçüm yada sayım olması kriterine bakacağız.

Page 150: Istatistik

• Veri ölçümle belirtilen karakterlerden oluşuyorsa 2 nolu karar ağacını, sayımla belirtilen karakterlerden oluşuyorsa 3 nolu karar ağacını izleyeceğiz. Testin seçiminde karar ağacı ile birlikte önce parametrik test varsayımlarını gerçekleştirip gerçekleştirmediğine bakacağız.Parametrik (P), Nonparametrik (NP) ile belirtilen testi alacağız.

Page 151: Istatistik

VERİ

ÖLÇÜM SAYIM

Page 152: Istatistik

ÖLÇÜM

Grup Tek Grup İki Grup Çok

Page 153: Istatistik

ÖLÇÜM

Grup Tek Grup İki Grup Çok

Bağımsız Bağımlı Bağımsız Bağımlı

Page 154: Istatistik

ÖLÇÜM

Grup Tek Grup İki Grup Çok

Bağımsız Bağımlı Bağımsız Bağımlı

İki Ortalama Arası Fark Testi

İki Eş Arası Fark Testi

Tek YönlüVaryans Analizi

Tekrarlı ÖlçümlerVaryans Analizi

Mann WhitneyU Testi

Wilcoxon EşTesti

Kuruskal Wallis Varyans Analizi

Fredman Testi

Kitle OrtalamasıAnlamlılık Testi

İşaret Testi

Parametrik OlmayanTestleri

ParametrikTestler

Page 155: Istatistik

Sayım

Grup Tek Grup İki Grup Çok

Page 156: Istatistik

SAYIM

Grup Tek Grup İki Grup Çok

Bağımsız Bağımlı Bağımsız

Page 157: Istatistik

SAYIM

Grup Tek Grup İki Grup Çok

Bağımsız Bağımlı Bağımsız

Bağımsız İki Oran Arası Fark Testi

Bağımlı İki OranArası Fark Testi

2 x 2 DüzenindeKi-KareTesti

MacNemarTesti

Çok GözlüKi-Kare Testii

Kitle OranınınAnlamlılık Testi

Tek DeğişkenliKi-KareTesti

Fisher Kesin Ki-KareTesti

Kolmogrov Simirnov Testi

Parametrik OlmayanTestleri

ParametrikTestler

Page 158: Istatistik

Parametrik Hipotez Testlerine GirişT-Testleri

• Tek grupta t-testi• Bağımsız iki grupta t-testi• Eşleştirilmiş iki grupta t-testi

Page 159: Istatistik

Parametrik Hipotez Testlerine GirişT-Testleri• Tek grupta t-testinin varsayımları

nelerdir?– Test edilecek örneklem normal

dağılıma uygun olmalıdır.– Vakalar rasgele olarak seçilmiş

olmalıdır– Vakalar birbirinden bağımsız

olmalıdır.

Page 160: Istatistik

Parametrik Hipotez Testlerine GirişT-Testleri• Tek grupta t-testi örneklem

ortalamasının evren ortalamasına eşit olup olmadığını test etmek için kullanılır.

• Örneğin spor yapmayan yetişkin erkeklerin depresyon ölçeği puanlarının 50’den fazla olduğu yönünde bir hipotezimiz olduğunda oluşturduğumuz örneklemdeki puan ortalamasının 50’den farklı olup olmadığını test etmemiz gerekir. İşte örneklem ortalamamızın belli bir evren ortalamasına uyup uymadığını test etmek için tek grupta t-testini uygularız.

Page 161: Istatistik

KİTLE ORTALAMASI ÖNEMLİLİK TESTİ

t = X - Sx

H0 : = 50 n = 30

H1 : 50 S= 10,33 Sx = 10,33 / 30

t = 50-54,63 1,88

= -2,457 t 0.05,30 = 2.10p=0.020 p< 0,05

Sonuç örneklem ortalaması kitle ortalamasından farklıdır

Page 162: Istatistik

ÖrnekBasketbol oyuncularının vücut yağ yüzdesi ortalamasının %10 olup araştırılmak istenmektedir. Bu amaçla rasgele seçilen 30 basketbolcunun vücut yağ yüzdeleri ölçülmüştür.

H0 : Basketbolcuların vücut yağ yüzdesi ortalaması 10’dur. H1: Basketbolcuların vücut yağ yüzdesi ortalaması 10’dan farklıdır.

68.63090.1

1068.7

/

nS

xt

P<0.000

Yorum:Basketbolcuların vücut yağ yüzdesi ortalaması 10’dan farklı bulunmuştur.

Page 163: Istatistik

İki ortalama arasındaki farkın anlamlılığı testi• İncelenen bir değişken yönünden

birbirinden bağımsız iki grubun karşılaştırılmasında kullanılır.

• Varsayımları şunlardır:– Karşılaştırılacak iki grup vardır– Gruplar birbirinden bağımsızdır yani her

grupta farklı kişiler yer alır– Veriler sürekli sayısal verilerdir– Gruplardaki denek sayıları yeterlidir

(n>=30)– Evren dağılımları normal dağılım gösterir.– Evren varyansları homojendir

Page 164: Istatistik

İki ortalama arasındaki farkın anlamlılık testi• Örneğimizde iki farklı grup öğrenci var. 50 adet

kız öğrenci ve 50 adet erkek öğrenci. Burada cinsiyetin bilgi skorları üzerindeki etkisi araştırılmıştır. Buna göre iki ayrı cinsiyet grubunda bilgi skorlarının ortalaması karşılaştırılmıştır.– Birinci adım, iki farklı gruba ait verilerin bu testin

varsayımlarını karşılayıp karşılamadığıdır.– İkinci adım ise verilen istatistiklere göre arada anlamlı

fark olup olmadığına bakılmasıdır.– Birinci grubun bilgi skoru ortalaması 8,46,diğer grubun

ise 7,62 olsun. Formüllerde bunları ve standart sapmaları yerine koyduğumuzda ortaya bir t istatistiği çıkacaktır. Bunun p değerini bulduğumuzda 0.05’ten küçükse anlamlı bir fark olduğunu söyler,H0’ı reddederiz.

Page 165: Istatistik

İKİ ORTALAMA ARASINDAKİ FARKIN ÖNEMLİLİK TESTİ

H0 : X1 - X2 = 0

H1 : X1 - X2 0

X1 - X2

S12 + S2

2

n1 n2

Kızlarla erkeklerin bilgi skorları arasında fark var mı?

8.46 - 7.621.702 + 2.232

50 50

t =

t = = 2.12 t 0.05 , 49 = 2.01 p< 0.05

Page 166: Istatistik

İki eş arasındaki farkın anlamlılık testi• Bir denek üzerinde bazen birden fazla deney yapılmak

istenebilir. Örneğin spor bilimlerinde antrenman öncesi ve antrenman sonrası birçok parametre açısından karşılaştırma yapılarak antrenmanın bu parametrelere etkisi araştırılabilmektedir. Bu tür araştırmalarda grupların bağımlı yani aynı kişilerden oluştuğu söylenir.

• Eğer bağımlı grup sayısı 2 ve gruplara ait verilerin yapısı parametrik testlerin varsayımlarını karşılıyorsa iki eş arasındaki farkın anlamlılık testi ya da paired-t test kullanılabilir.

• Buna göre varsayımlarımız:– Bağımlı grup sayısı 2’dir– Veriler ölçümle belirtilmiştir– Denek sayısı her iki grupta da yeterlidir (n30)– Gruplardaki gözlem değerleri çıkartılarak elde edilen

farkların dağılımı normal dağılıma uygunsa bu test kullanılır

Page 167: Istatistik

Hipotezlerin kurulması:

H0:

H1:

D = 0D 0

Test istatistiğinin hesaplanması:

a) Gözlemlerin önceki değerlerinden sonraki değerleri çıkartılarak fark dizisi oluşturulur.

D

DS

nSS DD /

b) Farkların ortalaması bulunur:

c) Farkların standart sapması bulunur:

d) Farkların standart hatası bulunur:

Page 168: Istatistik

l t hesap l > t tablo

ise H0 hipotezi reddedilir ve p< (örneğin p<0.05) şeklinde gösterilir.

e) Test istatistiği (t hesap) hesaplanır:

DS

Dt

Page 169: Istatistik

ÖRNEK:

Primer hipertansiyonlu bireylere günde iki kez 20’şer dakikalık yürüyüş önerilerek, yürüyüşe başlamadan önceki 1 haftalık ortalama tansiyon miktarı ile yürüyüşe başladıktan sonraki 1 haftalık ortalama tansiyon miktarları arasında fark olup olmadığı öğrenilmek isteniyor.

Aynı bireylerin iki farklı zamandaki ölçümleri söz konusu olduğundan gruplar bağımlıdır.

Page 170: Istatistik

HastaSis. KanÖnce

BasıncıSonra

FarkÖnce-Sonra

1 140 125 15

2 135 120 15

3 150 145 5

4 155 155 0

5 145 150 -5

. . . ,

. . . ,

36 140 120 20Ortalam

a146,86 138,1

68,69

S. sapma

7,06 7,97

6,18

Page 171: Istatistik

FARK DEĞERLERİ

20,015,010,05,00,0-5,0

S A

Y I

10

8

6

4

2

0

P-P PLOT

1,0,8,5,30,0

1,0

,8

,5

,3

0,0

Page 172: Istatistik

03,136/18,6/ nSS DD

H0:

H1:

D = 0

D 0

1. Hipotezlerin Kurulması:

2. Test İstatistiğinin Hesaplanması

44,803,1

69,8

DS

Dt

Page 173: Istatistik

3. Alfa yanılma düzeyi 0.05 olarak alınmıştır.

4. İstatistiksel karar.

p<0,05

Yorum: Yürüyüş sonrasında sistolik kan basıncındaki 8.69 birimlik (mm/Hg) düşme istatistiksel açıdan anlamlıdır.

Page 174: Istatistik

Tek Yönlü Varyans Analizi

• Parametrik test varsayımları karşılanmalıdır– Gruplar normal dağılım göstermelidir– Grupların varyansları homojen olmalıdır– Gruplar birbirinden bağımsız olmalıdır– Veriler ölçümle belirlenmelidir– Her bir gruptaki gözlem sayısı 30’un

üzerinde olmalıdır• İkiden fazla bağımsız grup arasında fark olup

olmadığını test etmek için kullanılır• Yani iki ortalama arasındaki farkın anlamlılığı

testinin 2’den çok gruba uyarlanmış halidir

Page 175: Istatistik

İkiden Fazla Bağımsız Grupta Tek Yönlü Varyans Analizi

• Örnek: hentbol, basketbol ve futbol oynayan öğrencilerin yüzde yağ değerlerinin karşılaştırılması istendiğinde yüzde yağ değeri açısından 3 farklı spor grubu karşılaştırılırken tek yönlü varyans analizi kullanılır

Hentbol Basketbol Futbol

X 10,37 7,68 4,89

n1 30 30 30

Page 176: Istatistik

Tek Yönlü Varyans Analizi

• Varyans analizi sonucunda gruplar arasında fark yoksa işlemler sona erer.

• Varyans analizi sonucunda gruplar arasında fark bulunursa hangi gruplar arasında farklılık olduğu ortaya çıkarılır. Bunun için post-hoc testler uygulanır:– En küçük önemli fark yöntemi (her bir ortalama 1 kez

kullanılır)– Duncan yöntemi– Tukey HSD yöntemi ikili karşılaştırma– Student-Newman-Keuls yöntemi– Dunnett yöntemi (her bir deney grubu kontrol grubu ile

karşılaştırılır)

Page 177: Istatistik

İkiden Fazla Bağımlı Grupta nTekrarlı Ölçümlerde Varyans Analizi

• Bazı çalışmalarda aynı denekler ikiden fazla sayıda ölçüme tabi tutulurlar. Özellikle farklı zamanlarda yapılan ölçümlerin kullanıldığı çalışmalar tekrarlı ölçümlerde varyans analiziyle incelenir.

• Bu şekildeki deneylere denekler içi düzen (within-subject design) adı verilir.

• Tekrarlı ölçümlerde varyans analizinde de parametrik testlerde olduğu gibi – Normal dağılıma uygunluk – Varyansların homojenliği– n sayısının yeterliliği kavramları yer almaktadır.

Page 178: Istatistik

Tekrarlı Ölçümlerde Varyans Analizi• Örnek: Spor yapan kişilerde tansiyonların zaman

içindeki değişimi incelenmek istenebilir. • Bunun için aynı deneklerin spordan önce, spor yapmaya

başladıktan 3 ay sonra ve 6 ay sonra yapılan tansiyon ölçümleri karşılaştırılabilir.

Sporcu no

Önce 3 ay sonra

6 ay sonra

1 175 160 145

2 185 172 150

... ... ... ...

X 172,64 164,95 153,55140

145

150

155

160

165

170

175

önce 3 ay sonra 6 ay sonra

Page 179: Istatistik

ÖRNEK:

Lise öğrencilerinin düzey belirleme sınavı öncesi durumluk kaygı düzeylerini belirlemek ve varolan kaygı düzeyini azaltmak amacıyla düzenlenen bir çalışmada, rasgele seçilen 25 lise 1. sınıf öğrencisi araştırma örneklemini oluşturuyor.

Öğrencilerin ilk düzey belirleme sınavı öncesindeki durumluk kaygı düzeyleri belirlendikten sonra, gevşeme çalışması eğitimi veriliyor ve 2. ve 3. seviye belirleme sınavı öncesindeki kaygı düzeyleri tekrar ölçülüyor. Kaygı düzeyleri 20 maddelik durumluk kaygı ölçeği ile elde ediliyor.

Page 180: Istatistik

Öğrenci

İlk sınav

Öncesi

İkinci sınav

Öncesi

Üçüncü Sınav Öncesi

1 40 37 34

2 52 50 43

3 35 35 34

4 38 35 32

5 45 40 41

6 41 42 37

7 41 40 41

8 40 37 32

9 44 46 40

. . . .

25 42 41 34

Durumluk Kaygı Puanları

Page 181: Istatistik

Zaman Ortalama

S. Sapma n

I. Sınav Öncesi

42,24 4,92 25

II. Sınav Öncesi

41,80 4,91 25

III. Sınav Öncesi

38,36 4,57 25

Tanımlayıcı İstatistikler

Page 182: Istatistik

252525N =

DURUMLUK KAYGI ÖLÇÜMÜ ZAMANI

III. sınav öncesi

II. sınav öncesi

I. sınav öncesi

Duru

mlu

k K

aygı

Ort

ala

ma +

- 1 S

sapm

a

50

48

46

44

42

40

38

36

34

32

30

28

Page 183: Istatistik

Ho: Eğitim verilmeden önceki ve eğitim verildikten sonraki dönemlerde elde edilen durumluk kaygı puanları arasında fark yoktur.

HİPOTEZLERİN BELİRLENMESİ

H1: Eğitim verilmeden önceki ve eğitim verildikten

sonraki dönemlerde elde edilen durumluk kaygı puanları arasında fark vardır.

Karşılaştırma için F dağılımından yararlanılır. Hesapla bulunan F istatistiğinin elde edilmesinde kullanılan bilgiler bilgiler sıklıkla varyans analizi tablosunda özetlenir.

Page 184: Istatistik

Durumluk kaygı örneği için Varyans Analizi Tablosu

Değişim Kaynağı KT Sd KO F P

DönemlerArası

436.4

2 218.2 41.6 0.000

Denekler

Arası

182.3

24 7.6

Hata251.

748 5.2

Durumluk kaygı puanlarının dönemlere göre değişimi önemlidir (p<0.05). Hangi dönemler arasında fark olduğu ikişerli karşılaştırmalarla incelenmelidir.

KT: kareler toplamı, Sd: serbestlik derecesi, Ko:kareler ortalaması

Page 185: Istatistik

Sayımla Belirtilen Verilerde

Çapraz Tablo ve Ki kare analiziİki ya da daha çok değişkenin birlikte değişiminin

incelenmesi çoğu zaman çapraz tablo yapımını gerektirir.

İki ve daha fazla değişkenin kategorilerinin kesiştiği yerde frekansların olduğu tablolara çapraz tablo denir.

Eğer incelenecek iki değişken varsa, bu iki değişkenin birlikte değişimini göstermek amacıyla oluşturulan tabloya ikili çapraz tablo denir. Üç değişkenin birlikte değişimini incelemek amacıyla oluşturulan tabloya üçlü çapraz tablo,.... denir.

Page 186: Istatistik

Yaş Grupları Erkek % Kadın % Toplam

0 19 47.5 21 52.5 40

1-4 85 53.1 75 46.9 160

5-9 95 47.5 110 52.5 200

10-14 185 49.3 190 50.7 375

15-19 210 46.7 240 53.3 450

. . . . . .

. . . . . .

85+ 50 7.6 75 6.3 125

Toplam 1655 100 1595 100.0 3250

A Sağlık Bölgesindeki Nüfusun Yaşa ve Cinsiyete Göre Dağılımı

Page 187: Istatistik

Aile Planlaması Kullanma

Kullanan Kullanmayan

Öğrenim Sayı (%) Sayı (%) ToplamOkur Yazar Değil 15 25.

045 75.0 60

İlkokul 25 41.7

35 58.3 60

Ortaokul 32 53.3

28 46.7 60

Lise 40 66.7

20 33.3 60

Üniversite 48 80.0

12 20.0 60

Toplam 160 53.3

140 46.7 300

Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu

Page 188: Istatistik

0

20

40

60

80

100

Okur YazarDeğil

İlkolul Ortaokul Lise Üniversite

Öğrenim Durumu

Yüz

de (%

)

Kullanan

Kullanmayan

Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu

Aile P.

Page 189: Istatistik

Kİ-KARE TESTLERİ

1. Ki-kare testleri veri tipinin nitelik olduğu (kadın-erkek, iyileşti-iyileşmedi, hasta-sağlam, sosyo-ekonomik düzeyi iyi-orta-kötü,... gibi) verilerde kullanılır.

2. Ayrıca sürekli ya da kesikli sayısal veri tipinde olduğu halde sonradan nitelik veri konumuna dönüştürülen veriler arasında fark olup olmadığının incelenmesinde de kullanılır.

3. Veriler 2x2, 2x3, 3x3, 3x4, ... Boyutlu çapraz tablo şeklinde olmalıdır.

Page 190: Istatistik

2x2 ki-kare testiİki yüzde arasındaki farkın anlamlılık

testinin uygulandığı durumlarda istenirse 2x2 ki-kare testinden de yararlanılabilir.

2x2 ki-kare testinin avantajı, gruplardaki gözlem sayılarının az olduğu durumlar için

geliştirilmiş değişik ki-kare testlerinin olmasıdır. Gruplardaki gözlem sayısının az

olması durumunda ki-kare testlerinden yararlanmak daha uygundur.

Page 191: Istatistik

ÖRNEKLER: 2x2 (4 gözlü) ki-kare tablosu

Sigara Var

Yakınma Yok Toplam

İçen

İçmeyen

Toplam

Page 192: Istatistik

EğitimDüzeyi

İyi

Sağlık Orta

Bilgisi Kötü Topla

m

Düşük

Yüksek

Toplam

ÖRNEKLER: 2x3 ki-kare tablosu

Page 193: Istatistik

Çalışma Pozisyon

u

Varis

Olan

BulgusuOlmayan Toplam

Oturarak 26 175 201

Ayakta 44 181 225

Toplam 70 356 426

4.32

p>0.05Elde edilen sonuca göre oturarak ve ayakta çalışanlar Arasında varis bulgusu açısından anlamlı farklılık yoktur

Page 194: Istatistik

Akdeniz Üniversitesi Tıp Fakültesi

Osman Saka 194

Chi-Square Tests

8,025a 3 ,046

7,853 3 ,049

,070 1 ,792

73

Pearson Chi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)

3 cells (37,5%) have expected count less than 5. Theminimum expected count is 1,97.

a.

cinsiyet * pre op memnuniyet Crosstabulation

Count

3 18 25 3 49

3 9 6 6 24

6 27 31 9 73

erkek

kadin

cinsiyet

Total

zayif orta iyi çok iyi

pre op memnuniyet

Total

Page 195: Istatistik

Korelasyon Analizi ve Tahmin Kavramı

Page 196: Istatistik

Pearson Korelasyon Katsayısı (r)

Ölçümle belirtilen iki değişken arasındaki doğrusal ilişkinin kuvveti

(derecesi) ve yönü hakkında bilgi verir.

-1<= r <=+1arasında değişir.

Page 197: Istatistik

197

İlişki artar

0-1 +1

İlişki Azalır

Page 198: Istatistik

r(±) İlişkinin derecesi

0.90 to 1.00 Çok kuvvetli

0.70 to 0.89 Kuvvetli

0.50 to 0.69 Orta

0.30 to 0.49 Düşük

0.00 to 0.29 Zayıf

Olarak değerlendirilmekle birlikte ilişkinin derecesi ne olursa olsun anlamlı (p<0.05)olmalıdır. Aksi halde r ne olursa olsun (p>0.05) olması durumunda değişkenler arasında ilişkinin varlığından söz edilemez

İlişkilerin Değerlendirilmesi

Page 199: Istatistik

• Boy(cm) yaş(Ay)• 60 1• 65 3• 70 5• 75 7• 80 9

• 85 11• 90 13• 97 15• 100 17• 105 20• 110 21• 115 23• 120 25• 125 27• 130 30

• Egzersiz_Süresi Performans

• 60 100• 65 98• 70 96• 75 94• 80 92• 85 90• 90 88• 97 86• 100 84• 105 82• 110 80• 115 78• 120 76• 125 74• 130 72

Page 200: Istatistik

Tam İlişkir=1

0 5 10 15 20 25 30

Yaþ

130

120

110

100

90

80

70

60

Boy

60 70 80 90 100 110 120 130

Egzersiz_Süresi

100

95

90

85

80

75

70

perf

orm

ans

r=+1 r=-1

Page 201: Istatistik

Tam İlişkir=1

0 5 10 15 20 25 30

Yaþ

130

120

110

100

90

80

70

60

Boy

60 70 80 90 100 110 120 130

Egzersiz_Süresi

100

95

90

85

80

75

70

perf

orm

ans

r=+1r=-1

Page 202: Istatistik

• Boy_cm_ Yaş_ay_• 60 1• 62 3• 62 5• 80 7• 80 9

• 81 11• 90 13• 97 15• 100 17• 100 20• 100 21• 104 23• 108 25• 114 27• 130 30

• Egzersiz_Süre Performans

• 60 100• 65 100• 70 99• 75 99• 80 90• 85 95• 90 90• 95 88• 100 89• 105 87• 110 83• 115 79• 120 78• 125 70• 130 72

Page 203: Istatistik

Kuvvetli İlişki

0 5 10 15 20 25 30

Yaþ_ay_

130

120

110

100

90

80

70

60

Boy

_cm

_

60 70 80 90 100 110 120 130

Egzersiz_Süresi

100

95

90

85

80

75

70P

erfo

rman

s

r=0.97 p<0.001 r=-0.96 p<0.001

Page 204: Istatistik

Kuvvetli İlişki

0 5 10 15 20 25 30

Yaþ_ay_

130

120

110

100

90

80

70

60

Boy

_cm

_

60 70 80 90 100 110 120 130

Egzersiz_Süresi

100

95

90

85

80

75

70P

erfo

rman

s

r=0.97 p<0.001 r=-0.96 p<0.001

Page 205: Istatistik

Zayıf İlişkiler

P O Z İ T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

30

20

10

0

N E G A T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

30

20

10

0

Page 206: Istatistik

Zayıf İlişkiler

P O Z İ T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

30

20

10

0

N E G A T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

30

20

10

0

Page 207: Istatistik

İlişki Yok

Osman Saka

10 15 20 25 30 35

Yaþ

19

18

17

16

15

14

13

12

Hb

r=0.027 p=0.887

Page 208: Istatistik

İlişki Yok

Osman Saka

10 15 20 25 30 35

Yaþ

19

18

17

16

15

14

13

12

Hb

r=0.027 p=0.887

Page 209: Istatistik

İlişki Yok

Osman Saka

10 15 20 25 30 35

Yaþ

19

18

17

16

15

14

13

12

Hb

r=-0.027 p=0.887

Page 210: Istatistik

Korelasyon Analizi

• İki değişken arasındaki ilişkinin kuvveti ve yönünü bildiren bir analizdir

• Öncelikle saçılım (scatter) grafiklerinden yararlanılarak değişkenlerdeki ilişkilerin yapısı konusunda bir ön bilgi edinilir.

• Saçılım grafikleri doğrusal pozitif ve negatif yönde zayıf, kuvvetli ve tam ilişki gösterebilirken hiç ilişki de göstermeyebilmektedir.

Page 211: Istatistik

• Değişkenler arasında doğrusal ilişkilerin dışında doğrusal olmayan ilişkiler de bulunabilmektedir.

• Örnek: yaş ile sıçrama yüksekliği arasında belli bir yaşa kadar pozitif bir ilişki varken, belli bir yaşta maksimuma ulaştıktan sonra negatif bir ilişki gerçekleşir.

• Doğrusal ilişkiye sahip olmayan veriler bazen logaritmik dönüşümlerle doğrusal hale getirilebilir

Page 212: Istatistik

Korelasyon Katsayısı (r) • Ölçümle belirtilen değişkenler arasındaki

doğrusal ilişkinin yönünü ve kuvveti hakkında bilgi almak amacıyla Pearson Korelasyon Katsayısı kullanılır.

• Analizi yapılacak değişkenlerin normal dağılım varsayımını karşılaması gerekmektedir

• Normal dağılıma uyulmayan durumlarda Spearman rank korelasyon katsayısı kullanılabilir

Page 213: Istatistik

Korelasyon Katsayısının Hesaplanması

x y x.y - n• r= [( x2 - ( x)2 /n] [ y2 - ( y)2 /n]

r= xy çarpımlar toplamı (x ortalamadan ayrılış kareler toplamı)(y ortalamadan ayrılış kareler t.)  

Page 214: Istatistik

Korelasyon Katsayısının Hesaplanması

n x.y - x y• r= [ (n x2 - ( x)2] [n y2 - ( y)2 ]

 

Page 215: Istatistik

Korelasyon Hesaplama -Örnek• Sporcuların masa tenisinde aldıkları sayı (X) antrenman haftası

sayısı arasındaki ilişkinin incelenmesi

X Y X2 Y2 XY

10 14 100 196 140

5 10 25 100 50

14 18 196 324 252

2 8 4 64 16

3 6 9 36 18

6 12 36 144 72

4 8 16 64 32

20 40 400 1600 800

12 24 144 576 288

8 16 64 256 128

X=84 Y=156 X2 = 994 Y2 = 3360 XY = 1796

Page 216: Istatistik

Korelasyon Katsayısının Hesaplanması

10. 1796 - 84.156• r= [10 . 994 - (84)2].[10.3360 - (156)2 ]

  17960 - 13104• r= [9940 - 7056].[33600 - 24336 ]

0,939

Page 217: Istatistik

Korelasyon Katsayısının Anlamı• Korelasyon katsayısı r, –1 ve +1

arasındaki değerlerden oluşmaktadır.• -1’e yakın değerler negatif yönde

kuvvetli bir ilişkiyi,• +1’e yakın değerle pozitif yönde

kuvvetli bir ilişkiyi• 0’a yakın değerler çok düşük bir ilişkiyi

gösterir.• +1 ve –1 tam ilişki, 0 ise hiç ilişki

olmamasıdır

Page 218: Istatistik

Korelasyon Matrisi

• Özellikle ikiden fazla değişken arasındaki ilişkilerle ilgileniliyorsa bu değişkenler arasındaki ilişkiler matris şeklinde sunulur

Page 219: Istatistik

Correlations

1 ,359** -,204 ,008 ,014 ,097

,005 ,118 ,951 ,913 ,463

60 60 60 60 60 60

,359** 1 -,038 ,016 -,021 -,003

,005 ,775 ,904 ,873 ,981

60 60 60 60 60 60

-,204 -,038 1 ,159 ,011 -,008

,118 ,775 ,225 ,934 ,950

60 60 60 60 60 60

,008 ,016 ,159 1 ,045 -,033

,951 ,904 ,225 ,731 ,804

60 60 60 60 60 60

,014 -,021 ,011 ,045 1 ,168

,913 ,873 ,934 ,731 ,200

60 60 60 60 60 60

,097 -,003 -,008 -,033 ,168 1

,463 ,981 ,950 ,804 ,200

60 60 60 60 60 60

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

boy

kilo

sistolik arter basýncý

nabýz

operasyon süresi

motor blok süresi

boy kilosistolik arter

basýncý nabýzoperasyon

süresimotor blok

süresi

Correlation is significant at the 0.01 level (2-tailed).**.

Korelasyon Matrisi

Page 220: Istatistik

Kısmi Korelasyon Katsayısı• Bazen bazı değişkenler birden çok

değişkeni etkilemektedir. • Örneğin yaş değişkeni özellikle belli

değerler arasında birçok parametreyi etkilerler ve ilişki olmadığı halde korelasyona yol açarlar

• Örn. Kuvvet ile boy uzunluğu belli yaş dönemlerinde çok güçlü bir korelasyona sahiptir ama aralarındaki ilişki bu kadar güçlü olmayabilir.

Page 221: Istatistik

Kısmi Korelasyon Katsayısı• Böyle durumlarda iki ilişkisiz

değişkende korelasyona yol açan bağımsız değişkenin etkisinin ortadan kaldırılması ya da sabit tutulması gerekmektedir.

• Örnek: x1, x2, x3 gibi üç değişken olsun.• X1= matematik başarı puanı• X2 = ayak uzunluğu • X3 = yaş olsun

Page 222: Istatistik

• r12 = 0,80 (matematik puanı, ayak uzunluğu

ilişkisi) • r13 = 0,90 (matematik puanı, yaş ilişkisi)

• r23 = 0,88 (ayak uzunluğu, yaş ilişkisi)

r12 - r13 r23

r12.3 =

(1- r213) - (1- r2

23)

Page 223: Istatistik

Kısmi Korelasyon Katsayısı

0,80 – 0,90. 0,88

r12.3 =

(1- 0,902) - (1- 0,882)

3 nolu değişkenin yani yaş değişkeninin etkisi Kaldırıldığında matematik başarı puanı ile Ayak uzunluğu arasındaki korelasyon katsayısır = 0,038, yani 0 yakın anlamsız bir ilişkiyi ifade eder

= 0,038

Page 224: Istatistik

Spearman Sıra Korelasyon Katsayısı (rs)

Değişkenlerin biri ya da her ikisinin normal dağılma uymadığı durumlarda kullanılabileceği gibi Bağımlı, Bağımsız Yada her ikisinin sıralı (ordinal) olması durumunda iki değişkenin ilişki miktarını belirlemek amacı ile kullanılır.

Parametrik olmayan bir ilişki katsayısıdır.

Page 225: Istatistik

Örnek

Verileri daha önce verilen 73 hastanın operasyon süresi ile hastaların operasyondan memnun oluup olmadıkları sorulmuştur. Memnuniyetleri 4= çok memnun olmak üzere 1,2,3,4 olarak derecelendirilmiştir. Operasyon süresi ile memnuniyet arasında ilişki varmıdır?

Page 226: Istatistik

Correlations

1,000 ,107

. ,367

73 73

,107 1,000

,367 .

73 73

Correlation Coefficient

Sig. (2-tailed)

N

Correlation Coefficient

Sig. (2-tailed)

N

operasyon süresi

post op memnuniyet

Spearman's rho

operasyonsüresi

post opmemnuniyet

Page 227: Istatistik

Açıklayıcılık Katsayısı (R2)• Açıklayıcılık katsayısı, bağımlı değişkendeki

toplam değişimin yüzde kaçının bağımsız değişken tarafından açıklandığını belirtmektedir.

• R2, 0 ile 1 arasında değişmektedir.• r = 0,939 olduğunda, R2= 0,8649’dur• R2 değerinin 1’e yakın olması bağımlı

değişkendeki değişimin büyük bir bölümünün bağımsız değişken tarafından açıklandığını ve modelin uygun olduğunu gösterir.