istatistik

İstatistik Araştırmalar, Bilimsel Çalışmalar ve Günlük Olaylardan

sistemli bir biçimde veri toplama ve bilgilerin incelenmesi, özetlenmesi, ölçülmesi, sınıflandırılması, çözümlenmesi, neden sonuç ilişkilerinin belirlenmesi, karşılaştırılması, aralarındaki ilişkilerin ortaya konması, elde edilen sonuçların kitlelere anlayabilecekleri ve etkili bir şekilde sunulmasının tüm evrelerini kapsayan bilim dalıdır.

• Teorik İstatistik• Uygulamalı İstatistik

Herhangi bir konu hakkındaHerhangi bir konu hakkında

►Bilgi toplamak,►Bilgi toplamak,

►Toplanan bilgileri düzenlemek,►Toplanan bilgileri düzenlemek,

►Çözümlemek►Çözümlemek

►Yorumlamak►Yorumlamak

►için gerekli yöntemler topluluğudur. ►için gerekli yöntemler topluluğudur.

Tanımlayıcı İstatistik

(Descriptive Statistics)

Tanımlayıcı İstatistik

(Descriptive Statistics)

olarak iki ana gruba ayrılır.

Çıkarımsal İstatistik

(Inferential Statistics)

Çıkarımsal İstatistik

(Inferential Statistics)

Tablo ve grafiklerle

sunulmasını içerir.

Verilerin özetlenmesi,

Sınıflandırılması,

Karara varmaKarara varma

Örneklemden elde edilen bulgular yardımıylaÖrneklemden elde edilen bulgular yardımıyla

Evren hakkında kestirimde bulunma,Evren hakkında kestirimde bulunma,

Hipotezleri test etme Hipotezleri test etme

İşlemlerini içerirİşlemlerini içerir

Evren(population): Belirli özellikleri gösteren bireylerin ya da nesnelerin oluşturduğu topluluktur.

Türkiye’deki spor yüksekokullarındaki öğrencilerin evreni, tüm spor yüksekokullarındaki tüm bölümlerdeki öğrencileri kapsar.

Örnek(sample): Evrenin tüm özelliklerini taşıyan, onu tanımlama yeteneğine sahip bir parçasıdır.

Parametre(parameter): Evrende incelenen değişkenleri tanımlamak için kullanılan ölçütlerdir ortalama(), varyans(2), oran(p) v.b.

İstatistik: örneklemi tanımlamak için kullanılan ölçütlerdir. Örneklem ortalaması (X) standart sapma (s) v.b.

Denek(subject): Bilimsel çalışmanın yapıldığı birim (insan, hayvan, nesne v.s.)

Evren ve örneklemde gösterim

Tanımlayıcı ölçüt Örneklemde (istatistik)

Evrende (parametre)

Ortalama X

Oran p P

Standart sapma S

Varyans S2 2

Gözlem sayısı N N

Değişken(variable): İncelenen faktör ya da karakter, farklı bireylerde farklı değerler alabiliyorsa buna değişken denir

Veri (data): Herhangi bir konuda bilinmeyeni ortaya çıkarmak amacıyla yapılan araştırma, deney, gözlem, uğraşı veya olay sonucu elde edilen nicel ya da nitel ham materyaldır.

VERİDE BULUNMASI GEREKEN ÖZELLİKLER

• DOĞRULUK• GÜNCELLİK• GÜVENİLİRLİK• EKSİKSİZLİK• KULLANILABİLİRLİK• AMACA UYGUNLUK

Bilgi (information): Verilerin ve önceki bilgilerin işlenmesiyle elde edilen anlamlı mesaj veren kavramlardır.

VERİBİLGİ

VERİ BİLGİ

VERİLERİN İŞLENMESİ

Nicelik belirten (ölçü-lerek yada sayılarak elde edilen) verilerdir.

Örneğin, yaş, ağırlık, boy gibi.

Bireylerin sahip olduğu belli özelliklerin sınıflara ayrılarak belirtildiği verilerdir.

Örneğin, cinsiyet, medeni durum, başarılı-başarısız gibi.

Niceliksel (Quantitative) Niteliksel (Qualitative)

Sıralanabilir(Ordered)

Sınıflanabilir(Nominal)

Nitelik verilerde belli bir sıralama söz konusu ise (kötü-orta-iyi-mükemmel gibi ya da Okur yazar olmayan, okur yazar, ortaokul, lise, üniversite mezunu) bu tür verilere sıralanabilir nitelik veriler denir.

Nitelik verilerde belli bir sıralama yoksa bu tür verilere sınıflanabilir nitelik veriler denir Örneğin cinsiyet, medeni durum gibi.

İki Sınıflıİki Sınıflı Çok SınıflıÇok Sınıflı

Kesikli SayısalDiscrete numeric variable

Sürekli SayısalContinuous numeric variableSürekli SayısalContinuous numeric variable

Belirli bir aralıktaki tam sayıları alan veri türüdür. Örnek: Sınıftaki öğrenci sayısı, çocuk sayısı gibi

Ölçümle belirtilirler ve bir aralıktaki bütün değerleri alırlar. Örnek: Boy uzunluğu, yaş, günlük kalsiyum tüketim miktarı (mg) gibi.

Aralık ÖlçekliInterval Scale

Oran ÖlçekliRatio Scale

ÖLÇME-ÖLÇEK KAVRAMLARI

• Gözlenen olayları sınıflandırma, değer verme ile sonuçlanan işlem

• Gözlenen olaylara sayısal bir değer verme, ya da olayları belli kurallara göre sayısallaştırma işlemidir

ÖLÇEK TÜRLERİ• Sınıflandırma ölçeği

– Erkek=1, Kadın=2• Sıralama ölçeği

– Ölçümler sadece sıra dizisini gösterir, ama aralarındaki uzaklık kesin değildir

– Doktora, yüksek lisans, lisans, önlisans• Aralık ölçeği

– Eşit bölme aralığına sahiptir– Başlangıç noktasının sıfır olma zorunluluğu yoktur,

varsa da yokluğu göstermez– Zeka testinden sıfır almak zekasız olmayı göstermez

• Oran ölçeği– Puanlar değişkenin gerçek miktarını yansıtır, eşit

ölçme birimi vardır– Sıfır değeri sıfır olma halini gösterir, (uzunluk, ağırlık

ölçümleri gibi)

Dağılım(distribution): Verilerin oluşturduğu yığınların biçimine dağılım denir.

Kesikli Dağılım: Dağılım aralığı içinde her değeri alamayan verilerin dağılımı kesikli dağılımdır. (Hiçbir zaman 3.7 bebek olamaz). Hasta-sağlam gibi.

Sürekli Dağılım: Sürekli verilerin (ölçüm ve tartımla belirtilen) oluşturduğu dağılımlardır.

Sürekli veriler sınıflandırılarak kesikli hale getirilebilirler.

Örneğin kişileri boylarına göre uzun boylu, orta boylu ve kısa boylu olarak sınıflandırabiliriz.

Sınılandırma yaparken objektif olmaya çalışmak gerekmektedir.

VERİLERİN SINIFLANDIRILMASI

Sınıflandırma

• Bir kitlenin veya grubun özelliklerine göre yapısını ortaya çıkarabilmek amacıyla, elde edilen bilgileri bir özellik ya da özellikler bakımından çeşitli seçeneklere ayırarak aynı seçeneğe ait birimleri kümeler halinde bir araya getirmedir

• Veri sayısı sınırlıyken yapılır

Sınıflandırmaya örnek

Yaş Frekans (sıklık)

TOPLAM 100

Gruplama

• Eğer sınıflandırılacak veri sayısı çok fazla ise bunları sınıflandırma yoluyla kümelere ayırmak mümkün olsa bile anlamlı ve işlemlere elverişli olmayabilir

• Böyle durumlarda bir özelliğin birbirine yakın olana seçenekleri gruplar halinde toplanır ve yeni gruplamalara başvurulur

Frekans Dağılımları (Frequency Distributions)

• Verilerin her bir sınıf aralığına düşen gözlem sayısını (frekans) gösterecek şekilde gruplandırılması işlemi

Frekans Dağılımları ile İlgili Temel Kavramlar• Dağılım genişliği = Verilerin minimum

ile maksimum değerleri arasındaki fark• Sınıf sayısı= O dağılımın incelemek

istenen sınıf sayısı• Sınıf sınırları= Sınıfa ait minimum ve

maksimum sınır değerleri• Sınıf aralığı= Sınıfın alt ve üst sınırları

arasındaki fark• Sınıf orta noktası=Sınıfın alt ve üst

sınırlarının ortalaması

Sınıf aralığının belirlenmesi

• Sınıf aralığı = Dağılım GenişliğiSınıf Sayısı

Maksimum değer-minimum değer sınıf sayısı33.625 – 12.546 = 21.079 = 3011 7

Frekans Dağılım Tablosunun Hazırlanması

Sınıflar Alt sınırlar Üst Sınırlar

1 12.546

(12.546 + 3.011)= 15.55715.557 – 1 = 15.55615.556

2 15.557

(15.557 + 3.011) = 18.56818.568 – 1 = 18.56718.567

3 18.568

(18.568 + 3.011) = 21.57921.579– 1 =21.57821.578

4 21.579

(21.579 + 3.011) = 24.59024.590 – 1 = 24.58924.589

Frekans Dağılım Tablosunun Hazırlanması

Sınıflar Alt sınırlar Üst Sınırlar

5 24.590

(24.590 + 3.011) = 27.60127.601 – 1 = 27.60027.600

6 27.601

(27.601 + 3.011) = 30.61230.612 – 1 = 30.61130.611

7 30.612 33.625

Frekans dağılım tablosu

HİSTOGRAM

Frekans Dağılımlarının Oluşturulmasında Dikkat Edilecek Noktalar

• Mümkün olduğu kadar eşit sınıf aralıkları seçilmelidir

• Eşit olmayan sınıf aralıkları frekansların grafiksel gösterimlerinde yanlış algılamalara yol açabilir

SUNU YÖNTEMLERİ

•METİN•TABLO•GRAFİK

•TEK BOYUTLU

• İKİ BOYUTLU

•ÇOK BOYUTLU

TABLO YAPIMINDA DİKKAT EDİLECEK NOKTALAR

• BAŞLIK– Başlık kısa, özlü olmalıdır. – Genelde tablonun üstüne yazılır– Başlığın bölüm ve sıra no’ su yazılır

• Kolon ve satır başlıkları,ölçekler,birimler yazılır

• Değerlere ek olarak yüzdeler de verilir• Üçten çok değişken aynı tabloda

verilmez, verilirse çizgilerle ayrılır

TEK BOYUTLU TABLO

voleybol 15 30

judo 10 20

tenis 15 30

basketbol 5 10

yüzme 5 10

TOPLAM 50 100

Tablo 1.1 Sporcuların Branşlarına Göre Dağılımı

İKİ BOYUTLU TABLO

E K TOPLAM

n % n %

voleybol 10 20 5 10 15

judo 8 16 2 4 10

tenis 5 10 10 20 15

basketbol 2 4 3 6 5

yüzme 1 2 4 8 5

TOPLAM 26 52 24 48 50

Tablo 1.2 Sporcuların Branşlarına ve Cinsiyetlerine Göre Dağılımları

ÇOK BOYUTLU TABLO

Erkek Kadın Toplam

Yaş Yaş

<20 20-22 22> <20 20-22 22>

voleybol 2 3 5 1 1 3 15

judo 1 3 4 0 1 1 10

tenis 2 1 2 1 1 8 15

basketbol 0 0 2 0 1 2 5

yüzme 0 0 1 0 2 2 5

TOPLAM 5 7 14 2 6 16 50

Tablo 1.3 Sporcuların Branşlarına Cinsiyetlerine ve Yaşlarına Göre Dağılımları

GRAFİK ÇEŞİTLERİ• SÜTUN GRAFİK• ÇUBUK GRAFİK• ÇİZGİ GRAFİK• PASTA-DAİRE DİLİMLERİ GRAFİĞİ• ALAN GRAFİĞİ• HİSTOGRAM, DAĞILIM POLİGONU• KUTU VE ÇİZİGİ GRAFİĞİ• DAL VE YAPRAK GRAFİĞİ• ORTALAMA STANDART SAPMA GRAFİĞİ• SAÇILIM (NOKTA GRAFİĞİ)

GRAFİK YAPIMINDA DİKKAT EDİLECEK NOKTALAR

• BAŞLIK– Her grafiğin bir başlığı olmalıdır– Grafiğin altına veya üstüne yazılabilir– Başlığın bölüm ve sıra no’ su yazılır.(Grafik 3.2)

• Eksenlerin neyi ifade ettiği ve değişkenlerin birimleri belirtilir.

• Kullanılan alan ve çizgi türleri çeşitlilik gösteriyorsa grafiğin iç sağ üstünde ya da dış sol altında açıklanmalıdır

• Başlıktaki ölçeklendirme ve kısaltmalar belirtilmelidir.

SÜTUN GRAFİK

Grafik 1.1 Sporcuların Branşlarına Göre Dağılımı

Basketbol Tenis Yüzme Judo Okçuluk

BRANŞLAR

ErkekKadin

Sütun Grafik

Çoğunlukla nitelik verilerde kullanılır.

Her bir kategori birbirinden ayrı çubuklarla gösterilir.

Çubukların eni birbirine eşittir ve bitişik değildir.

Yatay eksende incelenen değişkene ilişkin kategoriler dikey eksene

bu kategorilere ilişkin sayı ya da yüzde değerleri konulur.

105Şişman10050Toplam

2010Hafif Şişman

4020Normal

3015Zayıf

%SayıVücut Ağırlığı

Öğrencilerinin Ağırlıklarına Göre Dağılımı

Zayıf Normal Hafif Şişman Şişman

Öğrencilerin Ağırlıkları

ÇUBUK GRAFİK

Grafik 1.1 Sporcuların Branşlarına Göre Dağılımı

0 2 4 6 8 10 12

Voleybol

Okçuluk

Hentbol

Sporcu Sayısı

KadinErkek

Okur YazarDeğil

İlkolul Ortaokul Lise Üniversite

Öğrenim Durumu

Kullanmayan

Kullanan

Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu

Aile P.

ALAN GRAFİK

Grafik 1.1 Sporcuların Branşlarına ve Cinsiyetlerine Göre Dağılımı

Voleybol Tenis Basketbol Judo Okçuluk

Branşlar

KadınErkek

3B SÜTUN GRAFİK

VoleybolHentbol

JudoOkçuluk

Kadın0

Branşlar

Grafik 1.1 Sporcuların Branşlarına ve Cinsiyetlerine Göre Dağılımı

ErkekKadın

ÇİZGİ GRAFİK

Grafik 1.1 Spor Yüksekokulu Öğrencilerinin Başarı Durumlarının Yıllara Göre Dağılımı

1.yıl 2.yıl 3.yıl 4.yıl

Yıllar

ErkekKadın

Z AM A N (ay)

6543Başlangıç1

İ L A Ç

PASTA GRAFİKGrafik 1,1 Sporcuların Branşlarına GöreDağılımı

Voleybol

Basketbol

Yüzme

Pasta-Daire Dilimleri Grafiği

Nitelik verilerde kullanılan bir grafik yöntemidir.

105Şişman10050Toplam

2010Hafif Şişman

4020Normal

3015Zayıf

%SayıVücut Ağırlığı

Zayıf için:

Normal için:

Hafif Şişman için:

Şişman için:

derece

Zayıf30%

Normal40%

Hafif Şişman20%

Şişman10%

Öğrencilerinin Ağırlıklarına Göre Dağılımı

X-Y DAĞILIMI

YAS(AY)

121086420

Grafik 1.2 Çocuklarda Yaşa Göre Ağırlık

Gebelik Haftası

Sigara

İçiyor

İçmiyor

Doğum Ağırlığı Gebelik Haftası Sigara 2940 38 içiyor3130 38 İçmiyor2420 36 içiyor2450 34 İçmiyor

Annenin Sigara İçme ve Gebelik Haftası

Durumuna Göre Çocukların Doğum Ağırlığı Dağılımı

Histogram

Sürekli değişkenler için kullanılan grafik türüdür.

Çubuklar birbirine bitişik olarak çizilir.

Sayı ya da yüzde kullanmak grafiğin şeklini değiştirmez.

Yatay eksende sınıf değeri dikey eksende sayı ya da yüzde bulunur. (Yatay eksene alt sınır ve üst sınır değerleri de yazılabilir)

ANTREMAN SONRASI 10. DAKİKA NABIZ ÖLÇÜMLERİ

Std. Dev = 17,70 Mean = 92,4N = 26,00

NABIZ 10.DK

130,0120,0110,0100,090,080,070,060,0

HİSTOGRAM

Öğrencilerin BoyUzunluklarına Göre Dağılımı

147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182

Boy Uzunlukları (cm)

kansSimetrik Dağılım

Öğrencilerin BoyUzunluklarına Göre Dağılımı

147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178

Sağa Çarpık (Pozitif Çarpık) Dağılım

Sola Çarpık (Negatif Çarpık) Dağılım

Öğrencilerin Boy Uzunluklarına Göre Dağılımı

147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182

Dağılım PoligonuHistogramdaki çubukların en üst orta noktalarının çizgilerle

birleştirilmesiyle elde edilir.

Öğrencilerin Boy Uzunlıklarına Göre Dağılımı

147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182

Boy Uzunlukları

5. Kutu ve Çizgi Grafiği

Yüzdelikler yardımıyla veriyi özetlemekte kullanılan basit ve çok kullanışlı bir grafik yöntemidir.

Grafikte 25., 50., 75., Yüzdelikler en küçük değer ve en büyük değer bulunmaktadır.

Daha çok dağılım çarpık olduğunda kullanılır.

Dağılımdaki aşırı gözlemlerin varlığı konusunda da bilgi verir.

25.Yüzdelik

Sola Çarpık (Negatif Çarpık) Dağılım

Ortanca

*21 Çok Aşırı Değer

o22 Aşırı Değer

Aşırı değer Olmayan En Büyük Değer

Aşırı değer Olmayan En Küçük Değer

75.Yüzdelik

Ortanca

*21 Çok Aşırı Değer

o22 Aşırı Değer

75.Yüzdelik

Sağa Çarpık (Pozitif Çarpık) Dağılım

25.Yüzdelik

Simetrik Dağılım

) Ortanca

75.Yüzdelik

25.Yüzdelik

Tepe Değeri

Ortanca

Ortalama

Tepe DeğeriOrtanca

Ortalama

Tepe DeğeriOrtanca

Ortalama

Sola ÇarpıkSağa Çarpık Simetrik

Öğrenim Durumu

ÜNİVERSTELİSEORTAOKULİLKOKULOYD

ı 100

Annelerin Öğrenim Düzeylerine Göre

Çocuk Bakım Bilgi Puanlarının Dağılımı

Dal ve Yaprak Grafiği

Dal ve yaprak grafik yöntemi veri kümesini özetlemek için çok basit ve kullanışlı bir grafik yöntemidir.

Bu grafikte hem grafiğin şeklini hem de dağılımdaki gözlem değerlerini görmek olanaklıdır.

Dal ve Yaprak grafiği her sınıfın karşısına doğrudan frekansı yazmak yerine bu aralıktaki değerlerin son haneleri yazılır.

45 5 6 7 22 3

80 1 2 2 3 4 4 4 135 6 6 7 7 8 8 8 9 9 9 9 980 2 2 2 3 4 4 4 36 6 920 4

65-6970-74

60-6455-5950-5445-4940-44

SayıYapraklarDallar

Veriler: 40, 44, 46, 46, 49, 50, 52, 52, 52, 53, 54, 54, 54, 55, 56, 56, 57, 57,

58, 58, 58, 59, 59, 59, 59, 59, 60, 61, 62, 63, 64, 64, 64,65, 66, 66, 67, 72, 73

1 7 7 8 8

2 11 2 2 4 5 5 7

3 0 3 3 3 3 3 6 6 6 6 8

4 0 1 3 4 4 5 8 8 9

5 1 2 2 5 5 6 8

Dallar Yapraklar

Veriler: 17, 17, 18, 18, 21, 21, 22, 22, 24, 25, 25, 27, 30, 33, 33, 33, 33, 33, 36, 36, 36, 36, 38, 40, 41, 43, 44, 44, 45, 48, 48, 49, 51, 52, 52, 55, 55, 56, 58

Ortalama ve Standart Sapma Grafiği

Sürekli değişkenler için kullanılan grafik türüdür.

Dağılım simetrik olduğunda kullanılır.

Grafikte ortalama 1 x (standart sapma değeri) bulunur

Bazen ortalama 2 x (standart sapma değeri) de kullanılabilir.

Ortalama ve Standart Sapma Grafiği

Ortalama

+ 1 Standart Sapma

- 1 Standart Sapma

Ortalama=158.3

Standart Sapma=9.9

Saçılım (Nokta) Grafiği

Sınıftan Rasgele Seçilen 10 Öğrencinin Boy Uzunluğu Dağılımı

A Ğ I R L I K (Kg)

1009080706050

G L U K O Z (mg/100 ml)

Ağırlık Glukoz(x) (y)64.0 9075.3 10973.0 10482.1 10276.2 10595.7 121. .. .

77.6 87

Görünüşte Sağlıklı Bireylerin Ağırlık ve Glikoz Değerlerinin Saçılım Grafiği

MATRİS SAÇILIM GRAFİĞİ

MAXVO2

SPORYAS

Tanımlayıcı İstatistikler

Yer Gösteren Ölçüler Yaygınlık Ölçüleri

Tanımlayıcı İstatistikler bir değerler dizisinin istatistiksel olarak genel özelliklerini tanımlayan ölçülerdir

Yer Gösteren Ölçütler• Bir dağılımı tanımlayabilmek

için gereklidiriler• İki grupta incelenmektedir:

– Merkezi ölçütler-ortalama ölçütler•Ortalama, ortanca, tepe değeri

– Merkezi olmayan ölçütler-konum bildiren ölçütler•Çeyrekler, yüzdeler

Ortalama Ölçütleri • Dağılımdaki değerlerin en fazla yoğunlaştığı

bir merkezi referans değeri verirler• Frekans dağılımları ve grafiklerle gösterilen

değişkenlerin karşılaştırılmasında daha somut olarak bilgi veren ölçütlerdir.

• En yaygın olarak kullanılanları– Aritmetik ortalama– Ortanca (medyan)– Tepe değeri (mod)– Geometrik ortalama

Aritmetik ortalama

• Çoğunlukla simetrik bir yapıya sahip olan sürekli sayısal verilerde kullanılan bir ortalama ölçüsüdür.

• Büyüklük belirtmesi açısından kesikli sayısal verilerde de kullanılabilir. (Örneğin ortalama şut sayısı gibi)

• Sınıflandırılmış ve sınıflandırılmamış veriler için ayrı ayrı hesaplanır.

• X ile gösterilir• Sınıflandırılmamış verilerde her bir

gözleme ilişkin değerlerin toplamı denek sayısına bölünerek elde edilir:

Aritmetik OrtalamaÇoğunlukla sayısal verilerde kullanılan bir merkezi eğilim ölçüsüdür. Her bir gözleme ilişkin değerlerin toplamının denek sayısına bölünmesi ile elde edilir.

N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere

KitleA.Ortalaması

ÖrneklemA. Ortalaması

Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir.

Aritmetik ortalama

• Sınıflandırılmamış verilerde:

X = i=1,2,3...n n

5 kişinin yaşları: 20, 25, 22, 21, 18 olarak verilmiş olsun

X = (20+25+22+21+18)/5 = 21,2 olarak bulunur

Aritmetik ortalama

• Sınıflandırılmış verilerde:

fi . si

X = i=1,2,3...k (sınıf sayısı) n

fi = i.sınıfın frekansı,

si=i.sınıfın sınıf değeri olmak üzere

Aritmetik ortalamaMaxVO2 fi si fisi

40-44 2 42 84

45-49 3 47 141

50-54 8 52 416

55-59 13 57 741

60-64 8 62 494

65-69 4 67 268

70-74 2 72 144

Toplam 40 2290

X = 2290 /40 = 57.25 ml/kg/dk

Ortanca (medyan) • Bir dağılımdaki değerleri iki eşit parçaya bölen

ve uç değerlerin bulunduğu durumlarda kullanılan bir ortalama ölçüsüdür.

• Verileri küçükten büyüğe doğru dizdiğimizde gözlem sayısı tek sayılı bir değerse ortanca (n+1)/2. gözlem değeridir

• Verileri küçükten büyüğe doğru dizdiğimizde gözlem sayısı çift sayılı bir değerse ortanca n/2 ile (n+2)/2. gözlem değeridir

• Dağılımdaki aşırı değerlerden etkilenmediği için dağılımın çarpık olduğu durumlarda kullanılması gerekir.

• Ortalamaya göre zayıf olan tarafı dağılımdaki her değerin dikkate alınmamış olmasıdır.

Ortanca (medyan)

• 9 adet sporcunun milli olma sayıları şu şekilde verilmiş olsun:

5,6,4,7,5,8,38,7,4Medyanı bulmak için değerler önce

küçükten büyüğe dizilir:4,4,5,5,6,7,7,8,38 , ortanca (n+1)/2’den (9+1)/2=5. değer olan 6 olurDağılımın aritmetik ortalaması ise 9.3’tür aşırı değer olan 38’den

etkilenmiştir.

Ortanca (medyan) • 6 adet sporcunun şut sayıları şu şekilde

verilmiş olsun:15 21 17 42 18 19Medyanı bulmak için değerler önce

küçükten büyüğe dizilir:15 17 18 19 21 42 , ortanca (n)/2’den (6)/2=3. gözlem ile (6+2)/2= 4.gözlem

değerinin ortalamasıdır. yani: (18+19)/2= 18.5 olarak gerçekleşir.

Yani gözlemlerin %50’si 18.5’in altında %50’si ise üstündedir.

Tepe Değeri (mod) • Dağılımda en fazla tekrarlanan değerdir.Örneğin şu şekilde bir dağılımda:13 26 19 16 19 18 19 19 tepe değeri 19 olurSınıflandırılmış verilerde en yüksek frekansa

sahip sınıfın sınıf değeri tepe değeridir.Burada tepe değeri 57 dir

MaxVo2 Frekans %

40-44 2 5

45-49 3 7.5

50-54 8 20

55-59 13 32,5

60-64 8 20

65-69 4 10

70-74 2 5

Toplam 40 100

Tepe değeri (mod)

• Tek tepe değeri olan dağılımlar olabildiği gibi birbirine çok yakın frekansa sahip iki sınıf olabilir.

• Böyle dağılımlara bimodal dağılım denir• İkiden fazla tepe değeri görüldüğü de olabilmektedir. • Aritmetik ortalama ve ortancaya göre daha az kullanılan

bir ortalama ölçüsüdür• Hesaplaması kolay olduğu için dağılım ortalamasının

kestiriminde yaklaşık bilgi verebilir• Dezavantajları ise

– Yapılan sınıflamaya göre tepe değeri değşmektedir– Bazı dağılımlarda tepe değeri olmayacağı gibi bazı

dağılımlarda birden fazla tepe değeri olabilir– Tepe değeri sonuç bir istatistiktir, daha ileri hesaplamalar

için pek kullanılmaz

KONUM ÖLÇÜTLERİ

Çeyrekler: dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar,

Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür.

Değerlerin %50’si Ç2’ye eşit ya da ondan küçüktür. Bu değer aynı zamanda ortancadır.

Değerlerin %75’i Ç3’e eşit ya da ondan küçüktür.

1. Çeyrek (Ç1)1. Çeyrek (Ç1)1. Çeyrek (Ç1)1. Çeyrek (Ç1) 2. Çeyrek (Ç2)2. Çeyrek (Ç2)2. Çeyrek (Ç2)2. Çeyrek (Ç2) 3. Çeyrek (Ç3)3. Çeyrek (Ç3)3. Çeyrek (Ç3)3. Çeyrek (Ç3)

Yüzdelikler

Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler.Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler.

Örneğin verilerin ilk %30’u 30. Yüzdeliğe Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y30)(Y30) eşit ya da ondan küçüktür. eşit ya da ondan küçüktür.

• ÇEYREKLER: Dağılımdaki gözlemler büyüklüklerine göre sıralandıklarında %25' inci değer 1. çeyrek, %75.değer 3. çeyrektir. %50' nci değer 2. çeyrek olup, bu değer aynı zamanda ortancadır

• • Q1 = n/4' üncü gözlemin aldığı değer• Q2 = n/2' inci gözlemin aldığı değer• Q3 = 3n/4' üncü gözlemin aldığı

değer• • eşitlikleriyle hesaplanır.

• Yüzücülerin %25’i hangi değerden az değeri almıştır?(25. yüzdelik nedir? sorusudur) 0.25 x 40 = 10.

gözlemin değeri olan 53’tür

Sıra Gözlem Sıra Gözlem Sıra Gözlem Sıra Gözlem

1 40 11 54 21 58 31 63

2 44 12 54 22 59 32 64

3 46 13 54 23 59 33 64

4 46 14 55 24 59 34 64

5 49 15 56 25 59 35 65

6 50 16 56 26 59 36 66

7 52 17 57 27 60 37 66

8 52 18 57 28 61 38 67

9 52 19 58 29 62 39 72

10 53 20 58 30 62 40 73

Yüzdeliklerin hesaplanması

YAYGINLIK GÖSTEREN ÖLÇÜTLER

• Dağılım içindeki değerler ortalamaya ne kadar yakınsa ortalama o dağılım için o denli iyi bir ölçüttür. Dağılım içindeki her bir değerin ortalamaya olan uzaklığı dağılımın yaygınlığını belirler. Ortalamadan ayrılışlar ne kadar küçükse dağılım o denli dik, ne kadar büyükse o denli yaygındır.

• VARYANS ( 2 , s 2 )• STANDART SAPMA ( , s )• STANDART HATA ( , sx)• VARYASYON KATSAYISI (v)

Standart Sapma• Bir dağılımın yaygınlığını gösteren en

önemli yaygınlık ölçütlerinden biridir• Dağılımdaki tüm değerlerin aritmetik

ortalamaya olan uzaklıklarının ortalamasıdır• Standart sapma büyüdükçe dağılımın

yaygınlığı artar• Dağılımda değerler aynı olduğunda

yaygınlık yoktur ve standart sapma sıfır olur• Hesaplanırken dağılımdaki tüm değerler

dikkate alınır• Aritmetik ortalamayla birlikte kullanılır X ±

• VARYANS (2, S2) : Bir dağılıma ilişkin gözlemlerin ortalamadan ayrılışlarının kareleri ortalamasına VARYANS denir.

• • s2 = (Xi - X)2 / (n - 1) i=1, 2 … , n• • eşitliği ile ya da bu eşitliğin değişik şekilde ifadesi

olan,• • n

• Xi2 - ( Xi)

2 / n• i=1

• s2 =• n-1• ile hesaplanır

s2 = (Xi - X)2 / (n - 1)i=1, 2 … , n

eşitliği ile hesaplanır.

Şu şekilde bir dağılımımız olsun: 2, 1, 4, 3, 5. Bu dağılımın ortalaması (2+1+4+3+5)/5=3. Her bir gözlemin ortalamadan ayrılışlarını bulalım, bunların karesini alalım ve toplayalım

Ortalamadan ayrılış Kareler varyans

2- 3 = -1 1 10 / (5-1) = 2,5

1-3 = -2 4

4-3 = 1 1

3-3 = 0 0

5-3 = 2 + 4

Toplam 10

Varyansın sınıflandırılmamış verilerde hesaplanması

• Dağılımımızın şu şekilde olduğunu varsayalım:• 2, 6, 1, 15, 6• n

• Xi2 - ( Xi)

2 / n• i=1

• s2 =• n-1

• Xi2 = 22+62+12+152+62 =302

• ( Xi)2 / n = (2+6+1+15+6)=30

• s2 = 302 – (30)2/5 = 30,5002 5-1

• Sınıflandırılmış veriler için varyans aşağıdaki eşitlikle hesaplanır.

• • n

• fibi2 - ( fibi)

2 / n• i=1

• s2 =• n-1 • Buradaki fi, i.sınıfın frekansı, bi i.

sınıfın sınıf değeridir.

Varyansın sınıflandırılmış verilerde hesaplanması

s2 = 133100 – (2290)2 /40 =51,12 39

MaxVo2 fi si si2 fisi fisi

40-44 2 42 1764 4 3528

45-49 3 47 2209 141 6627

50-54 8 52 2704 416 21632

55-59 13 57 3249 741 42237

60-64 8 62 3844 496 30752

65-69 4 67 4489 268 17956

70-74 2 72 5184 144 10368

Toplam 40 2290 133100

• STANDART SAPMA (, S): varyansın kareköküdür. Varyans ve Standart Sapma dağılımın yaygınlığına ilişkin genel bir bilgi veriri. Bu değerlerin büyük mü, küçük mü olduğu ya da dağılımın homojenliği konusunda yargıya varabilmek için ortalaması ile kıyaslamak gerekir.

• Sınıflandırılmamış verilerdeki örneğimizde varyansımız s2 = 30,5002 standart sapmamız

s= 30,5002 = 5,5227• Sınıflandırılmış verilerdeki örneğimizde

varyansımız s2 = 51,1225, standart sapmamız

s= 51,1225 = 7,15 olur

• STANDART HATA (, SX): Standart hata, gözlem başına düşen sapma miktarıdır. Aritmetik ortalama genellikle standart hatası ile birlikte X Sx biçiminde verilir. STANDART HATA,

• • Sx = (S2 / n) 1/2 eşitliği ya da

s/n eşitliği ile hesaplanır. • Örneğimizde s= 30,5002 = 5,5227,

n=5 olduğuna göre

• Sx = 5,5227 / 5 olur

• VARYASYON KATSAYISI(v) : Standart Sapmanın ortalamaya göre yüzdesine VARYASYON KATSAYISI denir.

• • V = S 100• X• eşitliği ile hesaplanır. Bu değerin % 50'

den büyük olması durumunda dağılım heterojendir denilir. Bu ölçüt aynı zamanda iki ya da daha çok dağılımın yaygınlıklarını kıyaslamada kullanılır.

TEORİK DAĞILIŞLAR Verilerin oluşturduğu yığınlara dağılım demiştik. Verinin ölçüm biçimi gözlemlerin aldığı olası değerlerdir. Bu değerlerin birbirine göre konumu (büyüklük, küçüklük) dağılım aralığının sınırları v.b. gibi özelliklerden dolayı farklı yığınlar farklı dağılım yapısı gösterir. Spor ve sağlık bilimlerinde elde edilen verilerin oluşturduğu yığınlar daha çok şu üç dağılım tipine uyarlar: Normal dağılım Binom dağılım Poisson dağılım

Bunlardan ilki sürekli, diğer ikisi ise kesikli dağılımdır.

Normal Dağılım Fonksiyonunun Grafiksel Formülü:

biçimindedir. Bu eğriye çan eğrisi denir. Bu dağılım fonksiyonu Alman bilim adamı C.F. Gauss tarafından bulunmuştur. Bu nedenle eğriye Gauss eğrisi de denir.

NORMAL DAĞILIM

Normal dağılım fonksiyonunda herhangi bir deneğin ortalamadan uzaklığının standart sapmaya oranı Z' ye standart normal dağılım denir.

Z = Xi - X

SBu frekans dağılımının normal dağılım gösterip göstermediğini saptamada kullanılır. Ortalaması 0 varyansı 1 olan normal dağılımı aynı standart normal dağılım denir.

-4 -3 -2 -1 0 1 2 3 4

-3 -2 -1 0 1 2 3

Normal Dağılımın Özellikleri:

Teorik normal dağılımda deneklerin aldığı değerler birbirinden bağımsız ve rasgeledir.

Teorik normal dağılım ortalamaya göre simetriktir. Gözlemler ortalamaya yakın değerler alırsa homojen, ortalamalardan uzak değerler alırsa dağılıma heterojen denir. Aynı ortalamaya sahip üç dağılımın dik ya da yayvan olması durumundaki eğriler aşağıda verilmiştir.

Teorik normal dağılımda veriler süreklidir ve dağılım aralığı içinde her değeri alabilirler, yani - < x < +

• Teorik normal dağılımda; • X S sınırları arasına gözlemlerin

% 68.26' sı• X 2S sınırları arasına

gözlemlerin % 95.44' ü• X 3S sınırları arasına gözlemlerin

% 99.74' ü girer.

-3s -2s -1s X 1s 2s 3s

ÇARPIKLIK VE DİKLİK Normal dağılıma uyan gerçek veriler her

zaman ortalamaya göre simetrik olmazlar sola (negatif) ya da sağa (pozitif) çarpık olabilirler ama bu çarpıklık kabul edilebilir sınırlar arasında olmalıdır.

Standart normal dağılımda ortalama,

ortanca, tepe değeri birbirine eşit ve üstüste çakışır. Dağılımın çarpıklığının ölçüsü çarpıklık katsayısı (Ç) ile ölçülür.

Tepe Değeri

Ortanca

Ortalama

Tepe DeğeriOrtanca

Ortalama

Tepe DeğeriOrtanca

Ortalama

Sola ÇarpıkSağa Çarpık Simetrik

ÇARPIKLIK VE DİKLİK

(Xi - X)3

ile hesaplanır. Bu değer; Ç = 0 ise dağılım simetrik,Ç < 0 ise dağılım sola (-) çarpıkÇ > 0 ise dağılım sağa (+) çarpık

ÇARPIKLIK VE DİKLİK

Dağılım ortalamaya göre simetrik olabilir. Aynı ortalamaya sahip dağılımların görünümleri, varyansları farklı olabilir. Bu farklılık

Basıklık Katsayısı ile belirlenir. B>0 (Xi - X)4

• B>0• B=0• B<0

Burada; B=0 ise dağılım normalB<0 ise dağılım basıkB>0 ise dağılım dik denir.

Sağa (pozitif) çarpık dağılım• TD < ortanca<X

ortanca

Ç = 0 ise dağılım simetrik,Ç < 0 ise dağılım sola (-) çarpıkÇ > 0 ise dağılım sağa (+) çarpık

Sola (negatif) çarpık dağılım• X< ortanca<Tepe değeri

ortanca

Simetrik normal dağılımda ise ortalama, ortanca ve TD birbirine eşittir.Sağa çarpık dağılımlarda büyük değerler sayısı daha fazla, sola çarpık dağılımlarda da küçük değerlerin sayısı daha fazladır.

BİNOM (İKİ TERİMLİ) DAĞILIMI

Herhangi bir olayın gerçekleşmesi ya da gerçekleşmemesi inceleniyorsa yani iki olası sonuç varsa bu verilerin dağılımı binom dağılıma uyar. Örnek olarak:

Yapılan antrenman tekniğinin başarılı olup olmaması gibi

POISSON DAĞILIMIÇok sayıda olası durum içerisinde aranan olayın

gerçekleşme olasılığı küçükse ve veriler kesikli sayısalsa x=0, 1, 2, 3… v.b bu verilerin dağılımı poisson dağılımına uyar.

Verilerde Standartlaştırma

STANDARTLAŞTIRMA• Elde edilen puanlar veya veriler karşılaştırılırken

kullanılır• Örneğin bir öğrencinin sınav sonuçları şu şekilde

olsun:Ders İng Mat Psikol

Öğrencinin puanları

80 65 75

Öğrencinin sınıfa göre en başarılı olduğu dersi belirlerken sadece almış olduğu notlara bakarak karar veremeyiz. Sınıf ortalaması ve sınıf standart sapmasına göre yapılacak bir standartlaştırma yani yeni bir ölçeğe dönüştürme işlemi sayesinde daha rahat karşılaştırma yapabiliriz.

STANDARTLAŞTIRMA• Öğrencinin bulunduğu sınıfa ait değerler de

eklenmiş olsun

Ders İng Mat Psikol

80 65 75

Sınıfın ortalaması 85 55 60

Sınıfın standart sapması

10 5 15

Aslında öğrencinin en başarılı dersi gibi görünen İngilizce’de sınıf ortalamasının altında not aldığı başarısız gibi göründüğü matematik ve psikolojide sınıf ortalamasının üzerinde aldığı görülmektedir.

Standartlaştırmada Z Skoru

• Verilerin standartlaştırılmasında en çok kullanılan yöntemlerden biridir

• Orijinal verileri ortalaması 0, standart sapması 1 olan yeni bir skora dönüştürür

STANDARTLAŞTIRMADers İng Mat Psikol

80 65 75

10 5 15

Bu veriler yardımıyla z-skorlarını hesaplayalım;

z = (Xi – X) / s

STANDARTLAŞTIRMADers İng Mat Psikol

80 65 75

10 5 15

Z (80-85)/10= - 0,50

(65-55)/5= +2

(75-60)/15= +1

Öğrenci İngilizce’de ortalamanın 0,50 standart sapma altında bir z skoruna sahipken, matematik dersinde ortalamanın 2 standart sapma üzerinde bir z skoruna sahiptir.

Standartlaştırmada T Skoru

• Standart z skorlarının küçük ondalıklı sayıları içermesi ve de negatif ve pozitif değerler alabilmesi (genellikle –3 ve +3 arasında) , z skoruna dayalı ancak daha kolay anlaşılan t skorlarını ortaya koymuştur

• T skorları ortalaması 50, standart sapması 10 olan bir skorlar kümesidir.

• Genelde 20 ile 80 arasında değer alırlar

STANDARTLAŞTIRMA

T skorunu elde etmek için her bir z skoru 10 ile çarpılarak 50 puan eklenir. En yüksek t skoru 80, en düşük t skoru 20 olabilir.

Ders İng Mat Psikol

80 65 75

Z (80-85)/10= - 0,50

(65-55)/5= +2

(75-60)/15= +1

T (10*-0,50)+50= 45

(10*2)+50= 70

(10*1)+50=60

Güven Aralıkları

• Kitle dağılımına ilişkin parametreleri elde etmek çok zor, çoğu kez de olanaksızdır. Böyle durumlarda o kitleden çekilen örnekleme ilişkin istatistikler (X, S2, pq…vb) hesaplanır.

• Aynı kitleden aynı koşullarda çekilen farklı örneklemlerden elde edilen istatistikler farklı değerler alabilirler. Bu farklı değerdeki istatistikler belirli bir dağılım aralığı içinde değer alırlar ki bu değerlerin kitle parametreleri olan ve 2 değerlerine yakın değerler olması beklenir.

• Bu şekilde aynı kitleden çekilen örneklem değerlerinin alabileceği değerlerin oluşturduğu dağılım aralığına Güven Aralıkları denir.

• KİTLE ORTALAMASI GÜVEN ARALIĞI

• Kitle Varyansı Bilindiğinde2 varyansına sahip bir kitlenin

ortalamasının (), güven sınırları, bu kitleden rasgele olarak çekilen bir örneklemin ortalaması (X), kitle standart hatası kullanılarak

• X- Z X + Z biçiminde hesaplanır.

• Burada = / n olarak hesaplanır.

• KİTLE ORTALAMASI GÜVEN ARALIĞI

• Kitle Varyansı Bilinmediğinde• Kitle varyansı 2 'nin bilinmediği

durumda kitle ortalaması, 'nın güven aralığı, bu kitleden çekilen ve ortalaması X, varyansı S2 olan bir örnekleme ilişkin istatistiklerle,

• X - t Sx X + t Sx biçimimde hesaplanır. Burada Sx örneklem standart hatasıdır.

• Sx = s / n olarak hesaplanır.

Hipotez ve Hipotez testleri

Hipotez nedir?• Hipotez örneklem yardımıyla evren parametreleri

hakkında kestirimde bulunma sürecidir. • Herhangi bir konudaki doğruluğu bilimsel olarak

kanıtlanmamış düşünce, görüş ya da varsayımlardır.

Hipotezin amacı nedir?• Evrenden çekilen örneklemler yardımıyla evren

hakkında bir karara varma konusunda yardımcı olmaktır.

Hipotezimizin doğruluğunu nasıl kanıtlarız?• Hipotezimizin doğruluğunu kanıtlayabilmek

için veri yapımıza uygun bir hipotez testi uygulamamız gerekir. Hipotez testlerine önemlilik ya da anlamlılık testleri de denir.

Hangi hipotez testini uygulayacağımız;

• Araştırma planına• Veri tipine• Denek sayısına• Verilerin dağılım yapısına göre, farklılık

gösterir.

Hipotezler iki türlüdür:

• H0 farksızlık hipotezi ya da sıfır hipotezi• H1 alternatif hipotezdir

• H0 farksızlık hipotezi örnekleri:– Voleybol ve basketbol oynayan sporcularda

vücut yağ yüzdeleri arasında fark yoktur.– Kızlarla erkeklerin istatistik dersi notları

arasında fark bulunmaz– Spor yöneticiliğini kazanan öğrencilerle beden

eğitimi öğretmenliğini kazanan öğrencilerin ÖSS puan ortalamaları arasında anlamlı bir farklılık bulunmaz

• H1 alternatif hipotezi örnekleri:– Voleybol ve basketbol oynayan sporcularda

vücut yağ yüzdeleri arasında farklılık bulunur.– Kızlarla erkeklerin istatistik dersi notları

farklıdır– Spor yöneticiliğini kazanan öğrencilerle beden

eğitimi öğretmenliğini kazanan öğrencilerin ÖSS puan ortalamaları arasında anlamlı bir farklılık bulunur

• Hipotezler tek yönlü ve çift yönlü olarak kurulmaktadır:

• TEK YÖNLÜ H0 : 1 - 2 = 0

H1 : 1 - 2 > 0

H0 : 1 - 2 = 0

H1 : 1 - 2 < 0

• ÇİFT YÖNLÜH0 : 1 - 2 = 0

H1 : 1 - 2 0

• H0 farksızlık hipotezi örnekleri:– Voleybol ve basketbol oynayan sporcularda

vücut yağ yüzdeleri arasında fark yoktur.– Kızlarla erkeklerin istatistik dersi notları

arasında fark bulunmaz– Spor yöneticiliğini kazanan öğrencilerle beden

eğitimi öğretmenliğini kazanan öğrencilerin ÖSS puan ortalamaları arasında anlamlı bir farklılık bulunmaz

• H1 alternatif tek yönlü hipotez örnekleri:– Voleybol oynayan sporcularda basketbol

oynayanlara göre vücut yağ yüzdesi daha düşüktür.

– Kızların istatistik dersi notları erkeklerinkinden yüksektir.

– Spor yöneticiliğini kazanan öğrencilerin ÖSS puan ortalamaları beden eğitimi öğretmenliğini kazanan öğrencilerinkine göre yüksektir.

Anlamlılık (yanılma ya da hata düzeyi nedir?

• Anlamlılık düzeyi araştırmacı tarafından testten önce belirlenen bir değerdir. ( ile gösterilir)

• H0 hipotezi doğru iken onu reddetme olasılığını ifade eder.

• Yani; gerçekte karşılaştırdığımız iki evren arasında fark yokken yanılıp fark varmış gibi farksızlık hipotezini reddetme olasılığıdır.

• Yanılma düzeyi ya da olarak en çok 0.05 kullanılır. Araştırmanın daha hassas olarak yapılması isteniyorsa olarak 0,01 ve 0,001 de kullanılabilir.

Red etme ve kabul etme neye göre olur?

• Bir istatistiksel test uyguladığımızda karşımıza bir test istatistiği ve p değeri ortaya çıkacaktır.

• Biz ortaya koyduğumuz H0 veya H1’i bu sonuçlara göre kabul veya reddederiz.

• Hesaplamış olduğumuz test istatistikleri teorik tablolardaki değerlere eşit ya da büyük ise H0 reddedilir.

• Aynı şekilde elde ettiğimiz p değerleri 0.05’ten küçükse H0’ı reddederiz ve H1’i kabul ederiz.

• İstatistiksel paket programlarda elde edilen test istatistiklerine karşılık gelen p değerleri verilmekte olduğundan ayrıca teorik tablo değerlerine bakılmadan da bir hipotezin reddedilip kabul edileceğine karar verebiliriz.

Hipotez testlerinde ne tür hatalar ortaya çıkar?

• Hipotez testlerinde karar verirken iki tür hata yapabiliriz.

• Bunlar:– 1. tip hata ( türü hata)– 2. tip hata ( türü hata) olarak adlandırılmaktadır

• H0 hipotezini gerçekte doğruyken reddetmek 1. tip hatadır

• H0 hipotezini gerçekte yanlışken kabul etmek de 2. tip hatadır.

Hipotez testlerindeki doğru kararlar ve hatalar

H0 doğru iken

H0 yanlış iken

H0 ‘ı kabul etmek

Doğru karar 2.tip hata()

H0 ‘ı reddetmek

1.Tip hata () Doğru karar

Hipotez Testlerinde İzlenecek Adımlar:

• Hipotezler kurulur yanılgı düzeyi belirlenir. • Verinin özelliklerine göre (dağılım yapısı

homojen, heterojen, sürekli, kesikli, denek sayısı v.b.) ve hipoteze bakılarak uygun test seçilir.

• Test yapılır. • i)Hesaplama bilgisayarda bir paket

program kullanılarak yapılıyorsa hesaplanan anlamlılık düzeyi p , yanılgı düzeyi ile karşılaştırılır.

• p > ise H0 kabul,• p ise H0 reddedilir.

Hipotez Testlerinde İzlenecek Adımlar• ii)Hesaplama elle yapılıyorsa hesaplanan test

istatistiği, yanılgı düzeyinde ve o test için hesaplanan Serbestlik Derecesindeki (SD) çizelge değeri ile karşılaştırılır. Hesapla bulunan test istatistiği çizelgeden bulunandan büyükse H0 yokluk hipotezi reddedilir ve p < yazılır. Aksi durumda H0 hipotezi kabul edilir ve p> yazılır.

= 0.05 alınma durumunda p<0.05 ise bunun anlamı şudur: Ben bu çalışmada H0 hipotezini reddettim farkı anlamlı buldum, benim bu kararım 0.95 olasılıkla doğrudur. (H0' ı kabul etme) Yanılma olasılığım 0.05' ten küçüktür.

• Hipotez testleri verilerin yapısına ve dağılım özelliklerine göre iki ana grupta toplanır:– Parametrik Hipotez Testleri– Parametrik Olmayan Hipotez

Testleri

Hipotez testleri

• Bu iki ana gruptan her biri kendi içinde çok sayıda hipotez testi içerir. Bunların seçimi örneklem dağılımlarının özeliklerine ve gözlemlerin skalasına göre belirlenir.

• Bu iki tip hipotez testinden parametrik olanların uygulanabilmesi için test edilecek verilerde bazı koşullar aranır.

• Bu koşullardan en az birinin gerçekleşmemesi durumunda parametrik testlerin kullanılması sakıncalı olur.

• Bu durumda parametrik test yerine o testin karşıtı olan parametrik olmayan test kullanılır. Parametrik testlerin çoğunun parametrik olmayan karşıtı vardır.

Hipotez testleri

Parametrik testler ve parametrik olmayan karşılıkları

PARAMETRİK PARAMETRİK OLMAYAN

İki Ortalama Arası Fark Mann Whitney U Testi

İki Eş Arasındaki Fark Wilcoxon İki Örnek Testi

Bağımsız İki Oran Arası Fark 2x2 Düzende Ki-Kare Testi

Bağımlı İki Oran Arası Fark Bağımlı Örneklerde Ki-Kare Testi

Tek Yönlü Varyans Çözümlemesi Kruskal Wallis Varyans Çözümlemesi

Tekrarlı Denemelerde Varyans Analizi

Freidman Testi

PARAMETRİK TESTLERİN VARSAYIMLARI

• Normal dağılıma sahip olma• İkiden çok kitle olduğunda varyansların

homojen olması• Verilerin sürekli dağılım gösteren

karakterlerden oluşması• Her bir dağılımdaki gözlem sayılarının yeterli

sayıda olması (nj10)• İki ya da daha çok dağılım birbiri ile

karşılaştırılıyorsa dağılımlardaki gözlem sayıları birbirlerine eşit ya da yakın sayıda olmalıdır. Bu koşul küçük n' ler için daha da anlamlıdır.

• Örnekler birbirinden bağımsız ve rasgele seçilmelidir.

PARAMETRİK TESTLERİN VARSAYIMLARI

• Bu varsayımlardan en az birisi yerine gelmezse parametrik testler kullanılmaz, bunun yerine parametrik olmayan karşıtı kullanılır. Parametrik olmayan testlerin varsayımları ise;

• -Örnekler rasgele ve birbirinden bağımsız olarak seçilecek

• -Her bir grupta en az 3 (n3) denek olacak

Parametrik test varsayımları

• Normal Dağılıma Uyum:• Eldeki verilerin çekildiği kitlenin dağılımının normal

dağılıma uyup uymadığını test etmek için istatistik paket programlarındaki normallik testlerinden yararlanılabileceği gibi aşağıda verilen ölçütlerle de belirlenebilir.

• Bir dağılımın normal dağılıma uyabilmesi için dağılım ortalaması ( X) ile standart sapması (S) kullanılarak

•xS sınırları içine gözlemlerin %68.2nin aldığı değer girmelidir.

•x2S sınırları içine gözlemlerin %95.44nün aldığı değer girmelidir

•x3S sınırları içine gözlemlerin %99.74nün aldığı değer girmelidir

Parametrik test varsayımları• Varyansların Homojenliği:• Varyansların homojenliği iki yönden ele

alınmalıdır. Birincisi her bir grubun küçük varyanslı olması(varyasyon katsayısı <%50)bunun anlamı standart sapma ortalamanın yarısından küçük olmalı , ikincisi ise birden fazla grup varsa varyanslarının birbirine oranı 1'e yakın olmalıdır. Normallik testinde olduğu gibi homojenlik testide istatistik paket programlarında vardır. Bunlar kullanılarak test edilebilirler.

• Dağılımın Sürekli Olması: Bu varsayım için temel özellik önce veriler ölçüm mü yoksa sayımla belirlenen veriler mi? Bakılır.Ölçüm olması dağılımın sürekli olması için yeterli değildir. Dağılımda uç değerler (çok küçük yada çok büyük)varsa ölçüm olmasına karşın kesikli olabilir.

• Örneğin 20 denekten 19 tanesinin kan şekeri düzeyi 9-100 arasında değişirken bir tanesi 400 ise bu değer dağılımın süreklilik yapısını bozar ve bu değer dağılımdan çıkartılmalıdır.(Yanlış ölçüm ya da yanlış denek) Buna benzer birkaç değer varsa, dağılımdan atılamıyorsa bu durumda sürekliliği sağlayacak bir transformasyon yöntemi uygulanmalıdır. (Log, karekök, vb.)

• Denek Sayıları:• Herbir dağılımdaki denek sayısı n10 olmalıdır.

n10 olmasının nedeni bu değerin rasgeleliğin dağılımı etkileme altsınırıdır.

• İstatistikteki Büyük Sayılar Kanunu'na göre n büyüdükçe rasgeleliğin dağılım üzerindeki etkisi azalır, gerçeğe ulaşma olasılığı artar. İşte bu kural için alt sınır 10'dur. n30 olduğunda rasgeleliğin etkisi yok denecek kadar azdır. Bunu bir örnekle açıklayalım:Dünyadaki kadın erkek oranı 0.50'dir.Bu doğan her bebekten 1 kız 1 erkek olacağı anlamına gelir. Doğum kliniği önüne gidelim, doğan bebeklerin cinsiyetine bakalım. Hiçbir zaman 1 kız 1 erkek doğmaz. Çünkü her doğum birbirinden bağımsızdır ve olasılığı 0.50'dir. Bazen arka arkaya 3 kız ya da 2 erkek ya da farklı oranlarda doğabilir. Hiçbir zaman arka arkaya 10 kız yada 10 erkek doğmaz.Bu oran 3 kız 7 erkek yada 4 erkek 6 kız yada 5 kız 5 erkek vb. olabilir. Doğum sayısı 30'a ulaştığında rasgeleliğin etkisi tamamen ortadan kalkar, oran 0.50 ulaşır.

• İki yada daha çok grup karşılaştırılacaksa gruplardaki denek sayıları birbirine eşit yada yakın olmalıdır. bunun amacı herbir gruptaki rasgeleliğin etkisini eşit tutmaktır.Örneğin bir grupta 10 denek diğerinde 25 denek varsa birinci grupta rasgeleliğin etkisi 25 denekli ikinci gruptan daha fazladır. bu da farklı koşullarda kıyaslama yapmaya ve hatalı sonuç bulunmasına yol açar. Herbir gruptaki denek sayısının 30'un üzerinde olması durumunda eşitlik önemini yitirir. Bir grupta 30 diğerinde 50 denek olabilir.

• UYGUN TEST SEÇİMİ• Eldeki veriye uygun test seçmek çok

önemlidir. Araştırma ne kadar iyi planlansa ne kadar iyi uygulansa tüm aşamaları ne kadar iyi yürütülse de sonuçta değerlendirme aşamasında yanlış test uygulanırsa o aşamaya kadar harcanan tüm emekler boşa gider. Peki elimizdeki veriye çok sayıda testten hangisini seçeceğiz. Doğru kararı nasıl vereceğiz. İşte bu iş için istatistikteki karar ağacı yöntemini bu amaçla kullanabiliriz. Bu aşamada önce verinin ölçüm yada sayım olması kriterine bakacağız.

• Veri ölçümle belirtilen karakterlerden oluşuyorsa 2 nolu karar ağacını, sayımla belirtilen karakterlerden oluşuyorsa 3 nolu karar ağacını izleyeceğiz. Testin seçiminde karar ağacı ile birlikte önce parametrik test varsayımlarını gerçekleştirip gerçekleştirmediğine bakacağız.Parametrik (P), Nonparametrik (NP) ile belirtilen testi alacağız.

ÖLÇÜM SAYIM

ÖLÇÜM

Grup Tek Grup İki Grup Çok

ÖLÇÜM

Bağımsız Bağımlı Bağımsız Bağımlı

ÖLÇÜM

Bağımsız Bağımlı Bağımsız Bağımlı

İki Ortalama Arası Fark Testi

İki Eş Arası Fark Testi

Tek YönlüVaryans Analizi

Tekrarlı ÖlçümlerVaryans Analizi

Mann WhitneyU Testi

Wilcoxon EşTesti

Kuruskal Wallis Varyans Analizi

Fredman Testi

Kitle OrtalamasıAnlamlılık Testi

İşaret Testi

Parametrik OlmayanTestleri

ParametrikTestler

Sayım

Bağımsız Bağımlı Bağımsız

Bağımsız İki Oran Arası Fark Testi

Bağımlı İki OranArası Fark Testi

2 x 2 DüzenindeKi-KareTesti

MacNemarTesti

Çok GözlüKi-Kare Testii

Kitle OranınınAnlamlılık Testi

Tek DeğişkenliKi-KareTesti

Fisher Kesin Ki-KareTesti

Kolmogrov Simirnov Testi

Parametrik OlmayanTestleri

ParametrikTestler

Parametrik Hipotez Testlerine GirişT-Testleri

• Tek grupta t-testi• Bağımsız iki grupta t-testi• Eşleştirilmiş iki grupta t-testi

Parametrik Hipotez Testlerine GirişT-Testleri• Tek grupta t-testinin varsayımları

nelerdir?– Test edilecek örneklem normal

dağılıma uygun olmalıdır.– Vakalar rasgele olarak seçilmiş

olmalıdır– Vakalar birbirinden bağımsız

olmalıdır.

Parametrik Hipotez Testlerine GirişT-Testleri• Tek grupta t-testi örneklem

ortalamasının evren ortalamasına eşit olup olmadığını test etmek için kullanılır.

• Örneğin spor yapmayan yetişkin erkeklerin depresyon ölçeği puanlarının 50’den fazla olduğu yönünde bir hipotezimiz olduğunda oluşturduğumuz örneklemdeki puan ortalamasının 50’den farklı olup olmadığını test etmemiz gerekir. İşte örneklem ortalamamızın belli bir evren ortalamasına uyup uymadığını test etmek için tek grupta t-testini uygularız.

KİTLE ORTALAMASI ÖNEMLİLİK TESTİ

t = X - Sx

H0 : = 50 n = 30

H1 : 50 S= 10,33 Sx = 10,33 / 30

t = 50-54,63 1,88

= -2,457 t 0.05,30 = 2.10p=0.020 p< 0,05

Sonuç örneklem ortalaması kitle ortalamasından farklıdır

ÖrnekBasketbol oyuncularının vücut yağ yüzdesi ortalamasının %10 olup araştırılmak istenmektedir. Bu amaçla rasgele seçilen 30 basketbolcunun vücut yağ yüzdeleri ölçülmüştür.

H0 : Basketbolcuların vücut yağ yüzdesi ortalaması 10’dur. H1: Basketbolcuların vücut yağ yüzdesi ortalaması 10’dan farklıdır.

68.63090.1

1068.7

P<0.000

Yorum:Basketbolcuların vücut yağ yüzdesi ortalaması 10’dan farklı bulunmuştur.

İki ortalama arasındaki farkın anlamlılığı testi• İncelenen bir değişken yönünden

birbirinden bağımsız iki grubun karşılaştırılmasında kullanılır.

• Varsayımları şunlardır:– Karşılaştırılacak iki grup vardır– Gruplar birbirinden bağımsızdır yani her

grupta farklı kişiler yer alır– Veriler sürekli sayısal verilerdir– Gruplardaki denek sayıları yeterlidir

(n>=30)– Evren dağılımları normal dağılım gösterir.– Evren varyansları homojendir

İki ortalama arasındaki farkın anlamlılık testi• Örneğimizde iki farklı grup öğrenci var. 50 adet

kız öğrenci ve 50 adet erkek öğrenci. Burada cinsiyetin bilgi skorları üzerindeki etkisi araştırılmıştır. Buna göre iki ayrı cinsiyet grubunda bilgi skorlarının ortalaması karşılaştırılmıştır.– Birinci adım, iki farklı gruba ait verilerin bu testin

varsayımlarını karşılayıp karşılamadığıdır.– İkinci adım ise verilen istatistiklere göre arada anlamlı

fark olup olmadığına bakılmasıdır.– Birinci grubun bilgi skoru ortalaması 8,46,diğer grubun

ise 7,62 olsun. Formüllerde bunları ve standart sapmaları yerine koyduğumuzda ortaya bir t istatistiği çıkacaktır. Bunun p değerini bulduğumuzda 0.05’ten küçükse anlamlı bir fark olduğunu söyler,H0’ı reddederiz.

İKİ ORTALAMA ARASINDAKİ FARKIN ÖNEMLİLİK TESTİ

H0 : X1 - X2 = 0

H1 : X1 - X2 0

X1 - X2

S12 + S2

Kızlarla erkeklerin bilgi skorları arasında fark var mı?

8.46 - 7.621.702 + 2.232

t = = 2.12 t 0.05 , 49 = 2.01 p< 0.05

İki eş arasındaki farkın anlamlılık testi• Bir denek üzerinde bazen birden fazla deney yapılmak

istenebilir. Örneğin spor bilimlerinde antrenman öncesi ve antrenman sonrası birçok parametre açısından karşılaştırma yapılarak antrenmanın bu parametrelere etkisi araştırılabilmektedir. Bu tür araştırmalarda grupların bağımlı yani aynı kişilerden oluştuğu söylenir.

• Eğer bağımlı grup sayısı 2 ve gruplara ait verilerin yapısı parametrik testlerin varsayımlarını karşılıyorsa iki eş arasındaki farkın anlamlılık testi ya da paired-t test kullanılabilir.

• Buna göre varsayımlarımız:– Bağımlı grup sayısı 2’dir– Veriler ölçümle belirtilmiştir– Denek sayısı her iki grupta da yeterlidir (n30)– Gruplardaki gözlem değerleri çıkartılarak elde edilen

farkların dağılımı normal dağılıma uygunsa bu test kullanılır

Hipotezlerin kurulması:

D = 0D 0

Test istatistiğinin hesaplanması:

a) Gözlemlerin önceki değerlerinden sonraki değerleri çıkartılarak fark dizisi oluşturulur.

nSS DD /

b) Farkların ortalaması bulunur:

c) Farkların standart sapması bulunur:

d) Farkların standart hatası bulunur:

l t hesap l > t tablo

ise H0 hipotezi reddedilir ve p< (örneğin p<0.05) şeklinde gösterilir.

e) Test istatistiği (t hesap) hesaplanır:

ÖRNEK:

Primer hipertansiyonlu bireylere günde iki kez 20’şer dakikalık yürüyüş önerilerek, yürüyüşe başlamadan önceki 1 haftalık ortalama tansiyon miktarı ile yürüyüşe başladıktan sonraki 1 haftalık ortalama tansiyon miktarları arasında fark olup olmadığı öğrenilmek isteniyor.

Aynı bireylerin iki farklı zamandaki ölçümleri söz konusu olduğundan gruplar bağımlıdır.

HastaSis. KanÖnce

BasıncıSonra

FarkÖnce-Sonra

1 140 125 15

2 135 120 15

3 150 145 5

4 155 155 0

5 145 150 -5

. . . ,

36 140 120 20Ortalam

a146,86 138,1

S. sapma

7,06 7,97

FARK DEĞERLERİ

20,015,010,05,00,0-5,0

P-P PLOT

1,0,8,5,30,0

03,136/18,6/ nSS DD

1. Hipotezlerin Kurulması:

2. Test İstatistiğinin Hesaplanması

44,803,1

3. Alfa yanılma düzeyi 0.05 olarak alınmıştır.

4. İstatistiksel karar.

p<0,05

Yorum: Yürüyüş sonrasında sistolik kan basıncındaki 8.69 birimlik (mm/Hg) düşme istatistiksel açıdan anlamlıdır.

Tek Yönlü Varyans Analizi

• Parametrik test varsayımları karşılanmalıdır– Gruplar normal dağılım göstermelidir– Grupların varyansları homojen olmalıdır– Gruplar birbirinden bağımsız olmalıdır– Veriler ölçümle belirlenmelidir– Her bir gruptaki gözlem sayısı 30’un

üzerinde olmalıdır• İkiden fazla bağımsız grup arasında fark olup

olmadığını test etmek için kullanılır• Yani iki ortalama arasındaki farkın anlamlılığı

testinin 2’den çok gruba uyarlanmış halidir

İkiden Fazla Bağımsız Grupta Tek Yönlü Varyans Analizi

• Örnek: hentbol, basketbol ve futbol oynayan öğrencilerin yüzde yağ değerlerinin karşılaştırılması istendiğinde yüzde yağ değeri açısından 3 farklı spor grubu karşılaştırılırken tek yönlü varyans analizi kullanılır

Hentbol Basketbol Futbol

X 10,37 7,68 4,89

n1 30 30 30

Tek Yönlü Varyans Analizi

• Varyans analizi sonucunda gruplar arasında fark yoksa işlemler sona erer.

• Varyans analizi sonucunda gruplar arasında fark bulunursa hangi gruplar arasında farklılık olduğu ortaya çıkarılır. Bunun için post-hoc testler uygulanır:– En küçük önemli fark yöntemi (her bir ortalama 1 kez

kullanılır)– Duncan yöntemi– Tukey HSD yöntemi ikili karşılaştırma– Student-Newman-Keuls yöntemi– Dunnett yöntemi (her bir deney grubu kontrol grubu ile

karşılaştırılır)

İkiden Fazla Bağımlı Grupta nTekrarlı Ölçümlerde Varyans Analizi

• Bazı çalışmalarda aynı denekler ikiden fazla sayıda ölçüme tabi tutulurlar. Özellikle farklı zamanlarda yapılan ölçümlerin kullanıldığı çalışmalar tekrarlı ölçümlerde varyans analiziyle incelenir.

• Bu şekildeki deneylere denekler içi düzen (within-subject design) adı verilir.

• Tekrarlı ölçümlerde varyans analizinde de parametrik testlerde olduğu gibi – Normal dağılıma uygunluk – Varyansların homojenliği– n sayısının yeterliliği kavramları yer almaktadır.

Tekrarlı Ölçümlerde Varyans Analizi• Örnek: Spor yapan kişilerde tansiyonların zaman

içindeki değişimi incelenmek istenebilir. • Bunun için aynı deneklerin spordan önce, spor yapmaya

başladıktan 3 ay sonra ve 6 ay sonra yapılan tansiyon ölçümleri karşılaştırılabilir.

Sporcu no

Önce 3 ay sonra

6 ay sonra

1 175 160 145

2 185 172 150

... ... ... ...

X 172,64 164,95 153,55140

önce 3 ay sonra 6 ay sonra

ÖRNEK:

Lise öğrencilerinin düzey belirleme sınavı öncesi durumluk kaygı düzeylerini belirlemek ve varolan kaygı düzeyini azaltmak amacıyla düzenlenen bir çalışmada, rasgele seçilen 25 lise 1. sınıf öğrencisi araştırma örneklemini oluşturuyor.

Öğrencilerin ilk düzey belirleme sınavı öncesindeki durumluk kaygı düzeyleri belirlendikten sonra, gevşeme çalışması eğitimi veriliyor ve 2. ve 3. seviye belirleme sınavı öncesindeki kaygı düzeyleri tekrar ölçülüyor. Kaygı düzeyleri 20 maddelik durumluk kaygı ölçeği ile elde ediliyor.

Öğrenci

İlk sınav

Öncesi

İkinci sınav

Öncesi

Üçüncü Sınav Öncesi

1 40 37 34

2 52 50 43

3 35 35 34

4 38 35 32

5 45 40 41

6 41 42 37

7 41 40 41

8 40 37 32

9 44 46 40

. . . .

25 42 41 34

Durumluk Kaygı Puanları

Zaman Ortalama

S. Sapma n

I. Sınav Öncesi

42,24 4,92 25

II. Sınav Öncesi

41,80 4,91 25

III. Sınav Öncesi

38,36 4,57 25

Tanımlayıcı İstatistikler

252525N =

DURUMLUK KAYGI ÖLÇÜMÜ ZAMANI

III. sınav öncesi

II. sınav öncesi

I. sınav öncesi

Ho: Eğitim verilmeden önceki ve eğitim verildikten sonraki dönemlerde elde edilen durumluk kaygı puanları arasında fark yoktur.

HİPOTEZLERİN BELİRLENMESİ

H1: Eğitim verilmeden önceki ve eğitim verildikten

sonraki dönemlerde elde edilen durumluk kaygı puanları arasında fark vardır.

Karşılaştırma için F dağılımından yararlanılır. Hesapla bulunan F istatistiğinin elde edilmesinde kullanılan bilgiler bilgiler sıklıkla varyans analizi tablosunda özetlenir.

Durumluk kaygı örneği için Varyans Analizi Tablosu

Değişim Kaynağı KT Sd KO F P

DönemlerArası

2 218.2 41.6 0.000

Denekler

Arası

24 7.6

Hata251.

748 5.2

Durumluk kaygı puanlarının dönemlere göre değişimi önemlidir (p<0.05). Hangi dönemler arasında fark olduğu ikişerli karşılaştırmalarla incelenmelidir.

KT: kareler toplamı, Sd: serbestlik derecesi, Ko:kareler ortalaması

Sayımla Belirtilen Verilerde

Çapraz Tablo ve Ki kare analiziİki ya da daha çok değişkenin birlikte değişiminin

incelenmesi çoğu zaman çapraz tablo yapımını gerektirir.

İki ve daha fazla değişkenin kategorilerinin kesiştiği yerde frekansların olduğu tablolara çapraz tablo denir.

Eğer incelenecek iki değişken varsa, bu iki değişkenin birlikte değişimini göstermek amacıyla oluşturulan tabloya ikili çapraz tablo denir. Üç değişkenin birlikte değişimini incelemek amacıyla oluşturulan tabloya üçlü çapraz tablo,.... denir.

Yaş Grupları Erkek % Kadın % Toplam

0 19 47.5 21 52.5 40

1-4 85 53.1 75 46.9 160

5-9 95 47.5 110 52.5 200

10-14 185 49.3 190 50.7 375

15-19 210 46.7 240 53.3 450

. . . . . .

85+ 50 7.6 75 6.3 125

Toplam 1655 100 1595 100.0 3250

A Sağlık Bölgesindeki Nüfusun Yaşa ve Cinsiyete Göre Dağılımı

Aile Planlaması Kullanma

Kullanan Kullanmayan

Öğrenim Sayı (%) Sayı (%) ToplamOkur Yazar Değil 15 25.

045 75.0 60

İlkokul 25 41.7

35 58.3 60

Ortaokul 32 53.3

28 46.7 60

Lise 40 66.7

20 33.3 60

Üniversite 48 80.0

12 20.0 60

Toplam 160 53.3

140 46.7 300

Okur YazarDeğil

İlkolul Ortaokul Lise Üniversite

Öğrenim Durumu

Kullanan

Kullanmayan

Aile P.

Kİ-KARE TESTLERİ

1. Ki-kare testleri veri tipinin nitelik olduğu (kadın-erkek, iyileşti-iyileşmedi, hasta-sağlam, sosyo-ekonomik düzeyi iyi-orta-kötü,... gibi) verilerde kullanılır.

2. Ayrıca sürekli ya da kesikli sayısal veri tipinde olduğu halde sonradan nitelik veri konumuna dönüştürülen veriler arasında fark olup olmadığının incelenmesinde de kullanılır.

3. Veriler 2x2, 2x3, 3x3, 3x4, ... Boyutlu çapraz tablo şeklinde olmalıdır.

2x2 ki-kare testiİki yüzde arasındaki farkın anlamlılık

testinin uygulandığı durumlarda istenirse 2x2 ki-kare testinden de yararlanılabilir.

2x2 ki-kare testinin avantajı, gruplardaki gözlem sayılarının az olduğu durumlar için

geliştirilmiş değişik ki-kare testlerinin olmasıdır. Gruplardaki gözlem sayısının az

olması durumunda ki-kare testlerinden yararlanmak daha uygundur.

ÖRNEKLER: 2x2 (4 gözlü) ki-kare tablosu

Sigara Var

Yakınma Yok Toplam

İçen

İçmeyen

Toplam

EğitimDüzeyi

Sağlık Orta

Bilgisi Kötü Topla

Düşük

Yüksek

Toplam

ÖRNEKLER: 2x3 ki-kare tablosu

Çalışma Pozisyon

BulgusuOlmayan Toplam

Oturarak 26 175 201

Ayakta 44 181 225

Toplam 70 356 426

p>0.05Elde edilen sonuca göre oturarak ve ayakta çalışanlar Arasında varis bulgusu açısından anlamlı farklılık yoktur

Akdeniz Üniversitesi Tıp Fakültesi

Osman Saka 194

Chi-Square Tests

8,025a 3 ,046

7,853 3 ,049

,070 1 ,792

Pearson Chi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)

3 cells (37,5%) have expected count less than 5. Theminimum expected count is 1,97.

cinsiyet * pre op memnuniyet Crosstabulation

3 18 25 3 49

3 9 6 6 24

6 27 31 9 73

cinsiyet

zayif orta iyi çok iyi

pre op memnuniyet

Korelasyon Analizi ve Tahmin Kavramı

Pearson Korelasyon Katsayısı (r)

Ölçümle belirtilen iki değişken arasındaki doğrusal ilişkinin kuvveti

(derecesi) ve yönü hakkında bilgi verir.

-1<= r <=+1arasında değişir.

İlişki artar

0-1 +1

İlişki Azalır

r(±) İlişkinin derecesi

0.90 to 1.00 Çok kuvvetli

0.70 to 0.89 Kuvvetli

0.50 to 0.69 Orta

0.30 to 0.49 Düşük

0.00 to 0.29 Zayıf

Olarak değerlendirilmekle birlikte ilişkinin derecesi ne olursa olsun anlamlı (p<0.05)olmalıdır. Aksi halde r ne olursa olsun (p>0.05) olması durumunda değişkenler arasında ilişkinin varlığından söz edilemez

İlişkilerin Değerlendirilmesi

• Boy(cm) yaş(Ay)• 60 1• 65 3• 70 5• 75 7• 80 9

• 85 11• 90 13• 97 15• 100 17• 105 20• 110 21• 115 23• 120 25• 125 27• 130 30

• Egzersiz_Süresi Performans

• 60 100• 65 98• 70 96• 75 94• 80 92• 85 90• 90 88• 97 86• 100 84• 105 82• 110 80• 115 78• 120 76• 125 74• 130 72

Tam İlişkir=1

0 5 10 15 20 25 30

60 70 80 90 100 110 120 130

Egzersiz_Süresi

r=+1 r=-1

Tam İlişkir=1

0 5 10 15 20 25 30

60 70 80 90 100 110 120 130

Egzersiz_Süresi

r=+1r=-1

• Boy_cm_ Yaş_ay_• 60 1• 62 3• 62 5• 80 7• 80 9

• 81 11• 90 13• 97 15• 100 17• 100 20• 100 21• 104 23• 108 25• 114 27• 130 30

• Egzersiz_Süre Performans

• 60 100• 65 100• 70 99• 75 99• 80 90• 85 95• 90 90• 95 88• 100 89• 105 87• 110 83• 115 79• 120 78• 125 70• 130 72

Kuvvetli İlişki

0 5 10 15 20 25 30

Yaþ_ay_

60 70 80 90 100 110 120 130

Egzersiz_Süresi

r=0.97 p<0.001 r=-0.96 p<0.001

Kuvvetli İlişki

0 5 10 15 20 25 30

Yaþ_ay_

60 70 80 90 100 110 120 130

Egzersiz_Süresi

r=0.97 p<0.001 r=-0.96 p<0.001

Zayıf İlişkiler

P O Z İ T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

N E G A T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

Zayıf İlişkiler

P O Z İ T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

N E G A T İ F Z A Y I F İ L İ Ş K İ

2624222018161412108

İlişki Yok

Osman Saka

10 15 20 25 30 35

r=0.027 p=0.887

İlişki Yok

Osman Saka

10 15 20 25 30 35

r=0.027 p=0.887

İlişki Yok

Osman Saka

10 15 20 25 30 35

r=-0.027 p=0.887

Korelasyon Analizi

• İki değişken arasındaki ilişkinin kuvveti ve yönünü bildiren bir analizdir

• Öncelikle saçılım (scatter) grafiklerinden yararlanılarak değişkenlerdeki ilişkilerin yapısı konusunda bir ön bilgi edinilir.

• Saçılım grafikleri doğrusal pozitif ve negatif yönde zayıf, kuvvetli ve tam ilişki gösterebilirken hiç ilişki de göstermeyebilmektedir.

• Değişkenler arasında doğrusal ilişkilerin dışında doğrusal olmayan ilişkiler de bulunabilmektedir.

• Örnek: yaş ile sıçrama yüksekliği arasında belli bir yaşa kadar pozitif bir ilişki varken, belli bir yaşta maksimuma ulaştıktan sonra negatif bir ilişki gerçekleşir.

• Doğrusal ilişkiye sahip olmayan veriler bazen logaritmik dönüşümlerle doğrusal hale getirilebilir

Korelasyon Katsayısı (r) • Ölçümle belirtilen değişkenler arasındaki

doğrusal ilişkinin yönünü ve kuvveti hakkında bilgi almak amacıyla Pearson Korelasyon Katsayısı kullanılır.

• Analizi yapılacak değişkenlerin normal dağılım varsayımını karşılaması gerekmektedir

• Normal dağılıma uyulmayan durumlarda Spearman rank korelasyon katsayısı kullanılabilir

Korelasyon Katsayısının Hesaplanması

x y x.y - n• r= [( x2 - ( x)2 /n] [ y2 - ( y)2 /n]

r= xy çarpımlar toplamı (x ortalamadan ayrılış kareler toplamı)(y ortalamadan ayrılış kareler t.)

n x.y - x y• r= [ (n x2 - ( x)2] [n y2 - ( y)2 ]

Korelasyon Hesaplama -Örnek• Sporcuların masa tenisinde aldıkları sayı (X) antrenman haftası

sayısı arasındaki ilişkinin incelenmesi

X Y X2 Y2 XY

10 14 100 196 140

5 10 25 100 50

14 18 196 324 252

2 8 4 64 16

3 6 9 36 18

6 12 36 144 72

4 8 16 64 32

20 40 400 1600 800

12 24 144 576 288

8 16 64 256 128

X=84 Y=156 X2 = 994 Y2 = 3360 XY = 1796

10. 1796 - 84.156• r= [10 . 994 - (84)2].[10.3360 - (156)2 ]

17960 - 13104• r= [9940 - 7056].[33600 - 24336 ]

Korelasyon Katsayısının Anlamı• Korelasyon katsayısı r, –1 ve +1

arasındaki değerlerden oluşmaktadır.• -1’e yakın değerler negatif yönde

kuvvetli bir ilişkiyi,• +1’e yakın değerle pozitif yönde

kuvvetli bir ilişkiyi• 0’a yakın değerler çok düşük bir ilişkiyi

gösterir.• +1 ve –1 tam ilişki, 0 ise hiç ilişki

olmamasıdır

Korelasyon Matrisi

• Özellikle ikiden fazla değişken arasındaki ilişkilerle ilgileniliyorsa bu değişkenler arasındaki ilişkiler matris şeklinde sunulur

Correlations

1 ,359** -,204 ,008 ,014 ,097

,005 ,118 ,951 ,913 ,463

60 60 60 60 60 60

,359** 1 -,038 ,016 -,021 -,003

,005 ,775 ,904 ,873 ,981

60 60 60 60 60 60

-,204 -,038 1 ,159 ,011 -,008

,118 ,775 ,225 ,934 ,950

60 60 60 60 60 60

,008 ,016 ,159 1 ,045 -,033

,951 ,904 ,225 ,731 ,804

60 60 60 60 60 60

,014 -,021 ,011 ,045 1 ,168

,913 ,873 ,934 ,731 ,200

60 60 60 60 60 60

,097 -,003 -,008 -,033 ,168 1

,463 ,981 ,950 ,804 ,200

60 60 60 60 60 60

Pearson Correlation

Sig. (2-tailed)

Pearson Correlation

Sig. (2-tailed)

Pearson Correlation

Sig. (2-tailed)

Pearson Correlation

Sig. (2-tailed)

Pearson Correlation

Sig. (2-tailed)

Pearson Correlation

Sig. (2-tailed)

sistolik arter basýncý

nabýz

operasyon süresi

motor blok süresi

boy kilosistolik arter

basýncý nabýzoperasyon

süresimotor blok

süresi

Correlation is significant at the 0.01 level (2-tailed).**.

Korelasyon Matrisi

Kısmi Korelasyon Katsayısı• Bazen bazı değişkenler birden çok

değişkeni etkilemektedir. • Örneğin yaş değişkeni özellikle belli

değerler arasında birçok parametreyi etkilerler ve ilişki olmadığı halde korelasyona yol açarlar

• Örn. Kuvvet ile boy uzunluğu belli yaş dönemlerinde çok güçlü bir korelasyona sahiptir ama aralarındaki ilişki bu kadar güçlü olmayabilir.

Kısmi Korelasyon Katsayısı• Böyle durumlarda iki ilişkisiz

değişkende korelasyona yol açan bağımsız değişkenin etkisinin ortadan kaldırılması ya da sabit tutulması gerekmektedir.

• Örnek: x1, x2, x3 gibi üç değişken olsun.• X1= matematik başarı puanı• X2 = ayak uzunluğu • X3 = yaş olsun

• r12 = 0,80 (matematik puanı, ayak uzunluğu

ilişkisi) • r13 = 0,90 (matematik puanı, yaş ilişkisi)

• r23 = 0,88 (ayak uzunluğu, yaş ilişkisi)

r12 - r13 r23

r12.3 =

(1- r213) - (1- r2

Kısmi Korelasyon Katsayısı

0,80 – 0,90. 0,88

r12.3 =

(1- 0,902) - (1- 0,882)

3 nolu değişkenin yani yaş değişkeninin etkisi Kaldırıldığında matematik başarı puanı ile Ayak uzunluğu arasındaki korelasyon katsayısır = 0,038, yani 0 yakın anlamsız bir ilişkiyi ifade eder

= 0,038

Spearman Sıra Korelasyon Katsayısı (rs)

Değişkenlerin biri ya da her ikisinin normal dağılma uymadığı durumlarda kullanılabileceği gibi Bağımlı, Bağımsız Yada her ikisinin sıralı (ordinal) olması durumunda iki değişkenin ilişki miktarını belirlemek amacı ile kullanılır.

Parametrik olmayan bir ilişki katsayısıdır.

Örnek

Verileri daha önce verilen 73 hastanın operasyon süresi ile hastaların operasyondan memnun oluup olmadıkları sorulmuştur. Memnuniyetleri 4= çok memnun olmak üzere 1,2,3,4 olarak derecelendirilmiştir. Operasyon süresi ile memnuniyet arasında ilişki varmıdır?

Correlations

1,000 ,107

. ,367

,107 1,000

,367 .

Correlation Coefficient

Sig. (2-tailed)

Correlation Coefficient

Sig. (2-tailed)

operasyon süresi

post op memnuniyet

Spearman's rho

operasyonsüresi

post opmemnuniyet

Açıklayıcılık Katsayısı (R2)• Açıklayıcılık katsayısı, bağımlı değişkendeki

toplam değişimin yüzde kaçının bağımsız değişken tarafından açıklandığını belirtmektedir.

• R2, 0 ile 1 arasında değişmektedir.• r = 0,939 olduğunda, R2= 0,8649’dur• R2 değerinin 1’e yakın olması bağımlı

değişkendeki değişimin büyük bir bölümünün bağımsız değişken tarafından açıklandığını ve modelin uygun olduğunu gösterir.

istatistik

Investor Relations

57 statistika iii tur - е-учебници...İstatistik...

istatistik unite02

temel istatistik

İstatİstİk araŞtirma dergİsİ

6331 istatistik

matematik- İstatistik

istatistik teorisi

İstatİstİk · İstatistik sözcüğü farklı...

istatistik fizik deneyleri

kestİrİsel İstatİstİk

İstatİstİk -...

İstatistik kavramları

istatistik unite06

temel İstatİstİk yÖntemler

kalİte kontrolÜnde İstatİstİk

tÜrkİye İstatİstİk kurumu€¦ · türkiye İstatistik...

İstatİstİk ÇÖzÜmlÜ sorulari · 2017-01-09 · ...

istatistik ders

istatistik unite08

davranış bilimlerinde İstatistik