bilgilerin derlenmesi (fazlası için )

57
BİLGİLERİN DERLENMESİ

Upload: wwwtipfakultesi-org

Post on 08-Jul-2015

260 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: bilgilerin derlenmesi (fazlası için )

BİLGİLERİN DERLENMESİ

Page 2: bilgilerin derlenmesi (fazlası için )

Gruplama (Sınıflama)

• Bir amaç için birimlerden elde edilen bilgiler yığını (sınıflayıcı, sıralayıcı, eşit aralıklı veya oransal ölçekle ölçülmüş değerler) ilk başta ham durumdadır.

• Bunlar dağınık olduklarından amaca hizmet etmeleri düşünülemez. Bir anlam çıkarmak da oldukça güçtür.

• Her bir bilginin değerini tek tek gözden geçirerek bir sonuca gitmek zaman alıcı ve yorucu olduğu kadar, çok sayıda değer akılda tutulamayacağı için böyle bir yolu denemek de anlamsız olur.

Page 3: bilgilerin derlenmesi (fazlası için )

Herhangi bir karakterin,

herhangi bir ölçekle ölçülmüş dağınık durumda olan bilgileri daha anlaşılır ve daha düzenli bir duruma getirmek,

özetlemek için amaca uygun olarak birimlerin her vasfı için toplanan bilgileri kendi içlerinde şıklarına göre gruplandırmak

(sınıflandırmak) gerekir.

Değişkene ait şıklar sayısal olabilir ya da sayısal olmayabilir.

Page 4: bilgilerin derlenmesi (fazlası için )

• VERİLERİN SINIFLANDIRILMASI• Veriler; değişkenlerin ölçüm, tartım ya da

sayım sonucu edilmiş sayısal değerleridir. Değişkenlerin nitel ya da nicel özellikte olmalarına göre verileri farklı yapıdadır.

Page 5: bilgilerin derlenmesi (fazlası için )

Nitel değişkenler; •Birimlerin kalite, kategorik ya da isimsel olarak belirtilebilen karakteristik özelliklerini, durumlarını ve pozisyonlarını belirten değişkenlerdir.

•Bu değişkenlerin verileri isimsel ya da sıralı ölçekle elde edilmişlerdir ve iki ya da daha fazla kategoriye (altseçenek, sınıf, grup) ayrılarak sayımla elde edilir.

•Bu değişkenlerin verilerine nitel veriler adı verilir.

•Örneğin, birimlerin cinsiyeti, kan grubu, eğitim durumu, mesleği, medeni durumu, göz rengi, saç rengi, oturduğu yerleşim yeri, geçirmiş olduğu hastalıkların türleri, hastalık şiddeti, tedavi sonuçları gibi nitelik bildiren durumlarını açıklayan değişkenlerdir.

Page 6: bilgilerin derlenmesi (fazlası için )

Nicel değişkenler; •Birimlerin ölçüm ve tartım sonucu değerleri saptanan sayısal özelliklerini belirten değişkenlerdir.

•Bu değişkenlerin değerleri, mekanik ve elektronik araçlarla sayısal olarak aralıklı ölçekli ya da orantılı ölçekli verilerdir.

•Nicel değişkenlerin verilerine nicel veriler adı verilir.

•Örneğin birimlerin, boy uzunluğu, vücut ağırlıkları, kan basınçları, kolesterol düzeyleri gibi özellikleri nicel değişkenlerdir.

•Verilerin sınıflandırılmasında değişkenin özelliği ve veri tipi önem taşır.

•Nitel değişkenler ve nicel değişkenler farklı kurallara göre sınıflandırılırlar.

Page 7: bilgilerin derlenmesi (fazlası için )

Nitel Verilerin Sınıflandırılması•Nitel veriler sınıflandırılırken değişkenin kaç kategorisi (sınıf, alt seçenek) varsa belirlenir ve her bir kategoride kaç birim bulunduğu sayılarak belirlenir.

•Nitel verileri el ile sınıflandırırken iki sütunlu bir tablo düzenlenir.

•Bu tabloda birinci sütuna değişkenin kategorileri yazılır. •İkinci sütuna ise veri setindeki her değer ele alınarak bu değerin hangi kategoriye girdiği çeteleme yolu ile ait olduğu sınıfa yazılır.

•Tüm değerler tarandıktan sonra çeteleme değerleri sayılır ve her bir kategoride gözlenen birim sayısını gösteren frekanslar belirlenir.

Page 8: bilgilerin derlenmesi (fazlası için )

• Örneğin, üniversite uygulama hastanesi doğum kliniğinde 2001 haziran ayında doğum yapan 50 kadının eğitim durumlarına ilişkin verileri aşağıda verilmiştir. Bu kadınları eğitim durumuna göre frekans tablosu halinde gösterelim.

• Dizide (1) Okuryazar, (2) İlkokul mezunu, (3) Orta ve dengi okul mezunu, (4) Lise ve dengi okul mezunu, (5) Meslek Yüksekokulu mezunu, (6) Fakülte mezunu olan kadınları belirtmektedir.

• 50 kadının eğitim durumlarına ilişkin kodlanmış değerler veri seti aşağıdaki gibidir.1, 3, 4, 6, 2, 1, 4, 2, 3, 1, 2, 3, 4, 3, 3, 2, 3, 6, 5, 4, 2, 2, 3, 3, 2 , 1, 1, 5, 2, 5, 3, 6, 5, 1, 6, 5, 4, 3, 2, 3, 3, 2, 4, 5, 2, 6, 3, 4, 5, 2

Page 9: bilgilerin derlenmesi (fazlası için )

1, 3, 4, 6, 2, 1, 4, 2, 3, 1, 2, 3, 4, 3, 3, 2, 3, 6, 5, 4, 2, 2, 3, 3, 2 , 1, 1, 5, 2, 5, 3, 6, 5, 1, 6, 5, 4, 3, 2, 3, 3, 2, 4, 5, 2, 6, 3, 4, 5, 2

• Her nitelikte kaç kadın gözlendiği sayılarak ya da dizideki her kod tek tek ele alınarak oluşturulan tablodaki seçeneklerden hangisine girdiği bir çizgi ile belirlenerek sınıflandırma işlemi yapılır.

Eğitim Durumu KodKadın Sayısı Çetelemesi

Kadın Sayısı (frekans)

Okur Yazar 1 IIIII I 6

İlkokul mezunu 2 IIIII IIIII II 12

Orta ve dengi okul mezunu 3 IIIII IIIII III 13

Lise ve dengi okul mezunu 4 IIIII II 7

Meslek yüksek okulu mezunu 5 IIIII II 7

Fakülte mezunu 6 IIIII 5

Toplam - - 50

Page 10: bilgilerin derlenmesi (fazlası için )

• Tabloda iki sütun vardır. 1. sütun eğitim durumunun sınıflarını (kategorilerini), 2. sütun ise frekansları gösterir.

• Tablo-1: Üniversite uygulama hastanesinde haziran 2001'de doğum yapan kadınların eğitim durumlarına göre dağılımı

Eğitim Durumu Kod Kadın Sayısı ÇetelemesiKadın Sayısı

(frekans)

Okur Yazar 1 IIIII I 6

İlkokul mezunu 2 IIIII IIIII II 12

Orta ve dengi okul mezunu 3 IIIII IIIII III 13

Lise ve dengi okul mezunu 4 IIIII II 7

Meslek yüksek okulu mezunu 5 IIIII II 7

Fakülte mezunu 6 IIIII 5

Toplam - - 50

Page 11: bilgilerin derlenmesi (fazlası için )

• ÖRNEK• Örnek olarak, bir hastanede bir yılda doğum yapmış 100

tane kadından ikamet yeri, eğitim durumu, çocuk sayısı, bebeğin cinsiyeti gibi bilgileri ele alalım.

• Bu bilgilerin sayısal olmayan, ikamet yeri cinsiyet ve eğitim durumu vasıflarına göre dağılımı tablolarda görülmektedir.

• Tablolardan görüleceği gibi ikamet yeri ve cinsiyet vasıflarına ait bilgiler dağınık durumlarından kurtarılıp, iki grupla özetlenmiş oldular.

• Bu düzenlemede, araştırmaya konu olan vasıf sayısal olmayan şıklarına ayrılarak her birinden elde edilen gözlem sonucu bu şıklardan uygun olanın içine yerleştirilir.

Page 12: bilgilerin derlenmesi (fazlası için )

Tablo-2 : Annelerin ikamet yerlerine göre çocuk sayısının dağılımı Çocuk Sayısı İkamet Yeri Anne Sayısı 1 2 3 ≤

_______________________________________________________________

İl Merkezi 30 8 12 10

İlçe Merkezleri 20 5 5 10

Köyler 50 20 15 15

________________________________________________________________

TOPLAM 100 33 32 35

________________________________________________________________

Page 13: bilgilerin derlenmesi (fazlası için )

Tablo-3 : Bebeklerin cinsiyete göre dağılımı

Son Bebeğin Cinsiyeti Bebek Sayısı ___________________________________________________

Erkek 52

Kız 48

___________________________________________________

TOPLAM 100

___________________________________________________

Page 14: bilgilerin derlenmesi (fazlası için )

Tablo-4 : Kadınların eğitim seviyesine göre dağılımları

Eğitim Durumu Kadın Sayısı

___________________________________________________

Okur-yazar değil 20

Okur-yazar 25

İlköğretimi bitirmiş 20

Lise bitirmiş 25

Yüksek okul bitirmiş 10

___________________________________________________

TOPLAM 100

___________________________________________________

Page 15: bilgilerin derlenmesi (fazlası için )

Nicel Verilerin Sınıflandırılması•Birimlerin nicel (quantitatif, sayısal) özellikleri ölçülebilir tartılabilir niteliktedir.

•Bu tip değişkenlerin verilerine nicel veriler (data with scale measure) adı verilir.

•Nicel veriler Aralıklı (Interval Scale) ya da Oransal (Ratio Scale) ölçümleme teknikleri ile elde edilirler.

•Nicel verileri değerlerine göre Kesikli veriler ve Sürekli veriler adı altında iki farklı grupta ele alarak sınıflandırmak gerekir.

Page 16: bilgilerin derlenmesi (fazlası için )

a) Kesikli Veriler: Belirlenen gözlenme aralığında sadece tam sayıların yer aldığı veri setleridir. Sayımla elde edilmiş ve tam sayıya yuvarlatılmış veriler kesikli veri olarak alınırlar.

Page 17: bilgilerin derlenmesi (fazlası için )

b) Sürekli veriler: •Dağılım aralığında her değeri alabilen ölçü birimi ve titizliği arttıkça daha alt düzeyde değeri saptanabilen ve kesirli değerler içeren veri setleridir. •Ölçüm ve tartımla elde edilmiş veriler, sayısal değerleri tam sayılarla gösterilmiş olsalar da sürekli değişim gösterdikleri kabul edilen değişkenlere ilişkin veriler sürekli veriler olarak ele alınırlar.

Page 18: bilgilerin derlenmesi (fazlası için )

• Verilerin kesikli ya da sürekli olmaları frekans tablosu hazırlamayı ve istatistiklerin hesaplanmalarını etkiler.

• Nicel veriler sınıflandırılırken uyulması gereken genel prensipler kısaca aşağıdaki gibi özetlenebilir.

i- Sınıflandırmada tablodaki tercih edilen sınıf sayısı 10 ile 20 arasında olmalıdır. Sınıflandırmada özel hallerde bile tablonun bir sayfayı aşmasını önleyecek biçimde sınıf sayısı seçilmesi tercih edilmelidir.

ii- Sınıflandırmada sınıf aralıkları eşit alınmalıdır.

iii- Sınıf aralıklarının 0.25, 0.5, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50, 75, 100 ... gibi katları kolay alınabilir, tamsayı olan devirli sayılardan seçilmesi tercih edilmelidir.

Page 19: bilgilerin derlenmesi (fazlası için )

iv- İlk sınıf başlangıç değeri (SBD) Xmin değerini ve son sınıf üstsınır değeri (SÜD) Xmax değerini kapsayacak biçimde sınıfların SBD ve SÜD'leri belirlenmelidir.

v- Ulusal ve Uluslararası bilimsel sonuçların karşılaştırılmasını kolaylaştırmak amacı ile değişkenin sınıflandırma biçimi için özel bir sınıflama biçimi, bir standart varsa bu özel biçime ya da standartlara uygun sınıf değerleri seçilmesi tercih edilmelidir.

– Örneğin, Hastalık risklerine göre yaş grupları Dünya Sağlık Örgütü (DSÖ, WHO) ya da bilim çevreleri tarafından yıl olarak 0, 1-4, 5-9, 10-14, 15-24, 25-34, 35- 44, 45-54, 55-74, 75+ yaş/yıl biçiminde yaş gruplaması önerilmiş ise hastalık risk faktörleri çalışmalarında bu sınıflamaya uyulmalıdır.

Page 20: bilgilerin derlenmesi (fazlası için )

Sayısal Şıkların Gruplandırılması •100 tane anne biriminden yaş vasfı için alınan bilgiler tabloda verilmiştir.•Tabloda annelerin yaşları, onların sıra numaralarına göre dizilmiştir.

Page 21: bilgilerin derlenmesi (fazlası için )

• Bu şekilde bilgilerin sıra ile verilişine liste adı verilir. • Tablodaki bilgiler oldukça dağınıktır. • Bir anlam çıkarılması da mümkün görülmemektedir. • Bunların arasında en büyük yaşlı ya da en küçük yaşlı anneyi bulmak için

hepsini tek tek gözden geçirmek gerekir. • En küçük ya da en büyük yaşlı anne yerine herhangi bir yaştaki ya da yaşlar

arasındaki anneleri de bilmek isteyebiliriz.

Page 22: bilgilerin derlenmesi (fazlası için )

• Bilgileri kolaylıkla elde edebilmek için bu bilgileri küçükten büyüğe doğru yeniden sıralamamız gerekir.

• Böylece en küçük ve en büyük yaşları ve bu yaşlarda kaçar annenin bulunduğunu önceki listeden daha kolay bir şekilde bulabiliriz.

• Yaşların küçükten büyüğe doğru sıraya konulmuş şekli Tablo 3.3'de verilmiştir.

• Küçükten büyüğe düzenlemede en küçük yaşın 14 olduğu ve bu yaşta bir annenin bulunduğu kolaylıkla görülebilir. Benzer şekilde başka bir yaşta da kaç annenin yer aldığı kolayca bulunabilir.

_________________________________________________________ 14 20 24 27 29 31 32 35 37 40 15 20 25 27 29 31 33 35 37 40 16 21 25 27 29 31 33 35 37 40 17 22 25 27 30 31 33 35 38 40 18 22 25 28 30 31 33 35 38 41 18 22 25 28 30 31 33 36 38 42 19 23 26 29 30 32 34 36 39 42 19 23 26 29 30 32 34 36 39 43 20 23 26 29 30 32 34 36 39 44 20 24 27 29 30 32 35 37 39 45 _________________________________________________________

Tablo 3.3: 100 Annenin Yaşlarının Küçükten Büyüğe Doğru Sıralanışı

Page 23: bilgilerin derlenmesi (fazlası için )

• Örneğin, 35 yaşında kaç annenin bulunduğunu, tabloda sıra ile yer alan 35'leri sayarak hemen söylenebilir.

• Bu şekilde yapılan düzenlemeye sıralı tablo adı verilir. Sıralı tabloda tekrar eden sayılar tekrar sayısı kadar yazıldığı için tablo fazla yer kaplamaktadır.

_________________________________________________________ 14 20 24 27 29 31 32 35 37 40 15 20 25 27 29 31 33 35 37 40 16 21 25 27 29 31 33 35 37 40 17 22 25 27 30 31 33 35 38 40 18 22 25 28 30 31 33 35 38 41 18 22 25 28 30 31 33 36 38 42 19 23 26 29 30 32 34 36 39 42 19 23 26 29 30 32 34 36 39 43 20 23 26 29 30 32 34 36 39 44 20 24 27 29 30 32 35 37 39 45 _________________________________________________________

Tablo 3.3: 100 Annenin Yaşlarının Küçükten Büyüğe Doğru Sıralanışı

Page 24: bilgilerin derlenmesi (fazlası için )

• Sıralı Tabloda 35 sayısı fazla olsaydı, bu yaştakilerin sayısını bulmak biraz zaman alacaktır.

• Bu durumdan kurtulmak için yaşlar bir sütuna ve yaşların tekrar eden sayıları da hizalarına ve başka bir sütuna yazılabilir.

• Böylece tekrar eden sayıları yazmaktan kurtulunulduğu gibi, tablo da küçülmüş olur.

• Her yaş için tekrar eden sayı o yaşın frekansını oluşturur. • Bu şekilde ortaya çıkan yeni tabloya da frekans tablosu adı verilir. Bu yeni

düzenleme Tablo 3.4’de görülmektedir.

_______________________________________ Yaş f Yaş f Yaş f ________________________________________ 14 1 25 5 36 4 15 1 26 3 37 4 16 1 27 5 38 3 17 1 28 2 39 4 18 2 29 7 40 4 19 2 30 7 41 1 20 4 31 6 42 2 21 1 32 5 43 1 22 3 33 5 44 1 23 3 34 3 45 1 24 2 35 6 _________________________________________ Toplam 100 __________________________________________

Tablo 3.4: 100 Annenin Yaşlarının Frekans Dağılımı

Page 25: bilgilerin derlenmesi (fazlası için )

• Birim sayısı ve o birimlere ait bir vasfın şık sayısı arttıkça frekans dağılım tablosu da daha uzun olacaktır. Bu gibi durumlarda tabloyu küçültmenin yolu, verileri frekans tablosu haline getirmektir.

_______________________________________ Yaş f Yaş f Yaş f ________________________________________ 14 1 25 5 36 4 15 1 26 3 37 4 16 1 27 5 38 3 17 1 28 2 39 4 18 2 29 7 40 4 19 2 30 7 41 1 20 4 31 6 42 2 21 1 32 5 43 1 22 3 33 5 44 1 23 3 34 3 45 1 24 2 35 6 _________________________________________ Toplam 100 __________________________________________

Tablo 3.4: 100 Annenin Yaşlarının Frekans Dağılımı

Page 26: bilgilerin derlenmesi (fazlası için )

Sınıflandırılmış Frekans Tablosu Düzenleme

• Gözlem sonuçlarından elde edilen sayısal değerlerin dağılım aralığı içinde küçükten büyüğe doğru oluşturulmuş sınıflara dağıtılarak her sınıfa düşen birim sayısının saptanmasına sınıflandırılmış frekans tablosu denir.

• Her sınıfın içinde yer alan birim sayısına o sınıfın frekansı ve frekansların sınıflara göre dağılımına da frekans tablosunun frekans dağılımı denir.

Page 27: bilgilerin derlenmesi (fazlası için )

• Sınıflandırılmış frekans tablosu hazırlanırken şu sıra izlenir;

1. Dağılım aralığının belirlenmesi: Değişkenlerin değişim gösterdiği aralığa değişim aralığı denir.

• Bir örnek içinde bulunan n tane değişkenin değerleri küçükten büyüğe doğru x1, x2, x3,....xn olsun.

• x1 en küçük değişken değeri ve xn de en büyük değişken değeridir.

• x1 den başlayıp xn'e kadar uzanan aralık, örnekteki değişkenlerin değişim aralığıdır. Değişim aralığının genişliği R ile gösterilir.

• Yukarıda verilen örneğimizde, 100 tane yaş için en küçük değer 14 ve en büyük değer de 45'dir.

• Değişim aralığı 14 ile 45 yaş arası olup, genişliği R=45-14=31 olur.

Page 28: bilgilerin derlenmesi (fazlası için )

2. Sınıf aralığının saptanması:

•Değişkenlerin R genişliğindeki dağılım aralığının uygun görülen grup sayısı k'ya bölünmesiyle elde edilen aralık genişliği, bir grubun aralığı ya da sınıf aralığı olur.

•Sınıf aralığı, sınıfın başlangıç değeri ile bitiş değeri arasındaki farka eşittir. C ile gösterilen sınıf aralığı dağılım aralığının sınıf sayısına bölünmesiyle elde edilir.

•Sınıf sayısı değiştikçe C de değişir. Bu nedenle C'yi saptayabilmek için önce sınıf sayısına karar vermek gerekir.

•Sınıf sayısı için kesin bir hüküm olmamakla birlikte, 10 ile 20 arasında tutulması uygun görülmektedir.

•Sınıf sayısı 20'den fazla olduğu zaman frekans tablosunun kavranması güçleşir ve işlemler uzar.

•10'nun altında sınıf sayısı olduğu zaman da sınıf aralığının büyümesinden dolayı yapılacak hesaplamalarda hata payı artar. Ayrıca dağılıma ait bazı özellikler de açığa çıkamazlar.

Page 29: bilgilerin derlenmesi (fazlası için )

• Frekans tablosundan iyi bir sonuç alabilmek için veri sayısının 50'nin üzerinde olması gerekir.

• Sınıf aralığı sınıf sayısı ile değiştiğinden, uygun sınıf sayısı 10 ile 20 arasında değişirken (10≤k≤20) sınıf aralığının değeri de R/10≥C≥R/20 olarak değişir.

• R/10, 10 sınıfı bir frekans tablosunda sınıf aralığını verirken, R/20 de 20 sınıflı bir frekans tablosundaki sınıf aralığını vermektedir. Bu iki değer arasından uygun bir değer sınıf aralığı olarak seçildiğinde oluşacak sınıf sayısı 10 ile 20 arasında olacaktır. – Örneğin, yaş örneğimizdeki değerleri 10 sınıflı bir frekans tablosu

yapmak istersek, sınıf aralığı C=31/10=3.1 ve 20 sınıflı bir frekans tablosu yapmak istediğimizde ise C=31/20=1.55 olmaktadır. Bu duruma göre en uygun sınıf aralığı 1.55≤C≤3.1 olacaktır.

Page 30: bilgilerin derlenmesi (fazlası için )

• Eğer biz, frekans tablosunda k sayıda sınıf bulunmasını istiyorsak o zaman sınıf aralığı R/k olur.

• Bu bölümden elde edilen sonuç her zaman bir tam sayı çıkmayabilir. O zaman, o sayıya en yakın olan tam sayı sınıf aralığı olarak seçilebilir. – Örneğin, Tablo 3.3 'de verilen 100 tane annenin

yaşı için 15 sınıflı bir frekans tablosu yapmak istersek sınıf aralığı C=31/15≅2 olur.

Page 31: bilgilerin derlenmesi (fazlası için )

• 3. Sınıfların oluşturulması:

• Sınıflamaya başlarken başlangıç sayısı olarak en küçük değişken değeri ya da ondan daha küçük bir değer alınır.

• • Başlangıç sayısı olarak seçilen sayının, sınıf aralığı C'nin

katı olması bazı kolaylıklar sağlar.

• Sınıflamada başlangıç ve bitiş değerleri, en küçük değer ilk sınıfın içinde ve en büyük değer de son sınıfın içinde olacak şekilde seçilmelidir.

Page 32: bilgilerin derlenmesi (fazlası için )

• Örnek 3.1: 100 tane annenin yaşlarının sınıflandırılmış frekans tablosu haline getirilmesi

• Yaşların dağılım aralığı (R)=45-14=31

• 20 sınıflı bir frekans tablosu yapılmak istense, sınıf aralığı C=31/20=1.55

• 10 sınıflı bir frekans tablosu yapılmak istense, sınıf aralığı C=31/10=3.1 olacaktır.

• Uygun bir frekans tablosu için 1.55≤C≤3.1 olmalıdır.

• Buna göre 1.55 ve 3.1 arasında herhangi bir değer sınıf aralığı olarak seçilirse sınıf sayısı 10 ile 20 arasında olur.

• Sınıf aralığı olarak 2'nin alınması diğerlerine göre daha uygundur.

Page 33: bilgilerin derlenmesi (fazlası için )

• Başlangıç değeri olarak, en küçük değeri içinde bulundurması gerektiği için 14 ya da 15 alınmak durumundadır.

• C=2 alındığından 2'nin katı olması nedeniyle başlangıç değerinin 14 olarak seçilmesi uygun olur.

_______________________________________ Yaş f Yaş f Yaş f ________________________________________ 14 1 25 5 36 4 15 1 26 3 37 4 16 1 27 5 38 3 17 1 28 2 39 4 18 2 29 7 40 4 19 2 30 7 41 1 20 4 31 6 42 2 21 1 32 5 43 1 22 3 33 5 44 1 23 3 34 3 45 1 24 2 35 6 _________________________________________ Toplam 100 __________________________________________

Page 34: bilgilerin derlenmesi (fazlası için )

4. Verilerin Sınıflara Dağılımı: •Yaş değerleri kesikli değişken olarak alınarak, Tabloda her sınıfın başlangıç ve bitiş değerleri belirtilmiştir.

•İlk sınıf 14'de başlayıp 15'de bitmekte ve 2.sınıf da 16'da başlayıp 17'de bitmektedir.

•14 ve 15 yaşında olanlar ilk sınıfta, 16 ve 17 yaşında olanlar da 2. sınıfta yer alacaklardır. •Aynı şekilde, verilerin her biri tek tek ele alınarak hangi sınıfın sınırları içine düşüyorsa o sınıfa yerleştirilirler. •Sonuçta, her sınıfta toplanacak veri sayısı o sınıfın frekansını oluşturur.

______________________________________________________________ Yaş (yıl) Frekans ______ ____________ 14-15 2 16-17 2 18-19 4 20-21 5 22-23 6 24-25 7 26-27 8 28-29 9 30-31 13 32-33 10 34-35 9 36-37 8 38-39 7 40-41 5 42-43 3 44-45 2 ____________________________________________________________ TOPLAM 100

Tablo 3.5: 100 Anneye Ait Yaşların Sınıflandırılmış Frekans Tablosu

Page 35: bilgilerin derlenmesi (fazlası için )

• Sınıf Değeri : Bir sınıfın sınıf değeri, o sınıfın alt sınırı ile üst sınırının orta noktası ya da bu iki sınır değerinin ortalamasıdır.

Sınıf Değeri = ( Sınıfın üst sınırı + Sınıfın alt sınırı ) / 2

• 14-15 sınıfının alt sınır değeri 14 ve üst sınır değeri 15'dir.Sınıf Değeri = ( 14 + 15 ) /2 = 29 /2 =14.5

• Bir sınıfın sınıf değeri o sınıfın değişken değeri olarak işleme girer. Başka bir deyişle, sınıfın içinde bulunan bütün ölçümlerin hepsinin aynı ve aralığın ortasına rastlayan sınıf değerine eşit oldukları kabul edilir.

• Bu değer, aritmetik ortalama ve standart sapma gibi istatistik değerlerinin elle hesaplandıkları durumlarda ve frekans poligonu grafiğinin çiziminde gereklidir.

Page 36: bilgilerin derlenmesi (fazlası için )

Tablo 3.5: 100 Anneye Ait Yaşların Frekans Tablosu ______________________________________________________________ Yaş (yıl) Frekans Sınıf Değeri (Anne Sayısı) ______ ____________ ___________ 14-15 2 14.5 16-17 2 16.5 18-19 4 18.5 20-21 5 20.5 22-23 6 22.5 24-25 7 24.5 26-27 8 26.5 28-29 9 28.5 30-31 13 30.5 32-33 10 32.5 34-35 9 34.5 36-37 8 36.5 38-39 7 38.5 40-41 5 40.5 42-43 3 42.5 44-45 2 44.5 ____________________________________________________________ TOPLAM 100

Page 37: bilgilerin derlenmesi (fazlası için )

• Görüldüğü gibi Tablo 3.5 'deki veriler kesiklidir. • Yaşların yıldan arta kalan kısımları

değerlendirilmeyip tam sayılarla belirtilirtilerek yaş ölçüleri kesikli duruma getirilmiştir.

• Eğer yaşlar, yalnızca yıl olarak düşünülmeyip bunun daha küçük parçaları olan ay, hafta, gün ve saat de hesaba katılarak değerlendirilseydi o zaman veriler bir süreklilik gösterirlerdi.

• Aynı tablodaki veriler sürekli olsalardı, ilk sınıfın bitiş noktası 15 olmayıp 15.9999... olurdu. Bu duruma göre kuramsal olarak 16 yıldan, düşünülebilen en küçük bir zaman parçası kadar küçük olanlar 14-15 sınıfında yer alacak ve tam 16 yaşında olanlar ise 16-17 sınıfında yer alacaklardır. Matematiksel olarak yaşı x ile gösterirsek,

14 ≤x < 16 ilk sınıfta yer alanlar

16 ≤x < 18 ise ikinci sınıfta yer alanlar olacaktır.

______________________________________________________________ Yaş (yıl) Frekans Sınıf Değeri (Anne Sayısı) ______ ____________ ___________ 14-15 2 14.5 16-17 2 16.5 18-19 4 18.5 20-21 5 20.5 22-23 6 22.5 24-25 7 24.5 26-27 8 26.5 28-29 9 28.5 30-31 13 30.5 32-33 10 32.5 34-35 9 34.5 36-37 8 36.5 38-39 7 38.5 40-41 5 40.5 42-43 3 42.5 44-45 2 44.5 ____________________________________________________________ TOPLAM 100

Page 38: bilgilerin derlenmesi (fazlası için )

• Örnek: Deney hayvanlarına yönelik yapılan bir çalışmada ağırlıklar (gram) kesikli değişken ve sürekli değişken olarak sınıflandırıldığında aşağıdaki gibi sınıflandırmalar yapılır.

Page 39: bilgilerin derlenmesi (fazlası için )

Tablo 7.4- Ağırlık kesikli alındığında sınıfların alt sınıf, üst sınıf ve sınıf değerleriAlt sınıf değeri Üst sınıf değeri Sınıf değeri

120 122 121123 125 124126 128 127129 131 130132 134 133135

137 136138 140 139141 143 142144 146 145

Tablo 7.5: Ağırlık sürekli alındığında sınıfların alt sınıf, üst sınıf ve sınıf değerleriAlt sınıf değeri Üst sınıf değeri Sınıf değeri

120 122.99 121.5

123 125.99 124.5

126 128.99 127.5

129 131.99 130.5

132 134.99 133.5

135 137.99 136.5

138 140.99 139.5

141 143.99 142.5

144 146.99 145.5

• Örnek: Deney hayvanlarına yönelik yapılan bir çalışmada ağırlıklar (gram) kesikli değişken ve sürekli değişken olarak sınıflandırıldığında aşağıdaki gibi sınıflandırmalar yapılır.

Page 40: bilgilerin derlenmesi (fazlası için )

• Eklemeli Frekans• Bir sınıfın eklemeli frekansı, o sınıfın ve ondan

önce gelen sınıfların frekanslarının toplamıdır. • Frekans tablosunda ilk sınıfın eklemeli frekansı

o sınıfın kendi frekansına ve son sınıfın eklemeli frekansı da toplam frekansa eşittir.

• Eklemeli frekanslar küçükten büyüğe (den az) ya da büyükten küçüğe (den çok) şeklinde oluşturulurlar.

Page 41: bilgilerin derlenmesi (fazlası için )

• Tablo 3.5 de "den az" ve "den çok" frekansları eklemeli frekanslar sütunlarında görülmektedir.

• Eklemeli frekanslar, belirli bir değerin altında ya da üstünde bulunan değişken sayısının bilinmesinin gerekli olduğu durumlarda yararlıdır.

• Ortanca değer, kuartil, desil ve yüzdelik değerlerinin elle hesaplanmasında eklemeli frekanstan yararlanılır.

Tablo 3.5: 100 Anneye Ait Yaşların Frekans Tablosu ______________________________________________________________ Yaş (yıl) Frekans Sınıf Değeri Eklemeli Frekanslar (Anne Sayısı) (den az) (den çok) ______ ____________ ___________ _______ _______ 14-15 2 14.5 2 100 16-17 2 16.5 4 98 18-19 4 18.5 8 96 20-21 5 20.5 13 92 22-23 6 22.5 19 87 24-25 7 24.5 26 81 26-27 8 26.5 34 74 28-29 9 28.5 43 66 30-31 13 30.5 56 57 32-33 10 32.5 66 44 34-35 9 34.5 75 34 36-37 8 36.5 83 25 38-39 7 38.5 90 17 40-41 5 40.5 95 10 42-43 3 42.5 98 5 44-45 2 44.5 100 2 ____________________________________________________________ TOPLAM 100

Page 42: bilgilerin derlenmesi (fazlası için )

______________________________________________________________ Yaş (yıl) Frekans Sınıf Değeri Eklemeli Frekanslar (Anne Sayısı) (den az) (den çok) ______ ____________ ___________ _______ _______ 14-15 2 14.5 2 100 16-17 2 16.5 4 98 18-19 4 18.5 8 96 20-21 5 20.5 13 92 22-23 6 22.5 19 87 24-25 7 24.5 26 81 26-27 8 26.5 34 74 28-29 9 28.5 43 66 30-31 13 30.5 56 57 32-33 10 32.5 66 44 34-35 9 34.5 75 34 36-37 8 36.5 83 25 38-39 7 38.5 90 17 40-41 5 40.5 95 10 42-43 3 42.5 98 5 44-45 2 44.5 100 2 ____________________________________________________________ TOPLAM 100

Page 43: bilgilerin derlenmesi (fazlası için )

Frekans Dağılım Eğrisi•Bir frekans tablosunda yer alan bilgilerden, ölçüm değerlerini x ekseninde ve bunlara karşı gelen frekans değerlerini de y ekseninde kartezyen koordinatlarına göre yerleştirip birbiriyle birleştirildiklerinde ortaya çıkan eğri frekans dağılım eğrisi olur.

Tablo3.2’ye ait frekans dağılım eğrisi

Tablo3.2’ye ait serpme grafiği

0

1

2

3

4

5

6

7

8

14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

Yaş

Frekans

0

1

2

3

4

5

6

7

8

0 5 10 15 20 25 30 35 40 45 50

Yaş

Frekans

Page 44: bilgilerin derlenmesi (fazlası için )

• Frekans dağılım eğrileri, tepe sayılarına ve aldıkları biçimlere göre değişik şekillerde olabilir.

• Biyolojik bilimlerde, genellikle frekans dağılım eğrileri bir tepeli, çan şeklinde, simetrik bir durum gösterirler.

• Biyoistatistik çalışmalarında da üzerinde durulan eğri tipi budur. Bu tip eğriler normal dağılım eğrisi olarak adlandırılır. Normal dağılımlarda aritmetik ortalama, ortanca değer ve tepe değeri birbirine eşittir.

Tablo3.2’ye ait frekans dağılım eğrisi

0

1

2

3

4

5

6

7

8

14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

Yaş

Frekans

Page 45: bilgilerin derlenmesi (fazlası için )

• Çarpık Eğriler• Eğriler her zaman normallik özelliği göstermezler.

• Simetri bozularak çarpık hale dönüşebilirler. Çarpıklık iki şekilde olur. Kabaca çarpıklık ölçüsü,

Ç = ( Aritmetik ortalama - Tepe değeri ) / standart sapma

• Çarpıklık katsayısı pozitif olursa, çarpıklık sağa tarafa doğrudur. – Çarpıklık yönden dolayı, sağa çarpık ya da pozitif çarpıklık adını alır.

• Çarpıklık katsayısı negatif olursa, çarpıklık sol tarafa doğrudur. – Çarpıklık yönünden dolayı, sola çarpık ya da negatif çarpıklık adı verilir.,

• Hafif derecede çarpık eğrilerdeA.O. - T.D. = 3 ( A.O. - Ortanca değer)

• ilişkisi mevcuttur.

• Bu ilişki çarpıklık katsayısında yerine konulursa,Ç = 3.(A.O. - O.D.)/S

şeklini alır.

Page 46: bilgilerin derlenmesi (fazlası için )

• İki ayrı şekilde belirtilen bu çarpıklık katsayıları sırasıyla Pearson'ın birinci ve ikinci çarpıklık katsayıları olarak adlandırılır.

• x değişken değerini, n değişken sayısını, s standart sapmayı ve de aritmetik ortalamayı göstermek üzere çarpıklığın en iyi ölçüsü,

• Dağılım Ç=0 için normal, Ç > 0 için pozitif ve Ç < 0 için negatif çarpıklık gösterir.

• Örnek: 100 tane annenin yaş verilerinin çarpıklık katsayısı,• Ç=-0.191 olarak hesaplanmıştır. Buna göre, yaş verilerinin dağılımı

negatif çarpıklık göstermekte olup çarpıklığın derecesi 0.191’dir.

Page 47: bilgilerin derlenmesi (fazlası için )

Sağa Çarpık Eğri

T.D. O.D. A.O.

Sola Çarpık Eğri

A.O. O.D. T.D.

Şekil 3.1: Çarpık Eğriler

Sağa Çarpık Eğri (Pozitif Çarpıklık)

Sola Çarpık Eğri (Negatif Çarpıklık)

Page 48: bilgilerin derlenmesi (fazlası için )

• Basık ve Sivri Eğriler• Normal dağılım eğrisinin üstten basılarak basık ve yanlardan

basılarak da sivri duruma gelmesi halidir. • Bu eğrilerde simetri bozulmadan (Ç=0) yalnızca tepe noktasının yeri

aşağı-yukarı oynayabildiği gibi her iki yönde de değişme olabilir.

• Yani, hem çarpıklık hem de basıklık ve sivrilik olabilir. Basıklık ve sivriliğin ölçüsü,

• Normal dağılım için B=0 dır. B>0 için eğri sivri, B<0 için eğri basıktır.

• Örnek: 100 tane annenin yaş verilerinin basıklık katsayısı,B=-0.568’dir. Buna göre, yaş verilerinin dağılımı basık olup, basıklığın

derecesi 0.568’dir.

Page 49: bilgilerin derlenmesi (fazlası için )

• Sivri ve basık eğriler Şekil 3.2'de görülmektedir.

Normal Basık Sivri

Şekil 3.2: Sivri ve Basık Eğriler

Page 50: bilgilerin derlenmesi (fazlası için )

Normal Dağılıma Göre Sivri ve Basık Eğriler

Normale göre sivri eğri

Normale göre basık eğri

Normal

Page 51: bilgilerin derlenmesi (fazlası için )

• Özet Tablolar• Bilgilerin frekans tablosu yapılmasıyla

grafiklerinin çizilmesi ve özetlenmesi bakımından yarar sağlamasına karşın, veriler gerçek değerlerini kaybettiklerinden bilgi kayıplarına ve istatistik değerlerinin hesaplanmasında da hatalara neden olabilmektedir.

• Bunun yerine, sayısal vasıflar için yalnız bilgilerin sayısı, aritmetik ortalaması, standart sapması, standart hatası, en küçük değeri ve en büyük değeri gibi önemli bazı istatistik değerleri verilerek özet tablolarla betimleyici değerler sunulabilir.

Page 52: bilgilerin derlenmesi (fazlası için )

• Tablo yaparken uyulması gerekli bazı kurallar vardır. Bu kurallar şöyle sıralanabilir.

a) Her tablonun, içerdiği bilgileri belirten bir adı olmalıdır. Ad genellikle üstte olur.

b) Yazı içinde geçen tablo sayısı birden fazla ise onlara numara verilmelidir.

c) Tabloda bir sembol ya da işaret kullanılmışsa ya da bazı sözcükler kısaltılarak yazılmışsa bunların anlamı tablonun altında belirtilmelidir.

d) Tablo karışık olmamalı, sade ve anlaşılır olmalıdır.

e) Tablo içindeki sütunların neyi temsil ettikleri gösterilmelidir.

Page 53: bilgilerin derlenmesi (fazlası için )

• Örnek : Gözlerine lens takılan 15 hastanın kornea ön yüzünün kurvatur yarıçaplarının lens takıldıktan sonra 1. ve 3. günlerdeki değerleri mm cinsinden aşağıda liste olarak verilmiştir.

Page 54: bilgilerin derlenmesi (fazlası için )

Örnek 3.2: Gözlerine lens takılan 15 hastanın kornea ön yüzünün kurvatur yarıçaplarının lens takıldıktan sonra 1. ve 3. günlerdeki değerleri mm cinsinden aşağıda liste olarak verilmiştir.

Hasta no 1. Gün 3. Gün Fark(3.Gün-1.Gün) ______________________________________________________

1 8.1 8.2 0.1 2 8.1 8.1 0.0 3 8.1 8.0 -0.1 4 8.5 8.7 0.2 5 8.5 8.6 0.1 6 8.0 8.1 0.1 7 7.7 7.8 0.1 8 7.7 7.6 -0.1 9 7.6 7.6 0.0 10 8.4 8.5 0.1 11 7.7 7.8 0.1 12 8.2 8.3 0.1 13 8.9 8.8 -0.1 14 9.1 9.1 0.0 15 7.2 7.1 -0.1 _____________________________________________________ 8.12 8.15 0.03 S 0.51 0.53 0.10 S.H. 0.13 0.14 0.03

Page 55: bilgilerin derlenmesi (fazlası için )

Örnek 3.3: Örnek 3.2'deki tabloyu yalnız verilerin istatistik değerlerini vererek özetleyelim.

Gruplar n S S.H. D.K.(%) Min Max _____________________________________________________________________________

1.Gün 15 8.12 0.51 0.13 6.2 7.2 9.1

3.Gün 15 8.15 0.53 0.14 6.5 7.1 9.1

Fark 15 0.03 0.10 0.03 333 -0.1 0.2 _____________________________________________________________________________

Page 56: bilgilerin derlenmesi (fazlası için )

Örnek 3.4: 100 kadına ait bazı vasıfların istatistik değerleri aşağıda hesaplanarak verilmiştir.

Vasıf n S S.H. D.K.(%) Min Max _______________________________________________________________________________

Yaş (Yıl) 100 25 5 0.5 20 16 48

Kan basıncı (mm/Hg) 100 120 20 2 17 90 200

Nabız 100 72 12 1.2 17 65 94

Çocuk sayısı 100 4 2 0.2 50 1 6 _______________________________________________________________________________

Page 57: bilgilerin derlenmesi (fazlası için )

Kaynaklar• Prof. Dr. Rian DİŞÇİ, Temel ve Klinik Biyoistatistik, İstanbul Medikal Yayıncılık• Prof. Dr. Yusuf ÇELİK, Nasıl Biyoistatistik Bilimsel Araştırma SPSS (kitap isteme Tel

0412.2488001-4208)

• Prof Dr Kazım ÖZDAMAR, SPSS ile Biyoistatistik, Kaan Kitabevi• Prof Dr İsmet KAN, Biyoistatistik, Nobel Yayınevi