bilgilerin derlenmesi (fazlası için )

Post on 08-Jul-2015

260 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

BİLGİLERİN DERLENMESİ

Gruplama (Sınıflama)

• Bir amaç için birimlerden elde edilen bilgiler yığını (sınıflayıcı, sıralayıcı, eşit aralıklı veya oransal ölçekle ölçülmüş değerler) ilk başta ham durumdadır.

• Bunlar dağınık olduklarından amaca hizmet etmeleri düşünülemez. Bir anlam çıkarmak da oldukça güçtür.

• Her bir bilginin değerini tek tek gözden geçirerek bir sonuca gitmek zaman alıcı ve yorucu olduğu kadar, çok sayıda değer akılda tutulamayacağı için böyle bir yolu denemek de anlamsız olur.

Herhangi bir karakterin,

herhangi bir ölçekle ölçülmüş dağınık durumda olan bilgileri daha anlaşılır ve daha düzenli bir duruma getirmek,

özetlemek için amaca uygun olarak birimlerin her vasfı için toplanan bilgileri kendi içlerinde şıklarına göre gruplandırmak

(sınıflandırmak) gerekir.

Değişkene ait şıklar sayısal olabilir ya da sayısal olmayabilir.

• VERİLERİN SINIFLANDIRILMASI• Veriler; değişkenlerin ölçüm, tartım ya da

sayım sonucu edilmiş sayısal değerleridir. Değişkenlerin nitel ya da nicel özellikte olmalarına göre verileri farklı yapıdadır.

Nitel değişkenler; •Birimlerin kalite, kategorik ya da isimsel olarak belirtilebilen karakteristik özelliklerini, durumlarını ve pozisyonlarını belirten değişkenlerdir.

•Bu değişkenlerin verileri isimsel ya da sıralı ölçekle elde edilmişlerdir ve iki ya da daha fazla kategoriye (altseçenek, sınıf, grup) ayrılarak sayımla elde edilir.

•Bu değişkenlerin verilerine nitel veriler adı verilir.

•Örneğin, birimlerin cinsiyeti, kan grubu, eğitim durumu, mesleği, medeni durumu, göz rengi, saç rengi, oturduğu yerleşim yeri, geçirmiş olduğu hastalıkların türleri, hastalık şiddeti, tedavi sonuçları gibi nitelik bildiren durumlarını açıklayan değişkenlerdir.

Nicel değişkenler; •Birimlerin ölçüm ve tartım sonucu değerleri saptanan sayısal özelliklerini belirten değişkenlerdir.

•Bu değişkenlerin değerleri, mekanik ve elektronik araçlarla sayısal olarak aralıklı ölçekli ya da orantılı ölçekli verilerdir.

•Nicel değişkenlerin verilerine nicel veriler adı verilir.

•Örneğin birimlerin, boy uzunluğu, vücut ağırlıkları, kan basınçları, kolesterol düzeyleri gibi özellikleri nicel değişkenlerdir.

•Verilerin sınıflandırılmasında değişkenin özelliği ve veri tipi önem taşır.

•Nitel değişkenler ve nicel değişkenler farklı kurallara göre sınıflandırılırlar.

Nitel Verilerin Sınıflandırılması•Nitel veriler sınıflandırılırken değişkenin kaç kategorisi (sınıf, alt seçenek) varsa belirlenir ve her bir kategoride kaç birim bulunduğu sayılarak belirlenir.

•Nitel verileri el ile sınıflandırırken iki sütunlu bir tablo düzenlenir.

•Bu tabloda birinci sütuna değişkenin kategorileri yazılır. •İkinci sütuna ise veri setindeki her değer ele alınarak bu değerin hangi kategoriye girdiği çeteleme yolu ile ait olduğu sınıfa yazılır.

•Tüm değerler tarandıktan sonra çeteleme değerleri sayılır ve her bir kategoride gözlenen birim sayısını gösteren frekanslar belirlenir.

• Örneğin, üniversite uygulama hastanesi doğum kliniğinde 2001 haziran ayında doğum yapan 50 kadının eğitim durumlarına ilişkin verileri aşağıda verilmiştir. Bu kadınları eğitim durumuna göre frekans tablosu halinde gösterelim.

• Dizide (1) Okuryazar, (2) İlkokul mezunu, (3) Orta ve dengi okul mezunu, (4) Lise ve dengi okul mezunu, (5) Meslek Yüksekokulu mezunu, (6) Fakülte mezunu olan kadınları belirtmektedir.

• 50 kadının eğitim durumlarına ilişkin kodlanmış değerler veri seti aşağıdaki gibidir.1, 3, 4, 6, 2, 1, 4, 2, 3, 1, 2, 3, 4, 3, 3, 2, 3, 6, 5, 4, 2, 2, 3, 3, 2 , 1, 1, 5, 2, 5, 3, 6, 5, 1, 6, 5, 4, 3, 2, 3, 3, 2, 4, 5, 2, 6, 3, 4, 5, 2

1, 3, 4, 6, 2, 1, 4, 2, 3, 1, 2, 3, 4, 3, 3, 2, 3, 6, 5, 4, 2, 2, 3, 3, 2 , 1, 1, 5, 2, 5, 3, 6, 5, 1, 6, 5, 4, 3, 2, 3, 3, 2, 4, 5, 2, 6, 3, 4, 5, 2

• Her nitelikte kaç kadın gözlendiği sayılarak ya da dizideki her kod tek tek ele alınarak oluşturulan tablodaki seçeneklerden hangisine girdiği bir çizgi ile belirlenerek sınıflandırma işlemi yapılır.

Eğitim Durumu KodKadın Sayısı Çetelemesi

Kadın Sayısı (frekans)

Okur Yazar 1 IIIII I 6

İlkokul mezunu 2 IIIII IIIII II 12

Orta ve dengi okul mezunu 3 IIIII IIIII III 13

Lise ve dengi okul mezunu 4 IIIII II 7

Meslek yüksek okulu mezunu 5 IIIII II 7

Fakülte mezunu 6 IIIII 5

Toplam - - 50

• Tabloda iki sütun vardır. 1. sütun eğitim durumunun sınıflarını (kategorilerini), 2. sütun ise frekansları gösterir.

• Tablo-1: Üniversite uygulama hastanesinde haziran 2001'de doğum yapan kadınların eğitim durumlarına göre dağılımı

Eğitim Durumu Kod Kadın Sayısı ÇetelemesiKadın Sayısı

(frekans)

Okur Yazar 1 IIIII I 6

İlkokul mezunu 2 IIIII IIIII II 12

Orta ve dengi okul mezunu 3 IIIII IIIII III 13

Lise ve dengi okul mezunu 4 IIIII II 7

Meslek yüksek okulu mezunu 5 IIIII II 7

Fakülte mezunu 6 IIIII 5

Toplam - - 50

• ÖRNEK• Örnek olarak, bir hastanede bir yılda doğum yapmış 100

tane kadından ikamet yeri, eğitim durumu, çocuk sayısı, bebeğin cinsiyeti gibi bilgileri ele alalım.

• Bu bilgilerin sayısal olmayan, ikamet yeri cinsiyet ve eğitim durumu vasıflarına göre dağılımı tablolarda görülmektedir.

• Tablolardan görüleceği gibi ikamet yeri ve cinsiyet vasıflarına ait bilgiler dağınık durumlarından kurtarılıp, iki grupla özetlenmiş oldular.

• Bu düzenlemede, araştırmaya konu olan vasıf sayısal olmayan şıklarına ayrılarak her birinden elde edilen gözlem sonucu bu şıklardan uygun olanın içine yerleştirilir.

Tablo-2 : Annelerin ikamet yerlerine göre çocuk sayısının dağılımı Çocuk Sayısı İkamet Yeri Anne Sayısı 1 2 3 ≤

_______________________________________________________________

İl Merkezi 30 8 12 10

İlçe Merkezleri 20 5 5 10

Köyler 50 20 15 15

________________________________________________________________

TOPLAM 100 33 32 35

________________________________________________________________

Tablo-3 : Bebeklerin cinsiyete göre dağılımı

Son Bebeğin Cinsiyeti Bebek Sayısı ___________________________________________________

Erkek 52

Kız 48

___________________________________________________

TOPLAM 100

___________________________________________________

Tablo-4 : Kadınların eğitim seviyesine göre dağılımları

Eğitim Durumu Kadın Sayısı

___________________________________________________

Okur-yazar değil 20

Okur-yazar 25

İlköğretimi bitirmiş 20

Lise bitirmiş 25

Yüksek okul bitirmiş 10

___________________________________________________

TOPLAM 100

___________________________________________________

Nicel Verilerin Sınıflandırılması•Birimlerin nicel (quantitatif, sayısal) özellikleri ölçülebilir tartılabilir niteliktedir.

•Bu tip değişkenlerin verilerine nicel veriler (data with scale measure) adı verilir.

•Nicel veriler Aralıklı (Interval Scale) ya da Oransal (Ratio Scale) ölçümleme teknikleri ile elde edilirler.

•Nicel verileri değerlerine göre Kesikli veriler ve Sürekli veriler adı altında iki farklı grupta ele alarak sınıflandırmak gerekir.

a) Kesikli Veriler: Belirlenen gözlenme aralığında sadece tam sayıların yer aldığı veri setleridir. Sayımla elde edilmiş ve tam sayıya yuvarlatılmış veriler kesikli veri olarak alınırlar.

b) Sürekli veriler: •Dağılım aralığında her değeri alabilen ölçü birimi ve titizliği arttıkça daha alt düzeyde değeri saptanabilen ve kesirli değerler içeren veri setleridir. •Ölçüm ve tartımla elde edilmiş veriler, sayısal değerleri tam sayılarla gösterilmiş olsalar da sürekli değişim gösterdikleri kabul edilen değişkenlere ilişkin veriler sürekli veriler olarak ele alınırlar.

• Verilerin kesikli ya da sürekli olmaları frekans tablosu hazırlamayı ve istatistiklerin hesaplanmalarını etkiler.

• Nicel veriler sınıflandırılırken uyulması gereken genel prensipler kısaca aşağıdaki gibi özetlenebilir.

i- Sınıflandırmada tablodaki tercih edilen sınıf sayısı 10 ile 20 arasında olmalıdır. Sınıflandırmada özel hallerde bile tablonun bir sayfayı aşmasını önleyecek biçimde sınıf sayısı seçilmesi tercih edilmelidir.

ii- Sınıflandırmada sınıf aralıkları eşit alınmalıdır.

iii- Sınıf aralıklarının 0.25, 0.5, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50, 75, 100 ... gibi katları kolay alınabilir, tamsayı olan devirli sayılardan seçilmesi tercih edilmelidir.

iv- İlk sınıf başlangıç değeri (SBD) Xmin değerini ve son sınıf üstsınır değeri (SÜD) Xmax değerini kapsayacak biçimde sınıfların SBD ve SÜD'leri belirlenmelidir.

v- Ulusal ve Uluslararası bilimsel sonuçların karşılaştırılmasını kolaylaştırmak amacı ile değişkenin sınıflandırma biçimi için özel bir sınıflama biçimi, bir standart varsa bu özel biçime ya da standartlara uygun sınıf değerleri seçilmesi tercih edilmelidir.

– Örneğin, Hastalık risklerine göre yaş grupları Dünya Sağlık Örgütü (DSÖ, WHO) ya da bilim çevreleri tarafından yıl olarak 0, 1-4, 5-9, 10-14, 15-24, 25-34, 35- 44, 45-54, 55-74, 75+ yaş/yıl biçiminde yaş gruplaması önerilmiş ise hastalık risk faktörleri çalışmalarında bu sınıflamaya uyulmalıdır.

Sayısal Şıkların Gruplandırılması •100 tane anne biriminden yaş vasfı için alınan bilgiler tabloda verilmiştir.•Tabloda annelerin yaşları, onların sıra numaralarına göre dizilmiştir.

• Bu şekilde bilgilerin sıra ile verilişine liste adı verilir. • Tablodaki bilgiler oldukça dağınıktır. • Bir anlam çıkarılması da mümkün görülmemektedir. • Bunların arasında en büyük yaşlı ya da en küçük yaşlı anneyi bulmak için

hepsini tek tek gözden geçirmek gerekir. • En küçük ya da en büyük yaşlı anne yerine herhangi bir yaştaki ya da yaşlar

arasındaki anneleri de bilmek isteyebiliriz.

• Bilgileri kolaylıkla elde edebilmek için bu bilgileri küçükten büyüğe doğru yeniden sıralamamız gerekir.

• Böylece en küçük ve en büyük yaşları ve bu yaşlarda kaçar annenin bulunduğunu önceki listeden daha kolay bir şekilde bulabiliriz.

• Yaşların küçükten büyüğe doğru sıraya konulmuş şekli Tablo 3.3'de verilmiştir.

• Küçükten büyüğe düzenlemede en küçük yaşın 14 olduğu ve bu yaşta bir annenin bulunduğu kolaylıkla görülebilir. Benzer şekilde başka bir yaşta da kaç annenin yer aldığı kolayca bulunabilir.

_________________________________________________________ 14 20 24 27 29 31 32 35 37 40 15 20 25 27 29 31 33 35 37 40 16 21 25 27 29 31 33 35 37 40 17 22 25 27 30 31 33 35 38 40 18 22 25 28 30 31 33 35 38 41 18 22 25 28 30 31 33 36 38 42 19 23 26 29 30 32 34 36 39 42 19 23 26 29 30 32 34 36 39 43 20 23 26 29 30 32 34 36 39 44 20 24 27 29 30 32 35 37 39 45 _________________________________________________________

Tablo 3.3: 100 Annenin Yaşlarının Küçükten Büyüğe Doğru Sıralanışı

• Örneğin, 35 yaşında kaç annenin bulunduğunu, tabloda sıra ile yer alan 35'leri sayarak hemen söylenebilir.

• Bu şekilde yapılan düzenlemeye sıralı tablo adı verilir. Sıralı tabloda tekrar eden sayılar tekrar sayısı kadar yazıldığı için tablo fazla yer kaplamaktadır.

_________________________________________________________ 14 20 24 27 29 31 32 35 37 40 15 20 25 27 29 31 33 35 37 40 16 21 25 27 29 31 33 35 37 40 17 22 25 27 30 31 33 35 38 40 18 22 25 28 30 31 33 35 38 41 18 22 25 28 30 31 33 36 38 42 19 23 26 29 30 32 34 36 39 42 19 23 26 29 30 32 34 36 39 43 20 23 26 29 30 32 34 36 39 44 20 24 27 29 30 32 35 37 39 45 _________________________________________________________

Tablo 3.3: 100 Annenin Yaşlarının Küçükten Büyüğe Doğru Sıralanışı

• Sıralı Tabloda 35 sayısı fazla olsaydı, bu yaştakilerin sayısını bulmak biraz zaman alacaktır.

• Bu durumdan kurtulmak için yaşlar bir sütuna ve yaşların tekrar eden sayıları da hizalarına ve başka bir sütuna yazılabilir.

• Böylece tekrar eden sayıları yazmaktan kurtulunulduğu gibi, tablo da küçülmüş olur.

• Her yaş için tekrar eden sayı o yaşın frekansını oluşturur. • Bu şekilde ortaya çıkan yeni tabloya da frekans tablosu adı verilir. Bu yeni

düzenleme Tablo 3.4’de görülmektedir.

_______________________________________ Yaş f Yaş f Yaş f ________________________________________ 14 1 25 5 36 4 15 1 26 3 37 4 16 1 27 5 38 3 17 1 28 2 39 4 18 2 29 7 40 4 19 2 30 7 41 1 20 4 31 6 42 2 21 1 32 5 43 1 22 3 33 5 44 1 23 3 34 3 45 1 24 2 35 6 _________________________________________ Toplam 100 __________________________________________

Tablo 3.4: 100 Annenin Yaşlarının Frekans Dağılımı

• Birim sayısı ve o birimlere ait bir vasfın şık sayısı arttıkça frekans dağılım tablosu da daha uzun olacaktır. Bu gibi durumlarda tabloyu küçültmenin yolu, verileri frekans tablosu haline getirmektir.

_______________________________________ Yaş f Yaş f Yaş f ________________________________________ 14 1 25 5 36 4 15 1 26 3 37 4 16 1 27 5 38 3 17 1 28 2 39 4 18 2 29 7 40 4 19 2 30 7 41 1 20 4 31 6 42 2 21 1 32 5 43 1 22 3 33 5 44 1 23 3 34 3 45 1 24 2 35 6 _________________________________________ Toplam 100 __________________________________________

Tablo 3.4: 100 Annenin Yaşlarının Frekans Dağılımı

Sınıflandırılmış Frekans Tablosu Düzenleme

• Gözlem sonuçlarından elde edilen sayısal değerlerin dağılım aralığı içinde küçükten büyüğe doğru oluşturulmuş sınıflara dağıtılarak her sınıfa düşen birim sayısının saptanmasına sınıflandırılmış frekans tablosu denir.

• Her sınıfın içinde yer alan birim sayısına o sınıfın frekansı ve frekansların sınıflara göre dağılımına da frekans tablosunun frekans dağılımı denir.

• Sınıflandırılmış frekans tablosu hazırlanırken şu sıra izlenir;

1. Dağılım aralığının belirlenmesi: Değişkenlerin değişim gösterdiği aralığa değişim aralığı denir.

• Bir örnek içinde bulunan n tane değişkenin değerleri küçükten büyüğe doğru x1, x2, x3,....xn olsun.

• x1 en küçük değişken değeri ve xn de en büyük değişken değeridir.

• x1 den başlayıp xn'e kadar uzanan aralık, örnekteki değişkenlerin değişim aralığıdır. Değişim aralığının genişliği R ile gösterilir.

• Yukarıda verilen örneğimizde, 100 tane yaş için en küçük değer 14 ve en büyük değer de 45'dir.

• Değişim aralığı 14 ile 45 yaş arası olup, genişliği R=45-14=31 olur.

2. Sınıf aralığının saptanması:

•Değişkenlerin R genişliğindeki dağılım aralığının uygun görülen grup sayısı k'ya bölünmesiyle elde edilen aralık genişliği, bir grubun aralığı ya da sınıf aralığı olur.

•Sınıf aralığı, sınıfın başlangıç değeri ile bitiş değeri arasındaki farka eşittir. C ile gösterilen sınıf aralığı dağılım aralığının sınıf sayısına bölünmesiyle elde edilir.

•Sınıf sayısı değiştikçe C de değişir. Bu nedenle C'yi saptayabilmek için önce sınıf sayısına karar vermek gerekir.

•Sınıf sayısı için kesin bir hüküm olmamakla birlikte, 10 ile 20 arasında tutulması uygun görülmektedir.

•Sınıf sayısı 20'den fazla olduğu zaman frekans tablosunun kavranması güçleşir ve işlemler uzar.

•10'nun altında sınıf sayısı olduğu zaman da sınıf aralığının büyümesinden dolayı yapılacak hesaplamalarda hata payı artar. Ayrıca dağılıma ait bazı özellikler de açığa çıkamazlar.

• Frekans tablosundan iyi bir sonuç alabilmek için veri sayısının 50'nin üzerinde olması gerekir.

• Sınıf aralığı sınıf sayısı ile değiştiğinden, uygun sınıf sayısı 10 ile 20 arasında değişirken (10≤k≤20) sınıf aralığının değeri de R/10≥C≥R/20 olarak değişir.

• R/10, 10 sınıfı bir frekans tablosunda sınıf aralığını verirken, R/20 de 20 sınıflı bir frekans tablosundaki sınıf aralığını vermektedir. Bu iki değer arasından uygun bir değer sınıf aralığı olarak seçildiğinde oluşacak sınıf sayısı 10 ile 20 arasında olacaktır. – Örneğin, yaş örneğimizdeki değerleri 10 sınıflı bir frekans tablosu

yapmak istersek, sınıf aralığı C=31/10=3.1 ve 20 sınıflı bir frekans tablosu yapmak istediğimizde ise C=31/20=1.55 olmaktadır. Bu duruma göre en uygun sınıf aralığı 1.55≤C≤3.1 olacaktır.

• Eğer biz, frekans tablosunda k sayıda sınıf bulunmasını istiyorsak o zaman sınıf aralığı R/k olur.

• Bu bölümden elde edilen sonuç her zaman bir tam sayı çıkmayabilir. O zaman, o sayıya en yakın olan tam sayı sınıf aralığı olarak seçilebilir. – Örneğin, Tablo 3.3 'de verilen 100 tane annenin

yaşı için 15 sınıflı bir frekans tablosu yapmak istersek sınıf aralığı C=31/15≅2 olur.

• 3. Sınıfların oluşturulması:

• Sınıflamaya başlarken başlangıç sayısı olarak en küçük değişken değeri ya da ondan daha küçük bir değer alınır.

• • Başlangıç sayısı olarak seçilen sayının, sınıf aralığı C'nin

katı olması bazı kolaylıklar sağlar.

• Sınıflamada başlangıç ve bitiş değerleri, en küçük değer ilk sınıfın içinde ve en büyük değer de son sınıfın içinde olacak şekilde seçilmelidir.

• Örnek 3.1: 100 tane annenin yaşlarının sınıflandırılmış frekans tablosu haline getirilmesi

• Yaşların dağılım aralığı (R)=45-14=31

• 20 sınıflı bir frekans tablosu yapılmak istense, sınıf aralığı C=31/20=1.55

• 10 sınıflı bir frekans tablosu yapılmak istense, sınıf aralığı C=31/10=3.1 olacaktır.

• Uygun bir frekans tablosu için 1.55≤C≤3.1 olmalıdır.

• Buna göre 1.55 ve 3.1 arasında herhangi bir değer sınıf aralığı olarak seçilirse sınıf sayısı 10 ile 20 arasında olur.

• Sınıf aralığı olarak 2'nin alınması diğerlerine göre daha uygundur.

• Başlangıç değeri olarak, en küçük değeri içinde bulundurması gerektiği için 14 ya da 15 alınmak durumundadır.

• C=2 alındığından 2'nin katı olması nedeniyle başlangıç değerinin 14 olarak seçilmesi uygun olur.

_______________________________________ Yaş f Yaş f Yaş f ________________________________________ 14 1 25 5 36 4 15 1 26 3 37 4 16 1 27 5 38 3 17 1 28 2 39 4 18 2 29 7 40 4 19 2 30 7 41 1 20 4 31 6 42 2 21 1 32 5 43 1 22 3 33 5 44 1 23 3 34 3 45 1 24 2 35 6 _________________________________________ Toplam 100 __________________________________________

4. Verilerin Sınıflara Dağılımı: •Yaş değerleri kesikli değişken olarak alınarak, Tabloda her sınıfın başlangıç ve bitiş değerleri belirtilmiştir.

•İlk sınıf 14'de başlayıp 15'de bitmekte ve 2.sınıf da 16'da başlayıp 17'de bitmektedir.

•14 ve 15 yaşında olanlar ilk sınıfta, 16 ve 17 yaşında olanlar da 2. sınıfta yer alacaklardır. •Aynı şekilde, verilerin her biri tek tek ele alınarak hangi sınıfın sınırları içine düşüyorsa o sınıfa yerleştirilirler. •Sonuçta, her sınıfta toplanacak veri sayısı o sınıfın frekansını oluşturur.

______________________________________________________________ Yaş (yıl) Frekans ______ ____________ 14-15 2 16-17 2 18-19 4 20-21 5 22-23 6 24-25 7 26-27 8 28-29 9 30-31 13 32-33 10 34-35 9 36-37 8 38-39 7 40-41 5 42-43 3 44-45 2 ____________________________________________________________ TOPLAM 100

Tablo 3.5: 100 Anneye Ait Yaşların Sınıflandırılmış Frekans Tablosu

• Sınıf Değeri : Bir sınıfın sınıf değeri, o sınıfın alt sınırı ile üst sınırının orta noktası ya da bu iki sınır değerinin ortalamasıdır.

Sınıf Değeri = ( Sınıfın üst sınırı + Sınıfın alt sınırı ) / 2

• 14-15 sınıfının alt sınır değeri 14 ve üst sınır değeri 15'dir.Sınıf Değeri = ( 14 + 15 ) /2 = 29 /2 =14.5

• Bir sınıfın sınıf değeri o sınıfın değişken değeri olarak işleme girer. Başka bir deyişle, sınıfın içinde bulunan bütün ölçümlerin hepsinin aynı ve aralığın ortasına rastlayan sınıf değerine eşit oldukları kabul edilir.

• Bu değer, aritmetik ortalama ve standart sapma gibi istatistik değerlerinin elle hesaplandıkları durumlarda ve frekans poligonu grafiğinin çiziminde gereklidir.

Tablo 3.5: 100 Anneye Ait Yaşların Frekans Tablosu ______________________________________________________________ Yaş (yıl) Frekans Sınıf Değeri (Anne Sayısı) ______ ____________ ___________ 14-15 2 14.5 16-17 2 16.5 18-19 4 18.5 20-21 5 20.5 22-23 6 22.5 24-25 7 24.5 26-27 8 26.5 28-29 9 28.5 30-31 13 30.5 32-33 10 32.5 34-35 9 34.5 36-37 8 36.5 38-39 7 38.5 40-41 5 40.5 42-43 3 42.5 44-45 2 44.5 ____________________________________________________________ TOPLAM 100

• Görüldüğü gibi Tablo 3.5 'deki veriler kesiklidir. • Yaşların yıldan arta kalan kısımları

değerlendirilmeyip tam sayılarla belirtilirtilerek yaş ölçüleri kesikli duruma getirilmiştir.

• Eğer yaşlar, yalnızca yıl olarak düşünülmeyip bunun daha küçük parçaları olan ay, hafta, gün ve saat de hesaba katılarak değerlendirilseydi o zaman veriler bir süreklilik gösterirlerdi.

• Aynı tablodaki veriler sürekli olsalardı, ilk sınıfın bitiş noktası 15 olmayıp 15.9999... olurdu. Bu duruma göre kuramsal olarak 16 yıldan, düşünülebilen en küçük bir zaman parçası kadar küçük olanlar 14-15 sınıfında yer alacak ve tam 16 yaşında olanlar ise 16-17 sınıfında yer alacaklardır. Matematiksel olarak yaşı x ile gösterirsek,

14 ≤x < 16 ilk sınıfta yer alanlar

16 ≤x < 18 ise ikinci sınıfta yer alanlar olacaktır.

______________________________________________________________ Yaş (yıl) Frekans Sınıf Değeri (Anne Sayısı) ______ ____________ ___________ 14-15 2 14.5 16-17 2 16.5 18-19 4 18.5 20-21 5 20.5 22-23 6 22.5 24-25 7 24.5 26-27 8 26.5 28-29 9 28.5 30-31 13 30.5 32-33 10 32.5 34-35 9 34.5 36-37 8 36.5 38-39 7 38.5 40-41 5 40.5 42-43 3 42.5 44-45 2 44.5 ____________________________________________________________ TOPLAM 100

• Örnek: Deney hayvanlarına yönelik yapılan bir çalışmada ağırlıklar (gram) kesikli değişken ve sürekli değişken olarak sınıflandırıldığında aşağıdaki gibi sınıflandırmalar yapılır.

Tablo 7.4- Ağırlık kesikli alındığında sınıfların alt sınıf, üst sınıf ve sınıf değerleriAlt sınıf değeri Üst sınıf değeri Sınıf değeri

120 122 121123 125 124126 128 127129 131 130132 134 133135

137 136138 140 139141 143 142144 146 145

Tablo 7.5: Ağırlık sürekli alındığında sınıfların alt sınıf, üst sınıf ve sınıf değerleriAlt sınıf değeri Üst sınıf değeri Sınıf değeri

120 122.99 121.5

123 125.99 124.5

126 128.99 127.5

129 131.99 130.5

132 134.99 133.5

135 137.99 136.5

138 140.99 139.5

141 143.99 142.5

144 146.99 145.5

• Örnek: Deney hayvanlarına yönelik yapılan bir çalışmada ağırlıklar (gram) kesikli değişken ve sürekli değişken olarak sınıflandırıldığında aşağıdaki gibi sınıflandırmalar yapılır.

• Eklemeli Frekans• Bir sınıfın eklemeli frekansı, o sınıfın ve ondan

önce gelen sınıfların frekanslarının toplamıdır. • Frekans tablosunda ilk sınıfın eklemeli frekansı

o sınıfın kendi frekansına ve son sınıfın eklemeli frekansı da toplam frekansa eşittir.

• Eklemeli frekanslar küçükten büyüğe (den az) ya da büyükten küçüğe (den çok) şeklinde oluşturulurlar.

• Tablo 3.5 de "den az" ve "den çok" frekansları eklemeli frekanslar sütunlarında görülmektedir.

• Eklemeli frekanslar, belirli bir değerin altında ya da üstünde bulunan değişken sayısının bilinmesinin gerekli olduğu durumlarda yararlıdır.

• Ortanca değer, kuartil, desil ve yüzdelik değerlerinin elle hesaplanmasında eklemeli frekanstan yararlanılır.

Tablo 3.5: 100 Anneye Ait Yaşların Frekans Tablosu ______________________________________________________________ Yaş (yıl) Frekans Sınıf Değeri Eklemeli Frekanslar (Anne Sayısı) (den az) (den çok) ______ ____________ ___________ _______ _______ 14-15 2 14.5 2 100 16-17 2 16.5 4 98 18-19 4 18.5 8 96 20-21 5 20.5 13 92 22-23 6 22.5 19 87 24-25 7 24.5 26 81 26-27 8 26.5 34 74 28-29 9 28.5 43 66 30-31 13 30.5 56 57 32-33 10 32.5 66 44 34-35 9 34.5 75 34 36-37 8 36.5 83 25 38-39 7 38.5 90 17 40-41 5 40.5 95 10 42-43 3 42.5 98 5 44-45 2 44.5 100 2 ____________________________________________________________ TOPLAM 100

______________________________________________________________ Yaş (yıl) Frekans Sınıf Değeri Eklemeli Frekanslar (Anne Sayısı) (den az) (den çok) ______ ____________ ___________ _______ _______ 14-15 2 14.5 2 100 16-17 2 16.5 4 98 18-19 4 18.5 8 96 20-21 5 20.5 13 92 22-23 6 22.5 19 87 24-25 7 24.5 26 81 26-27 8 26.5 34 74 28-29 9 28.5 43 66 30-31 13 30.5 56 57 32-33 10 32.5 66 44 34-35 9 34.5 75 34 36-37 8 36.5 83 25 38-39 7 38.5 90 17 40-41 5 40.5 95 10 42-43 3 42.5 98 5 44-45 2 44.5 100 2 ____________________________________________________________ TOPLAM 100

Frekans Dağılım Eğrisi•Bir frekans tablosunda yer alan bilgilerden, ölçüm değerlerini x ekseninde ve bunlara karşı gelen frekans değerlerini de y ekseninde kartezyen koordinatlarına göre yerleştirip birbiriyle birleştirildiklerinde ortaya çıkan eğri frekans dağılım eğrisi olur.

Tablo3.2’ye ait frekans dağılım eğrisi

Tablo3.2’ye ait serpme grafiği

0

1

2

3

4

5

6

7

8

14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

Yaş

Frekans

0

1

2

3

4

5

6

7

8

0 5 10 15 20 25 30 35 40 45 50

Yaş

Frekans

• Frekans dağılım eğrileri, tepe sayılarına ve aldıkları biçimlere göre değişik şekillerde olabilir.

• Biyolojik bilimlerde, genellikle frekans dağılım eğrileri bir tepeli, çan şeklinde, simetrik bir durum gösterirler.

• Biyoistatistik çalışmalarında da üzerinde durulan eğri tipi budur. Bu tip eğriler normal dağılım eğrisi olarak adlandırılır. Normal dağılımlarda aritmetik ortalama, ortanca değer ve tepe değeri birbirine eşittir.

Tablo3.2’ye ait frekans dağılım eğrisi

0

1

2

3

4

5

6

7

8

14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

Yaş

Frekans

• Çarpık Eğriler• Eğriler her zaman normallik özelliği göstermezler.

• Simetri bozularak çarpık hale dönüşebilirler. Çarpıklık iki şekilde olur. Kabaca çarpıklık ölçüsü,

Ç = ( Aritmetik ortalama - Tepe değeri ) / standart sapma

• Çarpıklık katsayısı pozitif olursa, çarpıklık sağa tarafa doğrudur. – Çarpıklık yönden dolayı, sağa çarpık ya da pozitif çarpıklık adını alır.

• Çarpıklık katsayısı negatif olursa, çarpıklık sol tarafa doğrudur. – Çarpıklık yönünden dolayı, sola çarpık ya da negatif çarpıklık adı verilir.,

• Hafif derecede çarpık eğrilerdeA.O. - T.D. = 3 ( A.O. - Ortanca değer)

• ilişkisi mevcuttur.

• Bu ilişki çarpıklık katsayısında yerine konulursa,Ç = 3.(A.O. - O.D.)/S

şeklini alır.

• İki ayrı şekilde belirtilen bu çarpıklık katsayıları sırasıyla Pearson'ın birinci ve ikinci çarpıklık katsayıları olarak adlandırılır.

• x değişken değerini, n değişken sayısını, s standart sapmayı ve de aritmetik ortalamayı göstermek üzere çarpıklığın en iyi ölçüsü,

• Dağılım Ç=0 için normal, Ç > 0 için pozitif ve Ç < 0 için negatif çarpıklık gösterir.

• Örnek: 100 tane annenin yaş verilerinin çarpıklık katsayısı,• Ç=-0.191 olarak hesaplanmıştır. Buna göre, yaş verilerinin dağılımı

negatif çarpıklık göstermekte olup çarpıklığın derecesi 0.191’dir.

Sağa Çarpık Eğri

T.D. O.D. A.O.

Sola Çarpık Eğri

A.O. O.D. T.D.

Şekil 3.1: Çarpık Eğriler

Sağa Çarpık Eğri (Pozitif Çarpıklık)

Sola Çarpık Eğri (Negatif Çarpıklık)

• Basık ve Sivri Eğriler• Normal dağılım eğrisinin üstten basılarak basık ve yanlardan

basılarak da sivri duruma gelmesi halidir. • Bu eğrilerde simetri bozulmadan (Ç=0) yalnızca tepe noktasının yeri

aşağı-yukarı oynayabildiği gibi her iki yönde de değişme olabilir.

• Yani, hem çarpıklık hem de basıklık ve sivrilik olabilir. Basıklık ve sivriliğin ölçüsü,

• Normal dağılım için B=0 dır. B>0 için eğri sivri, B<0 için eğri basıktır.

• Örnek: 100 tane annenin yaş verilerinin basıklık katsayısı,B=-0.568’dir. Buna göre, yaş verilerinin dağılımı basık olup, basıklığın

derecesi 0.568’dir.

• Sivri ve basık eğriler Şekil 3.2'de görülmektedir.

Normal Basık Sivri

Şekil 3.2: Sivri ve Basık Eğriler

Normal Dağılıma Göre Sivri ve Basık Eğriler

Normale göre sivri eğri

Normale göre basık eğri

Normal

• Özet Tablolar• Bilgilerin frekans tablosu yapılmasıyla

grafiklerinin çizilmesi ve özetlenmesi bakımından yarar sağlamasına karşın, veriler gerçek değerlerini kaybettiklerinden bilgi kayıplarına ve istatistik değerlerinin hesaplanmasında da hatalara neden olabilmektedir.

• Bunun yerine, sayısal vasıflar için yalnız bilgilerin sayısı, aritmetik ortalaması, standart sapması, standart hatası, en küçük değeri ve en büyük değeri gibi önemli bazı istatistik değerleri verilerek özet tablolarla betimleyici değerler sunulabilir.

• Tablo yaparken uyulması gerekli bazı kurallar vardır. Bu kurallar şöyle sıralanabilir.

a) Her tablonun, içerdiği bilgileri belirten bir adı olmalıdır. Ad genellikle üstte olur.

b) Yazı içinde geçen tablo sayısı birden fazla ise onlara numara verilmelidir.

c) Tabloda bir sembol ya da işaret kullanılmışsa ya da bazı sözcükler kısaltılarak yazılmışsa bunların anlamı tablonun altında belirtilmelidir.

d) Tablo karışık olmamalı, sade ve anlaşılır olmalıdır.

e) Tablo içindeki sütunların neyi temsil ettikleri gösterilmelidir.

• Örnek : Gözlerine lens takılan 15 hastanın kornea ön yüzünün kurvatur yarıçaplarının lens takıldıktan sonra 1. ve 3. günlerdeki değerleri mm cinsinden aşağıda liste olarak verilmiştir.

Örnek 3.2: Gözlerine lens takılan 15 hastanın kornea ön yüzünün kurvatur yarıçaplarının lens takıldıktan sonra 1. ve 3. günlerdeki değerleri mm cinsinden aşağıda liste olarak verilmiştir.

Hasta no 1. Gün 3. Gün Fark(3.Gün-1.Gün) ______________________________________________________

1 8.1 8.2 0.1 2 8.1 8.1 0.0 3 8.1 8.0 -0.1 4 8.5 8.7 0.2 5 8.5 8.6 0.1 6 8.0 8.1 0.1 7 7.7 7.8 0.1 8 7.7 7.6 -0.1 9 7.6 7.6 0.0 10 8.4 8.5 0.1 11 7.7 7.8 0.1 12 8.2 8.3 0.1 13 8.9 8.8 -0.1 14 9.1 9.1 0.0 15 7.2 7.1 -0.1 _____________________________________________________ 8.12 8.15 0.03 S 0.51 0.53 0.10 S.H. 0.13 0.14 0.03

Örnek 3.3: Örnek 3.2'deki tabloyu yalnız verilerin istatistik değerlerini vererek özetleyelim.

Gruplar n S S.H. D.K.(%) Min Max _____________________________________________________________________________

1.Gün 15 8.12 0.51 0.13 6.2 7.2 9.1

3.Gün 15 8.15 0.53 0.14 6.5 7.1 9.1

Fark 15 0.03 0.10 0.03 333 -0.1 0.2 _____________________________________________________________________________

Örnek 3.4: 100 kadına ait bazı vasıfların istatistik değerleri aşağıda hesaplanarak verilmiştir.

Vasıf n S S.H. D.K.(%) Min Max _______________________________________________________________________________

Yaş (Yıl) 100 25 5 0.5 20 16 48

Kan basıncı (mm/Hg) 100 120 20 2 17 90 200

Nabız 100 72 12 1.2 17 65 94

Çocuk sayısı 100 4 2 0.2 50 1 6 _______________________________________________________________________________

Kaynaklar• Prof. Dr. Rian DİŞÇİ, Temel ve Klinik Biyoistatistik, İstanbul Medikal Yayıncılık• Prof. Dr. Yusuf ÇELİK, Nasıl Biyoistatistik Bilimsel Araştırma SPSS (kitap isteme Tel

0412.2488001-4208)

• Prof Dr Kazım ÖZDAMAR, SPSS ile Biyoistatistik, Kaan Kitabevi• Prof Dr İsmet KAN, Biyoistatistik, Nobel Yayınevi

top related