verİlerİn normallİĞİnİn ve homojenlİĞİnİn İncelenmesİ

49
GRUP 7 VERİLERİN NORMALLİĞİ VE HOMOJENLİĞİ REGRESYON VE KORELASYON ANALİZİ

Upload: zaynah

Post on 23-Feb-2016

148 views

Category:

Documents


1 download

DESCRIPTION

VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ. Uygun Analiz Türünün Belirlenmesi. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

GRUP 7 VERİLERİN NORMALLİĞİ VE HOMOJENLİĞİ

REGRESYON VE KORELASYON ANALİZİ

Page 2: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Page 3: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

UYGUN ANALİZ TÜRÜNÜN BELİRLENMESİ Uygun analiz türünün belirlenmesinde ilk kriter

verilerin türüdür. Analiz yöntemleri verilerin özelliklerine göre iki temel gruba ayrılır. Bu gruplarda yer alan temel analiz yöntemleri aşağıdaki gibidir.

1) Parametrik veriler için kullanılan analiz yöntemleri; Varyans Analizi, T-Testi, Pearson Korelasyonu

2) Parametrik olmayan veriler için kullanılan analiz yöntemleri; Ki-Kare Testleri, Spearman Korelasyonu.

Page 4: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Dolayısıyla uygun analiz türünü seçebilmek için öncelikle verilerin özelliklerinin belirlenmesi gerekecektir. Şimdi bunu nasıl yapacağımız görelim. İstatistiksel analiz yapmanın ilk şartı verilerin tesadüfi (yansız)olarak seçilmiş olmasıdır. Veriler ister parametrik ister parametrik olmayan özellikte olsun mutlaka tesadüfi olarak seçilmelidir.

Analiz Türünün Belirlenmesi

Page 5: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Eğer örneklem büyüklüğünüz 30’dan az iseparametrik olmayan yöntemleri kullanmanız gerek. Bu durumda veri setinizin diğer kriterleri karşılayıp

karşılamadığını incelemenize gerek kalmaz.

Eğer veri seti 30’dan büyük ise (parametrik test) her bir faktörü normal dağılıma sahip olup olmadığını ve verilerin homojen dağılıp dağılmadığını incelemeliyiz.

Analiz Türünün Belirlenmesi

Page 6: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Şimdi bu iki şartın sağlanıp sağlanmadığını SPSS’de nasıl ölçeceğimizi Bir örnek üzerinde inceleyelim.

Örnek: Beşiktaş ilçesindeki ilköğretim okullarında görev yapan öğretmenlerin “eleştirel öğrenme”, “çoklu öğrenme”, “yapılandırmacı öğrenme” ve “duygusal zeka” hakkındaki görüşleri cinsiyetlerine göre farklılık göstermekte midir?

Normalliğinin İncelenmesi

Page 7: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

NORMALLİK Verilerin normal dağılıma uygun olup olmadığını ortaya

koymak için çeşitli normallik testlerinden yararlanmak mümkündür. Bu testler arasında en bilinenleri Ki-Kare , Kolmogorow Smirnow normallik testleridir.

Verilerin normal dağılıma uygunluğunu biz bu örnekte Tek Örneklem Kolmogorov Smirnov Testi kullanarak belirliyoruz.

ANALYZE » NONPARAMETRIC TESTS » SAMPLE K-S

Normalliğinin İncelenmesi

Page 8: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Karşınıza aşağıdaki iletişim kutusu çıkacaktır. Burada dağılımlarını test edeceğiniz faktörleri aradaki oku kullanarak Test Variable List kutucuğuna gönderin. Daha sonra OK tuşunu tıklayın.

Normalliğinin İncelenmesi

Page 9: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Tablonun Assymp.Sig. (Anlamlılık) satırındaki değerlerin istatistikselanlamlılık hesaplamalarında sınır değeri kabul edilen0,05’den büyük olması incelenen faktörlerin dağılımlarının normalolduğunu göstermektedir. Eğer bu değerler 0,05’den küçükolsa idi parametrik olmayan test yöntemlerini kullanmak durumundakalacaktık.

Normalliğinin İncelenmesi

Page 10: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

HOMOJENLİK Şimdi aynı verilerin homojenliğini

inceleyelim. Bunun için öncelikle aşağıdaki mönüleri kullanınız.

ANALYZE » COMPARE MEANS » ONEWAY ANOVA

Page 11: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Karşınıza aşağıdaki iletişim kutusu çıkacaktır. Burada dağılımlarınıtest edeceğiniz faktörleri aradaki oku kullanarak DependentList kutucuğuna gönderin. Daha sonra bu değişkenleri gruplamadakullanacağınız değişkeni yine aradaki oku kullanarakFactor satırına yerleştirin.

Homojenliğinin İncelenmesi

Page 12: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Daha sonra Options tuşuna basın . Kaşınıza çıkacak aşağıdakiiletişim kutusundan Homogeneity of variance test seçeneğiniişaretleyin. Sırasıyla Continue ve OK tuşlarını tıklayın.

Homojenliğinin İncelenmesi

Page 13: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

KARŞINIZA AŞAĞIDAKİ TEST OF HOMOGENİTY OF VARİANCES TABLOSU GELECEKTİR.BU TABLONUN DA SİG. (ANLAMLILIK) SÜTUNUNDAKİ DEĞERLERİN0,05’DEN BÜYÜK OLMASI İNCELENEN FAKTÖRLERİN DAĞILIMLARININ HOMOJEN OLDUĞUNU GÖSTERMEKTEDİR. DOLAYISIYLA BU SORU İÇİN PARAMETRİK TEST YÖNTEMLERİNİ KULLANABİLİRİZ.

Homojenliğinin İncelenmesi

Page 14: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

KORELASYON

Page 15: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Korelasyon analizi, iki değişken arasındaki doğrusal ilişkiyi veya bir değişkenin iki yada daha çok değişken ile olan ilişkisini test etmek, varsa bu ilişkinin derecesini ölçmek için kullanılan istatistiksel bir yöntemdir.

Page 16: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Korelasyon analizinde amaç; bağımsız değişken (X) değiştiğinde, bağımlı değişkenin (Y) ne yönde değişeceğini görmektir. Korelasyon analizi yapabilmek için, her iki değişkenin de sürekli olmaları ve normal dağılım göstermeleri gereklidir.

Page 17: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Korelasyon analizi sonucunda, doğrusal ilişki olup olmadığı ve varsa bu ilişkinin derecesi korelasyon katsayısı ile hesaplanır. Korelasyon katsayısı “r” ile gösterilir ve -1 ile +1 arasında değerler alır.

Page 18: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 19: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Pozitif bir ilişkinin olması X değişkeninin değerlerinin artması durumunda Y değişkeninin değerlerinin de artması, yada X değişkeninin değerlerinin düşmesi durumunda Y değişkenine ait değerlerin de düşme eğiliminde olduğunu gösterir (Şekil1. a.)

Page 20: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Negatif korelasyon (negatif ilişki) olması değişkenlerin birine ait değerlerin artması durumunda diğer değişkene ait değerlerin düşmesi demektir (Şekil1. b.). Korelasyon katsayısının “0” olması değişkenler arasında doğrusal bir ilişkinin söz konusu olmadığını gösterir (Şekil 1. c.). Korelasyon, neden sonuç ilişkisi anlamına gelmemektedir.

Page 21: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Pearson Korelasyon Katsayısı, iki sürekli değişkenin doğrusal ilişkisinin derecesinin ölçümünde kullanılır. İki değişken arasında anlamlı bir ilişki var mıdır sorusunun cevabı aranır. Korelasyon katsayısı hesaplanmadan önce mutlaka serpilme grafiği yapılarak doğrusal ilişki olup olmadığı kontrol edilmelidir.

PEARSON KORELASYON KATSAYISI

Page 22: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Korelasyon katsayısı -1 ile +1 arasında değerler alır. Eğer; r=-1 ise Tam negatif doğrusal bir ilişki vardır. r=+1 ise, Tam pozitif doğrusal bir ilişki vardır. r=0 ise, iki değişken arasında ilişki yoktur.

Page 23: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Pearson Korelasyon Katsayısının yorumu; r İlişki

0,00-0,25 Çok Zayıf0,26-0,49 Zayıf0,50-0,69 Orta0,70-0,89 Yüksek0,90-1,00 Çok Yüksek

Page 24: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Fen bilgisi laboratuar dersini alan bir grup öğrencinin bilimsel süreç becerisi (BSB) puanları ile ders başarı puanları arasında anlamlı bir ilişki var mıdır? Şeklindeki bir araştırma sorusunun cevabını araştıralım.

ÖRNEK UYGULAMA

Page 25: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 26: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Örneğimize ait veriler SPSS te girildikten sonra verileri özelliklerine bakılır. Verilerin sürekli olduğu görülmektedir. Normal dağılıma bakılır; Veriler normal dağılıma uygunsa Pearson Korelasyon Katsayısı, Normal dağılım göstermiyorsa Sperman Sıra Korelasyonu hesaplanır. Ayrıca doğrusal ilişki olup olmadığını görmek için serpilme diyagramı çizilir.

Page 27: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Saçılma grafiği incelendiğinde değişkenler arasında pozitif bir doğrusal ilişki olduğu görülmektedir. Veriler kontrol edildikten sonra korelasyon analizine geçilir. Analiz için aşağıdaki şekilde gösterilen komutlar takip edilir.

Page 28: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 29: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Yukarıdaki komutlar verildiğinde aşağıdaki pencere açılır.

Page 30: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 31: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Değişkenler aktarıldıktan sonra Correlation Coefficients kısmından Pearson (eğer veriler normal dağılmıyorsa Sperman) işaretlenir. Burada biz karşılaştırma için her ikisini de seçtik. Diğer seçenekler işaretlidir. Aynen kalacaktır. OK işaretlenerek analiz tamamlanır ve çıktılar alınır.

Page 32: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Korelasyon Analizi Çıktılarının Yorumu

Page 33: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Yukarıdaki tablolardan birincisi Pearson Korelasyonuna ikincisi Sperman korelasyonuna aittir. tablolar incelendiğinde, Öğrencilerin bilimsel süreç becerileri ile ders başarıları arasında çok yüksek, pozitif yönlü ve anlamlı bir ilişki olduğu görülmektedir [r(20)=0,992; p<0,01].

Page 34: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Buna göre, bilimsel süreç becerisi yüksek olan öğrencilerin laboratuar başarısı da yüksektir. Aynı şekilde bilimsel süreç becerileri düşük olan öğrencilerin ders başarısı da düşüktür şeklinde ifade edilebilir.

Page 35: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

REGRESYON ANALİZİ

Page 36: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

REGRESYON ANALİZİ Regresyon analizi, aralarında sebep-sonuç

ilişkisi bulunan iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili tahminler ya da kestirimler yapabilmek amacıyla yapılır.

Bu analiz tekniğinde iki (basit regresyon) veya daha fazla değişken (çoklu regresyon) arasındaki ilişkiyi açıklamak için matematiksel bir model kullanılır ve bu model regresyon modeli olarak adlandırılır.

Page 37: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

BASİT DOĞRUSAL REGRESYON Regresyon analizinde bağımlı değişken sayısı her zaman

tektir. Eğer bağımsız değişken de tek ise “Basit Doğrusal

Regresyon” adı verilir.

SPSS uygulamalı regresyon analizini bir örnek ile açıklayalım;

Öğrencilerin fen bilgisi notlarından matematik notlarını tahmin edebilir miyiz?

H0 (boş hipotez): Öğrencilerin matematik ve fen notları arasında doğrusal bir ilişki yoktur.

H1 (araştırma hipotezi): Öğrencilerin matematik ve fen notları arasında doğrusal bir ilişki vardır.

Page 38: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 39: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 40: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

SPSS ÇIKTILARI:

Page 41: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 42: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

 

Page 43: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

ÇIKTI YORUMU Matematik notu bağımlı değişken , Fen

Bilgisi notu ise bağımsız değişkendir.Bağımsız değişken bağımlı değişkendeki değişimin yaklaşık %40 açıklar. Bağımlı değişkenle bağımsız değişken için kurulacak regresyon modeli istatistiksel olarak anlamlıdır (F=130.808 ,p=0.00) . Nitekim Matematik notu ile Fen Bilgisi notu arasında pozitif bir ilişki vardır ve bu ilişki istatistiksel olarak anlamlıdır.

Page 44: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

ÇOKLU DOĞRUSAL REGRESYON Regresyon analizinde bağımlı değişken sayısı her zaman tektir.Eğer bağımsız değişken de tek ise “Basit Doğrusal Regresyon” adı verilir.Öğrencilerin matematik notunu, fen bilgisi ve sosyal bilgiler puanlarından tahmin edebilir miyiz?

Page 45: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 46: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 47: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ
Page 48: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

Tablo 7. Öğrencilerin matematik notlarının fen bilgisi ve sosyal bilgiler notlarına göre tahmini için yapılan çoklu regresyon analizi sonuçları

βt p F p Regresyon katsayısı 14,358 4,96 0,000 Fen bilgisi notu 0,482 8,286 0,000 0,478 90,304

0,000 Sosyal bilgiler notu 0,320 5,512 0,000

Matematik notu bağımlı değişken, fen bilgisi ve sosyal bilgiler notları bağımsız değişkenlerdir

(tahmin değişkenleridir). Fen bilgisi ve sosyal bilgiler notları birlikte matematik notundaki

değişimin %48’ini açıklamaktadırlar (=0,478).

Page 49: VERİLERİN NORMALLİĞİNİN VE HOMOJENLİĞİNİN İNCELENMESİ

(Not: Fen bilgisi ile sosyal bilgiler notlarının bağımsız değişken olarak birlikte alındığı

çoklu regresyon modeli, matematik notundaki değişimi, yalnızca fen bilgisi notunun alındığı basit regresyon modelinden daha iyi açıklamaktadır.)

Bağımlı değişken ve tahmin değişkenleri için kurulacak çoklu regresyon modeli istatistiksel

olarak anlamlıdır (F=90,304, p=0,000).

Fen bilgisi ve sosyal bilgiler notları birlikte matematik notundaki değişimin yaklaşık %48’ini

açıklamaktadır (=0,478). Nitekim, matematik notuyla fen bilgisi notu ve sosyal bilgiler notu arasında pozitif ilişkiler vardır (0,482; 0,320) ve bu ilişkiler istatistiksel olarak anlamlıdır (tfen=8,286, pfen=0,000; tsosyal=5,512, psosyal=0,000)

Çoklu regresyon modeli: Matematik notu=14,358+0,482*Fen bilgisi notu+0,320*Sosyal bilgiler notu