ölçümlerin geçerliliği

9

Upload: dilekservet

Post on 05-Jul-2015

13.826 views

Category:

Education


1 download

TRANSCRIPT

Page 1: öLçümlerin geçerliliği
Page 2: öLçümlerin geçerliliği

Yukarıdaki ve benzer yorumlar tamamen yapılan sınavın geçerli puanlar

verdiğini belirten yorumlardır. Bu soruların doğru yorumlanması için ölçümlerin

geçerliliği ve geçerlik kestirme yöntemlerinin kavranmış olması gerekmektedir.

Eğitimde ölçme ve değerlendirme,okullarda birçok amaca hizmet etmektedir.

Örneğin ; öğrencilerin belli bir programı seçimi ve bu programda kur veya

düzeyin belirlenmesinde, öğrencilerin öğrenme-öğretme süreci içerisindeki

eksiklik ve yetersizliklerin belirlenmesinde ,kurs bitiminde öğrencilerin öğrenme

düzeylerinin belirlenmesinde yine ölçme ve değerlendirmeden

faydalanılmaktadır. Amacımız bir işle ilgili hızı,performansı ölçmek veya

kişilik,ilgi,tutum,yetenek,başarı gibi faktörleri ölçmek olabilir. Anlaşılacağı üzere

eğitimde ölçülmek istenen özellikler genelde;başarı,ilgi,tutum gibi bazı soyut

niteliklerdir. Bu değişkenleri ölçerken elde edilecek ölçümlere,ölçülmesi

amaçlanmayan değişkenlerin karışması söz konusudur ki bu ölçme açısından hiç

istenmeyen bir durumdur

Sorulan sorular tam anlamıyla bu dersle ilgili bilgi ve becerileri ölçer niteliktedir.Ders içeriğini bilmeyen bu derste başarılı olamaz.Sınav tam olarak derste ne öğretildiyse ,onları ölçer niteliktedir.

Page 3: öLçümlerin geçerliliği

Ölçme geçerliliğini düşüren etkenler Bir ölçme aracından elde edilen puanlara,arcın ölçmek istediği niteliklerin dışındaki

niteliklerin karışması(dili kullanma,puanlamada yanlılık gibi). Ölçülecek bir değişkeni eksik bir şekilde ölçen bir ölçme araç veya yöntem

Tesadüfi ölçme hatalarının çok olduğu anlamına gelen düşük güvenirlik(kopya,puanlama hatası gibi) katsayısı da geçerlilik katsayısının düşük olmasına sebep olur.Geçerlik Bulma Yöntemleri

1) Kapsam geçerliliği(Content Validation)2) Ölçüt geçerliliği(Criterion-related validation)3) Yapı geçerliliği-Teorik yapıyı destekleme (Construct Validation)4) Görünüş geçerliliği (Face Validity)

1)Kapsam GeçerliliğiBir ölçme aracının kapsam geçerliliği;testi oluşturan maddelerin ölçülen davranışlar

evrenini temsil etme düzeyi hakkında bir karara varmadır. Başka bir ifade ile kapsam geçerliliği;bir ölçme aracının hem konu ve davranış boyutuna bakılarak hem de test maddelerinin ölçülmek istenen davranışları ölçmede uygun olup olmadığına bakılarak varılan bir geçerlilik yargısıdır.

Page 4: öLçümlerin geçerliliği

Kapsam geçerliliği aşamalarında,genelde gözden kaçırılan son aşamanın bir kez daha vurgulanmasında fayda vardır. Bir testin kapsam geçerliliği hakkında karar verirken, testte sorulan soruların ilgi davranışları ölçmede uygun olup olmadığının da tespit edilmesi gerekmektedir.

Bir sorunun ilgi davranışı ölçmek için,uygun bir şekilde nasıl yazılacağı bu kitabın “sınav türleri” ünitesinde detaylı olarak anlatılmıştır.

Kapsam geçerliliği aşamaları1)Ölçülecek değişkenle ilgili davranışlar evreninin belirlenmesi.2)Testi oluşturacak davranışlarının (örneklemin) belirlenmesi.3)Testi oluşturan davranışlar örnekleminin, evreni temsil düzeyinin tespit edilmesi.4)Testteki soruların ilgili olduğu davranışı ölçmeye uygun olup olmadığının kontrol edilmesi.

Page 5: öLçümlerin geçerliliği

Bir test maddesinin geçerliği hakkında yargıda bulunmanın bir yolu da; öğrencinin bu maddeden aldıkları puanlarla, testin tümünden aldıkları puanlar arasında ne düzeyde bir benzerlik olduğunun bulunmasıdır(madde ayırıcılık gücü). Bu benzerliğin veya ilişkinin ölçüsü istatistiksel olarak çift serili korelasyonla tespit edilebilir. Geçerlilik katsayısı bir korelasyon katsayısı olduğu için teorik olarak “-1” ile “+1” arasında değer alabilir.Eğer bir madde için hesaplanan madde test korelasyonu veya madde test korelasyonu 0.20 den az ise bu madde; testin tümünün ölçtüğü boyutu ölçmede geçersiz bir madde olarak yorumlanabilir. Çift serili korelasyon katsayısı 0.20 den düşük maddelerin teste alınmaması güvenilir ve geçerli bir test elde etmek için önerilir

Bloom, Hasting ve Madaus(1971) davranışların sınıflandırılmasına yönelik kapsamlı bir çalışmalar yapmışlardır. Kapsam geçerliliğinin tespit edilmesinde; testi oluşturan davranışların, davranışlar evrenini temsil etme düzeyinin belirlenmesinde bir belirtke tablosunun hazırlanmasını önermişlerdir.

Page 6: öLçümlerin geçerliliği

2) Ölçüt GeçerliliğiGeçerliği çalışan bir ölçme aracıyla,geçerliği olduğu kabul edilen bir

öğrenme aracının aynı denklere uygulanması sonucu elde edilen ölçümler arası korelasyondur. Genel de iki tür ölçüt geçerlik katsayısı tanımlanmaktadır.

a) Uyum geçerliliğib) Yordama geçerliliğiölçüt geçerliliğinin hangi anlamda tanımlandığı, kriter yada ölçülen

değişkene ait ölçümlerin elde edilme zamanları arasındaki farka bağlıdır.Uyum geçerliliği,bir kişinin kriter değişkendeki performansının, o anda

ölçmeye konu olan değişkendeki performansını nasıl tahmin ettiğiyle ilgilidir.Yordama geçerliğinde ise geçerliği çalışkan bir testle daha sonra elde

edilecek olan kriter testi puanlarının benzer puanlar verme durumuna göre yordayıcı testin geçerliliği hakkında karar verilir.Yordayıcı testin amacı, gelecekte belli olacak bir değişkene yönelik olarak tahminde bulunmaktadır.

1) Geçerliliği önceden kanıtlanmış bir ölçme aracının uygulanması.2) Geçerliği çalışkan (yordayıcı) bir testin uygulanması.3) İki uygulamadan elde edilen ölçümler arasındaki korelasyon

katsayısının hesaplanması.

Page 7: öLçümlerin geçerliliği

3) Yapı Geçerliği- Teorik Yapıyı DesteklemeBir ölçme aracının teorik olarak ölçmek istediği yapıyı ölçmeye uygun olup

olmadığına dair kanıt toplama çabasındadır. Anlaşılacağı üzere yapı geçerliliği çalışması genel olarak hem teorik oluşturmada hem de teori test etmede kullanılabilir. Bu teorik yapı ile kast edilen ; Yaratıcılık, kişilik, zeka gibi bireylerin doğasında var olan özelliklerdir. Bu teorik yapılar soyut değişken niteliğinde olduklarından ölçmeleri zordur.Çünkü dolaylı bir şekilde gözlenmeleri gerekmektedir.

Günümüzde ,istatiksel olarak bir ölçme aracının yapı geçerliğini çalışmada; açıklayıcı faktör analizi, doğrulayıcı faktör analizi,yapısal eşitleme modeli gibi teknikler kullanılmaktadır.

Geçerliliği Etkileyen FaktörlerGeçerliliği düşüren bazı etkenler aşağıda kısaca sunulmuştur.

Güvenirlik; Bir testin güvenirliği , o testin geçerliliğini etkileyen faktörlerdendir. Güvenirlik geçerlilik için gerekli ama yeterli bir şart değildir. Güvenirliğin düşük veya tam olmasının geçerliği nasıl düşüreceği aşağıdaki eşitlikte Lord & Novicktarafından formüle edilmiştir.

p(Tх,Ty)= Pxy/ √PxxPyy

Page 8: öLçümlerin geçerliliği

Sistematik YanlılıkÖlçümlerimizi ait geçerliliğin düşük olmasını etkileyen etkenlerden

biride, ölçme sisteminden kaynaklanan hataların olmasıdır. Bu hatalardan bazıları şunlardır.

a) Ölçme YöntemiKullanılan ölçme yöntemi bireyin alacağı puanı etkileyebilir. Yazılı

yoklama, çoktan seçmeli test, doğru-yanlış testi veya sözlü yoklama gibi ölçme yöntemlerinden birinin seçimi ve uygulanış biçimi öğrencinin alacağı puandaki hata miktarını değiştirebilir.

b) Soru SeçimiSınavda yoklanacak davranışları ölçmek için test maddelerini yazmak ve yazılan

maddeler arasından bazılarını seçmek söz konusudur. Sorulan kapsam geçerliliğine uygun olarak seçilmemesi durumu ölçümlerin geçerliği ve güvenirliği düşer. Seçilen test maddelerinin nitelikleri hem test puanlarının güvenirliğini hem de kapsam geçerliğini önemli ölçüde etkilemektedir.

c) İstenmedik Değişkenlerin Ölçümlere KarışmasıÖlçme aracının ölçmeyi amaçlamadığı değişkenlerinde ölçümleri etkilemesi de

geçerliliği düşürür.( tarih dersinde kompozisyon sınavında yazı güzelliğine puan verilmesi)

d) Test Yanlılığı Öğrencilerin aynı düzeyde olmalarına rağmen , testteki performansları veya test

başarılarının farklı olması durumunda testin yanlı sonuçlar verdiği yorumlanır.

Page 9: öLçümlerin geçerliliği

e) NormlarNormlara dayalı bir ölçme ve değerlendirme yapılacaksa, norm oluşturan

grubun evreni yeterli düzey de temsil etmemesi geçerliliği düşürür.

ÜNİTE SORULARI 1) “ bir başarı testinden elde edilen ölçümlerin geçerliliği yüksektir” demekle kast

edilen nedir? Açılayınız örnek vererek.2) Yapı geçerliliğini bir örnekle açıklayınız.3) Uygulanmış bir sınavın geçerlik çalışması nasıl yapılabilir?