evaluasi hasil belajar

23
RELIABILITAS ARTI RELIABILITAS BAGI SEBUAH TES Reliabilitas berhubungan dengan kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tsb dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti. Menurut Scarvia B Anderson cs, persyaratan bagi tes, yaitu validitas dan reliabilitas. Validitas lebih penting, dan reliabilitas ini perlu,karena menyokong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid. Sebaliknya,sebuah tes yang valid biasanya reliabel

Upload: ary-ghost

Post on 05-Nov-2015

33 views

Category:

Documents


2 download

DESCRIPTION

evaluasi soal tes

TRANSCRIPT

  • RELIABILITASARTI RELIABILITAS BAGI SEBUAH TESReliabilitas berhubungan dengan kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tsb dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.

    Menurut Scarvia B Anderson cs, persyaratan bagi tes, yaitu validitas dan reliabilitas. Validitas lebih penting, dan reliabilitas ini perlu,karena menyokong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid. Sebaliknya,sebuah tes yang valid biasanya reliabel

  • A reliable measure inone that provides consistent and stable indicationof the characteristic being investigated.

    Hal-hal yang banyak mempengaruhi hasil tes banyak sekali namun secara garis besar dapat dikelompokkan menjadi 3 hal:

    Hal yang berhubungan dengan tes itu sendiri,yaitu panjang tes dan kualitas butir-butir soalnya Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes. Semakin panjang tes,maka reliabilitasnya semakin tinggi.Rumus untuk menghitung besarnya reliabilitas berhubung dengan banyaknya butirsoal dalam tes adalah rumusyang diberikan oleh Spearman dan Brown dikenal dengan rumus Spearman-Brown

  • Rumusnya adalah :

    nrrnn =1 + (n 1)r

    dimana : rnn = besarnya koefisein reliabilitas sesudah tes tsb ditambah butir soal baru n = berapa kali butir-butir soal itu ditambah r = besarnya koefisein reliabilitas sebelum butir-butir soalnya di tambah

    Contoh :Suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabilitas 0,70. kemudian butir-butir soal itu ditambahmenjadi 60 butir soal. Maka koefisien reliabilitas baru adalah :

  • nr 1,5 x 0,70rnn = = 1 + (n 1)r 1 + (1,5 1)x 0,70

    1,05 = = 0,79 1,35

    Dengan demikian makapenambahan sebanyak 20 butir soal dari 40 butir, memperbesar koefisien reliabilitas sebesar 0,09. Akan tetapi penambahan butir-butir soal tes adakalanya tidak berarti bahkan adakalanya merugikan, hal ini disebabkan karena :1) Sampai pada suatu batas tertentu, penambahan banyaknya butir soal sudah tidak menambah tinggi reliabiltas tes. Remmers dan Gage menggambarkan antara penambahan butir soal reliabilitas sbb :

  • Koefisein Reliabilitas1,000,950,900,850,80 50100150200250300Penambahan butir soal

    2) Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan waktu, biaya dan tenaga yang dikeluarkan untuk itu. Misalnya Guru sudah cukup membuat 100 soal bentuk objektif dan 10 soal bentuk esai sudah cukup mempunyai validitas isi dan tingkah laku. Guru tsb ingin menambah butir-butir soal-soal sehingga menjadi 200 dan 20 dengan menambahkan soal-soal yang paralel. Tentu saja hal ini hanya akan menambah waktu,biaya, dan tenaga saja tanpa ada keuntungan apa-apa.

  • Kualitas butir-butir soal ditentukan oleh :Jelas tidaknya rumusan soalBaik-tidaknya pengarahan soal kepadaj awaban sehingga tidak menimbulkan salah jawabPetunjuknya jelas sehingga mudah dan cepat dikerjakan.

    Hal yang berhubungan dengan tercoba (testee)Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya reliabilitas tes. Tes yang dicobakan kepada bukan kelompok terpilih,akan menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada kelompok tertentu yang diambil secara terpilih.

    Hal yang berhubungan dengan penyelenggaraan tesFaktor penyelenggaraan tes yang bersifat administratif sangat menentukan hasil tes.

  • Contoh :Petunjuk yang diberikan sebelum tes dimulai, akanmemberikan ketenangan kepada para tes-tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak terdapat pertanyaan.ketenagaan ini tentu saja akan berpengaruh terhadap hasil tes.Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap tes. Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes.Suasana lingkungan dan tempat tes(duduk tidak teratur,suasana disekelilingnya ramai,dsb) akan mempengaruhi hasil tes.

    Adanya hal-hal yang mempengaruhi hasil tes ini semua.secara tidak langsung akan mempengaruhi reliabilitas soal tes.

  • Cara-cara Mencari Besarnya ReliabilitasReliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat dari kesejajaran hasil. Rumus yang digunakan adalah korelasi product moment untuk mengetahui validitas,kesejajaran hasil dalam reliabilitas tes.Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di luar tes (consistency external) dan pada tes itu sendiri (consistency internal)

    Metode bentuk paralel (equivalent)Tes paralel atau tes equivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran,dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa Inggris disebut alternate- forms method (paralel forms)

  • Dengan metode bentuk paralel ini,dua buah tes yang paralel, misalnya tes Matematika Seri A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada kelompok siswa yang sama,kemudian hasilnya dikorelasikan.

    Koefisien korelasi dari kedua hasil tes itulah yang menunjukkan koefisien reliabilitas tes Seri A. Jika koefisiennya tinggi maka tes tsb sudah reliabel dan dapat digunakan sebagai alat pengetes yang terandalkan.

    Dalammenggunakan metode tes paralel ini pengetes harus menyiapkan duabuah tes,dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu ada orang yang menyebutkan sebagai double test-double-trial method.

  • Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor masih ingat soalnya yang dalam evaluasi disebut adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tsb.

    Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.

    Metode tes ulang (test-retest method)Metode ini dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua kali.Tesnya hanya satu dan dicobakan dua kali, maka metode ini disebut dengan single-test-double-trial method. Kemudian hasil dari kedua kali tes tsb dihitung korelasinya.

  • Tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang mengena, karena tercoba akan masih ingat butir-butir soalnya.

    Masalah tenggang waktu antara pemberian tes pertama dengan kedua menjadi permasalahan tersendiri.

    Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice effect dan over effect, yang penting adalah kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.

  • Contoh :

    Walaupun tampak skornya naik,akan tetapi kenaikannya dialami oleh semua siswa.

    Metode ini disebut self-correlation method (korelasi diri sendiri) karena mengkorelasikanhasil dari tes yang sama

    SiswaTes PertamaTes keduaSkorRankingSkorRankinABCDE15209181231524202515231831524

  • Metode belah dua atau split-half methodKelemahan dari metode pertama dan kedua diatasi dengan metode ketiga yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karenaitu, disebut juga single-test-single-trial method.

    Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes.untuk mengetahui reliabilitas seluruh tes harus dirumuskan rumus Spearman Brown. 2 r1/21/2r1I =(1 + r1/21/2)

  • Dimana :r1/21/2 = korelasi antaraskor-skor setiapbelahan tes

    r1I = koefisien reliabilitas yang sudah disesuaikan

    Contoh :Korelasi antara belahan tes = 0,602 x 0,601,20Makareliabilitas tes = = = 0,75 1 + 0,60 1,60

    Banyak pemakai metodeini salah membelah hasiltes pada waktu, menganalisis. Yang mereka lakukan adalah mengelompokkan hasil separo subjek peserta tes dan separo yang lain kemudian hasil kedua kelompok ini dikorelasikan .

  • Yang benar adalah membelah item atau butir soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir soal harus genap agar dapat dibelah.

    Ada dua cara membelah butir soal ini yaitu :Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut belahan ganjil-genapMembelah atas item-item awal dan item-item akhir yaitu separo jumlah pada nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya disebut belahan awal-akhir.

    Contoh perhitungan reliabilitas dengan metode belah duaMengadakan analisis butir soal yang lebih terkenal dengan nama analisis item.Item yang dapat dijawab dengan benar diberi skor 1 dan bagi yang salah diberi skor 0. Skor-skor untuk seluruh subjek dan seluruh item ini diterakan dalam tabel analisi sbb :

  • TABEL ANALISIS ITEMTES MATEMATIKA

    NoNamaNomor Item1,3,5,7,92,4,6,8,101.2.3.4.56.7.8.9.1012345678910Skor totalGan-jilGe-napAwalAkhir1.2.3.4.5.6.7.8.HartatiYoyokOktavWendiDianaPaulSusanaHelen100111100011101111001110000010111101111110111011100001111110000111010001111000018545647853033443324230353213535353321125

  • Pembelahan ganjil-genapTabel persiapan perhitungan reliabilitas dengan belah dua ganjil-genap adalah sbb :

    X = 25 X2 = 93

    Y = 22 Y2 = 76

    XY = 63

    Setelah dihitung dengan rumuskorelasi product moment dengan angkakasardiketahui bahwa rxy = - 0,3786

    NoNamaItem ganjil (1,3,5,7,9) (X)Item genap (2,4,6,8,10) (Y) 1.2.3.4.5.6.7.8.HartatiYoyokOktavWendiDianaPaulSusanaHelen5303344332423035

  • Harga tsb menunjukkan reliabilitas separo tes. Oleh karena itu rxy untuk belahan ini disebut dengan istilah r1/21/2 atau rgg singkatan dari rganjil-genap.

    Jika koefisien reliabilitas separo tes ini dimasukkan ke dalam rumus: 2 r1/21/2r1I =(1 + r1/21/2)

    2 x -0,3786-0,7572 = = =-0,54931 + (-0,3786) 1,3786

  • Pembelahan awal-akhir

    X = 25 X2 = 91

    Y = 22 Y2 = 78

    XY = 63 Hasilnya : 2 r1/21/2 = -0,3831 r1I = -0,5538

    NoNamaItem awal (1,2,3,4,5) (X)Item Akhir (6,7,8,9,10) (Y)1.2.3.4.5.6.7.8.HartatiYoyokOktavWendiDianaPaulSusanaHelen3213535353321125

  • Mencari reliabilitas tes bentuk uraian

    Reliabilitas yang dibahas adalah hanya meliputi uraian mengenai reliabilitas tes bentuk objektif,yaitu soal yang terdiri dari butir-butir soal yang dinilai hanya benaratau salah.

    Menilai soal bentuk uraian tidak dapat dilakukan seperti ini. Sesuatu butir soal uraian menghendaki gradualisasi penilaian.barangkali butir soal nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya 5,dan butir soal nomor 3 sampai 10 dsb.

    Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukanan alisis butir soal seperti halnya soal bentuk objektif. Skor untuk masing-masing butir soal dicantumkan pada kolom item menurut apa adanya.

  • Rumus yang digunakan adalah rumus Alpha sbb : n s 21R1l = ( ) ( 1 - ) (n 1) s21

    Di mana :

    R1l = reliabilitas yang dicari

    s 21 = jumlah varians skor tiap-tiap item

    s 21 = varians total