ppep bab 13 d1n 14.docx
TRANSCRIPT
BAB 13
MENGANALISIS HASIL TES
1. Menganalisis Tes yang Dibuat Sendiri
Tidak ada usaha guru yang lebih baik selain usaha untuk selalu meningkatkan mutu
tes yang disusunnya. Namun, hal ini tidak dilaksanakan karena kecenderungan seseorang
untuk beranggapan bahwa hasil karyanya adalah yang terbaikatau setidak- tidaknya sudah
cukup baik. Oleh karena itu, cara yang paling baik adalah secara jujur melihat hasil yang
diperoleh siswa.
Secara teoretis, siswa dalam satu kelas merupakan populasi atau kelompok yang
keadaannya heterogen. Dengan demikian, maka apabila dikenai sebuah tes akan tercermin
hasilnya dalam suatu kurva normal. Sebagian besar siswa berada di daerah sedang, sebagan
kecil berada di ekor kiri, dan sebagian kecil yang lain berasa di ekor kanan kurva.
Apabila keadaan setelah hasil tes dianalisis seperti yang diharapkan dalam kurva
normal, maka tentu ada “apa-apa” dengan soal tesnya.Apabila hampir seluruh siswa
memperoleh skor jelek, berarti bahwa tes yang disusun mungkin terlalu sukar. Sebaliknya,
jika seluruh siswa memeroleh skor baik, dapat diartikan bahwa tesnya terlalu mudah. Tentu
saja interpretasi terhadap soal tes akan lain seandainya tes itu sudah disusun sebaik-baiknya
sehingga memenuhi persyaratan sebagai tes.
Ada 4 cara untuk menilai tes, yaitu :
a. Meneliti secara jujur soal- soal yang sudah disusun, kadang- kadang dapat diperoleh
jawaban tentang ketidakjelasan perintah atau bahasa, taraf kesukaran, dan lain- lain
keadaan soal tersebut.
Pertanyaan- Pertanyaan tersebut, antara lain :
1. Apakah banyaknya soal untuk tiap topik sudah seimbang?
2. Apakah semua soal menanyakan bahan yang telah diajarkan?
3. Apakah soal yang kita sususn tidak merupakan pertanyaan yang membingungkan
(dapat disalahtafsirka)?
4. Apakah soal itu tidak sukar untuk dimengerti?
5. Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?
b. Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur yang
sistematis, yang akan memberikan informasi- informasi yang sangat khusus terhadap
butir tes yang kita susun.
Faedah mengadakan analisis soal :
1. Membantu kita dalam mengidentifikasi butir- butir soal yang jelek.
2. Memperoleh informasi yang akan dapat digunakan untuk meneyempurnakan soal-
soal untuk kepentingan lebih lanjut.
3. Memperoleh gambaran secara selintas tentang keadaan yang kita susun.
c. Mengadakan checking validitas. Validitas yang paling penting dari tes buatan guru
adalah validitas kulikuler (content validity). Untuk mengadakan checking validitas
kulikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas
sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut. Tes yang
tidak mempunyai validitas kulikuler atau walupun mempunyai tetapi kecil maka dapat
juga terjadi jika salah satu atau beberapa tujuan husus tidak dicantumkan dalam tabel
spesifikasi. Semakin banyak tujuan khusus yang tidak dicantumkan, berarti bahwa
validitas kulikulernya semakin kecil.
d. Mengadakan checking reabilita. Salah satu indikator untuk tes yang mempunyai
reliabilitas yang tinggi adalah bahwa kebanyakan dari soal- soal tes itu mempunyai daya
pembeda yang tinggi.
2. Analisis Butir Soal
Analisis soal bertujuan untuk mengadakan identifikasi soal- soal yang baik,
kurang baik, dan soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang
kejelekan sebuah soal dan “petunjuk” untuk mengadakan perbaikan.
Kapan sebuah soal dikatakan baik ? untuk memberi jawaban pertanyyan ini ada
tiga masalah yang berhubungan dengan analisis soal, yaitu taraf kesukaran, daya
pembeda, dan pola jawaban soal.
a. Taraf Kesukaran
Soal yang baik adalah soal yang tidak teralu mudah atau tidak terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.
Sebaliknya, soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan
tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks
kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 samapai 1,0.
Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks
kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0
menunjukkan bahwa soal terlalu mudah.
0,0 0,1
Sukar Mudah
Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (p besar), singkatan
dari kata “proporsi”. Dengan demikian maka soal dengan P= 0,70 lebih mudah
dibandingkan dengan P = 0,20. Sebaliknya soal dengan P = 0,30 lebih sukar daripada
soal dengan P=0,80.
Melihat besarnya bilangan indeks ini maka lebih cocok jika bukan disebut sebagai
indeks kesukaran tetapi indeks kemudahan atau indeks fasilitas,karena semakin
mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati
bahwa walaupun semakin tinggi indeksnya menunjukkan soal yang semakin mudah,
tetapi tetap disebut indeks kesukaran.
Rumus Mencari P adalah : P = B
JS
Dimana :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa pserta tes
b. Daya Pembeda
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa
yang berkemampuan tinggi dan yang berkemampuan rendah. Indeks diskriminasi (D)
adalah angka yang menunjukkan daya pembeda , kisarannya yaitu 0.00 sampai
dengan 1.00. Titik daya pembeda terdiri dari titik negatif, rendah, sampai tinggi (-
1.00, 0.00, dan 1.00). Titik daya pembeda yang negatif menunjukkan kualitas testee
jika suatu soal ‘terbalik’ (pandai-bodoh, bodoh-pandai). Soal tanpa daya pembeda
merupakan soal yang tidak baik. Adapun klasifikasi daya pembeda sebagai berikut:
• D = 0,00 – 0,20 = jelek
• D = 0,20 – 0,40 = cukup
• D = 0,40 – 0,70 = baik
• D = 0,70 – 1,00 = baik sekali
• D = negatif = semuanya tidak baik, sebaiknya dibuang
Dalam penentuan nilai daya pembeda (D), peserta tes dibagi menjadi dua kelompok,
kelompok atas (upper) dan kelompok bawah (lower). Dalam kelompok kecil yang
jumlahnya kurang dari 100, kedua kelompok dibagi menjadi 50% dan 50%,
sedangkan pada kelompok besar yang jumlahnya lebih dari 100, kedua kelompok
hanya diambil 27% teratas dan 27% terbawah. Rumus yang digunakan untuk
menentukan indeks diskriminasi adalah seperti di bawah ini:
D = BA/JA – BB/JB = PA - PB
dimana, J = jumlah peserta tes
JA = banyaknya peserta upper group
JB = banyaknya peserta lower group
BA = banyaknya peserta upper group yg menjawab benar
= banyaknya peserta lower group yg menjawab benar
PA = proporsi peserta upper group yg menjawab benar (P indeks
kesukaran)
PB = proporsi peserta lower group yg menjawab benar (P indeks
kesukaran)
Adanya pola jawaban soal adalah untuk mengetahui:
– Taraf kesukaran soal
– Daya pembeda soal
– Baik/tidaknya distraktor
Distraktor adalah pengecoh jawaban. Perlakuan distraktor:
– Diterima (baik)
– Ditolak (tidak baik)
– Ditulis kembali (kurang baik)
– Distraktor yg baik minimal dipilih 5% oleh pengikut
BAB 14
MENSKOR DAN MENILAI
1. Menskor
Menskor yaitu kegiatan memberi nilai yang menggunakan alat bantu:
– Kunci jawaban
– Kunci skoring
– Pedoman penilaian
Kunci Jawaban adalah deretan jawaban yang kita persiapkan untuk pertanyaan-
pertanyaan/soal yg kita susun. Kunci skoring adalah alat yg kita gunakan untuk
mempercepat pekerjaan seseorang . Kunci jawaban dan kunci skoring berbeda-beda
sesuai dengan macam tesnya, antara lain:
1. Tes Benar atau Salah
• Testee diminta melingkari jawaban B atau S
• Sebelum menyusun soal, tentukan dulu kunci jawabannya, usahakan jumlah
jawaban B hampir sama banyaknya dgn S
• Kunci jawaban dapat diganti dengan scoring key sebagai berikut:
a. Tanpa Hukuman
Angka yg diperoleh siswa sebanyak jawaban yg cocok dgn kunci
b. Dengan Hukuman
1) S = R - W
dimana S = skor, R = right, dan W = wrong
2) S = T – 2 W
T adalah total jumlah soal dalam tes
2. Tes Pilihan Ganda
a. Tanpa Hukuman
b. Dengan Hukuman
S = R – (W/(n-1))
n = banyaknya pilihan jawaban
3. Tes Jawaban Singkat
Tes bentuk jawab singkat adalah bentuk tes yg menghendaki jawaban terbentuk kata
atau kalimat pendek
Kalau jawaban mudah, skor disamakan dengan pilihan ganda
Kalau jawaban bervariasi tingkatnya, lengkap, lengkap sekali, kurang lengkap maka
skornya juga bervariasi
Normalnya, tiap soal diberi skor 2
Kunci jawabannya berderet sesuai nomor
4. Tes Menjodohkan
Berupa deretan jawaban yg dikehendaki atau deretan nomor yg diikuti huruf-huruf yg
terdapat di depan alternatif jawaban
Angka tiap nomor adalah 2
5. Tes bentuk uraian atau essay
Tidak ada jawaban yang pasti pada tes bentuk uraian ini, untuk itu akan lebih mudah jika
menggunakan suatu cara dengan melakukan bebrapa hal. Dibawah ini merupakan
langkah-langkah yang sebaiknya dilakukan dalam memberi skor untuk tes bentuk uraian
berdasarkan pada norma kelompok (norm referenced test)
1. Membaca soal pertama dari seluruh siswa untuk mengetahui situasi jawaban. Dengan
membaca seluruh jawaban, kita dapat memperoleh gambaran lengkap tidaknya
jawaban yang diberikan siswa secara keselurruhan.
2. Menentukan angka untuk soal pertama tersebut. Dalam menentukan angka, kita perlu
berpikir bahwa tidak ada unsure tebakan. Dengan demikian maka ada dua pendapat,
satu pendapat menentukan menentukan angka 1 atau 2 untuk untuk jawaban yang
salah, pendapat lain menentukan angka 0 untuk jawaban tersebut.
3. Memberikan angka untuk soal pertama.
4. Mengulangi langkah-langkah tersebut bagi soal-soal lainnya.
5. Menjumlahkan angka-angka yang diperoleh masing-masing siswa untuk tes bentuk
uraian.
Dengan melakukan langkah-langkah tersebut, kita tahu bahwa dengan membaca terlebih
dahulu seluruh jawaban yang diberikan siswa, kita menjadi tahu bahwa mungkin tidak
ada seorangpun dari siswa yang menjawab dengan betul suatu nomor soal.
Mendapati situasi yang seperti ini, kita gunakan cara pemberian angka yang relative.
Misalnya, untuk suatu nomor soal jawaban yang paling lengkap hanya mengandung 3
unsur, padahal kita menghendaki 5 unsur, maka kepada jawaban paling lengkap itulah
kita memberikan angka 5 sedangkan untuk yang menjawab hanya 1 atau 2 unsur, beri
angka lebih sedikit. Dengan cara ini maka [emberian angka untuk jenis tes uraian akan
lebih konsisten.
Jika dalam memebrikan angka mendasarkan pada standar mutlak (criterion referenced
test), maka langkah-langkahnya akan berbeda. berikut langkah-langkah yang harus
dilakukan dalam pemberian skor pada tes bentuk uraian berdasarkan standar mutlak:
1. Membaca setiap jawaban yang diberikan oleh siswa, dan dibandingkan dengan kunci
jawaban yang telah kita susun.
2. Membubuhkan skor di sebelah kiri setiap jawaban. Hal ini dilakukan per nomr soal.
3. Menjumlah skor-skor yang telah dituliskanpada setiap soal.
Dengan cara ini, maka skor siswa tidak dibandingkan dengan jawaban paling lengkap
dengan jawaban siswa lain, tetapi dibandingkan dengan jawaban lengkap yang
dikehendaki dan sudah ditentukan oleh guru.
Adakalanya kita dituntut untuk memberikan nilai tetrhadap prestasi belajar siswa
tanpa memberikan skor terlebih dahulu. Misalnya pada waktu ujian lisan. Sesuatu yang
dilarang adalah masuknya unsure subjektivitas dalam diri kita sehingga kita seringkali
melakukan hal-hal di luar keadilan. Kemungkinannya adalah apabila kita hanya
memberikan nilai satu kali, yakni pada akhir ujian.
Untuk mengurangi masuknya unsure subjektivitas, kita dapat menentukan sendiri
aspek-aspek yang menjadi bagian dari penilaian. Untuk masing-masing aspek dapat
ditentukan berapa nilainya, kemudian dijumlah dan ditentukan nilai akhirnya. Dalam
menentukan nilai akhir, dapat juga memberikan bobot yang berbeda pada masing-masing
aspek, asalkan dengan argumentsi yang kuat.
Dalam menentukan nilai pada tiap-tiap aspek ini pun kita dituntut untuk memberikan
pertimbangan yang didasari oleh kebijaksanaan. Kita dapat mengambil salah satu dari dua
cara di bawah ini, yaitu;
1. Bertitik tolak dari batas bawah, yaitu berpikir dari pekerjaan yang paling jelek
dahulu, kemudian membandingkan hasil pekerjaan yang kita hadapi dengan
nilai batas bawah tersebut.
2. Bertitik tolak pada batas atas. Dengan cara ini kita berpikir mengenai
kesempurnaan pekerjaan tetapi diukur menurut ukuran yang bisa dicapai oleh
siswa/mahasiswa.
6. Tugas
Kunci jawaban untuk memeriksa tugas merupakan pokok-pokok yang harus termuat
di dalam pekerjaan siswa. hal ini menyangkut kriteria untuk isi tugas. Namun, sebagai
kelengkapan dalam pemberian skor, digunakan suatu tolak ukur tertentu.
Tolak ukur yang disarankan dalam keberhasilan tugas adalah:
a. Ketepatan waktu penyerahan tugas
b. Bentuk fisik pengerjaan tugas yang menunjukka keseriussan siswa dalam
mengerjakan tugas
c. Sistematika yang menunjukan alur keruntutan pikiran
d. Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi
e. Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan
Dalam mempertimbangkan nilai akhir, perlu dipikirkan peranan masing-masing
aspek. Maka nilai akhir tugas tersebut dapat dihitung dengan mengkalikan masing-masing
nilai aspek dengan bobot aspek, kemudian menjumlahkan keseluruhannya.
2. Perbedaan antara skor dan nilai
Banyak diantara para guru yang masih mencampuradukkan antara dua pengertian
yaitu antara skor dan nilai.
Skor: adalah hasil pekerjaan menskor yang diperoleh dengan menjumlahkan angka-
angka setiap soal tes yang dijawab betul oleh siswa.
Nilai: adalah angka ubahan dari skor dengan menggunakan acuan tertentu, yakni
acuan normal atau acuan standar
Seorang siswa yang memperoleh skor 40 bagi tes yang menghendaki skor maksimum
40, mempunyai arti bahwa siswa tersebut sudah menguasai 100% dari tujuan
instruksional khusus yang dirancangkan oleh guru. Akan tetapi jika skor 40 tersebut
diperoleh dari pengerjaan tes yang menghendaki soal maksimum 100, maka skor 40
mencerminkan 40% penguasaab tujuan saja.
Dengan demikian maka angka 40 yang diperoleh siswa belum berbicara apa-apa sebelum
diketahui berapa skor maksimum yang diharapkan jika siswa tersebut dapat
mengerjakannya dengan sempurna. Angka 40 ini disebut skor mentah.
Atas dasar itulah, guru diwajibkan untuk mengubah skor mentah menjadi skor berstandar
100.
Contoh:
Skor yang diharapkan 40.
A memperoleh skor 24. Ini berarti bahwa A hanya menguasai 2440
x 100 % tujuan
instruksional khusus tersebut atau hanya 60% dari tujuan. Dalam daftar nilai dituliskan A
mendapat nilail 60. Jadi 24 adalah skor dan 60 adalah nilai.
Secara rinci skor dapat dibedakan menjadi 3 macam, yaitu skor yang diperoleh (obtained
score), skor sebenarnya (true score), dan skor kesalahan (error score).
Skor yang diperoleh adalah sejumlah biji yang dimiliki oleh testee sebagi hasil
mengerjakan tes. Kelemahan-kelemahan butir tes, situasi yang tidak mendukung,
kecemasan, dan lain-lain faktor dapat berakibat terhadap skor yang diperoleh ini, apabila
faktor-faktor yang berpengaruh ini muncul, baik sebagian atau menyeluruh, penilai tidak
dapat mengira-ngira seberapa cermat skor yang diperoleh siswa ini mampu
mencerminkan pengetahuan dan keterampilan siswa yang sesungguhnya.
Skor sebenarnya seringkali juga juga disebut dengan istilah skor univers – skor alam,
adalah nilai hipotesis yang sangat tergantung dari perbedaan individu berkenaan dengan
pengetahuan yang dimilki secara tetap.
Perbedaan skor yang diperoleh dengan skor yang sebenarnya disebut dengan istilah
kesalahan dalam pengukuran atau skor kesalahan.
3. Norm referenced dan criterion referenced
Dari sederetan skor yang telah diubah ke standar 100 inilah maka dapat diperoleh
gabungannya, misalnya gabungan antara nilai ulangan ke-1, ulangan ke-2 dst, yang
merupakan catatan untuk dirata-rata dan menggambarkan penguasaan siswa terhadap
materi yang diajarkan, atau menggambarkan sejauh manasiswa mencapai tujuan
instruksional umum dari satu unit bahan yang dipelajari dalam satu ukuran waktu.
Dalam penggunaan norm referenced, prestasi belajar seorang siswa dibandingkan
dengan siswa lain dalam kelompoknya. Kualitas seseorang sangat dipengaruhi oleh
Kurva Normal IQKurva Normal preprestasi belajar
kualitas kelompoknya. Seorang siswa apabila terjun ke kelompok A termasuk “hebat”
mungkin jika pindah ke kelompok lain hanya menduduki kuailtas “sedang” saja.
Ukurannnya adalah relative. Oleh sebab itu, maka dikatakan pula diukur dengan standar-
relatif. Ukuran demikian juga disebut menggunakan norm referenced atau norma
kelompok
Dasar pemikiran dari penggunaan standar ini adalah adanya asumsi bahwa di setiap
populasi yang heterogen tentu terdapat kelompok baik, kelompok sedang, dan kelompok
kurang. Dimulai dengan bakat yang dibawa sejak lahir yang dalam hal ini tampak sebagai
IQ, maka seluruh populasi tergambar sebagai kurva normal. Apabila anak-anak itu belajar
yang diakibatkan itu pun akan tergambar sebagai kurva normal.
Penggunaan penilaian dengan norma kelompok atau norma relative ini untuk pertama
kali dikemukakan pada tahun 1908 (cureton 1971), dengan landasan dasar bahwa tingkat
pencapaian belajar siswa akan tersebar menurut kurva normal. Dengan demikian maka
penilaian berdasarkan kurava normal merupakan hal yang tidak dapat dibantah lagi.
Apabila standar relative dan standar mutlak ini dihubungkan dengan pengubahan skor
menjadi nilai, maka akan terlihat seperti dibawah ini:
a. Dengan standar mutlak
1. Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan
yang ditentukan.
2. Nilai diperoleh dengan mencari rata-rata langsung dari skor asal (skor mentah)
Contoh:
- Dari ulangan ke-1, memperoleh skor 60 (mencapai 60% tujuan)
- Dari ulangan ke-2, memperoleh skor 80 (mencapai 80% tujuan)
- Dari ulangan ke-3, memperoleh skor 50 (mencapai 50% tujuan)
Maka nilai siswa tersebut 60+80+50
3=63,3 dibulatkan menjadi 63
b. Dengan standar relative
1. Pemberian skor terhadap siswa didasarkan atas pencapaian siswa terhadap tujuan
yang ditentukan
2. Nilai diperoleh dengan 2 cara, yaitu
a. Mengubah skor dari tiap-tiap ulangan, lalu diambil rata-ratanya
b. Menjumlah skor tiap ulangan, baru diubah ke nilai
POST TEST
1. Berikut ini adalah hal yang perlu diperhatikan dalam menganalisis butir soal, yaitu
a. Pola jawaban soal dan checking reliabilitas
b. Checking validitas dan daya pembeda
c. Taraf kesukaran dan checking validitas
d. Daya pembeda dan taraf kesukaran
e. pola jawaban soal dan checking validitas
2. Kemampuan sesuatu soal untuk membedakan antara siswa yg berkemampuan tinggi
dan yg berkemampuan rendah disebut...
a. Indeks Diskriminasi
b.Daya Pembeda
c. Indeks Kesukaran
d. Skoring
e. Distraktor
3. Berikut ini pernyataan yg benar adalah, kecuali...
a. soal yg baik memiliki daya pembeda sebesar 0,4-0,7
b. soal dengan D bernilai negatif merupakan soal yg tidak baik
c. soal yg buruk bila distraktornya dipilih oleh > 5%
d. untuk menentukan D bagi kelompok <100, peserta dibagi 2 kelompok (upper dan
lower), masing-masing 50%
e. untuk menentukan D bagi kelompok >100, peserta dibagi 2 kelompok, masing-
masing 27% dan 27%
uraian !
4. Sebutkan 4 cara untuk menilai hasil tes ?
Meneliti secara jujur soal- soal yang sudah disusun.
Mengadakan analisis soal (item analysis).
Mengadakan checking validitas
Mengadakan checking reabilita
5. A memperoleh skor 24, sedangkan skor yang diharapkan adalah 40. tentukan skor
yang diperoleh (obtained score, skor sebenarnya (true score), dan skor kesalahan
(error score)!
skor yang diperoleh (obtained score) = 24, skor sebenarnya (true score) = 40, dan
skor kesalahan (error score) = 16
6. Sebutkan tolak ukur yang disarankan dalam keberhasilan tugas (min 2)!
Ketepatan waktu penyerahan tugas
Bentuk fisik pengerjaan tugas yang menunjukka keseriussan siswa dalam
mengerjakan tugas
Sistematika yang menunjukan alur keruntutan pikiran
Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi
Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah
ditentukan
BAB 13 dan 14
Menganalisis Hasil Tes dan Menskor Dan Menilai
Disusun oleh kelompok 7
Desi Ayu Triana 34151014
Esihana Masrimuna 34151024
Siti Chaerun Nisa 34151014
Pendidikan Biologi Reguler 2010
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Negeri Jakarta