ppep bab 13 d1n 14.docx

BAB 13

MENGANALISIS HASIL TES

1. Menganalisis Tes yang Dibuat Sendiri

Tidak ada usaha guru yang lebih baik selain usaha untuk selalu meningkatkan mutu

tes yang disusunnya. Namun, hal ini tidak dilaksanakan karena kecenderungan seseorang

untuk beranggapan bahwa hasil karyanya adalah yang terbaikatau setidak- tidaknya sudah

cukup baik. Oleh karena itu, cara yang paling baik adalah secara jujur melihat hasil yang

diperoleh siswa.

Secara teoretis, siswa dalam satu kelas merupakan populasi atau kelompok yang

keadaannya heterogen. Dengan demikian, maka apabila dikenai sebuah tes akan tercermin

hasilnya dalam suatu kurva normal. Sebagian besar siswa berada di daerah sedang, sebagan

kecil berada di ekor kiri, dan sebagian kecil yang lain berasa di ekor kanan kurva.

Apabila keadaan setelah hasil tes dianalisis seperti yang diharapkan dalam kurva

normal, maka tentu ada “apa-apa” dengan soal tesnya.Apabila hampir seluruh siswa

memperoleh skor jelek, berarti bahwa tes yang disusun mungkin terlalu sukar. Sebaliknya,

jika seluruh siswa memeroleh skor baik, dapat diartikan bahwa tesnya terlalu mudah. Tentu

saja interpretasi terhadap soal tes akan lain seandainya tes itu sudah disusun sebaik-baiknya

sehingga memenuhi persyaratan sebagai tes.

Ada 4 cara untuk menilai tes, yaitu :

a. Meneliti secara jujur soal- soal yang sudah disusun, kadang- kadang dapat diperoleh

jawaban tentang ketidakjelasan perintah atau bahasa, taraf kesukaran, dan lain- lain

keadaan soal tersebut.

Pertanyaan- Pertanyaan tersebut, antara lain :

1. Apakah banyaknya soal untuk tiap topik sudah seimbang?

2. Apakah semua soal menanyakan bahan yang telah diajarkan?

3. Apakah soal yang kita sususn tidak merupakan pertanyaan yang membingungkan

(dapat disalahtafsirka)?

4. Apakah soal itu tidak sukar untuk dimengerti?

5. Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?

b. Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur yang

sistematis, yang akan memberikan informasi- informasi yang sangat khusus terhadap

butir tes yang kita susun.

Faedah mengadakan analisis soal :

1. Membantu kita dalam mengidentifikasi butir- butir soal yang jelek.

2. Memperoleh informasi yang akan dapat digunakan untuk meneyempurnakan soal-

soal untuk kepentingan lebih lanjut.

3. Memperoleh gambaran secara selintas tentang keadaan yang kita susun.

c. Mengadakan checking validitas. Validitas yang paling penting dari tes buatan guru

adalah validitas kulikuler (content validity). Untuk mengadakan checking validitas

kulikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas

sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut. Tes yang

tidak mempunyai validitas kulikuler atau walupun mempunyai tetapi kecil maka dapat

juga terjadi jika salah satu atau beberapa tujuan husus tidak dicantumkan dalam tabel

spesifikasi. Semakin banyak tujuan khusus yang tidak dicantumkan, berarti bahwa

validitas kulikulernya semakin kecil.

d. Mengadakan checking reabilita. Salah satu indikator untuk tes yang mempunyai

reliabilitas yang tinggi adalah bahwa kebanyakan dari soal- soal tes itu mempunyai daya

pembeda yang tinggi.

2. Analisis Butir Soal

Analisis soal bertujuan untuk mengadakan identifikasi soal- soal yang baik,

kurang baik, dan soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang

kejelekan sebuah soal dan “petunjuk” untuk mengadakan perbaikan.

Kapan sebuah soal dikatakan baik ? untuk memberi jawaban pertanyyan ini ada

tiga masalah yang berhubungan dengan analisis soal, yaitu taraf kesukaran, daya

pembeda, dan pola jawaban soal.

a. Taraf Kesukaran

Soal yang baik adalah soal yang tidak teralu mudah atau tidak terlalu sukar. Soal yang

terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.

Sebaliknya, soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan

tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.

Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks

kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 samapai 1,0.

Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks

kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0

menunjukkan bahwa soal terlalu mudah.

0,0 0,1

Sukar Mudah

Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (p besar), singkatan

dari kata “proporsi”. Dengan demikian maka soal dengan P= 0,70 lebih mudah

dibandingkan dengan P = 0,20. Sebaliknya soal dengan P = 0,30 lebih sukar daripada

soal dengan P=0,80.

Melihat besarnya bilangan indeks ini maka lebih cocok jika bukan disebut sebagai

indeks kesukaran tetapi indeks kemudahan atau indeks fasilitas,karena semakin

mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati

bahwa walaupun semakin tinggi indeksnya menunjukkan soal yang semakin mudah,

tetapi tetap disebut indeks kesukaran.

Rumus Mencari P adalah : P = B

JS

Dimana :

P = indeks kesukaran

B = banyaknya siswa yang menjawab soal itu dengan betul

JS = jumlah seluruh siswa pserta tes

b. Daya Pembeda

Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa

yang berkemampuan tinggi dan yang berkemampuan rendah. Indeks diskriminasi (D)

adalah angka yang menunjukkan daya pembeda , kisarannya yaitu 0.00 sampai

dengan 1.00. Titik daya pembeda terdiri dari titik negatif, rendah, sampai tinggi (-

1.00, 0.00, dan 1.00). Titik daya pembeda yang negatif menunjukkan kualitas testee

jika suatu soal ‘terbalik’ (pandai-bodoh, bodoh-pandai). Soal tanpa daya pembeda

merupakan soal yang tidak baik. Adapun klasifikasi daya pembeda sebagai berikut:

• D = 0,00 – 0,20 = jelek

• D = 0,20 – 0,40 = cukup

• D = 0,40 – 0,70 = baik

• D = 0,70 – 1,00 = baik sekali

• D = negatif = semuanya tidak baik, sebaiknya dibuang

Dalam penentuan nilai daya pembeda (D), peserta tes dibagi menjadi dua kelompok,

kelompok atas (upper) dan kelompok bawah (lower). Dalam kelompok kecil yang

jumlahnya kurang dari 100, kedua kelompok dibagi menjadi 50% dan 50%,

sedangkan pada kelompok besar yang jumlahnya lebih dari 100, kedua kelompok

hanya diambil 27% teratas dan 27% terbawah. Rumus yang digunakan untuk

menentukan indeks diskriminasi adalah seperti di bawah ini:

D = BA/JA – BB/JB = PA - PB

dimana, J = jumlah peserta tes

JA = banyaknya peserta upper group

JB = banyaknya peserta lower group

BA = banyaknya peserta upper group yg menjawab benar

= banyaknya peserta lower group yg menjawab benar

PA = proporsi peserta upper group yg menjawab benar (P indeks

kesukaran)

PB = proporsi peserta lower group yg menjawab benar (P indeks

kesukaran)

Adanya pola jawaban soal adalah untuk mengetahui:

– Taraf kesukaran soal

– Daya pembeda soal

– Baik/tidaknya distraktor

Distraktor adalah pengecoh jawaban. Perlakuan distraktor:

– Diterima (baik)

– Ditolak (tidak baik)

– Ditulis kembali (kurang baik)

– Distraktor yg baik minimal dipilih 5% oleh pengikut

BAB 14

MENSKOR DAN MENILAI

1. Menskor

Menskor yaitu kegiatan memberi nilai yang menggunakan alat bantu:

– Kunci jawaban

– Kunci skoring

– Pedoman penilaian

Kunci Jawaban adalah deretan jawaban yang kita persiapkan untuk pertanyaan-

pertanyaan/soal yg kita susun. Kunci skoring adalah alat yg kita gunakan untuk

mempercepat pekerjaan seseorang . Kunci jawaban dan kunci skoring berbeda-beda

sesuai dengan macam tesnya, antara lain:

1. Tes Benar atau Salah

• Testee diminta melingkari jawaban B atau S

• Sebelum menyusun soal, tentukan dulu kunci jawabannya, usahakan jumlah

jawaban B hampir sama banyaknya dgn S

• Kunci jawaban dapat diganti dengan scoring key sebagai berikut:

a. Tanpa Hukuman

Angka yg diperoleh siswa sebanyak jawaban yg cocok dgn kunci

b. Dengan Hukuman

1) S = R - W

dimana S = skor, R = right, dan W = wrong

2) S = T – 2 W

T adalah total jumlah soal dalam tes

2. Tes Pilihan Ganda

a. Tanpa Hukuman

b. Dengan Hukuman

S = R – (W/(n-1))

n = banyaknya pilihan jawaban

3. Tes Jawaban Singkat

Tes bentuk jawab singkat adalah bentuk tes yg menghendaki jawaban terbentuk kata

atau kalimat pendek

Kalau jawaban mudah, skor disamakan dengan pilihan ganda

Kalau jawaban bervariasi tingkatnya, lengkap, lengkap sekali, kurang lengkap maka

skornya juga bervariasi

Normalnya, tiap soal diberi skor 2

Kunci jawabannya berderet sesuai nomor

4. Tes Menjodohkan

Berupa deretan jawaban yg dikehendaki atau deretan nomor yg diikuti huruf-huruf yg

terdapat di depan alternatif jawaban

Angka tiap nomor adalah 2

5. Tes bentuk uraian atau essay

Tidak ada jawaban yang pasti pada tes bentuk uraian ini, untuk itu akan lebih mudah jika

menggunakan suatu cara dengan melakukan bebrapa hal. Dibawah ini merupakan

langkah-langkah yang sebaiknya dilakukan dalam memberi skor untuk tes bentuk uraian

berdasarkan pada norma kelompok (norm referenced test)

1. Membaca soal pertama dari seluruh siswa untuk mengetahui situasi jawaban. Dengan

membaca seluruh jawaban, kita dapat memperoleh gambaran lengkap tidaknya

jawaban yang diberikan siswa secara keselurruhan.

2. Menentukan angka untuk soal pertama tersebut. Dalam menentukan angka, kita perlu

berpikir bahwa tidak ada unsure tebakan. Dengan demikian maka ada dua pendapat,

satu pendapat menentukan menentukan angka 1 atau 2 untuk untuk jawaban yang

salah, pendapat lain menentukan angka 0 untuk jawaban tersebut.

3. Memberikan angka untuk soal pertama.

4. Mengulangi langkah-langkah tersebut bagi soal-soal lainnya.

5. Menjumlahkan angka-angka yang diperoleh masing-masing siswa untuk tes bentuk

uraian.

Dengan melakukan langkah-langkah tersebut, kita tahu bahwa dengan membaca terlebih

dahulu seluruh jawaban yang diberikan siswa, kita menjadi tahu bahwa mungkin tidak

ada seorangpun dari siswa yang menjawab dengan betul suatu nomor soal.

Mendapati situasi yang seperti ini, kita gunakan cara pemberian angka yang relative.

Misalnya, untuk suatu nomor soal jawaban yang paling lengkap hanya mengandung 3

unsur, padahal kita menghendaki 5 unsur, maka kepada jawaban paling lengkap itulah

kita memberikan angka 5 sedangkan untuk yang menjawab hanya 1 atau 2 unsur, beri

angka lebih sedikit. Dengan cara ini maka [emberian angka untuk jenis tes uraian akan

lebih konsisten.

Jika dalam memebrikan angka mendasarkan pada standar mutlak (criterion referenced

test), maka langkah-langkahnya akan berbeda. berikut langkah-langkah yang harus

dilakukan dalam pemberian skor pada tes bentuk uraian berdasarkan standar mutlak:

1. Membaca setiap jawaban yang diberikan oleh siswa, dan dibandingkan dengan kunci

jawaban yang telah kita susun.

2. Membubuhkan skor di sebelah kiri setiap jawaban. Hal ini dilakukan per nomr soal.

3. Menjumlah skor-skor yang telah dituliskanpada setiap soal.

Dengan cara ini, maka skor siswa tidak dibandingkan dengan jawaban paling lengkap

dengan jawaban siswa lain, tetapi dibandingkan dengan jawaban lengkap yang

dikehendaki dan sudah ditentukan oleh guru.

Adakalanya kita dituntut untuk memberikan nilai tetrhadap prestasi belajar siswa

tanpa memberikan skor terlebih dahulu. Misalnya pada waktu ujian lisan. Sesuatu yang

dilarang adalah masuknya unsure subjektivitas dalam diri kita sehingga kita seringkali

melakukan hal-hal di luar keadilan. Kemungkinannya adalah apabila kita hanya

memberikan nilai satu kali, yakni pada akhir ujian.

Untuk mengurangi masuknya unsure subjektivitas, kita dapat menentukan sendiri

aspek-aspek yang menjadi bagian dari penilaian. Untuk masing-masing aspek dapat

ditentukan berapa nilainya, kemudian dijumlah dan ditentukan nilai akhirnya. Dalam

menentukan nilai akhir, dapat juga memberikan bobot yang berbeda pada masing-masing

aspek, asalkan dengan argumentsi yang kuat.

Dalam menentukan nilai pada tiap-tiap aspek ini pun kita dituntut untuk memberikan

pertimbangan yang didasari oleh kebijaksanaan. Kita dapat mengambil salah satu dari dua

cara di bawah ini, yaitu;

1. Bertitik tolak dari batas bawah, yaitu berpikir dari pekerjaan yang paling jelek

dahulu, kemudian membandingkan hasil pekerjaan yang kita hadapi dengan

nilai batas bawah tersebut.

2. Bertitik tolak pada batas atas. Dengan cara ini kita berpikir mengenai

kesempurnaan pekerjaan tetapi diukur menurut ukuran yang bisa dicapai oleh

siswa/mahasiswa.

6. Tugas

Kunci jawaban untuk memeriksa tugas merupakan pokok-pokok yang harus termuat

di dalam pekerjaan siswa. hal ini menyangkut kriteria untuk isi tugas. Namun, sebagai

kelengkapan dalam pemberian skor, digunakan suatu tolak ukur tertentu.

Tolak ukur yang disarankan dalam keberhasilan tugas adalah:

a. Ketepatan waktu penyerahan tugas

b. Bentuk fisik pengerjaan tugas yang menunjukka keseriussan siswa dalam

mengerjakan tugas

c. Sistematika yang menunjukan alur keruntutan pikiran

d. Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi

e. Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan

Dalam mempertimbangkan nilai akhir, perlu dipikirkan peranan masing-masing

aspek. Maka nilai akhir tugas tersebut dapat dihitung dengan mengkalikan masing-masing

nilai aspek dengan bobot aspek, kemudian menjumlahkan keseluruhannya.

2. Perbedaan antara skor dan nilai

Banyak diantara para guru yang masih mencampuradukkan antara dua pengertian

yaitu antara skor dan nilai.

Skor: adalah hasil pekerjaan menskor yang diperoleh dengan menjumlahkan angka-

angka setiap soal tes yang dijawab betul oleh siswa.

Nilai: adalah angka ubahan dari skor dengan menggunakan acuan tertentu, yakni

acuan normal atau acuan standar

Seorang siswa yang memperoleh skor 40 bagi tes yang menghendaki skor maksimum

40, mempunyai arti bahwa siswa tersebut sudah menguasai 100% dari tujuan

instruksional khusus yang dirancangkan oleh guru. Akan tetapi jika skor 40 tersebut

diperoleh dari pengerjaan tes yang menghendaki soal maksimum 100, maka skor 40

mencerminkan 40% penguasaab tujuan saja.

Dengan demikian maka angka 40 yang diperoleh siswa belum berbicara apa-apa sebelum

diketahui berapa skor maksimum yang diharapkan jika siswa tersebut dapat

mengerjakannya dengan sempurna. Angka 40 ini disebut skor mentah.

Atas dasar itulah, guru diwajibkan untuk mengubah skor mentah menjadi skor berstandar

100.

Contoh:

Skor yang diharapkan 40.

A memperoleh skor 24. Ini berarti bahwa A hanya menguasai 2440

x 100 % tujuan

instruksional khusus tersebut atau hanya 60% dari tujuan. Dalam daftar nilai dituliskan A

mendapat nilail 60. Jadi 24 adalah skor dan 60 adalah nilai.

Secara rinci skor dapat dibedakan menjadi 3 macam, yaitu skor yang diperoleh (obtained

score), skor sebenarnya (true score), dan skor kesalahan (error score).

Skor yang diperoleh adalah sejumlah biji yang dimiliki oleh testee sebagi hasil

mengerjakan tes. Kelemahan-kelemahan butir tes, situasi yang tidak mendukung,

kecemasan, dan lain-lain faktor dapat berakibat terhadap skor yang diperoleh ini, apabila

faktor-faktor yang berpengaruh ini muncul, baik sebagian atau menyeluruh, penilai tidak

dapat mengira-ngira seberapa cermat skor yang diperoleh siswa ini mampu

mencerminkan pengetahuan dan keterampilan siswa yang sesungguhnya.

Skor sebenarnya seringkali juga juga disebut dengan istilah skor univers – skor alam,

adalah nilai hipotesis yang sangat tergantung dari perbedaan individu berkenaan dengan

pengetahuan yang dimilki secara tetap.

Perbedaan skor yang diperoleh dengan skor yang sebenarnya disebut dengan istilah

kesalahan dalam pengukuran atau skor kesalahan.

3. Norm referenced dan criterion referenced

Dari sederetan skor yang telah diubah ke standar 100 inilah maka dapat diperoleh

gabungannya, misalnya gabungan antara nilai ulangan ke-1, ulangan ke-2 dst, yang

merupakan catatan untuk dirata-rata dan menggambarkan penguasaan siswa terhadap

materi yang diajarkan, atau menggambarkan sejauh manasiswa mencapai tujuan

instruksional umum dari satu unit bahan yang dipelajari dalam satu ukuran waktu.

Dalam penggunaan norm referenced, prestasi belajar seorang siswa dibandingkan

dengan siswa lain dalam kelompoknya. Kualitas seseorang sangat dipengaruhi oleh

Kurva Normal IQKurva Normal preprestasi belajar

kualitas kelompoknya. Seorang siswa apabila terjun ke kelompok A termasuk “hebat”

mungkin jika pindah ke kelompok lain hanya menduduki kuailtas “sedang” saja.

Ukurannnya adalah relative. Oleh sebab itu, maka dikatakan pula diukur dengan standar-

relatif. Ukuran demikian juga disebut menggunakan norm referenced atau norma

kelompok

Dasar pemikiran dari penggunaan standar ini adalah adanya asumsi bahwa di setiap

populasi yang heterogen tentu terdapat kelompok baik, kelompok sedang, dan kelompok

kurang. Dimulai dengan bakat yang dibawa sejak lahir yang dalam hal ini tampak sebagai

IQ, maka seluruh populasi tergambar sebagai kurva normal. Apabila anak-anak itu belajar

yang diakibatkan itu pun akan tergambar sebagai kurva normal.

Penggunaan penilaian dengan norma kelompok atau norma relative ini untuk pertama

kali dikemukakan pada tahun 1908 (cureton 1971), dengan landasan dasar bahwa tingkat

pencapaian belajar siswa akan tersebar menurut kurva normal. Dengan demikian maka

penilaian berdasarkan kurava normal merupakan hal yang tidak dapat dibantah lagi.

Apabila standar relative dan standar mutlak ini dihubungkan dengan pengubahan skor

menjadi nilai, maka akan terlihat seperti dibawah ini:

a. Dengan standar mutlak

1. Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan

yang ditentukan.

2. Nilai diperoleh dengan mencari rata-rata langsung dari skor asal (skor mentah)

Contoh:

- Dari ulangan ke-1, memperoleh skor 60 (mencapai 60% tujuan)



Maka nilai siswa tersebut 60+80+50

3=63,3 dibulatkan menjadi 63

b. Dengan standar relative

1. Pemberian skor terhadap siswa didasarkan atas pencapaian siswa terhadap tujuan

yang ditentukan

2. Nilai diperoleh dengan 2 cara, yaitu

a. Mengubah skor dari tiap-tiap ulangan, lalu diambil rata-ratanya

b. Menjumlah skor tiap ulangan, baru diubah ke nilai

POST TEST

1. Berikut ini adalah hal yang perlu diperhatikan dalam menganalisis butir soal, yaitu

a. Pola jawaban soal dan checking reliabilitas

b. Checking validitas dan daya pembeda

c. Taraf kesukaran dan checking validitas

d. Daya pembeda dan taraf kesukaran

e. pola jawaban soal dan checking validitas

2. Kemampuan sesuatu soal untuk membedakan antara siswa yg berkemampuan tinggi

dan yg berkemampuan rendah disebut...

a. Indeks Diskriminasi

b.Daya Pembeda

c. Indeks Kesukaran

d. Skoring

e. Distraktor

3. Berikut ini pernyataan yg benar adalah, kecuali...

a. soal yg baik memiliki daya pembeda sebesar 0,4-0,7

b. soal dengan D bernilai negatif merupakan soal yg tidak baik

c. soal yg buruk bila distraktornya dipilih oleh > 5%

d. untuk menentukan D bagi kelompok <100, peserta dibagi 2 kelompok (upper dan

lower), masing-masing 50%

e. untuk menentukan D bagi kelompok >100, peserta dibagi 2 kelompok, masing-

masing 27% dan 27%

uraian !

4. Sebutkan 4 cara untuk menilai hasil tes ?

Meneliti secara jujur soal- soal yang sudah disusun.

Mengadakan analisis soal (item analysis).

Mengadakan checking validitas

Mengadakan checking reabilita

5. A memperoleh skor 24, sedangkan skor yang diharapkan adalah 40. tentukan skor

yang diperoleh (obtained score, skor sebenarnya (true score), dan skor kesalahan

(error score)!

skor yang diperoleh (obtained score) = 24, skor sebenarnya (true score) = 40, dan

skor kesalahan (error score) = 16

6. Sebutkan tolak ukur yang disarankan dalam keberhasilan tugas (min 2)!

Ketepatan waktu penyerahan tugas

Bentuk fisik pengerjaan tugas yang menunjukka keseriussan siswa dalam

mengerjakan tugas

Sistematika yang menunjukan alur keruntutan pikiran

Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi

Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah

ditentukan

BAB 13 dan 14

Menganalisis Hasil Tes dan Menskor Dan Menilai

Disusun oleh kelompok 7

Desi Ayu Triana 34151014

Esihana Masrimuna 34151024

Siti Chaerun Nisa 34151014

Pendidikan Biologi Reguler 2010

Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Negeri Jakarta

ppep bab 13 d1n 14.docx

Documents