bab 8 penyediaan ujian pentadbiran dan analisis item
TRANSCRIPT
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
1
Bab 8
PPPEEENNNYYYEEEDDDIIIAAAAAANNN UUUJJJIIIAAANNN,,, PPPEEENNNTTTAAADDDBBBIIIRRRAAANNN DDDAAANNN AAANNNAAALLLIIISSSIIISSS IIITTTEEEMMM
Dalam bab ini, kita akan memperincikan bagaimana merancang sebuah ujian dan
melaksanakan analisis item. Sebuah ujian harus dirancang dengan teliti dan ia
melibatkan beberapa fasa: memperjelaskan tujuan, memilih jenis soalan, membina
sebuah jadual spesifikasi dan merancang pentadbiran ujian. Adalah juga penting
semasa menggubal ujian untuk mengenal pasti kekuatan dan kelemahan setiap item
dengan menggunakan analisis item. Analisis item melibatkan penggunaan tiga
prosedur: kepayahan item, diskriminasi item dan analysis pengganggu untuk
membantu penggubal ujian membuat keputusan samada item-item dalam sebuah
ujian dapat diterima, dimodifikasi ataupun ditolak. Prosedur-prosedur ini adalah agak
mudah dan senang digunakan dan pendidik perlu memahami logik yang mendasari
analisis-analisis ini agar dapat menggunakannya dengan betul dan berkesan.
Di akhir bab ini, anda harus boleh:
Menerangkan fasa-fasa dalam penyediaan ujian
Menyenaraikan garispanduan untuk mentadbir ujian
Mentakrifkan analisis item
Menghitung indeks kepayahan dan diskriminasi
Analisis keberkesanan penganggu dalam soalan
Membincangkan hubungkait antara indeks kepayahan dan indeks diskriminasi sebuah item
BAB SEPINTAS LALU
8.1 Menyediakan sebuah ujian
8.2 Apakah itu Analisis Item?
8.3 Langkah-langkah Analisis Item
8.4 Indeks Kepayahan
8.5 Indeks Diskriminasi
8.6 Hubungkait Antara Indeks
Kepayahan dan Indeks
Diskriminasi
8.7 Analisis Pengganggu
8.8 Pendekatan Praktikal Dalam
Analisis Item
8.9 Bank Item
Ringkasan
Istilah Penting
Rujukan
Bab 1: Pengenalan
Bab 2: Memutuskan apa yang akan
ditaksir
Bab 3: Mentaksir Hasil Pembelajaran
Menggunakan Ujian Objectif
Bab 4: Mentaksir Hasil Pembelajaran
Menggunakan Ujian Karangan
Bab 5: Mentaksir Hasil Pembelajaran
Menggunakan Projek dan Amali
Bab 6: Mentaksir Hasil Pembelajaran
Menggunakan Pencerapan, Ujian
Lisan, dan Portfolio
Bab 7: Kebolehpercayaan dan Kesahan
Kaedah Pentaksiran
Bab 8: Analisis Item
Bab 9: Analisis Pemarkahan Ujian dan
Melaporkan Pentaksiran Pelajar
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
2
8.1 Menyediakan Ujian
Bagi memastikan keputusan yang terbaik, sebuah ujian perlu dirancang.
Sebuah ujian yang baik tidak terjadi dengan sendirinya! Ia terhasil daripada
perancangan yang teliti dan cermat. Perancangan dilaksanakan melalui fasa-fasa
berikut: memperjelaskan tujuan, menyediakan jadual spesifikasi, menentukan format
ujian, menyemak semula, menghimpunkan, mereproduksi dan melaksanakan ujian
(lihat Gambarajah 8.1).
Gambarajah 8.1 Fasa-fasa Dalam Penyediaan dan Pentadbiran Ujian
FASA 1: MEMPERJELASKAN TUJUAN
Cubalah Tanya seorang guru; Apakah tujuan ujian yang anda sedang bina? Jawaban yang kemungkinan besar anda akan terima adalah: Bagi melihat banyak mana pelajar tahu tentang mata pelajaran tersebut. Jawaban seperti ini memberi tanggapan bahawa pengujian adalah untuk member gred, iaitu suatu tujuan yang
berasas. Walau bagaimanapun, ini mungkin suatu pernyataan tujuan yang tidak
memuaskan. Seperti yang kita telah bincangkan dalam Bab-bab 2 sehinga 6, kita ingin
mentaksir hasil pembelajaran menggunakan berbagai teknik pentaksiran seperti soalan aneka pilihan, esei, projek, amali dan sebagainya. Suatu cara untuk melihat
tujuan pentaksiran atau pengujian yang lengkap dan tepat adalah seperti berikut:
Bagi mengukur tahap pencapaian keseluruhan dalam bidang kursus untuk tujuan member gred
Menghimpun
Mereproduksi
Mentadbir
Memperjelaskan
Tujuan
Jadual Spesifikasi
Format Ujian
Menyemak Semula
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
3
Bagi menentukan sejauhmana individu pelajar dan kumpulan secara keseluruhannya telah menguasai keperluan minimum kursus atau mata
pelajaran
Bagi menentukan tahap fungsi kognitif, afektif dan psikomotor pelajar yang dapat diterjemahkan kepada suatu keterangan tentang apa dia boleh buat
Suatu pernyataan tujuan pengujian yang menyeluruh harus memberi indikasi yang
jelas tentang bentuk keputusan yang guru ingin buat, bentuk data yang diperlukan
serta ciri-ciri individu dan kumpulan yang mana keputusan tersebut dibuat. Anda
perlu mencari jawaban kepada soalan-soalan berikut:
Apakah keputusan yang anda ingin buat berdasarkan keputusan ujian tersebut?
Apakah data yang anda perlukan untuk dapat membuat keputusan tersebut?
FASA 2: MENYEDIAKAN JADUAL SPESIFIKASI
Fasa berikutnya dalam pembinaan sebuah ujian adalah untuk menggubal suatu
rancangan ujian. Ini ada kalanya dipanggil sebagai sebuah "jadual spesifikasi" atau
"rangka tindakan" untuk ujian anda (Gronlund, 1988).
Tahap Hasil Pembelajaran
Topik
1
Topik
2
Topik
3
Topik
4
TOTAL
Pengetahuan:
Mengingat semula takrif
Mengenal pasti
1
-
1
1
-
1
1
-
5 (12.5%)
Pemahaman
Membuat interpretasi
Mengklasifikasi
Membuat inferensi
Membandingkan
Menjelaskan
1
-
1
-
-
-
-
-
1
-
-
1
-
-
1
1
-
1
-
-
7 (17.5%)
Aplikasi
Menyelesai
Mengaitkan
Menggunakan
2
1
1
1
2
1
1
1
1
1
1
2
15 (37.5%)
Analisis
Menganalisis
Mengasingkan
Membuat inferensi
2
-
1
1
-
1
2
1
-
1
1
-
10 (25.0%)
Sintesis
Mereka
-
1
-
1
2 (5.0%)
Penilaian
Menjustifikasi
-
-
1
-
1 (2.5%)
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
4
JUMLAH 10
(25%)
10
(25%)
10
(25%)
10
(25%)
40
Jadual 8.1 Contoh Jadual Spesifikasi
Ia bertujuan membantu memastikan agar ujian tersebut akan menjadi suatu
perwakilan objektif-objektif pembelajaran yang sah dan agar kandungan-kandungan
yang dicakupi dalam ujian mencerminkan penekanan yang anda letakkan dalam
pengajaran, nota-nota dan perbincangan dalam kelas. Dengan menyenarai kandungan
atau topik dan peratusan penekanan baginya, anda membina suatu struktur untuk ujian
anda. Anda juga mungkin ingin mempertimbangkan tahap kefahaman yang anda
mahukan pelajar anda perolehi tentang setiap topik. Sebagai contoh, adakah anda
ingin pelajar anda sekadar boleh mengingat semula maklumat, ataupun anda ingin
agar mereka memahami atai mengaplikasi maklumat kepada suatu situasi yang baru.
Anda boleh membuat suatu matriks dengan menyenaraikan kandungan atau
topik sebagai baris-baris, dan tahap pemikiran atau kemahiran proses (seperti
mengingat semula, memahami, mengaplikasi, menganalisis, mensintesis atau menilai)
sebagai lajur (lihat Jadual 8.1). Jadual spesifikasi mengenal pasti objektif-objektif dan
kemahiran-kemahiran yang diuji dan pemberat yang diberikan kepada setiap
daripadanya pada ujian tersebut. Jadual spesifikasi boleh membantu anda menentukan
yang anda mendapat liputan yang diinginkan untuk topic-topik dan tahap-tahap bagi
setiap objektif. Rangka tindakan tersebut membolehkan guru mensampel hasil-hasil
pengajaran secara seimbang, dengan memberikan penekanan secukupnya kepada
jenis-jenis objektif dan juga kandungan.
FASA 3: FORMAT UJIAN
Setelah menggariskan tujuan dan spesifikasi, anda perlu membuat beberapa
keputusan teknikal terlebih dahulu:
a) Bentuk ujian Aneka pilihan, esei, amali, projek, ujian lisan b) Panjangnya ujian dan peruntukan masa jumlah bilangan soalan c) Arahan-arahan
a) Bentuk Ujian
Apabila anda membuat rangka tindakan ujian anda, anda bolehlah mula
menulis item-item. Apabila anda menulis atau memilih item-item (daripada
sumber lain) anda harus mengikut rancangan anda dan sampel item tersebut akan
mewakili kandungan kursus anda. Menggubal sebuah rancangan ujian juga
membantu anda menentukan jenis item-item yang anda ingin masukkan dalam
ujian anda. Pilihan anda di antara item esei dan item objektif bergantung kepada
jenis-jenis objektif yang anda telah gubal dan tahap pemikiran yang anda ingin uji.
Anda mungkin ingin menggabungkan beberapa jenis item dalam ujian anda.
b) Panjangnya Ujian dan Peruntukan Masa
Semasa menulis item-item ujian, anda harus mempertimbangkan
panjangnya ujian atau peperiksaan tersebut dan juga tahap pembacaan pelajar
anda. Anda tidak mahu pelajar anda merasa didesak dan kecewa kerana mereka
tidak boleh menunjukkan pengetahuan mereka tentang bahan dalam masa yang
diperuntukkan. Beberapa garispanduan mengenai keperluan masa untuk pelajar
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
5
sekolah menengah yang mengambil ujian ditunjukkan dalam Jadual 8.2 (Nitko,
2004). Sekiranya anda menggabungkan soalan aneka pilihan dan item-item esei,
anggaran-anggaran ini mungkin dapat membantu anda menentukan berapa item
yang perlu dimasukkan. Salah satu kesilapan yang sering dibuat oleh pendidik
adalah memasukkan terlalu banyak soalan bagi masa yang diperuntukkan.
Tugasan Anggaran Masa Bagi Setiap Item
Item betul/salah 20-30 saat
Item aneka pilihan (fakta) 40-60 saat
Item aneka pilihan (kompleks) 70-90 saat
Item memadankan (5 stem/6 pilihan) 2-4 minit
Item jawaban pendek 2-4 minit
Item aneka pilihan (dengan penghitungan) 2-5 minit
Masalah dalam perkataan (kiraan mudah) 5-10 minit
Esei pendek 15-20 minit
Analysis data / membuat geraf 15-25 minit
Esei panjang 35-50 minit
Jadual 8.2 Peruntukan Masa Untuk Setiap Jenis Item
d) Arahan-arahan
Apabila soalan-soalan anda telah digubal, pastikan anda memasukkan
arahan-arahan yang jelas kepada pelajar. Bagi item-item objektif, khususkan
samada pelajar harus memilih satu jawaban bagi setiap item dan beri indikasi
nilai mata bagi setiap soalan, khususnya apabila anda memberi pemberat yang
berlainan bagi setiap bahagian dalam ujian. Bagi item-item esei, beri indikasi
nilai mata dan cadangkan masa untuk diluangkan untuk seriap item. Sekiranya
anda mengajar dalam sebuah kelas yang besar dengan kedudukan kerusi-
kerusi yang rapat dan anda menyediakan ujian objektif, anda mungkin perlu
mempertimbangkan untuk mentadbir beberapa versi ujian anda untuk
mengurangkan peluang meniru. Cukup kalau anda menyediakan beberapa
versi ujian anda dengan susunan item-item yang berbeza.
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
6
FASA 4: SEMAK SEMULA
Walau bagaimana bagus penguasaan anda tentang mata pelajaran atau
bagaimana tinggi kemahiran anda dalam membina sebuah ujian, anda selalunya akan
mendapat manafaat daripada menyemak semula bahan-bahan ujian. Apabila anda
telah mengerjakan bahan-bahan yang sama selama beberapa waktu, ada kemungkinan
anda hilang kesegaran berbanding semasa memulakan tugasan tersebut. Hasilnya,
anda mungkin gagal menjumpai kekeliruan dan kesalahan-kesalahan teknikal lain
yang mungkin menyelinap masuk ke dalam ujian tersebut. Adalah suatu amalan yang
baik untuk menyerahkan bahan-bahan kepada seorang atau lebih rakan ataupun
sebuah jawatankuasa penyemak semula bagi mendapatkan pandangan kritikal mereka.
Penyemak semula harus diminta melihat soalan-soalan, merekod pilihan mereka atau
menggariskan jawaban mereka secara bersendiri. Pengalaman ini harus membolehkan
mereka menghakimi kesesuaian setiap item atau soalan serta menjumpai kesalahan-
kesalahan (Furst, 1972). Berikut adalah beberapa perkara penyemak semula harus
semak:
Semak jawaban-jawaban yang dihajatkan (untuk soalan esei) atau pilihan jawaban (untuk ujian objektif) berbanding soalan.
Semak sekiranya ada item-item atau soalan-soalan yang bertindih.
Semak set response set dimana tidak terdapat corak yang dapat dikenal pasti dalam satu siri respon untuk item ujian objektif.
FASA 5: MENGHIMPUN
Selepas soalan ditulis dan disemak semula, soalan-soalan itu harus
dihimpunkan dalam suatu bentuk yang bermakna. Menurut Furst (1972), terdapat
beberapa cara menghimpun soalan-soalan atau item-item: 1) mengikut bidang; 2)
mengikut objektif; 3) mengikut bentuk; dan 4) Mengikut tahap kepayahan. Tidak ada
satu cara penghimpunan yang secara sendirinya lebih baik daripada yang lain.
Asalkan anda dapat memberi rational bagi pilihan anda, mana-mana cara
penghimpunan tersebut dapat diterima.
Mengikut bidang adalah apabila anda menghimpun soalan-soalan mengikut kandungan yang dicakupi oleh ujian. Sebagai contoh, kandungan yang diuji
diambil daripada empat bidang (mungkin empat unit atau topik); adalah
memudahkan bagi tujuan pemeriksaan (ataupun pemarkahan) dan membuat
interpretasi tentang prestasi untuk menghimpun soalan-soalan mengikut empat
bidang tersebut. Dalam setiap bidang, anda seterusnya boleh merombak
soalan-soalan tadi ataupun menyusunnya mengikut tahap kepayahan ataupun
mengikut objektif.
Mengikut objektif adalah apabila anda menghimpun atau menyusun ikut turutan soalan-soalan mengikut objektif atau hasil pembelajaran. Sebagai
contoh, anda mungkin menghimpun soalanan-soalan yang mengukur daya
SEMAK KENDIRI 8.1
a) Apakah tujuan Jadual Spesifikasi?
b) Pernahkah anda menggunakan Jadual Spesifikasi? Jelaskan.
c) Adakah anda bersetuju dengan peruntukan masa bagi setiap
jenis soalan seperti dalam Jadual 8.2?
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
7
ingatan fakta dan prinsip sementara sebuah kumpulan lain terdiri daripada
soalan-soalan yang berkaitan aplikasi konsep dan prinsip.
Mengikut bentuk adalah apabila anda menghimpun soalan-soalan mengikut jenis soalan. Sebagai contoh, Bahagian A mungkin terdiri daripada jenis
soalan objektif sementara Bahagian B mungkin terdiri daripada soalan esei.
Mengikut tahap kepayahan adalah apabila anda menghimpun mengikut tahap kepayahannya. Sebagai contoh, adalah menjadi amalan biasa untuk
memulakan ujian dengan item-item senang bagi memberi pelajar peluang
untuk memanaskan badan dan membina keyakinan. Ia juga menjarakkan tugasan agar pelajar boleh mengusahakan tugasan secara semakin mencabar
sehingga ke had kebolehan mereka dan tidak disekat pada awal lagi
disebabkan item-item susah.
FASA 6: REPRODUKSI
Apabila ujian telah siap, langkah seterusnya adalah untuk menghasilkan
semula atau membuat banyak salinan ujian untuk ditadbir. Walau bagaimanapun, isu
membuat salinan ujian tidak timbul sekiranya anda mentadbir ujian tersebut secara
atas talian. Pastikan cetakannya jelas, khususnya apabila grafik digunakan seperti
gambar, gambarajah, formula, simbol-simbol matematik dan sebagainya. Misalnya,
sekiranya gambar merupakan komponen penting sebuah soalan, semak sekiranya anda
perlukan gambar berwarna ataupun gambar hitam putih sudah memadai.
FASA 7: PENTADBIRAN UJIAN
Matlamat pentadbiran ujian adalah untuk memastikan keadaan yang paling
konsisten dengan tujuan ujian. Dalam kes ujian pencapaian, ini bermakna membentuk
keadaan yang akan memastikan kerja yang paling cekap untuk pelajar yang
mengambil ujian tersebut. Pentadbiran ujian boleh menjadi suatu aktiviti yang
kompleks khususnya sekiranya ia melibatkan bilangan pelajar yang ramai.
Keadaan yang betul Anda perlu memastikan bahawa semua keadaan fizikal menyokong kerja yang baik. Harus ada cahaya dan aliran udara yang
mencukupi, suhu yang selesa, kesenyapan, kerusi yang selesa serta cukup
ruang kerja agar pelajar dapat menebarkan bahan-bahan mereka. Sekiranya
saiz kumpulan memerlukan penggunaan sebuah dewan atau auditorium,
akustik harus memuaskan dan sebuah sistem PA harus digunakan.
Prosedur melaksanakan ujian Pastikan semua butiran tentang prosedur dituliskan dan dibincang terlebih dahulu, dan ujian harus dilaksanakan dengan
cermat. Bagi mengelakkan gangguan dan kekeliruan, bahan ujian harus
diagihkan dan dikumpulkan mengikut rancangan. Sebagai peraturan
menyeluruh, bahan tambahan atau sokongan harus diagihkan sebelum buku
jawaban dan kertas soalan diagihkan. Senaraikan peraturan yang berkaitan
dengan yang berikut:
o Pelajar meminta penjelasan tentang arahan-arahan o Pelajar meminta takrif sesuatu konsep yang ada dalam soalan.
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
8
8.2 APAKAH ANALISIS ITEM?
Setelah mentadbir ujian dan
memeriksanya, ramai guru yang akan
membincangkan jawaban dengan pelajar.
Perbincangan selalunya tertumpu kepada
jawaban yang betul dan kesalahan yang biasa
dilakukan oleh pelajar. Ada juga guru yang
menumpukan kepada soalan yang ramai
pelajar menjawab dengan lemah serta soalan
yang pelajar menjawab dengan baik. Walau
bagaimanapun, terdapat lebih banyak
maklumat information tentang sesebuah ujian
yang selalu ditinggalkan oleh guru. Maklumat
ini akan hanya timbul sekiranya Analisis Item
dilakukan. Apakah analisis item? Analisis
item merupakan suatu proses yang meneliti
respon-respon pelajar terhadap setiap item atau soalan ujian bagi mentaksir mutu
item-item tersebut dan ujian tersebut secara keseluruhan. Analisis item sangat bernilai
dalam memperbaiki item-item atau soalan-soalan yang akan digunakan lagi dalam
ujian-ujian kemudian, dan ia juga boleh digunakan untuk menolak item-itemyang
kabur atau mengelirukan dalam sesebuah ujian. Khususnya, analisis item merupakan
sebuah proses mencari indeks kepayahan, indeks diskriminasi dan keberkesanan
pengganggu. [Kita akan membincangkan setiap component analisis item ini secara
terperinci kemudian].
Mutu sesebuah ujian ditentukan oleh mutu setiap item atau soalan dalam ujian
tersebut. Guru yang membina sebuah ujian hanya boleh menganggar secara kasar
mutu ujian tersebut. Anggaran ini adalah berdasarkan hakikat bahawa guru telah
menuruti semua peraturan dan syarat pembinaan ujian. Walau bagaimanapun,
mungkin juga suatu anggaran tidak tepat dan beberapa aspek penting telah
ditinggalkan. Dengan itu, adalah disarankan agar kita melaksanakan analisis item ke
atas respon pelajar bagi mendapatkan kefahaman yang menyeluruh tentang ujian
tersebut. Analisis item dilaksanakan untuk mendapatkan maklumat tentang setiap item
8.1 AKTIVITI
a) Bincangkan bagaimana anda menyemak (atau memoderasi)
kertas ujian atau peperiksaan dalam bidang anda.
b) Adakah ada cara yang istimewa anda menghimpun soalan-
soalan ujian dalam bidang anda?
c) Apakah masalah yang timbul semasa pentadbiran sebuah
ujian atau peperiksaan dalam bidang anda?
d) Sejauhmanakah sekolah atau institusi anda mengikut fasa-
fasa penyediaan ujian yang telah dibincangkan?
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
9
atau soalan dalam sebuah ujian dan bagaimana ujian tersebut dapat diperbaiki. Ia juga
dapat membantu penggubalan sebuah bank item atau soalan (Anastasi, 2001).
8.2 LANGKAH-LANGKAH DALAM ANALISIS ITEM
Mari kita mengambil contoh seorang guru yang telah
menjalankan sebuah ujian objektif dengan 30 item
aneka pilihan dalam mata pelajaran geografi kepada
45 orang pelajar sekolah menengah.
Langkah 1: Tentunya, selepas menerima buku
jawaban, langkah pertama adalah untuk memeriksa
setiap buku jawaban.
Langkah 2: Susunkan 45 buku jawaban tadi
daripada markah tertinggi kepada markah terendah yang diterima. Buku jawaban
dengan markah tertinggi diletakkan di atas dan buku jawaban dengan markah
terendah diletakkan di bawah.
Langkah 3: Kalikan 45 (bilangan buku jawaban) dengan 0.27 (atau 27%) iaitu12.15
dan dibulatkan menjadi 12. Penggunaan nilai 0.27 atau 27% bukan tetap. Anda boleh
menggunakan mana-mana peratusan daripada 27% sehingga 35% sebagai nilai.
Langkah 4: Susunkan 45 buku jawaban tadi mengikut markah yang diterima
(daripada markah tertinggi kepada markah terendah). Keluarkan 12 buku jawaban
daripada atas longgokan tadi dan 12 buku jawaban daripada bawah longgokan. Kita
gelarkan longgokan-longgokan ini sebagai pelajar markah tinggi dan pelajar markah rendah. Ketepikan buku-buku jawaban di pertengahan (21 buku jawaban). Walaupun ini boleh dimasukkan dalam analisis ini, dengan menggunakan hanya
kumpulan tinggi dan rendah memudahkan prosedur ini.
Langkah 5: Rujuk kepada Item #1 atau Soalan #1,
Kira bilangan pelajar daripada kumpulan markah tinggi yang menjawab setiap pilihan (A, B, C atau D),
Kira bilangan pelajar daripada kumpulan markah rendah yang menjawab pilihan A, B, C atau D (lihat Gambarajah 8.3).
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
10
Jadual 8.3 Analisis Item Untuk Satu Item atau Soalan
Daripada analisis ini, 11 pelajar daripada kumpulan Markah Tinggi dan 2 pelajar daripada kumpulan Markah Rendah memilih jawabanB iaiut jawaban yang betul. Ini bermakna bahawa 13 daripada 24 pelajar telah memilih jawaban yang betul.
Dan juga, perhatikan bahawa pengganggu-pengganggu; A, C & D) telah dipilih oleh
sekurang-kurangnya satu pelajar. Walau bagaimanapun, maklumat yang diberi dalam
Gambarajah 8.1 tidak memadai dan analisis lanjut harus dilaksanakan.
8.3 INDEKS KEPAYAHAN
Dengan menggunakan maklumat yang diberi dalam Jadual 8.3, ada dapat
menghitung Indeks Kepayahan iaitu suatu indikator kuantitatif tentang tahap kepayahan setiap item atau soalan. Ia dapat dihitung menggunakan formula berikut:
Bilangan Pelajar Dengan Jawaban Betul (R)
Indeks Kepayahan =
( p ) Bilangan Pelajar Yang Cuba Menjawab (T)
R 13
= = = 0.54
T 24
Apakah maksud Indeks Kepayahan (p) yang berjumlah 0.54? Indeks kepayahan
merupakan pekali yang menunjukkan peratusan pelajar yang menjawab dengan betul
berbanding bilangan pelajar dalam dua kumpulan tadi yang mendapat jawaban yang
salah. Dalam erti kata lain, 54% pelajar telah memilih jawaban yang betul. Walaupun
hitungan ini berdasarkan kumpulan markah tinggi dan rendah sahaja, ia memberikan
Soalan 1: Ujian Geografi
Apakah nama kawasan subur dalam padang pasir dimana mata air sampai ke
permukaan tanah?
A. miraj B. oasis C. mata air D. polder
Analisis Item
Pilihan A B C D Kosong
Kumpulan Markah Tinggi (n=12) 0 11 1 0 0
Kumpulan Markah Rendah (n=12) 3 2 3 4 0
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
11
suatu anggaran yang hampir kepada anggaran yang mungkin dibuat dengan kesemua
pelajar. Dengan itu, kita boleh katakana bahawa indeks kepayahan untuk item ini
adalah 54% (untuk kumpulan ini). Perhatikan, oleh kerana kepayahan merujuk kepada
peratusan yang menjawab item dengan betul, lebih kecil peratusan maka lebih payah
item tersebut. Lien (1980) memberikan beberapa garispanduan tentang maksud indeks
kepayahan seperti berikut (lihat Gambarajah 8.4):
Jadual 8.4 Interpretasi Indeks Kepayahan (p)
Sekiranya seorang guru percaya bahawa pencapaian 0.54 dalam item tersebut
adalah terlalu rendah, dia boleh mengubah cara dia mengajar bagi lebih memenuhi
objektif yang diwakili oleh item tersebut. Satu lagi interpretasi ialah bahawa mungkin
item itu terlalu susah atau mengelirukan, ataupun tidak sah, dan dalam kes ini guru
mungkin menolak item tersebut atau mengubahnya, dengan menggunakan maklumat
daripada samada indeks diskriminasi item atau analisis pengganggu.
8.4 INDEKS THE DISKRIMINASI
Indeks Diskriminasi merupakan ukuran asas yang menunjukkan sejauhmana sebuah soalan mengasingkan atau membezakan antara pelajar dalam kumpulan
Markah Tinggi dan kumpulan Markah Rendah. Indeks ini boleh diinterpretasi sebagai suatu indikator sejauhmana keseluruhan pengetahuan tentang kandungan
pelajaran atau penguasaan kemahiran dikaitkan dengan respon kepada sesebuah item.
Yang paling penting dalam sebuah item ujian adalah samada seorang pelajar telah
mendapat jawaban betul atau salah disebabkan pengetahuan atau kemahirannya dan
> 0.70 = Mudah 0.30 0.69 = Sederhana < 0.29 = Payah
8.1 AKTIVITI
Seorang guru telah memberikan sebuah ujian sains 20 item
kepada sekumpulan 35 pelajar. Jawaban betul untuk
Soalan #25 adalah C dan keputusannya adalah berikut: Pilihan A B C D Kosong
Kump Markah Tinggi 0 2 8 2 0
(n= 10)
Kump Markah Rendah 2 4 3 2 1
(n- 10)
a) Hitungkan indeks kepayahan (p) untuk soalan #25. b) Adakah Soalan #25 sebuah soalan yang payah atau senang? c) Adakah anda berpendapat anda harus memperbaiki Soalan #25?
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
12
bukan disebabkan sesuatu perkara lain seperti nasib atau bias dalam ujian (Kubiszyn
dan Borich, 2006)
Perhatikan dalam contoh kita yang terdahulu, 11 dalam kumpulan markah
tinggi dan 2 pelajar dalam kumpulan markah rendah telah memilih jawaban yang
betul. Ini menunjukkan diskriminasi yang positif, kerana item tersebut membezakan
antara pelajar dengan cara yang sama ujian keseluruhan juga berbuat demikian. Iaitu,
pelajar dengan markah tinggi dalam ujian (kumpulan markah tinggi) telah lebih
selalunya menjawab item tersebut dengan betul berbanding pelajar yang mendapat
markah rendah (kumpulan markah rendah). Walaupun analisis melalui penelitian
mungkin apa yang perlu dibuat untuk kebanyakan tujuan, indeks diskriminasi dapat
dihitung menggunakan formula berikut dengan lebih mudah:
Indeks Diskriminasi =
Bilangan pelajar dalam kumpulan Markah Tinggi (RH ) dengan jawaban yang betul u)
Tolak ( ) Bilangan pelajar dalam kumpulan Markah Rendah (RL ) dengan jawaban yang betul
Bahagi dengan ( ) Separuh Jumplah Bilangan Pelajar yang Cuba Menjawab Soalan (T)
Contoh: Sebuah ujian telah diberikan kepada sekumpulan 43 pelajar dan 10 daripada
13 orang dalam kumpulan Markah Tinggi telah mendapat jawaban tersebut dengan betul berbanding 5 daripada 13 orang dalam kumpulan Markah Rendah yang mendapat jawaban betul. Indeks diskriminasi tersebut dihitung seperti berikut:
RH RL 10 5 10 5 = = = = 0.38
T (26) 13
Apakah maksud Indeks Diskriminasi 0.38? Indeks diskriminasi merupakan pekali
yang menunjukkan sejauhmana soalan tersebut mengasingkan atau membezakan
antara pelajar dengan Markah Tinggi dan pelajar dengan Markah Rendah. Blood dan Budd (1972) memberikan garispanduan berikut tentang maksud indeks
diskriminasi (lihat Jadual 8.5):
Jadual 8.5 Interpretasi Indeks Diskriminasi
Value Description Suggestion > 0.40 high discrimination Question is retained 0.20 0.39 moderate discrimination Question is checked & revised 0.10 0.19 low discrimination Question is removed or rewritten 0.00 & negative no discrimination Question is removed
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
13
Sebuah soalan yang mempunyai indeks diskriminasi yang tinggi dapat membezakan
antara pelajar yang tahu dan tidak tahu jawaban kepada soalan itu. Apabila kita
mengatakan bahawa sebuah soalan mempunyai indeks diskriminasi yang rendah, ia
tidak dapat membezakan antara pelajar yang tahu dan pelajar yang tidak tahu
jawabannya. Indeks diskriminasi yang rendah bermaksud bahawa lebih ramai pelajar
Markah Rendah mendapat jawaban betul kerana soalan tersebut terlalu mudah. Ia mungkin juga bermaksud bahawa pelajar daripada kedua-dua kumpulanMarkah Tinggi dan Markah Rendah mendapat jawaban salah disebabkan soalan tersebut terlalu payah.
Formula untuk indeks diskriminasi mungkin tinggi sekiranya lebih ramai
pelajar dalam kumpulan Markah Tinggi memilih jawaban yang betul berbanding pelajar dalam kumpulan Markah Rendah, dan nombor yang terhasil adalah positif. Sekurang-kurangnya, kita mengharapkan mendapat nilai positif, kerana ini
menunjukkan bahawa jawaban betul itu adalah disebabkan kerana pengetahuan
pelajar tentang kandungan.
Lebih tinggi nilai positif (nilai hampir kepada 1.0), lebih kukuh perkaitan antara prestasi ujian keseluruhan dan prestasi dalam item tersebut.
Sekiranya indeks diskriminasi adalah negatif, ini bermaksud bahawa pelajar yang mendapat markah rendah dalam ujian berkemunkinan lebih tinggi
mendapat jawaban yang betul. Ini mungkin suatu situasi yang pelik yang
menunjukkan kesahan yang lemah untuk item tersebut.
8.5 PERKAITAN ANTARA INDEKS KEPAYAHAN DAN INDEKS DISKRIMINASI
Secara Teori, lebih payah sebuah soalan (atau item) ataupun lebih senang
sebuah soalan (atau item), lebih rendahlah indeks diskriminasinya. Stanley dan
Hopkins (1972) mensyorkan sebuah model teori bagi menjelaskan hubungkait
diantara indeks kepayahan dan indeks diskriminasi sesebuah soalan atau item (lihat
Gambarajah 8.2). Menurut model tersebut, indeks kepayahan 0.2 mungkin membawa
kepada indeks diskriminasi lebih kurang 0.3 untuk sebuah item (yang mungkin
diterangkan sebagai sebuah item dengan diskriminasi yang sederhana). Perhatikan bahawa, sambil indeks kepayahan menaik daripada 0.1 kepada 0.5, indeks
8.2 AKTIVITI
Seorang guru telah memberi sebuah ujian ekonomi dengan
35 item kepada 42 pelajar. Untuk Soalan #16, 8 daripada 11
pelajar kumpulanMarkah Tinggi telah mendapat jawaban betul berbanding 4 orang daripada 11 dalam kumpulan
Markah Rendah yang mendapat jawaban betul.
a) Hitungkan indeks diskriminasi untuk Soalan #16. b) Adakah Soalan #16 mempunyai indeks diskriminasi yang tinggi atau
rendah?
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
14
diskriminasi menaik dengan lebih tinggi. Apabila indeks kepayahan mencapai 0.5
(dijelaskan sebagai sebuah item dengan kepayahan sederhana), indeks diskriminasi adalah positif 1.00 (diskriminasi yang tinggi). Yang menarik, indeks kepayahan > 0.5
membawa kepada indeks diskriminasi yang menurun.
1.00
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.00
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Gambarajah 8.2 Hubungkait Teoretikal antara Inde Kepayahan dan
Indeks Diskriminasi
[sumber: G. Stanley dan D. Hopkins, 1972. Introduction to Educational
Measurement and Testing. Boston: Macmillan. p.270]
Contohnya, indeks kepayahan 0.9 menghasilkan indeks diskriminasi lebih kurang 0.2 yang menerangkan item sebagai mempunyai diskriminasi rendah
hingga sederhana. Apakah maksudnya? Lebih payah sesebuah soalan, lebih
sukar untuk soalan atau item itu mengasingkan antara pelajar yang tahu dan
tidak tahu jawaban kepada soalan itu.
Sama juga, apabila indeks kepayahan adalah lebih kurang 0.1, indeks diskriminasi jatuh sehingga lebih kurang 0.2. Apakah maksudnya? Lebih
mudah soalan itu, lebih sukar soalan atau item itu mengasingkan antara pelajar
yang tahu dan yang tidak tahu jawaban kepada soalan itu.
Indeks
Diskrimi
-nasi
Indeks Kepayahan
Soalan
terlalu
payah
Soalan
terlalu
senang
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
15
8.6 ANALISIS PENGGANGGU
Tambahan kepada meneliti prestasi keseluruhan item ujian, guru juga ingin
meneliti prestasi setiap pengganggu (pilihan jawaban yang tidak betul) pada item
aneka pilihan. Dengan menghitung bahagian pelajar yang memilih setiap pilihan
jawaban, guru dapat mengenal pasti pengganggu yang mana yang "bertugas" dan
nampak menarik kepada pelajar yang tidak tahu jawaban betul, dan pengganggu yang
mana sekadar mengisi ruang kosong dan tidak dipilih oleh ramai pelajar. Bagi
mengelakkan pelajar meneka membuta tuli yang menghasilkan jawaban yang betul
semata-mata kerana nasib (yang mengurangkan kesahan sesebuah item ujian), guru
mahukan sebanyak mungkin pengganggu yang berkemungkinan. Analysis pilihan
respon membolehkan guru memperincikan dan memperbaiki item-item yang mereka
ingin gunakan lagi untuk kelas-kelas akan datang. Mari kita perincikan prestasi
sebuah item atau soalan (lihat Jadual 8.6)
Negara Eropah manakah yang menakluk Melaka dalam tahun 1511?
Portugis Belanda Spain Inggeris
Pilihan A B C D Tiada Respon
Kump Markah Tinggi (n=12) 5 5 0 2 0
Kump Markah Rendah (n=12) 3 4 0 5 0
Jadual 8.6 Keberkesanan Pengganggu
Umumnya, sebuah pengganggu harus boleh menarik lebih ramai pelajar Markah Rendah untuk memilih respon itu ataupun mengganggu pelajar Markah Rendah untuk menjawab sesuatu respon tertentu. Apakah yang menentukan keberkesanan
sesebuah pengganggu? Lihat Gambarajah 8.5 yang menunjukkan bagaimana 24
pelajar memilih jawaban A, B, C dan D untuk sesuatu soalan. Pilihan B adalah sebuah
pengganggu yang kurang berkesan kerana ramai pelajar Markah Tinggi (n = 5) telah memilih pilihan B. Pilihan D adalah suatu pengganggu yang lebih baik kerana 2
pelajar daripada kumpulan Markah Tinggi dan 5 pelajar daripada kumpulan Markah Rendah memilih pilihan ini. Analisis pilihan respon ini menunjukkan bahawa mereka yang tersalah dalam item itu mungkin memilih pilihan B atau D.
Tiada pelajar memilih pilihan C. Pilihan C tidak bertindak sebagai sebuah
SEMAK KENDIRI 8.2
a) Apakah yang dapat anda rumuskan tentang perkaitan antara
indeks kepayahan sebuah item dan indeks diskriminasinya?
b) Adakah anda mempertimbangkan faktor-faktor ini semasa
memberi sebuah ujian objektif kepada pelajar di sekolah anda?
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
16
pengganggu yang baik. Sebenarnya pelajar tidak
memilih daripada empat pilihan dalam item ini, mereka
hanya memilih daripada tiga pilihan, kerana mereka tidak langsung
mempertimbangkan pilihan C. Ini menjadikan meneka jawaban dengan betul lebih
berkemungkinan, yang akan mengurangkan kesahan item tersebut. Indeks
diskriminasi boleh diperbaiki dengan mengubah dan memperbaiki pilihan B dan C.
8.7 PENDEKATAN PRAKTIKAL DALAM ANALISIS ITEM
Ada guru medapati teknik-teknik yang dibincangkan terlebih dahulu
mengambil masa dan ini tidak dapat dinafikan (lebih-lebih lagi jika anda mempunyai
ujian dengan 40 item). Walau bagaimanapun, ada suatu pendekatan yang lebih
practikal yang mengambil kurang masa. Bayangkan anda telah mentabir sebuah ujian
dengan 40 item kepada sebuah kelas dengan 30 pelajar. Tentunya, untuk menganalisis
keberkesanan setiap item akan mengambil masa dan mungkin akan menghalang guru
daripada menganalisis setiap item dalam ujian tersebut. Diederich (1971) mensyorkan
suatu kaedah analisis item yang boleh dilakukan oleh guru dan pelajar di dalam kelas.
Berikut adalah langkah-langkahnya:
Langkah 1: Susunkan 30 buku jawaban daripada markah tertinggi sehingga ke
markah terendah yang diterima.
Langkah 2: Pilih buku jawaban yang menerima markah pertengahan. Himpunkan
kesemua buku jawaban yang mendapat jawaban lebih tinggi daripada itu sebagai
Markah Tinggi (catatkan T pada buku-buku jawaban ini). Himpunkan semua buku jawaban di bawah markah ini sebagai kumpulan Markah Rendah (Tandakan dengan R pada buku-buku jawaban tersebut).
Langkah 3: Bahagikan kelas kepada dua kumpulan (Tinggi dan Rendah) dan agihkan
buku jawaban Tinggi kepada kumpulan Tinggi dan buku jawaban Rendah kepada kumpulan Rendah. Lantik seorang pelajar daripada setiap kumpulan tadi menjadi
penghitung.
8.3 AKTIVITI
Residen British yang manakah yang dibunuh oleh
Maharajalela di Pasir Salak?
H. Low Birch Brooke Gurney
Pilihan A B C D Tiada
Respon
Mark Tinggi (n=15) 4 7 0 4 0
Markah Rendah (n=15) 6 3 2 4 0
Jawaban adalah B.
Analisis keberkesanan pengganggu-penggangu.
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
17
Langkah 3: Seterusnya guru bertanya pelajar.
Guru: Jawaban untuk Soalan #1 adalah C dan siapa yang mendapat betul, angkat tangan kamu. Penghitung daripada kumpulan T: Empat belas daripada kumpulan T Penghitung daripada kumpulanR: Lapan daripada kumpulan R
Langkah 4: Guru mencatat respon-respon tadi pada papan putih seperti berikut:
Tinggi Rendah Jumlah Jawaban Betul
Soalan #1 14 8 22
Soalan #2 12 6 18
Soalan #3 16 7 23
|
|
Soalan #n n n n
Langkah 5: Hitungkan Indeks Kepayahan untuk Soalan #1 seperti berikut:
RT + RR 14 + 8
Indeks Kepayahan = = = 0.73
30 30
Langkah 5: Hitungkan Indeks Diskriminasi untuk Soalan #1 seperti berikut:
RT RR 14 8 6 Indeks Diskriminasi = = = = 0.40
30 15 15
Perhatikan bahawa terlebih awal, kita telah mengambil 27% daripada buku jawaban
dalam kumpulanMarkah Tinggi dan 27% buku jawaban dalam kumpulan Markah Rendah daripada keseluruhan buku jawaban. Walau bagaimanapun, dalam pendekatan ini kita membahagikan jumlah kesemua buku jawaban kepada dua
kumpulan. Tidak ada kumpulan pertengahan. Yang penting adalah menggunakan
pecahan kumpulan yang cukup besar untuk memberi maklumat yang berguna.
Memilih yang atas dan bawah 27 peratus daipada kumpulan adalah disyorkan bagi
mendapatkan suatu analisis yang lebih jitu. Kaedah ini mungkin kurang tepat tetapi ia
merupakan suatu kaedah yang cepat.
8.4 AKTIVITI
Bandingkan indeks kepayahan dan indeks diskriminasi
yang didapati menggunakan kaedah kasar ini dengan model
teoretikal oleh Stanley Hopkins dalam Gambarajah 8.4.
Adakah indeks-indeks tersebut jauh berbeza?
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
18
8.8 BANK ITEM
Sebuah Bank Item merupakan suatu koleksi soalan-soalan atau item-item yang
telah ditadbir dalam masa yang panjang. Untuk ujian pencapaian yang mentaksir
prestasi dalam suatu bidang pengetahuan seperti geografi, sejarah, kimia atau
matematik, soalan-soalan yang boleh disoal agak terhad. Dengan itu, tidak hairanlah
sekiranya soalan-soalan yang pernah digunakandikitar semula dengan beberapa perubahan kecil dan ditadbir kepada sebuah kumpulan pelajar yang lain. Membuat
item-item ujian yang baik bukanlah suatu tugasan yang mudah dan boleh mengambil
maa kepada guru. Sebuah bank item atau soalan dapat membantu guru.
Sebuah bank item terdiri daripada soalan-soalan yang telah dianalisis dan
disimpan sebab mereka merupakan item-item yang baik. Setiap item yang disimpan
akan mempunyai maklumat tentang indeks kepayahan dan indeks diskriminasinya.
Setiap item disimpan mengikut apa yang diukurnya, khususnya berkaitan topik-topik
dalam kurikulum. Item-item ini akan disimpan dalam bentuk jadual spesifikasi yang
mengindikasi kandungan yang diukur serta tahap kognitif yang diukur. Contohnya,
anda akan dapat mengeluarkan daripada bank item, item-item yang mengukur aplikasi
konsep untuk topik tentang Letrik. Anda juga akan dapat mengeluarkan item-item dengan tahap yang berbeza daripada bank tersebut. Kemungkinan, anda ingin
menyusun soalan-soalan yang lebih mudah pada permulaan ujian agar dapat membina
keyakinan pelajar dan memberi soalan-soalan yang lebih susah secara beransur.
Dengan database berkomputer, bank-bank item adalah mudah dicapai. Guru
akan mempunyai beratus-ratus item tersedia daripada mana mereka dapat keluarkan
item-item semasa membina ujian kelas. Ini tentunya akan membantu guru dengan
tugasan remeh membina item-item atau soalan-soalan daripada mula yang selalunya
mengambil masa. Namun begitu, tidak banyak institusi-institusi pendidikan bersedia
dengan bank item seperti itu. Amalan yang lebih biasa adalah untuk guru memilih
item-item atau soalan-soalan daripada buku-buku kerja yang disediakan secara
komersial, kertas-kertas soalan peperiksaan yang lepas dan sampel item-item daripada
buku teks. Sumber-sumber ini tidak mempunyai maklumat tentang indeks kepayahan
dan indeks diskriminasi item-item tersebut, dan tiada juga maklumat tentang tahap
kognitif soalan-soalan tersebut ataupun apa yang ia ingin mengukur. Guru-guru akan
terpaksa memikirkan sendiri ciri-ciri item-item berdasarkan pengalaman mereka
dalam mengajar kandungan tersebut.
8.5 AKTIVITI
a) Sejauhmanakah sekolah-sekolah di Malaysia mempunyai item bank? Jelaskan.
b) Adakah anda berpendapat bahawa guru harus mempunyai
capaian kepada bank item berkomputer? Jelaskan.
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
19
RINGKASAN
Sebuah ujian yang baik adalah hasil daripada perancangan yang cermat dan teliti.
Perancangan dilaksanakan melalui fasa-fasa berikut: memperjelaskan tujuan, menyediakan jadual spesifikasi, menentukan format ujian, menyemak semula,
menghimpun, mereproduksi dan menyediakan garispanduan untuk pentadbiran.
Analisis item merupakan suatu proses yang meneliti respon-respon setiap item atau soalan ujian agar dapat mentaksir mutu item-item tersebut dan ujian secara
keseluruhan.
Analisis item dijalankan untuk mendapatkan maklumat tentang setiap item atau soalan dalam ujian dan bagaimana ujian tersebut dapat diperbaiki.
Indeks Kepayahan merupakan suatu indikator kuantitatif tentang tahap kepayahan sesebuah item atau soalan.
Indeks Diskriminasi merupakan suatu ukuran asas yang menunjukkan sejauhmana sebuah soalan mengasingkan atau membezakan antara pelajar dalam kumpulan
Markah Tinggi dan kumpulan Markah Rendah.
Secara teori, lebih payah sebuah soalan (atau item) ataupun lebih senang sebuah soalan (atau item), lebih rendah indeks diskriminasi.
Dengan menghitung proporsi pelajar yang memilih setiap pilihan jawaban, guru dapat mengenal pasti pengganggu yang mana "bertugas" dan nampak menarik
kepada pelajar yang tidak tahu jawaban betul, dan pengganggu yang mana sekadar
mengisi ruang dan tidak dipilih oleh pelajar.
Umumnya, sebuah pengganggu yang baik dapat menarik lebih ramai pelajar Markah Rendah untuk memilih respon tersebut atau mengganggu pelajar Markah Rendah agar memilih respon tersebut.
Sebuah Bank Item merupakan sebuah koleksi soalan-soalan atau item-item yang telah ditadbir dalam masa yang lama.
ISTILAH PENTING
Menyedia ujian Analisis Item Bank Item
Menyemak semula Indeks Diskriminasi Data Bank Berkomputer
Menghimpun Indeks Kepayahan Pengganggu yang baik
Reproduksi Soalan Payah
Jadual Spesifikasi Analisis Pengganggu
-
Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item
20
RUJUKAN:
Anastasi, A. (2001). Psychological Testing. New York, New York: MacMillan Publishing Company.
Ebel. L. (1979). Essentials of educational measurement. Englewood Cliff, NJ: Prentice-Hall.
Kubiszyn, T. & G. Borich (2006). Educational Testing and Measurement: Classroom Application and Practice. New Jersey: Wiley
Gronlund, N. (1988). How to construct achievement tests. Engelwood Cliffs, NJ: Prentice-Hall.
Furst, J. (1972). Constructing evaluation instruments. New York: Longmans
Nitko, A.J. (2004). Educational assessments of students. Englewood Cliffs, NJ: Prentice-Hall.
Stanley, G. and D. Hopkins (1972). Introduction to educational measurement and testing. Boston: Macmillan.