pengukuran & evaluasi hasil dan proses belajar

429

Upload: others

Post on 05-Oct-2021

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Pengukuran & Evaluasi Hasil Dan Proses Belajar
Page 2: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Pengukuran & Evaluasi Hasil Dan Proses Belajar @Prof. Dr. Yusrizal, M.Pd

Editor : Mukhlisuddin IlyasDesain sampul/Tata Letak: Musthafa.Net

Diterbitkan oleh: Penerbit Pale Media PrimaJln. Melati No171, Sembilegi Baru KidulMaguwoharjo, Depok, SlemanDaerah Istimewa YogyakartaTlp. ((0274) 4332233 Fax: (0274) 485222Email: [email protected]

Cetakan Pertama Oktober 2016Ukuran : 13.5 x 21 cm (a5)Halaman: xii+264

HAK CIPTA DILINDUNGAN UNDANG-UNDANGAll Rights Reserved. Dilarang mengutip atau

memperbanyak sebagian atau seluruh isi buku ini tanpa ada izin ini dari Penerbit.

Page 3: Pengukuran & Evaluasi Hasil Dan Proses Belajar

iii| Pengukuran & Evaluasi Hasil Dan Proses Belajar

Undang-Undang No. 19 tahun 2002Tentang Hak Cipta

1. Barang siapa sengaja melanggar dan tanpa hak melakukan perbuatan sebagaimana dimaksud

dalam pasal (2) Ayat (1) atau pasal 49 Ayat (1) dan Ayat (2) dipidana dengan pidana penjara masing-masing paling singkat 1 bulan dan/atau denda paling sedikit

Rp. 1.000.000,- (satu juta rupiah) atau pidana penjara paling lama 7 (tujuh) tahun dan/atau denda paling

banyak Rp. 500.000.000 (lima ratus juta rupiah)

2. Barang siapa dengan sengaja menyiarkan, memamerkan, mengedarkan, atau menjual kepada umum suatu ciptaan atau barang hasil pelanggaran hak ciptaan atau hak terkait sebagai pada Ayat (1)

dipidanan dengan pidana penjara paling lama 5 (lima) tahun dan/atau denda paling banyak Rp.500.000.000

(lima ratus juta rupiah)

Hak cipta dilindungi Undang-undangAll Right Reserved

Page 4: Pengukuran & Evaluasi Hasil Dan Proses Belajar

iv

Prof. Dr. Yusrizal, M.Pd

| Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 5: Pengukuran & Evaluasi Hasil Dan Proses Belajar

v| Pengukuran & Evaluasi Hasil Dan Proses Belajar

Puji syukur kami panjatkan ke hadirat Allah SWT, atas berkat rahmad, taufik, serta hidayah-NYA penulisan buku “Tanya Jawab Seputar Pengukuran, Penilaian dan Evaluasi Pendidikan” ini dapat diselesaikan. Selawat dan salam semoga dilimpahkan oleh Allah SWT kepada junjungan kita Nabi Muhammad SAW yang senantiasa kita jadikan contoh dan suru teladan dalam kehidupan kita.

Dalam Permendiknas No 16 Tahun 2007 tentang Kualifikasi Akademik dan Standar Kompetensi Guru disebutkan bahwa salah satu kompetensi inti guru adalah menyelenggarakan pengukuran dan evaluasi baik hasil maupun proses belajar. Namun, dari pengalaman mengajar mata kuliah Evaluasi Pendidikan pada berbagai program studi magister pendidikan PPs Unsyiah sejak

PRAKATA

Page 6: Pengukuran & Evaluasi Hasil Dan Proses Belajar

vi

Prof. Dr. Yusrizal, M.Pd

| Pengukuran & Evaluasi Hasil Dan Proses Belajar

tahun 2008 menunjukkan bahwa hampir semua mahasiswa yang umumnya guru, pengetahuan tentang evaluasinya belum memuaskan.

Berdasarkan alasan tersebut buku Pengukuran & Evaluasi Hasil dan Proses Belajar ini disusun. Buku ini terdiri atas Enam Unit yang urutannya sebagai berikut: Unit I.Pengukuran dan Evaluasi, Unit II.Taksonomi Bloom dan Ranah Hasil Belajar, Unit III. Instrumen Evaluasi dan Teknik Penilaian, Unit IV. Kualitas Instrumen, Unit V. Penyusunan Soal dan Penskoran, dan UnitVI. Pengukuran dan Penilaian Ranah Afektif.

Sebagai suatu usaha awal, penulis berharap buku ini dapat bermanfaat dalam membantu para guru dan calon guru memahami dan menggunakannya dalam proses pembelajaran.

Tiada gading yang tak retak, demikian juga buku ini mengandung banyak kekurangan dan kekurangsempurnaan. Karenaya, penulis menerima dengan hati terbuka berbagai saran dan kritik-kritik konstruktif yang dapat dijadikan dasar perbaikan dalam penerbitan berikutnya,

Banda Aceh, Agustus 2016

Page 7: Pengukuran & Evaluasi Hasil Dan Proses Belajar

vii| Pengukuran & Evaluasi Hasil Dan Proses Belajar

DAFTAR ISIPRAKATADAFTAR ISIUNIT I. PENGUKURANDAN EVALUASIBAB 1.Sejarah Pengukuran dan Evaluasi A. Pengembangan Tes Inteligensi B. Pengembangan Tes Prestasi C. Pengembangan tes Karakter dan Kepribadian

BAB 2. Konsep Pengukuran, Penilaian dan Evaluasi A. Pengertian Pengukuran B. Skala Pengukuran C. Pengertian Penilaian D. Penilaian Tradisional dan Penilaian Alternatif E. Pengertian Evaluasi F. Jenis Evaluasi G. Prinsip-Pinsip Evaluasi H. Fungsi Pengukuran dan Evaluasi

BAB.III. Belajar dan Hasil Belajar A. Belajar, Prestasi dan Hasil Belajar B. Pengukuran dan Evaluasi Hasil Belajar C. Instrumen Dalam Evaluasi

UNIT II.TAKSONOMI BLOOM DAN RANAH HASIL BELAJARBAB 4 . Ranah Kognitif A. Taksonomi Bloom Original B. Taksonomi Bloom Revisi

Page 8: Pengukuran & Evaluasi Hasil Dan Proses Belajar

viii

Prof. Dr. Yusrizal, M.Pd

| Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 5. Taksonomi Tujuan Afektif dan Psikomotor A. Taksonomi Ranah Afektif B. Taksonomi Ranah Psikomotor

UNIT III. INSTRUMEN EVALUASI DAN TEKNIK PENILAIANBAB 6. Instrumen Tes A. Pengertian Tes B. Tujuan Tes C. Klasifikasi Tes D. Jenis-Jenis Tes E. Bentuk-Bentuk Tes Hasil Belajar F. Keterbatasan Tes Sebagai Alat Ukur G. Fungsi Tes H. Karakteristik Tes Yang Baik

BAB 7. Bentuk Tes Hasil Belajar A. Tes Objektif B. Tes Esai

BAB 8. Instrumen Nontes A. Konsep Nontes B. Kuesioner (Angket) C. Wawancara (Interview) D. Daftar Cocok (Check List) E. Skala Penilaian (Rating Scale) F. Pengamatan/Observasi G. Jurnal H. Inventori

Page 9: Pengukuran & Evaluasi Hasil Dan Proses Belajar

ix| Pengukuran & Evaluasi Hasil Dan Proses Belajar

I. Penilaan Diri J. Penilaian Oleh Teman Sejawat

BAB 9.Teknik Penilaian A. Penilaian Kinerja B. Penilaian Produk C. Penilaian Proyek D. Penilaian Portofolio

UNIT IV KUALITAS INSTRUMEN DAN ANALISIS BUTIRBAB 10. Validitas Tes A.Konsep Val B. Macam-Macam Validitas C. Pengujian Validitas D. Faktor-Faktor Yang Mempengaruhi Validitas

BAB 11. Reliabilitas Tes A. Pengertian Reliabilitas B. Jenis-Jenis Reliabilitas C. Mengestimasi Koefisien Reliabilitas D. Kesalahan Pengukuran Standar E. Faktor-Faktor Yang Mempengaruhi Reliabilitas F. Hubungan Antara Reliabilitas dan Validitas

BAB 12. Analisis Butir Tes A. Pengertian Analisis Butir Tes B. Manfaat Analisis Butir Tes

Page 10: Pengukuran & Evaluasi Hasil Dan Proses Belajar

x

Prof. Dr. Yusrizal, M.Pd

| Pengukuran & Evaluasi Hasil Dan Proses Belajar

UNIT V. PENYUSUNAN SOAL DAN PENSKORANBAB 13. Penyusunan dan Penulisan Soal A. Penysunan Tes B. Kaidah Penulisan Soal C. Penulisan Soal Penalaran Tinggi BAB 14. Penskoran Hasil Tes A. Penskoran Hasil Tes B. Konversi Skor

UNIT VI.PENGUKURAN DAN PENILAIAN AFEKTIF.BAB 15. Bentuk-Bentuk Skala Pengukuran A.Skala Pengukuran B. Pengukuran dan Penilaian Sikap C. Metode Pengukuran Sikap

BAB 16. Pengembangan Instrumen Afektif A. Prosedur Pengembangan Instrumen B. Penulisan Butir Instrumen BAB 17. Contoh Pengembangan Instrumen Kinerja Guru A. Instrumen Kinerja Guru B. Analisis Hasil Ujicoba

DAFFTAR PUSTAKA

Page 11: Pengukuran & Evaluasi Hasil Dan Proses Belajar
Page 12: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

1 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

UNIT I PENGUKURAN DAN EVALUASI

Pengukuran dan evaluasi merupakan bagian

penting dalam siklus pendidikan. Hasil pengukuran dan

evaluasi sangat berpengaruh dalam pembuatan keputusan

oleh pihak yang terkait seperti guru. Oleh karena itu,

pengukuran dan evaluasi merupakan salah satu kegiatan

utama yang harus dilakukan oleh seorang guru dalam

kegiatan pembelajaran. Dengan pengukuran dan evaluasi,

guru akan mengetahui perkembangan hasil belajar,

intelegensi, bakat, minat, hubungan sosial, sikap dan

kepribadian siswa serta secara umum dapat mengetahui

berhasil dan tidaknya program pembelajaran.

Page 13: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

2 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Pengukuran dan evaluasi hasil belajar siswa yang

menjadi tanggung jawab guru di sekolah merupakan

bagian integral dari keseluruhan proses pendidikan.

Melalui kegiatan pengukuran, dapat diperoleh informasi

mengenai efektivitas pembelajaran, tingkat pencapaian/

keberhasilan belajar siswa, dan daya serap materi

pengajaran yang telah diberikan. Dalam setiap pelaksanaan

pengukuran hasil pembelajaran, guru harus

memperhatikan secara seksama alat ukur maupun kondisi

obyektif yang akan diukur, sehingga hasil pengukuran

benar-benar dapat memberikan gambaran obyektif dan

akurat tentang performa siswa yang diukurnya. Agar evaluasi dapat berhasil dengan baik

diperlukan alat evaluasi yang tepat dan telah teruji dengan

baik. Alat evaluasi harus juga dapat menghasilkan data

yang diperlukan sesuai dengan tujuan evaluasi. Dalam

pembelajaran, guru membutuhkan data yang berkaitan

dengan perkembangan belajar siswa, oleh karena itu guru

melakukan serangkaian pengukuran sesuai dengan jenis

penilaian dan evaluasi. Secara umum dikenal ada dua

macam alat evaluasi, yaitu tes dan nontes. Secara khusus di

dalam kelas alat ukur yang dominan digunakan untuk

mengukur hasil belajar ranah kognitif adalah tes. Nontes

lazimnya digunakan untuk mengukur dan menilai ranah

afektif dan psikomotor.

Page 14: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

3 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 1 SEJARAH PENGUKURAN

DAN EVALUASI

Pengukuran pendidikan berkembang melalui proses

evolusi, yang dimulai dari konsep-konsep sederhana

mengkuantifikasi dan menafsirkan perilaku tertentu, tes

dan pengukuran telah berkembang menjadi proses yang

kompleks meliputi seluruh ukuran kepribadian dan ukuran

bermacam-macam sistem kerja dan operasinya.

Gagasan tentang bagaimana pengukuran asal mula

tidak dapat diketahui secara pasti. Namun, dari sedikit

Page 15: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

4 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

fakta yang ada yang dibuat oleh beberapa ahli psikologi

dapat disimpulkan bahwa konsep-konsep tes dan

pengukuran diawali dengan pengembangan bermacam-

macam tes psikologis.

A. Pengembangan Tes Inteligensi

Jean Etienne Esquirol, Psikiatris Perancis yang

pertama kali melakukan usaha-usaha untuk

menggambarkan perbedaan-perbedaan diantara

kekurangan dan ketololan mental. Dia juga

memperhitungkan sejumlah pengembangan mendatang

dalam studi mengenai keterlambatan mental. Esquirol

menggunakan kemampuan berbahasa sebagai kriteria dari

perasaan-perasaan dalam mencoba mengelompokkan

individu-individu keterlambatan mental. Pada 1838, dia

menulis buku pertamanya Des maladies mentalis, dimana

dia menjelaskan suatu pandangan objektif dan rasional

tentang gangguan mental. Dia dikenal sebagai “Bapak

Psikologi Abnormal”.

Wilhelm Wundth, ahli Filsafat dan Psikologi Jerman

mendirikan laboratorium pertama di dunia, tempat dia

melakukan eksperimen Psikologi di Leipzig, Jerman dalam

1879. Laboratorium ini diperuntukkan bagi mahasiswa-

mahasiswanya yang berminat dalam psikollogi. Kesibukan

utamanya adalah tentang pengukuran perbedaan daya-

daya sesnsori, yang menghasilkan pengetahuan psikofisik.

Dia dikenal sebagai “Bapak Psikologi Eksperimental” dan

“Pendiri Psikologi Modern”

Page 16: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

5 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Hernann Ebbinghaus, ahli Psikologi Eksperimental

Jerman, membuat tes melengkapi kata, yang sampai

sekarang masih digunakan dalam tes-tes inteligensi. Dia

menyelidiki penglihatan warna dan kapasitas mental. Dia

merupakan salah seorang yang pertama

mendemonstrasikan bahwa belajar dan memori dapat

dipelajari secara eksperimen. Meskipun beberapa

tekniknya tentang demonstrasi ini mendapat kritikan,

sumbangan-sumbangannya untuk studi kuantitatif tentang

proses-proses mental lebih tinggi, termasuk tes-tes

inteligensi menjadi penting. Dia dikenal sebagai “Pendiri

Studi Memori Kuantitatif”

Francis Galton, ahli psikologi Inggris, tercatat

sebagai orang paling awal yang menerapkan analisis

statistik pada gejala perilaku dan mental. Dia adalah

seorang peninjau dan penanya inteligensi manusia. Dia

merupakan orang pertama yang menggunakan metode

kuesioner dan survey dalam menyelidiki perbedaan mental

kelompok-kelompok berbeda. Akibatnya, dia mampu

memperbaiki tes-tes pendidikan mental.

Karl Pearson, ahli matematika Inggris yang

mengembangkan teknik-teknik statistik modern. Pada awal

tahun1900-an dia tertarik pada kerja Francis Galton yang

berkeinginan menemukan hubungan-hubungan statistik

untuk menjelaskan bagaimana cirri-ciri biologis

diturunkan ke generasi-generasi. Pearson memperluas

ide-ide regesi Galton dan mengembangkan metode-metode

korelasi yang dikenal “ Koefisien Korelasi Product Moment

Pearson” Sebagian karyanya menjadi dasar statistik abad

ke 20. Pearson adalah mahasiswa Galton.

Page 17: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

6 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Charles Spearman, ahli Psikologi Inggris, yang

terpengaruh selama belajar oleh karya-karya Francis

Galton. Berbekal pengetahuan statistiknya yang kuat, dia

membuat suatu estimasi inteligensi sekelompok anak-anak.

Dia akhirnya mengembangkan teori dua faktor inteligensi.

Seperti Pearson, dia mengembangkan metode korelasi

yang dikenal sebagai “Koefisien Korelasi Perbedaan Rank

Spearman. Spaerman adalah juga mahasiswa Galton.

Edward L.Thorndike, ahli Psikologi Amerika yang

mengembangkan psikologi Conecsionis. Thorndike dan

mahasiswa-mahasiswanya menggunakan pengukuran-

pengukuran inteligensi pada manusia sejak 1903. Selama

1920-an dia mengembangkan sebuah tes inteligensi yang

terdiri dari melengkapi, ilmu hitung, kata-kata, dan

petunjuk-petunjuk tes yang dikenal sebagai “CAVD”. Tes

nya menjadi dasar tes-tes inteligensiu modern .

James McKeen Cattell, adalah ahli Psikologi Amerika,

yang menganggap penting gambar-gambar dalam psikologi

dan dalam mempelajari inteligensi manusia. Menggunakan

metode-metode statistik dan kuantifikasi datanya, dia

membantu pengembangan Psikologi Amerika sebagai sains

eksperimental. Dia merupakan ahli psikologi pertama di

Amerika yang menekankan pentingnya kuantifikasi, rankin,

dan rating. Karena sumbangan-sumbangannya yang

signifikan, dia diakui sebagai “ Bapak Tes Mental”

Clark Wissler, ahli Antropolgi Amerika, yang

menggunakan faktor korelasi untuk menemukan kesalahan

empiris metode testing inteligensi J.M.Cattel. Setelah

belajar di bawah Cattel, dia menilai hasil-hasil usaha Cattel

mengukur kemampuan mental dari siswa-siswa dengan

Page 18: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

7 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

cara mengukur waktu reaksi mereka, waktu gerakan, dan

proses-prosen sensori serta mental sederhana lainnya. Dia

mendapatkan korelasi yang sangat kecil diantara keadaan

akademik dan tes-tes.

Alfred Binet, ahli Psikologi Perancis, yang mulai

belajar sains pada 1878. Penelitian Binet bersama puteri-

puterinya membantuut mengembangkan konsepsi tentang

inteligensi, terutama pentingnya rentang perhatian dan

saran dalam pengembangan intelektual. Sementara

memimpin Laboratorium Psikologi Eksperimental,

Theodore Simon melakulan penelitian doktoral di bawah

supervisi Binet. Kedua mereka mengembangkan Skala

Binet-Simon. Binet dan Simon merupakan peneliti-peneliti

pertama yang menggunakan umur mental sebagai ukuran

inteligensi, namun ide mereka diperbaiki oleh peneliti-

peneliti pada tahun-tahun berikutnya.

Walter V. Bingham, ahli Psikologi Terapan Amerika,

yang mempercayai bahwa inteligensi adalah sesuatu yang

rumit yang dapat diukur dengan melihat sikap-sikap

individu kepada matematis, lisan, mekanis, dan keahlian

sosial. Dia percaya bahwa faktor keturunan adalah paling

penting dalam pengembangan intelektual, dan bahwa

pengaruh-pengaruh lingkungan hanya mengubah apa yang

sudah ada di dalam diri individu.

Henry Herbert Goddard, ahli Psikologi Amerika, pada

1010 mendirikan laboratorium pertama untuk studi

psikologis orang-orang lambat secara mental. Dia

menerjemahkan Skala Binet-Simon ke dalam Bahasa

Inggris. Pandangan-pandangannya tentang inteligensi

adalah berasal atau diturunkan dari genetik Mendelian. Dia

Page 19: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

8 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

mempercayai bahwa feeblemindedness disebabkan oleh

transmisi dari gen recessive tunggal. Dia dikenal sebagai

´Bapak Testing Inteligensi” di Amerika.

William Stern, ahli Psikologi Jerman yang mencoba

mengelompokkan orang menurut jenis, norma, dan

aberasi.Terinspirasi oleh kerja Binet, Stern

mengembangkan ide yang memperlihatkan hasil-hasil tes

inteligensi dalam bentuk angka tunggal,yaitu Inteligensi

Quotion (IQ). Dia menggambarkan inteligensi sebagai umur

mental dibagi dengan umur kronologis. Dalam bentuk

persamaan:

.

Lewis Madison Terman, ahli Psikologi Kognitif

Amerika, yang melihat apakah tes-tes mental dapat

membedakan siswa-siswa terbelakang. Akhir 1906, ketika

di Standford, Terman menerbitkan suatu revisi sempurna

skala Binet-Simon yang dikenal sebagai “ Standford-Binet”

yang merupakan tes inteligensi individu terbaik yang

tersedia. Kemudian, pada 1916, Terman menyatakan

mengubah persamaan inteligensi quotient dengan

mengalikannya angka 100 untuk menyingkirkan desimal-

desimal. Hasilnya adalah persamaan inteligensi quotient

sebagaai berikut:

.

Page 20: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

9 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Robert Mearns Yerkes adalah seorang ahli Psikologi

Komparatif Amerika, yang segera setelah Amerika terlibat

Perang Dunia Pertama, mendesak Perkumpulan Psikologi

Amerika untuk menyumbang keahlian psikologi untuk

usaha perang. Yerkes bekerjasama dengan Goodard,

Terman, dan Bingham mengembangkan tes inteligensi

kelompok yang dapat mengenali tentera baru

berinteligensi rendah dan mengizinkan Tentera mengakui

orang-orang yang berpakaian sangat baik untuk tugas-

tugas sekolah latihan. Mereka membuat tes verval dan tes

nonverbal yang masing-masing dikenal sebagai Army

Alpha dan Army Beta, untuk tentera baru yang buta huruf

dan tidak bisa berbicara bahasa Inggris, Bentuk bentuk

akhir tes-tes Army Alpha dan Army Beta dipublikasin pada

1919.,

David Wechsler, seorang ahli Psikologi Ameriak,

memahami inteligensi lebih dari suatu efek dari pada suatu

sebab. Untuk dalam perbandingan dengan rata-rata

individu menentukan suatu tuntutan penting dari

inteligensi orang dewasa,dia memperkenalkan Deviasi

Quotien, suatu IQ dihitung dengan mempertimbangkan

kemampuan mental individu dibanding dengan umur

individu rata-ratanya Dia adalah orang yang

mengembangkan sebuah tes inteligensi individu orang

dewasa menjadi lampiran pada tes Standford-Binet Tes ini

pada 1939..dikenal sebagai Wechsler Adult Intelligence

Scale disingkat dengan WAIS (Skala Inteligensi Orang

Dewasa Wechsler). Pada 1949, dia mempublikasikan tes

inteligensi lain yang disebut sebagai Wechsler Intelligence

Page 21: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

10 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Scale for Children, disingkat WISC atau tes inteligensi

Wechsler untuk anak-anak.

Joy Paul Guilford, seorang ahli Psikologi Amerika

yang membuat banyak sumbangan untuk studi

kemampuan-kemampuan intelektual manusia. Model

inteligensi manusianya dikenal sebagai “ Struktur Intelek”

yang rumit, model inteligensi tiga dimensi yang dapat

digunakan untuk panduan pengajaran pendidikan. Banyak

tes-tesnya diodefikasi dan dikembangkan dibawah

bimbingannya dengan menggunakan analisis faktor.

B. Pengembangan Tes Prestasi

Horace Mann yang memperkenalkan ujian tulis pada

sekolah-sekolah di Boston karena kelemahan tes lisan.

Sekolah Normal untuk Guru-Guru didirikan di Lexington,

Massachusetts pada 1839 atas usaha-usaha Mann. Karena

sumbangan-sumbangannya itu, dia dikenal sebagai “Bapak

Pendidikan Sekolah Umum Amerika”.

Rev. George Fisher, seorang kepala sekolah Inggris,

yang menciptakan dan menggunakan ukuran objektif

prestasi murid-murid. Pada 1864, dia menciptakan sebuah

instrument yang dinamakan “ Buku Skala”. Buku Skalanya

dibuat untuk mengukur prestasi siswa pada pokok materi

sekolah berbeda, seperti skala tulisan tangan, mengeja,

matematika, tata bahasa, komposisi, dan lainnya. Tes-tes

ini (Buku Skala) masih agak kasar, namun menjadi awal

dari tes-tes keahlian modern saat ini.

Page 22: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

11 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

J.M. Rice, yang dikenal sebagai penemu pertama tes

objektif komparatif di Amerika. Pada 1894, dia membuat

sebuah daftar ejaan (spelling) kata-kata untuk mengukur

perbedaan-perbedaan diantara kelompok-kelompok siswa

yang diajarka secara berbeda. Rice menemukan bahwa

siswa-siswa yang belajar spelling selama tiga puluh menit

setiap hari selama delapan tahun tidak menunjukkan lebih

baik kemampuan spellingnya dari pada siswa-siswa yang

belajar spelling hanya lima belas menit setiap hari selama

delapan tahun. Dia juga mempersiapkan tes-tes serupa

untuk bahasa dan ilmu hitung. Tes-tes ini merupakan awal

dari tes-tes objektif di sekolah-sekolah berbeda.

Dr. Edward L. Thorndike, telah mengembangkan

metode untuk mengukur bermacam-macam kemampuan

dan prestasi menjelang Amerika ambil bagian dalam

Perang Dunia I. Buku pertamanya yang dikenal sebagai

“Pengukuran Mental dan Sosial” diterbitkan pada 1904. Isi

buku tersebut menjadi dasar prosedur-prosedur dan

prinsip-prinsip statistik pada teknik-teknik statistik dan

tes-tes hari ini. Dia yang pertama kali mengkonstruksi

skala menulis tangan untuk mengukur menulis tangan

anak-anak pada 1909, yang menunjukkan nilai-nilai

kualitatif untuk kualitas menulis tangan. Skala ini dikenal

sebagai Skala Menulis tangan Thorndike”. Dia juga

dipandang sebagai “Bapak Pengukuran Pendidikan”.

Cliff W. Stone, seorang mahasiswa Thorndike,

mengkonstruksi dua macam tes, pertama, mengenai empat

operasi dasar dalam ilmu hitung dan yang kedua, tes nalar

ilmu hitung pada 1908. Stone dipandang sebagai orang

pertama yang mempublikasikan tes prestasi standar dalam

Page 23: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

12 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

ilmu hitung. Tes ini dikenal sebagai Tes Ilmu Hitung Stone

pada 1908. Tes nalar ilmu hitung merupakan sumbangan

Stone untuk testing dan pengukuran pendidikan.

S.A.Curtis, adalah juga mahasiswa Thorndike

lainnya, sama seperti Stone, Curtis tertarik dalam

mengukur pertumbuhan murid-murid dalam ilmu hitung

dan dalam menetapkan sebuah norma pencapaian untuk

setiap tingkat (grade). Dia mengembangkan serangkaian

tes-tes standar dalam ilmu hitung untuk digunakan pada

1909. Konsep kata benda (nouns) dan standar-standar

diawali oleh Curtis. Tes yang dikonstruksinya dikenal

sebagai “Rangkaian Tes Ilmu Hitung Curtis”

M.Hillegas, juga seorang mahasiswa Thorndike,

mengkonstruksi serangkaian tes-tes standar dalam Skala

Komposisi berdasarkan prinsip-prinsip dalam konstruksi

Skala Menulis Tangan Thorndike pada 1912. Skala ini

dikenal sebagai “Skala Komposisi Hillegas” dan tes ini

menjadi dasar skala komposisi hari ini.

Ayres, Mahasiswa Thorndika juga, yang

mengembangkan skala-skala ejaan (spelling) standar pada

1915. Skala ini dikenal sebagai “ Skala Ejaan Ayres”

William A.McCall, mempublikasikan buku pionirnya

berkaitan dengan adaptasi tes pada 1924. Jenis tes yang

dikonstruksinya merupakan jenis baru tes yang meluas

digunakan hari ini.

Raph. W. Tyler menyadari perlu ada perluasan tes

prestasi untuk hasil-hasil pengajaran yang tidak dapat

diukur secara akurat seperti sikap, apresiasi, minat,

gagasan, dan lainnya. Sumbangan Tyler jugamembawa

kekonsep testing modern.

Page 24: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

13 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

C. Pengembangan Tes Karakter dan

Kepribadian

Fernand adalah terkenal sebagai orang pertama

yang mengukur karakter dengan menggunakan tes,

sementara Voelker, orang yang menciptakan situasi-situasi

sebenarnya untuk testing (pengujian) karakter.

Percival Symonds, seorang ahli psikologi yang

mengembangkan studi ilmiah tentang kepribadian.

Herman Rorschach, memperkenalkan sebuah tes

multi dimensi kepribadian yang dikenal sebagai tes

Rorschach pada 1921. Tes ini terdiri atas 10 noda tinta

yang digunakan sebagai teknik proyektif untuk menilai

aspek-aspek global kepribadian. Siswa merespons dengan

cara melapurkan apa yang dilihat dalam noda tinta, dan

reaksi-reaksinya menentukan variable-variabel

kepribadiannya seperti sifat impulsif, sensitivitas, dan

stabilitas emosi.

Raymond B, Cattel, seorang ahli Psikologi Amerika

dan Inggris, penyumbang dan pemakai teknik-teknik

statistik lanjut. Dia mencari teori teori komprehensif

perilaku manusia melalui analisis multi faktor sejak awal

karirnya dan dia tertarik dengan analisis faktor C.

Spearman. Hobinya tentang teori komprehensif perilaku

melalui metode analisis faktor telah menghasilkan

bermacam-macam model teoritis dan instrumen-

instrumen psikometrik. Pengembangan teorinya dalam

pengukuran kepribadian dengan pertanyaan diwujudkan

dalam 16 faktor kepribadian.

Page 25: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

14 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 26: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

15 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 2 KONSEP PENGUKURAN,

PENILAIAN DAN EVALUASI

A. Pengertian Pengukuran Beberapa definisi yang dikemuka kan para ahli

tentang pengertian pengukuran adalah sebagai berikut :

1.Measurement is the assignment of numerals to objects

or events according to rules that give numeral

quantitative meaning”, Pengukuran adalah

pengalihan dari angka ke objek atau peristiwa sesuai

dengan aturan yang memberikan makna angka secara

kuantitatif (Wiersma and Jurs,1990)

Page 27: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

16 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

2.Measurement is a procedure for assigning numbers

(ussualy called scores) to a specified attribute or

characteristic of persons in such a manner as to

maintain the real world relationships among the

persons with regard to the attribute being measured.

Pengukuran adalah prosedur pemberian angka (biasa

disebut skor) untuk suatu atribut tertentu atau

karakteristik orang-orang sedemikian rupa untuk

menjaga hubungan dunia nyata antara orang-orang

berkaitan dengan atribut yang diukur (Lord and

Novick, 1974).

3.Measurement. is the assign of numbers to the results of

a test or other type of assessment according to a

specific rule. Pengukuran adalah pemberian angka

pada hasil suatu tes atau jenis penilaian lain menurut

aturan tertentu (Gronlund and Linn, 1995)

4.Measurement defined as the process of assigning

numerals to objects according to rules. Maksudnya

pengukuran didefinisikan sebagai proses penetapan

bilangan-bilangan pada objek menurut aturan

(Dizney, 1971)

Dari sejumlah pengertian di atas, pengukuran dapat

diartikan sebagai kegiatan atau upaya yang dilakukan

untuk memberikan angka-angka pada suatu gejala atau

peristiwa, atau benda, sehingga hasil pengukuran akan

selalu berupa angka. Menurut Zainul dan Nasution (2005)

pengukuran memiliki dua karakteristik utama, yaitu: 1)

Page 28: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

17 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

penggunaan angka atau skala tertentu, 2) menurut suatu

aturan atau formula tertentu.

Melalui pengukuran, atribut atau karakteristik yang

terdapat dalam obyek yang diukur ditransfer menjadi

bentuk angka sehingga lebih mudah untuk dinilai. Aspek-

aspek yang terdapat dalam diri manusia seperti kognitif,

afektif dan psikomotor dirubah menjadi angka. Adapun

proses pengukuran menurut Koyan (2012) dapat dilihat

pada Gambar 2.1 berikut.

Sasaran ukur: Atribut orang, objek

Peristiwa

Alat Ukur (Skala Ukur)

Cara Ukur

Responden: orang, objek, peristiwa

Skor (Data): Bilangan

Gambar 2.1. Proses Pengukuran

Makna gambar tersebut di atas dapat dijelaskan

sebagai berikut.

1) Sasaran ukur pada responden adalah atribut orang

(hasil belajar mahapeserta didik, sikap karyawan),

atribut objek (tinggi meja, kedalaman ilmu), peristiwa

Page 29: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

18 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(kecepatan pengolahan data); biasanya berbentuk

variable.

2) Alat ukur (skala ukur) dibuat, diuji coba, diperbaiki,

dan harus cocok dengan sasaran ukur dan responden

3) Skala ukur adalah besaran pada alat ukur (Misalnya:

satuan ukur) yang digunakan untuk memperoleh skor

atau data.

4) Cara ukur adalah cara alat ukur diberikan kepada

responden untuk memperoleh skor; dalam hal ini

perlu diperhatikan sifat alat ukur, sifat responden,

dan kualitas skor.

5) Skor adalah bilangan yang diberikan kepada atribut

orang, objek, atau peristiwa.

6) Nilai adalah arti dari skor sebagai hasil pengukuran;

skor ditransformasi menjadi nilai.

Dalam dunia pendidikan, yang dimaksud

pengukuran (measurement) adalah proses pemberian

angka atau usaha memperoleh deskripsi numerik dari

suatu tingkatan di mana seorang siswa telah mencapai

karakteristik tertentu. Sebagai contoh, guru melakukan

pengukuran terhadap proses dan hasil belajar yang

hasilnya berupa angka-angka yang mencerminkan capaian

dari proses dan hasil belajar tersebut. Angka 40, 65, atau

100 yang diperoleh dari hasil pengukuran proses dan hasil

pembelajaran tersebut bersifat kuantitatif dan belum dapat

memberikan makna apa apa, karena belum menyatakan

tingkat kualitas dari apa yang diukur. Angka hasil

pengukuran masih disebut skor mentah. Angka hasil

pengukuran baru mempunyai makna bila dibandingkan

Page 30: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

19 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dengan kriteria atau patokan tertentu, yang disebut

penilaian. Hasil penilaian dapat berupa nilai kualitatif

(pernyataan naratif dalam kata-kata) dan nilai kuantitatif

(berupa angka)

Pengukuran dapat menggunakan tes dan non-tes.

Pengukuran yang menggunakan tes seperti tes pilihan

ganda, tes benar-salah, tes menjodohkan, tes melengkapi,

dan tes esai yang terstruktur. Pengukuran yang

menggunakan non tes, misalnya skala sikap, skala penilaian

atau skala motivasi.

B. Skala Pengukuran

Skala pengukuran adalah seperangkat aturan yang

diperlukan untuk mengkuantitatifkan data pengukuraan

dari suatu variable (Djaali & Muljono, 2008). Dalam

pengukuran terdapat karakteristik utama, yaitu

penggunaan angka atau skala tertentu Skala atau angka

dalam pengukuran dapat diklasifikasikan ke dalam 4

(empat) kategori, yaitu: skala nominal, skala ordinal, skala

interval, dan skala rasio.

1. Skala Nominal

Nominal scales classify people or objects into

categories, classes, or sets (Reynolds, at.all, 2009)

Skala nominal adalah pengukuran yang semata-

mata hanya membedakan satu atau lebih kategori dengan

kategori lainnya. Kategori-kategori tersebut bersifat

Page 31: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

20 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

terpisah dan masing-masing kategori diberi nomor untuk

membedakannya.

Misalnya, variabel ”jenis kelamin”, nilai 1 untuk pria

dan 2 untuk wanita. Variabel ”agama”dapat diberi nomor 1

untuk Islam, 2 untuk kristen, 3 untuk Hindu, dan 4 untuk

Budha. Angka 1, 2, 3, 4 hanya sebagai label saja.

Angka atau nomor yang ditetapkan dalam skala

nominal hanya berfungsi sebagai identitas anggota suatu

kategori. Angka atau nomor yang terdapat pada baju para

pemain bola adalah contoh skala nominal. Jadi tidak dapat

dikatakan bahwa pemain dengan nomor baju 4 adalah

pemain yang selalu lebih baik daripada pemain dengan

baju nomor 8. Angka atau nomor baju pemain bola hanya

sebagai lambang atau simbol kategori saja.

Meskipun ada pemberian nomor atau angka, namun

dalam skala nominal tidak dapat menggunakan operasi-

operasi perhitungan penambahan, pengurangan,

pembagian, atau perkalian. Menurut Djaali (2008) tes yang

menggunakan skala nominal sebenarnya bukan kegiatan

pengukuran, melainkan lebih pada pengkategorisasian,

pemberian nama, dan menghitung fakta-fakta atau obyek

yang sedang diukur.

2. Skala Ordinal

Ordinal scales rank people or objects according to the

amount of characteristic they display or possess

(Reynolds, at.all, 2009)

Page 32: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

21 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Skala ordinal adalah skala yang di samping

membedakan antara satu kategori dengan kategori lainnya,

juga mempunyai ranking atau tingkatan kategorinya. Data

dapat disusun dari yang terendah ke yang tertinggi, atau

sebaliknya.

Sebagai contoh skala ordinal adalah ranking

prestasi yang dicapai siswa di sekolah berdasarkan hasil

tesnya. Skor siswa dapat diurut mulai dari ranking

pertama, kedua, ketiga, dan seterusnya. Contoh lainnya

adalah variabel ”kecantikan” yang dapat diurut menjadi

kategori sangat cantik diberi nilai 3, cantik diberi nilai 2,

dan kurang cantik diberi nilai 1, atau sebaliknya.

Data yang diperoleh dengan pengukuran skala

ordinal disebut data ordinal, yaitu data yang berjenjang di

mana jarak antara satu data dengan data lainnya tidak

sama. Skala ordinal dapat menggunakan operasi logika

yaitu > (lebih besar), atau < (lebih kecil), namun tidak

dapat diketahui tingkat perbedaan atau jarak intervalnya.

Karena itu prosedur statistika tidak dapat digunakan pada

skala ini. Operasi tambah, kurang, kali dan bagi juga tidak

dapat digunakan pada skala ordinal.

3. Skala Interval

Interval scales rank people or objects like an ordinal

scales, but on a scale with equal units (Reynolds,

at.all 2009)

Skala interval memiliki ciri yang sama dengan skala

ordinal. Bedanya pada skala interval mempunyai jarak

Page 33: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

22 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

yang sama antara satu data dengan data yang lain. Pada

skala interval hubungan urutan dan jarak antara angka-

angka itu mempunyai arti.

Misalnya, pada variabel ”temperatur” yang memiliki

perbedaan antara 50 dan 51 derajat Celcius sama dengan

perbedaan antara 30 dan 31 derajat Celcius. Tetapi tidak

dapat menyatakan bahwa 50 derajat Celcius itu sama

dengan dua kali lebih panas dari 25 derajat Celcius, karena

pada skala interval tidak ada titik nol mutlak.

Contoh lain dari skala interval adalah mengurutkan

kualitas kinerja guru: sangat tinggi (5), tinggi (4), cukup

tinggi (3), rendah (2), rendah sekali (1). Operasi hitung

seperti tambah, kurang. kali dan bagi dapat digunakan

pada skala interval.

Hal lain juga yang diingat adalah bahwa pada skala

interval tidak dikenal adanya nilai 0 (nol) mutlak, jadi, jika

misalnya seorang siswa hasil tesnya mendapat skor nol,

bukan berarti siswa tersebut tidak memiliki pengetahuan

sama sekali.

4. Skala Rasio

Ratio scales have the properties of interval scales plus

a true zero point (Reynolds, at.all, 2009)

Skala rasio adalah skala pengukuran yang

mempunyai nilai nol mutlak dan mempunyai jarak yang

sama. Menurut Sofian Effendi (1989) skala rasio adalah

suatu bentuk interval yang jaraknya (interval) tidak

dinyatakan sebagai perbedaan nilai antar responden, tetapi

antara seorang responden dengan nilai nol absolut.

Page 34: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

23 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh data skala rasio adalah gaji pegawai atau

karyawan. Gaji nol rupiah berarti pegawai atau karyawan

tersebut tidak menerima uang sedikitpun. Karena adanya

nol mutlak maka semua operasi matematik dapat

diterapkan pada skala rasio ini.

Tabel 2.1. Skala pengukuran

Skala Ciri-ciri

Nominal Mempunyai nilai pembeda saja

Ordinal Mempunyai nilai pembeda dan peringkat

Interval Mempunyai nilai pembeda, peringkat dan

mempunyai jarak yang sama

Rasio Mempunyai nilai pembeda, peringkat,

jarak yang sama, dan mempunyai titik nol

mutlak

C. Pengertian Penilaian Agar lebih jelas dan lebih memperluas wawasan

tentang pengertian penilaian, kita dapat melihat beberapa

pengertian penilaian atau asesmen yang dikemukakan para

ahli berikut ini:

1. Assessment is any of a variety of procedures used to

obtain information about student performance.

Penilaian adalah salah satu prosedur yang

digunakan untuk memperoleh informasi mengenai

kinerja siswa (Miller, Linn & Gronlund, 2009)

Page 35: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

24 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

2. Assessment is any systematic prosedure for collecting

information that can be used to make inferences

about the characteristics of people or objects.

Penilaian adalah salah satu prosedur sistematik

untuk mengumpulkan informasi yang dapat

digunakan untuk membuat kesimpulan mengenai

karakteristik orang atau objek (Reynolds, at all,

2009)

3. Assessment is “the’ collection, synthesis, and

interpretation of information to aid the teacher in

decision making. Penilaian merupakan

'pengumpulan, sintesis, dan menafsirkan informasi

untuk membantu pengajar dalam pengambilan

keputusan (Airasian, 1997)

4. Assessment is the act of collecting information about

individuals or groups of individuals in order to better

understand them. Penilaian adalah tindakan

mengumpulkan informasi tentang individu atau

kelompok untuk lebih memahami mereka (Buttler

and McMunn, 2006)

5. Penilaian adalah proses untuk menentukan nilai

dari suatu obyek atau peristiwa dalam suatu

konteks situasi tertentu, dimana proses penentuan

nilai berlangsung dalam bentuk interpretasi yang

kemudian diakhiri dengan suatu "Judgment"

(Sudjana ,2004)

Page 36: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

25 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

6. Penilaian mencakup semua cara yang digunakan

untuk menilai kerja individu, yaitu prestasi belajar

yang dicapai peserta didik. Proses penilaian melalui

bukti-bukti tentang pencapaian belajar peserta

didik (Mardapi, 2008)

Menurut Griffin & Nix (1991) penilaian merupakan

suatu pernyataan berdasarkan sejumlah fakta untuk

menjelaskan karakteristik seseorang atau sesuatu. Senada

dengan Griffin & Nix, Salvia dan Ysseldike (1994)

mengemukakan bahwa penilaian atau asesmen adalah

suatu proses mengumpulkan data dengan tujuan agar

dapat dilakukan keputusan mengenai suatu objek. Oleh

karena itu, kegiatan penilaian tidak terbatas hanya pada

karakteristik siswa saja, tetapi juga mencakup karakteristik

metode mengajar, kurikulum, fasilitas, dan administrasi

sekolah. Penilaian juga diartikan sebagai kegiatan

menafsirkan data hasil pengukuran atau kegiatan untuk

memperoleh informasi tentang pencapaian kemajuan

belajar siswa.

Jadi, penilaian (assessment) adalah penerapan

berbagai cara dan penggunaan beragam alat penilaian

untuk memperoleh informasi tentang sejauh mana hasil

belajar siswa atau ketercapaian kompetensi siswa.

Penilaian menjawab pertanyaan tentang sebaik apa hasil

atau prestasi belajar seorang siswa.

Pengukuran dan penilaian mempunyai hubungan

yang erat dan bertingkat. Kita tidak dapat melaksanakan

penilaian sebelum melakukan pengukuran terlebih dahulu

terhadap sesuatu. Sebaliknya, pengukuran tidak akan

Page 37: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

26 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

berguna apabila kita tidak mengadakan penilaian terhadap

sesuatu yang telah kita ukur itu. Penilaian merupakan

langkah lanjutan setelah dilakukan pengukuran. Informasi

yang diperoleh dari pengukuran selanjutnya

dideskripsikan dan ditafsirkan. Karenanya, jika seorang

guru ingin melakukan penilaian, maka haruslah terlebih

dahulu melakukan pengukuran. Mardapi (1999)

menyatakan bahwa penilaian adalah kegiatan menafsirkan

atau mendeskripsikan hasil pengukuran

Penilaian merupakan proses kegiatan untuk

mengambil keputusan berdasarkan informasi yang

diperoleh dari pengukuran hasil belajar baik melalui

instrumen tes maupun non tes. Penilaian dilakukan setelah

siswa menjawab soa-soal yang terdapat pada tes. Hasil

jawaban siswa tersebut ditafsirkan dalam bentuk nilai. Jadi

penilaian adalah suatu proses pengumpulan dan

pengelohan data dari hasil pengukuran menjadi bentuk

yang dapat dijelaskan.

D. Penilaian Tradisional dan Penilaian

Alternatif

Gabel (1993) mengelompokkan asesmen (penilaian)

ke dalam dua kelompok, yaitu penilaian tradisional

(traditional assessment) dan penilaian alternatif

(alternative assessment). Dalam beberapa literatur,

asesmen alternatif ini kadang-kadang disebut sebagai

asesmen autentik (authentic assessment), asesmen

Page 38: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

27 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

portofolio (portfolio assessment) atau asesmen kinerja

(performance assessment). (Herman, 1997; Popham, 1995).

Penilaian yang tergolong tradisional adalah

penilaian yang menggunakan tes Benar-Salah, tes Pilihan

Ganda, tes melengkapi, dan tes jawaban terbatas.

Sedangkan penilaian alternatif atau autentik menurut

Mueller (2008) adalah suatu bentuk tugas yang

menghendaki pembelajar untuk menunjukkan kinerja di

dunia nyata secara bermakna yang merupakan penerapan

esensi pengetahuan dan keterampilan. Penilaian autentik

memuat instrumen yang mengharuskan siswa untuk

mempertunjukkan kinerja, bukan menjawab atau memilih

jawaban dari sederetan kemungkinan jawaban yang sudah

tersedia.

E. Pengertian Evaluasi

Agar lebih jelas dan lebih memperluas wawasan

tentang pengertian penilaian, kita dapat melihat beberapa

pengertian penilaian atau asesmen yang dikemukakan para

ahli berikut ini:

Menurut pengertian bahasa, kata evaluasi berasal

dari bahasa Inggris evaluation yang berarti penilaian atau

penaksiran (Echols dan Shadily,1989). Beberapa

pengertian atau batasan evaluasi yang dikemukakan para

ahli adalah adalah sebagai berikut.

1. Evaluation refer to the act or process to determining the

value of samething. Artinya, evaluasi adalah suatu tindakan

Page 39: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

28 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

atau suatu proses untuk menentukan nilai dari sesuatu

(Wind and Brown, 1975).

2. Evaluation is the process of delineating, obtaining, and

providing useful, information for judging decision

alternatives. Maksudnya, evaluasi merupakan proses

menggambarkan, memperoleh dan menyajikan informasi

yang berguna untuk menilai alternatif keputusan

(Stufflebeam et.al, 1974).

3. Evaluation be defined as the systematic process of

collecting, analizing, and interpreting information to

determine the extent to which pupils are achieving

instructional objectives” artinya, evaluasi merupakan

proses pengumpulan informasi, analisis dan interpretasi

informasi yang sistematis untuk menentukan sejauhmana

siswa mencapai tujuan pembelajaran (Grounlund dan Linn,

1995).

4. Evaluation a systematic process of determining the extent

to which instructional objective are achieved by pupils”,

artinya, evaluasi adalah sebuah proses sistematis yang

menentukan sejauhmana tujuan pembelajaran dicapai oleh

siswa (Anastasi 1997)

Dari pandangan-pandangan di atas, kita dapat

melihat bahwa esensi dari evaluasi adalah suatu proses

sistematis untuk mengumpulkan informasi, mengadakan

pertimbangan-pertimbangan mengenai informasi, serta

mengambil keputusan berdasarkan pertimbangan yang

telah dilakukan. Menurut Kumano (2001) evaluasi adalah

Page 40: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

29 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

penilaian terhadap data yang dikumpulkan melalui

kegiatan asesmen.

Dalam konteks pembelajaran di kelas, evaluasi

dilakukan untuk mengetahui kemajuan dan hasil belajar

peserta didik, mendiagnosis kesulitan belajar, memberikan

umpan balik/perbaikan proses belajar mengajar, dan

penentuan kenaikan kelas. Melalui evaluasi dapat

diperoleh informasi yang akurat tentang penyelenggaraan

pembelajaran dan keberhasilan belajar peserta didik, guru,

serta proses pembelajaran itu sendiri. Dengan demikian

maka informasi yang diperoleh pada evaluasi harus

relevan, akurat, dan secara komprehensif mencerminkan

hasil belajar peserta didik.

Evaluasi merupakan suatu proses yang mempunyai

peranan sangat penting dalam dunia pendidikan karena

hasil evaluasi merupakan informasi yang dapat digunakan

sebagai landasan pengambilan bermacam-macam

keputusan. Evaluasi menentukan tingkat perbedaan antara

”apa yang dihasilkan” dengan ”apa yang diharapkan” dari

suatu program pendidikan.

Kegiatan evaluasi selalu didahului dengan kegiatan

pengukuran, yaitu proses penetapan angka menurut aturan

tertentu, kemudian dilanjutkan penilaian dan diakhiri

evaluasi. Penilaian diartikan sebagai suatu kegiatan

menafsirkan data hasil pengukuran. Dengan demikian

evaluasi merupakan suatu kegiatan yang kompleks dan

terus menerus untuk mengetahi manfaat suatu kegiatan

untuk selanjutnya digunakan sebagai pertimbangan dalam

menentukan suatu keputusan. Griffin & Nix (1991)

menyatakan pengukuran, asesmen, dan evaluasi adalah

Page 41: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

30 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

hirarki. Maksudnya kegiatan dilakukan secara berurutan,

dimulai dengan pengukuran, kemudian penilaian, dan

terakhir evaluasi.

F. Jenis Evaluasi

Terdapat tiga jenis evaluai prestasi siswa dalam

kaitan dengan pembelaajaran ruang kelas. Ketiga jenis

evaluasi tersebut yaitu evaluasi diagnostik, evaluasi

formatif dan evaluasi sumatif.

Evaluasi diagnostik mengacu pada evaluasi yang

dilakukan sebelum pembelajaran. Tujuan utama evaluasi

diagnostik adalah untuk mengidentifikasi kekuatan dan

kelemahan siswa, atau untuk mengetahui kesulitan belajar

yang dihadapi siswa, termasuk kesalahan pemahaman

konsep. Evaluasi diagnostik dilaksanakan kalau sebagian

besar siswa gagal dalam mengikuti proses pembelajaran

pada mata pelajaran tertentu. Dari hasil evaluasi diagnostik

akan diketahui konsep-konsep apa saja yang belum

dipahami dan yang telah dipahami siswa. Dari bukti nilai

yang diperoleh melalui tes, guru dapat memperbaiki

kelemahan pengajarannya yang memastikan siswa

menguasai sesuatu pengetahuan dan ketrampilan sebelum

pengetahuan dan ketrampilan yang lebih tinggi

dilanjutkan. Biasanya soal-soal untuk evaluasi diagnostik

berisi materi yang dirasa sulit oleh siswa.

Evaluasi formatif bertujuan untuk memperoleh

informasi atau masukan mengenai tingkat keberhasilan

pelaksanaan pembelajaran. Informasi ini berguna bagi guru

Page 42: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

31 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

untuk memperbaiki strategi mengajarnya. Evaluasi

formatif dilakukan secara periodik sepanjang semester.

Evaluasi formatif bukan untuk menentukan keberhasilan

belajar siswa, tetapi untuk mengetahui keberhasilan proses

pembelajaran. Evaluasi formatif dapat dilakukan dengan

kuiz-kuiz. Materi soal dipilih berdasarkan tujuan

pembelajaran tiap pokok materi atau sub pokok materi.

Evaluasi sumatif diberikan pada akhir suatu

pelajaran, atau akhir semester. Hasilnya untuk menentukan

keberhasilan belajar siswa. Tingkat keberhasilan ini

dinyatakan dengan skor atau nilai, pemberian sertifikat,

dan sejenisnya. Tingkat kesukaran soal pada evaluasi

sumatif bervariasi, sedang materinya harus mewakili

bahan yang telah diajarkan (Mardapi, 2004).

G. Prinsip-Prinsip Evaluasi

Pelaksanaan evaluasi agar akurat dan bermanfaat

baik bagi siswa, pendidik ataupun pihak yang

berkepentingan, maka harus memperhatikan prinsip-prisip

sebagai berikut:

a. Valid.

Evaluasi harus mengukur apa yang seharusnya

diukur dengan menggunakan jenis tes yang

terpercaya dan sahih. Artinya harus ada kesesuaian

antara alat ukur dengan fungsi pengukuran dan

sasaran pengukuran.

Page 43: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

32 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

b. Berkelanjutan/Berkesinambungan

(kontinuitas).

Evaluasi harus dilakukan secara terus menerus dari

waktu ke waktu untuk mengetahui secara

menyeluruh perkembangan siswa, sehingga

kegiatan dan untuk kerja siswa dapat dipantau

melalui evaluasi.

c. Menyeluruh (Komprehensif).

Evaluasi harus dilakukan secara menyeluruh, yakni

meliputi berbagai aspek kompetensi yang akan

dievaluasi. Evaluasi yang menyeluruh meliputi

ranah pengetahuan (kognitif), keterampilan

(psikomotor), sikap dan nilai (afektif) yang

direfleksikan dalam kebiasaan berfikir dan

bertindak.

d. Bermakna.

Evaluasi diharapkan mempunyai makna yang

signifikan bagi semua pihak. Oleh karena itu, maka

evaluasi hendaknya mudah difahami dan dapat

ditindaklanjuti oleh pihak-pihak yang

berkepentingan.

e. Adil dan objektif.

Evaluasi harus mempertimbangkan rasa keadilan

bagi siswa dan objektif berdasarkan kenyataan yang

sebenarnya, tidak boleh dipengaruhi oleh hal-hal

yang bersifat emosional dan irasional.

Page 44: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

33 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

f. Terbuka.

Evaluasi hendaknya dilakukan secara terbuka bagi

berbagai kalangan sehingga keputusan tentang

keberhasilan siswa jelas bagi pihak-pihak yang

berkepentingan, tanpa ada rekayasa atau sembunyi-

sembunyi yang dapat merugikan semua pihak.

g. Ikhlas.

Evaluasi harus dilakukan dengan niat dan yang

bersih, dalam rangka efisiensi tercapainya tujuan

pendidikan dan bai kepentingan siswa.

h. Praktis.

Evaluasi dilakukan dengan mudah dimengerti dan

dilaksanakan dengan beberapa indikator, yaitu: a)

hemat waktu, biaya dan tenaga; b) mudah

diadministrasikan; c) mudah menskor dan

mengolahnya; dan d) mudah ditafsirkan.

i. Sistematis.

Evaluasi dilakukan secara berencana dan bertahap

untuk memperoleh gambaran tentang

perkembangan belajar peserta didik sebagai hasil

kegiatan belajarnya.

j. Mendidik.

Evaluasi harus mampu memberikan sumbangan

positif terhadap peningkatan pencapaian belajar

siswa. Hasil penilaian harus dapat memberikan

Page 45: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

34 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

umpan balik dan memotivasi peserta didik untuk

lebih giat belajar.

H. Fungsi Pengukuran dan Evaluasi

Menurut Assad dan Hailaya (2005) ada lima fungsi

pengukuran dan evaluasi hasil belajar yaitu:

a. Mengukur pencapaian siswa. Melalui melakukan pengukuran, hasil belajar siswa dalam kelas dapat ditentukan. Selain itu, gambaran apakah siswa telah tercapai tujuan atau tidak dapat dinilai melalui pengukuran.

b. Memotivasi siswa untuk belajar. Pengukuran dapat membuat siswa untuk lebih giat belajar. Minat siswa untuk mempelajari materi atau pelajaran tertentu bangkit. Sebagai contoh, seorang siswa yang mendapat skor tinggi dalam suatu tes hasil belajar akan termotivasi untuk mempertahankan skor itu, bahkan ia berharap untuk mendapatkan skor yang lebih tinggi dalam tes berikutnya, dan berharap dapat menjadi juara kelas. Sebaliknya, jika perolehan skor hasil belajarnya rendah, dia terhalang untuk berusaha dan memperbaiki skornya pada ujian berikutnya.

c. Meramalkan keberhasilan siswa. Keberhasilan dan kegagalan siswa dalam kelas dan kelas-kelas lebih tinggi berikutnya dapat diprediksi melalui pengukuran. Guru dapat membedakan apakah sesorang siswa tertentu mempunyai kesempatan

Page 46: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

35 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

untuk lulus dan dapat dinaikkan ke kelas berikutnya. Misalnya, seorang siswa yang selalu mendapat skor tinggi dalam banyak pelajaran dapat diprediksi akan naik kelas atau lulus. Sebaliknya, seorang siswa yang setiap waktu memperoleh skor hasil belajarnya rendah dapat prediksi akan gagal dan tinggal kelas.

d. Mendiagnosis kesulitan siswa. Melalui pengukuran, kelemahan siswa dalam kelas dapat diidentifikasi dan diremidiasi.Hasil-hasil pengukuran juga dapat digunakan untuk memperbaiki pembelajaran dan kinerja siswa dalam kelas.

e. Mengevaluasi pengajaran. Pengukuran dapat menilai pembelajaran. Melalui pengukuran yang merupakan bagian tak terpisahkan dari proses, umpan balik tentang pembelajaran, yang menjadi dasar penting untuk perbaikan dan peningkatan dalam kelas terungkap. Sebagai contoh, Perolehan skor-skor yang tinggi dari kebanyakan siswa dalam tes hasil belajar (pencapaian) secara tidak langsung menunjukkan efektifnya pembelajaran di kelas. Berdasarkan hasil ini, seorang guru dapat lebih jauh memikirkan peningkatan aktivitas dalam pelajaran untuk memperkuat pembelajaran siswa. Sebaliknya, bila tes hasil belajar kebanyakan siswa rendah, menunjukkan tidak efektifnya pembelajaran. Dengan informasi ini, guru dapat memikirkan perbaikan medode pengajaran dalam kelas atau melakukan remedial pengajaran.

Page 47: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

36 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 48: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

37 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 3 BELAJAR DAN HASIL BELAJAR

A. Belajar, Prestasi dan Hasil Belajar

Bodger dan Seaborne (2001) menyatakan bahwa

belajar itu adalah …….. “ anymore or less permanent change

of behavior or which is their result of experience”. artinya

segala sesuatu atau perubahan tetap tingkah laku atau hasil

dari pada pengalaman. Menurut Hamalik (1983) “Belajar

adalah suatu bentuk pertumbuhan atau perubahan dalam

diri seseorang yang dinyatakan dalam cara-cara bertingkah

laku baru berkat pengalaman dan latihan”. Muhammad

(1999) mengatakan bahwa belajar adalah pekerjaan yang

Page 49: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

38 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

harus dikerjakan sendiri, diusahakan sendiri dan tidak

dapat menugaskan orang lain untuk mengerjakannya.

Belajar dapat didefinisikan sebagai upaya yang dilakukan

untuk menambah pengetahuan yang telah dimiliki (Maskul,

1998). Jadi Belajar adalah suatu proses usaha yang

dilakukan seseorang untuk memperoleh suatu perubahan

tingkah laku yang baru secara keseluruhan sebagai hasil

pengalamannya sendiri dalam interaksi dengan

lingkungannya.

Proses belajar dapat melibatkan aspek kognitif,

afektif dan psikomotorik. Pada belajar kognitif, prosesnya

mengakibatkan perubahan dalam aspek kemampuan

berpikir, pada belajar afektif mengakibatkan perubahan

dalam aspek kemampuaan merasakan, sedang belajar

psikomotorik memberikan hasil belajar berupa

keterampilan.

Kata prestasi berasal dari Bahasa Belanda prestatie,

kemudian di dalam bahasa Indonesia disebut prestasi,

diartikan sebagai hasil usaha. Prestasi banyak digunakan di

dalam berbagai bidang dan diberi pengertian sebagai

kemampuan, keterampilan, sikap seseorang dalam

menyelesaikan sesuatu (Arifin, 2009). Menurut Djamarah

(1994) “prestasi adalah hasil dari suatu kegiatan yang telah

dikerjakan, atau diciptakan secara individu maupun secara

kelompok.

Prestasi belajar menurut Kamus Besar Bahasa

Indonesia (2005) berarti: a) penguasaan pengetahuan atau

keterampilan yang dikembangkan oleh mata pelajaran,

lazimnya ditunjukkan dengan nilai tes atau angka nilai

yang diberikan guru, b) kemampuan yang sungguh-

Page 50: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

39 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

sungguh ada atau dapat diamati (actual ability) dan yang

dapat diukur langsung dengan tes tertentu. Menurut Azwar

(2010) “prestasi belajar adalah performa maksimal seseorang

dalam menguasai bahan-bahan atau materi yang telah

diajarkan atau telah dipelajari”.

Dari pendapat di atas dapat disimpulkan bahwa

prestasi belajar adalah hasil usaha siswa yang dapat

dicapai berupa penguasan pengetahuan, kemampuan

kebiasaan dan keterampilan serta sikap setelah mengikuti

proses pembelajaran yang dapat dibuktikan dengan hasil

tes. Jadi, prestasi itu baru ada setelah melakukan kegiatan.

Hasil belajar atau prestasi belajar adalah suatu hasil yang

telah dicapai oleh siswa setelah melakukan kegiatan belajar.

Sudjana (2003) menyatakan bahwa hasil belajar

siswa pada hakikatnya adalah perubahan tingkah laku dan

sebagai umpan balik dalam upaya memperbaiki proses

belajar mengajar. Belajar adalah suatu proses perubahan

tingkah laku sebagai hasil interaksi individu dengan

lingkungannya dalam memenuhi kebutuhan hidupnya .

Menurut Habeyb (1983) hasil belajar ialah apa yang telah

didapat, diciptakan atau hasil yang menyenangkan hati

yang diperoleh dengan jalan keuletan belajar. Nawawi

(2001) mengemukakan bahwa hasil belajar ialah tingkat

keberhasilan anak didik dalam mempelajari pelajaran di

sekolah yang dinyatakan dengan nilai yang diperoleh dari

hasil tes mengenai sejumlah materi tertentu. Selanjutnya,

Purwanto (1992) menyatakan bahwa hasil belajar ialah

hasil pencapaian belajar oleh anak didik pada jangka waktu

tertentu. Dengan demikian dapat disimpulkan bahwa hasil

belajar adalah tingkat penguasaan siswa terhadap materi

Page 51: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

40 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

pelajaran sebagai akibat dari perubahan perilaku setelah

mengikuti proses belajar mengajar berdasarkan tujuan

pengajaran yang ingin dicapai. Hasil belajar sering

digunakan sebagai ukuran untuk mengetahui seberapa

jauh seseorang menguasa bahan yang sudah diajarkan.

Untuk mengetahui hasil belajar tersebut diperlukan

serangkaian pengukuran yang menggunakan alat-alat ukur

yang memenuhi syarat.

B. Pengukuran dan Evaluasi Hasil Belajar

Tujuan pembelajaran pada hakikatnya adalah

perubahan tingkah laku yang diinginkan pada diri peserta

didik atau siswa yang tercermin pada ‘hasil belajar’ siswa

setelah mendapatkan serangkaian pengalaman belajar

(proses pengajaran). Tingkah laku sebagai hasil belajar

bisa meliputi kawasan kognitif, afektif, dan psikomotor

Untuk mengetahui hasil belajar siswa dilakukan

evaluasi. Tujuannya yaitu untuk memperoleh informasi

tentang sejauh mana hasil belajar siswa atau ketercapaian

kompetensi (rangkaian kemampuan) siswa. Penilaian hasil

belajar merupakan aktivitas yang sangat penting dalam

proses pendidikan. Semua proses di lembaga pendidikan

formal pada akhirnya akan bermuara pada hasil belajar

yang diwujudkan secara kuantitatif berupa nilai. Penilaian

menjawab pertanyaan tentang sebaik apa hasil atau

prestasi belajar seorang peserta didik. Jadi penilaian

dilakukan untuk mengetahui sejauh mana perubahan yang

terjadi melalui kegiatan belajar mengajar.

Page 52: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

41 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Hasil belajar merupakan tingkat kemampuan yang

dimiliki seseorang dalam mencerna informasi yang

diperoleh dalam proses belajar mengajar. Hasil belajar

dapat dilihat melalui kegiatan pengukuran yang bertujuan

untuk mendapatkan data yang menunjukkan tingkat

kemampuan siswa dalam mencapai tujuan pembelajaran.

Menurut Widoyoko (2009:1), hasil belajar terkait dengan

pengukuran, kemudian akan terjadi suatu penilaian dan

menuju evaluasi, baik menggunakan tes maupun non-tes.

Hasil belajar tidak lain adalah pengukuran hasil yang sudah

dicapai oleh setiap siswa dalam ranah kognitif, afektif dan

psikomotor yang diperoleh sebagai akibat usaha kegiatan

belajar dan dinilai dalam periode tertentu. Hasil belajar

seorang siswa sering disajikan dalam bentuk simbol

berupa angka, huruf maupun kalimat yang menceritakan

hasil yang sudah dicapai oleh setiap siswa pada suatu

periode tertentu.

Hasil belajar yang merupakan hasil pengukuran

terhadap siswa meliputi aspek kognitif (pengetahuan),

afektif (sikap) dan psikomotor (keterampilan) dapat

diketahui setelah diadakan evaluasi yang disebut tes hasil

belajar (achievement test). Sudjana (2005) mengemukakan

bahwa “di antara ketiga ranah tersebut, ranah kognitiflah

yang paling banyak dinilai oleh para guru di sekolah karena

berkaitan dengan kemampuan para siswa dalam

menguasai isi bahan pengajaran”

Page 53: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

42 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

C. Instrumen dalam Evaluasi

Ditinjau dari instrumen atau alat ukur yang

digunakan untuk melakukan pengukuran, secara umum

dibedakan menjadi dua, yaitu berbentuk tes dan non-tes

(Payne dalam Nasoetion, 2006). Alat pengukuran yang

berbentuk tes bisa dibedakan menjadi tiga macam, yaitu tes

lisan, test tertulis, dan tes perbuatan. Tes lisan bisa

diselenggarakan secara individual atau kelompok. Tes tertulis

bisa berbentuk esai (uraian) atau obyektif. Sedangkan tes

perbuatan bisa dilaksanakan secara individual atau juga

kelompok.

Alat pengukuran (penilaian) yang non-tes, yang

biasanya menyertai dalam pelaksanaan proses belajar

mengajar sangat banyak macamnya. Di antaranya bisa

disebutkan adalah observasi (baik dengan cara langsung, tak

langsung, maupun partisipasi), wawancara (terstruktur atau

bebas), angket (tertutup atau terbuka), sosiometri, checklist,

concept map, portfolio, student journal, pertanyaan-

pertanyaan, dan sebagainya. Dilihat dari wilayah atribut

yang diungkap, secara umum alat ukur dapat dikategorikan

menjadi dua wilayah yaitu wilayah kognitif dan wilayah

non kognitif (Suryabrata, 2000)

Page 54: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

43 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

UNIT II TAKSONOMI BLOOM DAN

RANAH HASIL BELAJAR

Kata taksonomi berasal dari dua kata dalam bahasa

Yunani yaitu tassein yang berarti mengklasifikasi dan

nomos yang berarti aturan. Jadi Taksonomi berarti

hierarkhi klasifikasi atas prinsip dasar atau aturan. Istilah

ini kemudian digunakan oleh Benjamin Samuel Bloom,

seorang psikolog bidang pendidikan yang melakukan

penelitian dan pengembangan mengenai kemampuan

berpikir dalam proses pembelajaran. Bloom, lahir pada

tanggal 21 Februari 1913 di Lansford, Pennsylvania dan

Page 55: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

44 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

berhasil meraih doktor di bidang pendidikan dari The

University of Chicago pada tahun 1942.

Taksonomi tujuan pendidikan ini, atau yang

terkenal dengan nama taksonomi Bloom terdapat dalam

buku yang berjudul Taxonomy of Educational Objectives:

The Classification of Educational Goals. Handbook I:

Cognitive Domain yang terbit pada tahun 1956. Taksonomi

Bloom adalah struktur hierarkhi yang mengidentifikasikan

skills mulai dari tingkat yang rendah hingga yang tinggi.

Bloom meninggal pada 13 September 1999. Dalam

kerangka konsep, tujuan pendidikan ini oleh Bloom dibagi

menjadi tiga domain/ranah kemampuan intelektual

(intellectual behaviors) yaitu kognitif, afektif dan

psikomotorik.

Page 56: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

45 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 4 RANAH KOGNITIF

A. Taksonomi Bloom Original

Taksonomi tujuan pendidikan (the taxonomy of

educational objective) Benjamin Bloom (Bloom, 1956)

mengelompokkan tujuan dan standar-standar penddikan.

Bloom, dan rekan-rekannya berhasil mengembangkan dan

mengenalkan kerangka konsep kemampuan berpikir yang

dinamakan Taxonomy Bloom, meliputi tiga ranah (domain),

yaitu kognitif (cognitive), psikomotor (psychomotor), dan

sikap (affective). Taksonomi Bloom BUKAN suatu ukuran

dari level kesulitan sebuah soal, ia merupakan kerangka

untuk mengklasifikasi pernyataan-pernyataan yang

Page 57: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

46 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

digunakan untuk mempredikasi kemampuan siswa dalam

belajar sebagai hasil dari kegiatan pembelajaran. Benjamin

S. Bloom dan rekan-rekannya menyadari bahwa ada

perbedaan tingkatan dalam perilaku berpikir (thinking

behavior) yang berguna untuk keperluan pembelajaran di

sekolah.

Structure of the Original Taxonomy 1. Knowledge

(a) Knowledge of spesifics

Knowledge of terminology

Knowledge of spesific fact

(b) Knowledge of ways and means of dealing with

spesifics

Knowledge of conventions

Knowledge of trends and sequences

Knowledge of classifications and categories

Knowledge of criteria

Knowledge of methodology

(c) Knowledge of universals and abstraction in a

field

Knowledge of principles and generalizations

Knowledge of theories and structures 2. Comprehension

(a) Translation

(b) Interpretation

(c) Extrapolation

3. Application

4. Analysis

(a) Analysis of elements

(b) Analysis of relationship

Page 58: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

47 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(c) Analysis of organizational principles

5. Synthesis

(a) Production of a unique communication

(b) Production of a plan, or proposed set of

operations

(c) Derivation of a set of abstract relation

6. Evaluation

(a) Evaluation in terms of internal evidence

(b) Judgments in terms of external criteria

Menurut taksonomi Bloom, ranah kognitif

mengurutkan keahlian berpikir sesuai dengan tujuan yang

diharapkan. Proses berpikir menggambarkan tahap

berpikir yang harus dikuasai oleh siswa agar mampu

mengaplikasikan teori ke dalam perbuatan. Ranah kognitif

ini terdiri atas enam level, yaitu: (1) knowledge

(pengetahuan), (2) comprehension (pemahaman atau

persepsi), (3) application (penerapan), (4) analysis

(penguraian atau penjabaran), (5) synthesis (pemaduan),

dan (6) evaluation (penilaian). Taksonomi ini dikenal

sebagai taksonomi Bloom (original taxonomy), dan menjadi

model taksonomi tujuan pembelajaran yang digunakan

sebagai acuan dalam sistem pendidikan di Indonesia. Level

taksonomi Bloom original diperlihatkan dalam gambar 4.1 .

Page 59: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

48 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Gambar 4.1 . Level Kognitif Bloom original

a. Pengetahuan ( knowledge)

Knowledge: remembering or recalling appropriate, previously learned information to draw out factual (usually right or wrong) answers.

Pengetahuan merupakan tingkat kemampuan yang

hanya meminta peserta didik atau siswa untuk mengenal

atau mengetahui adanya konsep, fakta, atau istilah-istilah

tanpa harus mengerti atau dapat menilai atau

menggunakannya. Dalam hal ini biasanya siswa menjawab

saja soal secara hafalan tanpa banyak berfikir.

Di antara kata kerja soal tes yang sesuai untuk tujuan

tingkat pengetahuan adalah:

Menyebutkan

Menyusun daftar

Mendefinisikan

Page 60: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

49 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Mengenali

Mendefinisikan

Mendapatkan

Membedakan

Soal tes untuk tingkat (level) pengetahuan meminta

siswa untuk mengingat kembali apa yang sudah

dipelajarainya,

Pertanyaan untuk pngetahuan

(a) Berikan definisi .........? (b) Siapa yang mencipta....?

(c) Kutub magnet biasanya dinamakan...........

b. Pemahaman (comprehension)

Comprehension: grasping or understanding the

meaning of informational materials

Pemahaman (C2) merupakan tingkat kemampuan

yang mengharapkan peserta didik atau siswa mampu

memahami arti atau konsep, situasi, serta fakta yang

diketahuinya. Dalam hal ini siswa tidak hanya hafal secara

verbal akan tetapi juga memahami konsep dari masalah

atau fakta yang ditanyakan dan dapat melihatnya dari

beberapa segi.

Soal tes pada tingkat pemahaman menghendaki siswa

untuk menyatakan masalah dengan kata-katanya sendiri,

memberi contoh suatu prinsip atau konsep.

Di antara kata kerja yang sesuai dengan untuk soal

untuk mengukur pemahaman adalah:

Page 61: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

50 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Menjelaskan

Merumuskan

Merangkum

Memberi contoh

Memperkirakan

Menerangkan

Membedakan

Pertanyan untuk pemahaman

(a) Terangkan.......

(b) Uraikan dengan perkataan anda..........

(c) Jika turun hujan maka...........................

c. Penerapan (application)

Application: applying previously learned information

(or knowledge) to new and unfamiliar situations.

Penerapan (C3) merupakan tingkat kemampuan yang menuntut atau meminta siswa menggunakan atau menerapkan informasi yang telah diperoleh pada situasi baru. Soal tes pada tingkat penerapan menghendaki siswa menggunakan informasi yang yang telah dipelajarinya untuk menyelesaikan masalah.

Di antara kata kerja yang sesuai untuk soal menguji

penerapan adalah:

Menerapkan

Menghubungkan

Menghitung

Menyelesaikan

Mengembangkan

Page 62: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

51 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Menggunakan

Menghasilkan

Pertanyaan untuk penerapan

(a) .Jika A dan B diketahui, bagaimana mencari C ?

(b) Cari angka yang ke tujuh dalam urutan: 12, 7,

2,..................

d. Analisis (analysis)

Analysis: breaking down information into parts, or

examining (and trying to understand the

organizational structure of) information.

Analisis (C4) merupakan tingkat kemampuan yang

meminta siswa untuk menganalisis atau menguraikan

suatu integritas atau situasi tertentu ke dalam komponen-

komponen atau unsur-unsur pembentuknya. Diharapkan

siswa dapat memahami dan sekaligus mampu memilah-

milahnya menjadi bagian-bagian, termasuk juga

menguraikan bagaimana proses terjadinya sesuatu, cara

bekerjanya sesuatu, atau mungkin juga sistematikanya.

Pada tingkat analisis: siswa diminta untuk

menguraikan informasi ke dalam beberapa bagian,

menemukan asumsi, membedakan fakta dan pendapat, dan

menemukan hubungan sebab dan akibat.

Di antara kata kerja soal tes untuk mengukur tingkat

analisis adalah:

Membedalan

Menemukan

Page 63: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

52 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Membandingkan

Membagi

Menganalisis

Memperinci

Mengkategorikan

Pertanyaan untuk analisis

(a) Apakah bukti yang menunjukkan bahwa es itu lebih

ringan daripada air?

(b) Yang mana fakta dan yang mana opini?

e. Sintesis (synthesis)

Synthesis: applying prior knowledge and skills to

combine elements into a pattern not clearly there

before.

Sintesis (C5) merupakan tingkat kemampuan yang

meminta siswa untuk mengintegrasikan bagian-bagian

yang terpisah menjadi suatu keseluruhan yang terpadu,

atau menggabungkan bagian-bagian (unsur-unsur)

sehingga terjelma pola yang berkaitan secara logis, atau

mengambil kesimpulan dari peristiwa-peristiwa yang ada

hubungannya satu dengan lainnya.

Pada tingkat sintesis: siswa dituntut menghasilkan

suatu cerita, komposisi, hipotesis, atau teorinya sendiri,

dan mengsintesiskan pengetahuan. Soal sintesis soal yang

menuntut pembuatan cerita, menghasilkan karangan,

hipotesis dengan memadukan berbagai pengetahuan atau

ilmu.

Page 64: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

53 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Di antara kata kerja soal tes untuk mengukur tingkat

sintesis adalah:

Menceriterakan

Menyusun

Menyatukan

Memodifikasikan

Menghasilkan

Mengorganisir

Membandingkan

Pertannyaan untuk sintesis

(a) Rencanakan.................

(b) Gubahlah sebuah puisi tentang................

f. Evaluasi (evaluation)

Evaluation: judging or deciding according to some

set of criteria, without real right or wrong answers.

Evaluasi (C6) merupakan tingkat kemampuan yang

meminta siswa mengevaluasi informasi, seperti bukti

sejarah, editorial, teori-teori, dan termasuk di dalamnya

melakukan judgement terhadap hasil analisis untuk

membuat kebijakan. Soal evaluasi: merupakan soal yang

menuntut pembuatan keputusan dan kebijakan, dan

penentuan “nilai” informasi. Evaluasi merupakan tingkat

kemampuan tertinggi,

Soal evaluasi meminta siswa membuat pertimbangan

tentang sesuatu, atau menafsirkan berdasarkan kriteria

tertentu.

Page 65: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

54 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Di antara kata kerja yang sesuai untuk menguji tingkat

evaluasi adalah:

Membuktikan

Memperhitungkan

Menilai

Menyesuaikan

Mengkritik

Mempertimbangkan

Membandingkan

Pertanyaan untuk evaluasi

(a) Beri alasan mengapa anda lebih suka memilih baju

putih ?

(b) Apakah tes objektif lebih baik dari pada tes uraian ?

B. Taksonomi Bloom Revisi

Pada tahun 1990-an Lorin Anderson bersama David

Krathwohl, mengkaji kembali taksonomi Bloom dan

menyusun ulang ranah kognitif, untuk dapat mengadopsi

perkembangan dunia pendidikan abad 21. Hasilnya dikenal

dengan sebutan taksonomi Bloom revisi (Krathwohl, D. R,

2002). Adapun perubahan dari kerangka pikir taksonomi

Bloom asli ke taksonomi Bloom revisi diilustrasikan pada

Gambar 4.2.

Page 66: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

55 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Gambar 4.2. Perubahan dari kerangka pikir taksonomi Bloom asli ke taksonomi Boom revisi

Pada Taksonomi Bloom revisi dilakukan pemisahan

yang tegas antara dimensi pengetahuan (knowledge

dimension) dengan dimensi proses kognitif (cognitive

process). Kalau pada taksonomi Bloom asli dimensi

pengetahuan dimasukkan pada jenjang paling bawah

(Pengetahuan), sedangkan pada taksonomi yang baru

pengetahuan benar-benar dipisah dari dimensi proses

kognitif. Pemisahan ini dilakukan sebab dimensi

pengetahuan berbeda dari dimensi proses kognitif.

Pengetahuan merupakan kata benda (noun) sedangkan

proses kognitif merupakan kata kerja( verb). Secara singkat

Pengetahuan

Pemahaman

Evaluasi

Sintesis

Analisis

Penerapani

Dimensi tersendiri

Memahami

Menerapka

n

Mengaalisis

Mengevalu

asi

Mencipta

Mengingat

Dimensi

Pengetahuan

Kata Kerja

Dimensi Proses

Kognitif

Page 67: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

56 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dapat dikatakan bahwa pada taksonomi Bloom revisi ada

dua dimensi yang terpisah, yaitu “knowledge dimension”

dan “cognitive process dimension.” Lihat Tabel 4.1 berikut.

Tabel 4.1 Tabel Taksonomi Bloom Revisi

Dimensi Pengetahuan Dimensi Proses Kognitif

1. Pengetahuan Faktual a. Pengetahuan ttg

terminologi b. Pengetahuan ttg bagian

detail dan unsur- unsur 2. Pengetahuan Konseptual

a. Pengetahuan ttg klasifikasin dan kategori

b. Pengetahuan ttg prinsip dan generalisasi

c. Pengetahuan ttg teori, model & struktur

3. Pengetahuan Prosedural a. Pengetahuan ttg

keterampilan khusus yg berhubungan dng suatu bidang tertentu dan pengetahuan algoritma

b. Pengetahuan ttg teknik dan metode

c. Pengetahuan ttg kriteria penggunaan suatu prosedur

4. Pengetahuan Metakognitif a. Pengetahuan strategik b. Pengetahuan ttg

operasi kognitif c. Pengetahuan ttg diri

sendiri

C.1. Mengingat (Remember) 1.1. Mengenali (recognizing) 1.2. Mengingat (recalling) C.2. Memahami (Understand) 1.3. Menafsirkan (interpreting) 1.4. Memberi contoh (exampliying) 1.5. Meringkas (summarizing) 1.6. Menarik inferensi (inferring) 1.7. Membandingkan (compairing) 1.8. Menjelaskan (explaining) C.3. Mengaplikasikan (Apply) 1.9. Menjalankan (executing) 1.10. Mengimplementasikan (implementing) C.4. Menganalisis (Analyze) 1.11. Menguraikan (diffrentiating) 1.12. Mengorganisir (organizing) 1.13. Menemukan makna tersirat (attributing) C.5. Evaluasi (Evaluate) 1.14. Memeriksa (checking) 1.15. Mengritik (Critiquing) C.6. Membuat Create) 1.16. Merumuskan

Page 68: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

57 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(generating) 1.17. Merencanakan (planning) 1.18. (Memproduksi

(producing)

a. Dimensi Pengetahuan

Dimensi pengetahuan merupakan dimensi

tersendiri dalam Taksonomi Bloom revisi. Ada empat jenis

kategori pengetahuan, yaitu: pengetahuan faktual,

pengetahuan konseptual, pengetahuan prosedural, dan

pengetahuan metakognitif. Jenis-jenis pengetahuan

menunjukkan penjenjangan dari yang sifatnya konkret

(faktual) hingga yang abstrak (metakognitif).

Anderson, et.all (2001) menunjukkan kategori

dimensi pengeta- huan seperti pada Tabel 4.2 berikut.

Tabel 4.2. Kategori dimensi pengetahuan

Mayor Types and Subtypes Examples 1. Factual knowledge- the basic element student must

know to beaquainted with a discipline or solve problems in it

1.1 Knowledge of terminology

Technical vocabulary, musical symbols

1.2 knowledge of specific details and elements

Major matural resources, reliable soyrces of information

2. Conceptual Knowledge- the interrelationships among the basic elements within a larger structure that enable

them to function together 2.1 knowledge of classification and categories

Period of geological time, forms of business ownership

2.2 knowledge of principles and generalizations

Pythagorean theorem, law of supply and demand

Page 69: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

58 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

2.3 knowledge of theories, models and structures

Theory of evaluation, structure of congrees

3. Procedural Knowledge- how ti do something, methods of inquiry, and criteria for using skills, algorithms,

techniques, and methods 3.1 knowledge of subject- specific skills and algoritms

Skills used in painting with water colors, whole number division algorithm

3.2 knowledge of subject- specific techniques and methods

Interviewing techniques, scientific method

3.3 knowledge of criteria for determining when to use appropriate procedures

Criteria used to determine when to apply a procedure involving Newton’s second law, criteria used to judge the feasibility of using a particular method to estimate business costs

4. Metacognitive knowledge- knowledge of cognitif in general as well as awarenness and knowledge of one’s

own cognition 4.1 Strategic knowledge Knowledge of outlining as a

means of capturing the structure of unit of subject matter in a textbook, knowledge of the use of heuristics

4.2 knowledge about cognitive task, including appropriate contextual and conditional knowledge

Knowledge of the types of tests particular teachers administer, knowledge of the cognitive demands of different tasks

4.3 self-knowledge Knowledge that critiquing essays is a personal streght, whereas writing essays is a personal weakness, awarenees of one’s own knowledge level

Page 70: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

59 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Dari Tabel 4.2 di atas dapat dijelaskan sebagai

berikut;

1) Pengetahuan Faktual (Factual knowledge):

Pengetahuan faktual meliputi elemen-elemen dasar

yang harus diketahui siswa ketika akan mempelajari

disiplin ilmu atau menyelesaikan masalah dalam

disiplin ilmu tersebut. Pengetahuan faktual pada

umumnya merupakan abstraksi tingkat rendah.

Pengetahuan faktual terbagi menjadi dua subjenis

yaitu: (1) pengetahuan tentang terminologi; dan (2)

pengetahuan tentang detail-detail dan elemen-

elemen yang spesifik.

a) Pengetahuan tentang terminologi

(knowledge of terminology):Pengetahuan ini

melingkupi pengetahuan tentang label dan

simbol verbal dan nonverbal (misalnya, kata,

angka, tanda dan gambar).

b) Pengetahuan tentang bagian detail dan

unsur-unsur (knowledge of specific details

and element): Pengetahuan tentang detail-detail

dan elemen-elemen yang spesifik. merupakan

pengetahuan tentang peristiwa, lokasi, orang,

tanggal, sumber informasi dan semacamnya.

Pengetahuan ini meliputi informasi yang

mendetail dan spesifik.

Page 71: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

60 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

2) Pengetahuan konseptual (conceptual

knowledge)

Pengetahuan konseptual mencakup pengetahuan

tentang kategori, klasifikasi dan hubungan antar

dua atau lebih kategori atau klasifikasi pengetahuan

yang lebih kompleks dan tertata. Pengetahuan

konseptual meliputi skema, model mental, atau teori

yang implisit atau eksplisit dalam beragam model

psikologi kognitif. Pengetahuan konseptual terdiri

dari tiga subjenis yaitu: (1) pengetahuan tentang

klasifikasi dan kategori; (2) pengetahuan tentang

prinsip dan generalisasi; dan (3) pengetahuan

tentang teori, model, dan struktur.

a) Pengetahuan tentang kelasifikasi dan

kategori: Pengetahuan tentang klasifikasi dan

kategori meliputi kelas, kategori, divisi, dan

susunan yang spesifik dalam disiplin-disiplin

ilmu. Setiap disiplin ilmu memiliki serangkaian

kategori yang digunakan untuk menemukan dan

mengkaji elemen-elemen baru. Klasifikasi dan

kategori menciptakan hubungan-hubungan

antara elemen-elemen.

b) Pengetahuan tentang prinsip dan

generalisasi: Prinsip dan generalisasi

merupakan abstraksi dari sejumlah fakta,

kejadian, dan saling keterkaitan antara sejumlah

fakta. Prinsip dan generalisasi biasanya

cenderung sulit untuk dipahami siswa apabila

Page 72: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

61 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

siswa belum sepenuhnya menguasai fenomena-

fenomena yang merupakan bentuk yang

“teramati” dari suatu prinsip atau generalisasi.

c) Pengetahuan tentang teori, model, dan

struktur: Pengetahuan ini meliputi

pengetahuan tentang prinsip dan generalisasi

serta antara keduanya yang menghadirkan

pandangan yang jelas, utuh dan sistemik tentang

sebuah fenomena, masalah, atau materi kajian

yang kompleks.

3) Pengetahuan prosedural:

Pengetahuan tentang bagaimana cara melakukan

sesuatu. Pengetahuan ini mencakup pengetahuan

tentang keterampilan, algoritma, teknik, dan

metode, yang semuanya disebut dengan prosedur

(Alexander, dkk., 1991), Seringkali pengetahuan

prosedural berisi langkah-langkah atau tahapan

yang harus diikuti dalam mengerjakan suatu hal

tertentu. Pengetahuan prosedural berkaitan dengan

pertanyaan “bagaimana”. Pengetahuan prosedural

terbagi atas tiga sub jenis yaitu: pengetahuan

tentang keterampilan dalam bidang tertentu dan

algoritma, (2) pengetahuan tentang teknik dan

metode dalam bidang tertentu, dan (3) pengetahuan

tentang kriteria untuk menentukan kapan harus

menggunakan prosedur yang tepat.

Page 73: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

62 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

a) Pengetahuan tentang keterampilan khusus

yang berhubungan dengan suatu bidang

tertentu dan pengetahuan tentang algoritme:

adalah pengetahuan tentang keterampilan

khusus yang diperlukan untuk bekerja dalam

suatu bidang ilmu atau tentang algoritme yang

harus ditempuh untuk menyelesaikan suatu

permasalahan.

b) Pengetahuan tentang teknik dan metode

yang berhubungan dengan suatu bidang

tertentu: adalah pengetahuan yang pada

umumnya merupakan hasil konsensus,

perjanjian, atau aturan yang berlaku dalam

disiplin ilmu tertentu. Pengetahuan tentang

teknik dan metode lebih mencerminkan

bagaimana ilmuwan dalam bidang tersebut

berpikir dan memecahkan masalah yang

dihadapi.

c) Pengetahuan tentang kriteria untuk

menentukan kapan suatu prosedur tepat

untuk digunakan: adalah pengetahuan tentang

kapan suatu teknik, strategi, atau metode harus

digunakan. Siswa dituntut bukan hanya tahu

sejumlah teknik atau metode tetapi juga dapat

mempertimbangkan teknik atau metode

tertentu yang sebaiknya digunakan dengan

mempertimbangkan situasi dan kondisi yang

dihadapi saat itu.

Page 74: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

63 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

4) Pengetahuan metakognitif

Pengetahuan metakognitif adalah pengetahuan

tentang kognisi secara umum dan pengetahuan

tentang diri sendiri. Metakognitif adalah “knowledge

and awareness about cognitive processes – or our

thought about thinking” (Margaret W. Matlin dalam

Desmita, 2006). Penelitian-penelitian tentang

metakognitif menunjukkan bahwa seiring dengan

perkembangannya siswa menjadi semakin sadar

akan pikirannya dan semakin banyak tahu tentang

kognisi, dan apabila siswa bisa mencapai hal ini

maka mereka akan lebih baik lagi dalam belajar.

Sebagai contoh pengetahuan metakognitif,

yaitu pengetahuan tentang langkah-langkah

penelitian, rencana kegiatan dan program kerja ;

pengetahuan tentang jenis metode, tes yang harus

digunakan dan dikerjakan guru ; dan pengetahuan

tentang sikap, minat, karakteristik yang harus

dikuasai untuk menjadi seorang guru yang baik.

Pengetahuan metakognitif terbagi menjadi tiga

subjenis yaitu: (1) pengetahuan strategik; (2)

pengetahuan tentang tugas-tugas kognitif yang

meliputi pengetahuan kontekstual dan kondisional;

dan (3) pengetahuan diri.

a) Pengetahuan strategik: adalah pengetahuan

tentang strategi-strategi belajar dan berpikir

serta pemecahan masalah. Subjenis pengetahuan

ini mencakup pengetahuan tentang berbagai

strategi yang dapat digunakan siswa untuk

Page 75: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

64 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

menghafal materi pelajaran, mencari makna

teks, atau memahami apa yang mereka dengar

dari pelajaran di kelas atau yang dibaca dalam

buku dan bahan ajar lain.

b) Pengetahuan tentang tugas kognitif,

termasuk di dalamnya pengetahuan tentang

konteks dan kondisional: adalah pengetahuan

tentang jenis operasi kognitif yang diperlukan

untuk mengerjakan tugas tertentu serta

pemilihan strategi kognitif yang sesuai dalam

situasi dan kondisi tertentu.

c) Pengetahuan tentang diri sendiri: adalah

pengetahuan tentang kelemahan dan

kemampuan diri sendiri dalam belajar. Salah

satu syarat agar siswa dapat menjadi

pembelajar yang mandiri adalah

kemampuannya untuk mengetahui dimana

kelebihan dan kekurangan serta bagaimana

mengatasi kekurangan tersebut.

Keempat kategori pada dimensi

pengetahuan dianggap kontinum dari yang

kongkrit sampai yang abstrak. Konseptual dan

prosedural mempunyai tingkat keabstrakan

yang berurutan, misalkan pengetahuan

prosedural lebih konkret ketimbang

pengetahuan konseptual yang paling abstrak

(Anderson dan Krathwohl, 2001).

Page 76: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

65 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

b. Dimensi proses kognitif

Dalam dimensi proses kognisi (cognitive process

dimension) terdapat enam kategori (Anderson dan

Krathwohl, 2001) sebagaimana pada taksonomi Bloom

lama; tetapi ada perubahan: kategori pengetahuan

(knowledge) diganti dengan ingatan (remember),

pemahaman (comprehension) diganti nama pengertian

(understand). Penerapan (application), analisis (analysis),

dan evaluasi (evaluation) dipertahankan, tetapi berganti

sebutan “application” diganti dengan “apply,” “analysis”

diganti dengan “analyze,” dan “evaluation” diganti dengan

“evaluate.” Sintetis (synthesis) bertukar tempat dengan

evaluasi dan berganti sebutan mencipta (create).

Perubahan mendasar terletak pada level 5 dan 6. Adapun

urutan atau level taksonomi Bloom revisi adalah seperti

dalam gambar 4.3 berikut.

Gambar 4.3. Level kognitif Bloom revisi

Page 77: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

66 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

1) Mengingat (Remember)

Remembering. Can the student recall or remember the

information? (define, duplicate, list, memorize, recall,

repeat, and reproduce state)

Mengingat adalah kemampuan memperoleh

kembali pengetahuan yang relevan dari memori jangka

panjang. Kategori Remember terdiri dari proses kognitif

Recognizing (mengenal kembali) dan Recalling

(mengingat). Untuk menilai Remember, siswa diberi soal

yang berkaitan dengan proses kognitif Recognizing

(mengenal kembali) dan Recalling (mengingat). Contoh

bentuk soal yang sering digunakan untuk proses kognitif

ini adalah soal ”benar-salah”, pilihan ganda, menjodohkan,

dan mengisi titik-titik.

Mengenali kembali (Recognizing): mencakup

proses kognitif untuk menarik kembali informasi yang

tersimpan dalam memori jangka panjang yang identik atau

sama dengan informasi yang baru. Bentuk tes yang

meminta siswa menentukan betul atau salah,

menjodohkan, dan pilihan berganda merupakan tes yang

sesuai untuk mengukur kemampuan mengenali.

Mengingat (Recalling): menarik kembali informasi

yang tersimpan dalam memori jangka panjang apabila ada

petunjuk (tanda) untuk melakukan hal tersebut. Tanda di

sini seringkali berupa pertanyaan. Istilah lain untuk

mengingat adalah menarik (retrieving).

Page 78: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

67 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Pertanyaan untuk mengingat:

Apa yang terjadi setelah ... ?

Berapa banyak...?

Siapakah yang ... ?

Dapatkah Anda menamakan ... ?

Temukan arti dari……..

Jelaskan apa yang terjadi setelah .....

Siapa yang berbicara kepada ... ?

Dapatkah Anda memberitahu mengapa ... ?

Cari makna ... ?

Apa yang...?

Manakah yang benar atau salah ... ?

2) Memahami (Understand )

Understanding Can the student explain ideas or concepts?

(classify, describe, discuss, explain, identify, locate, recognize,

report, select, translate, and paraphrase)

Memahami adalah kemampuan merumuskan makna

dari pesan pembelajaran dan mampu

mengkomunikasikannya dalam bentuk lisan, tulisan

maupun grafik. Siswa mengerti ketika mereka mampu

menentukan hubungan antara pengetahuan yang baru

diperoleh dengan pengetahuan mereka yang lalu. Kategori

memahami mencakup tujuh proses kognitif: menafsirkan

(interpreting), memberikan contoh (exemplifying),

mengkelasifikasikan (classifying), meringkas

(summarizing), menarik inferensi (inferring),

Page 79: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

68 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

membandingkan (comparing), dan menjelaskan

(explaining).

Menafsirkan (interpreting): mengubah dari satu

bentuk informasi ke bentuk informasi yang lainnya,

misalnya dari dari kata-kata ke grafik atau gambar, atau

sebaliknya, dari kata-kata ke angka, atau sebaliknya

Memberikan contoh (exemplifying): memberikan

contoh dari suatu konsep atau prinsip yang bersifat umum.

Memberikan contoh menuntut kemampuan

mengidentifikasi ciri khas suatu konsep dan selanjutnya

menggunakan ciri tersebut untuk membuat contoh.

Mengkelasifikasikan (classifying): Mengenali

bahwa sesuatu (benda atau fenomena) masuk dalam

kategori tertentu. Termasuk dalam kemampuan

mengkelasifikasikan adalah mengenali ciri-ciri yang

dimiliki suatu benda atau fenomena.

Meringkas (summarising): membuat suatu

pernyataan yang mewakili seluruh informasi atau

membuat suatu abstrak dari sebuat tulisan. Meringkas

menuntut siswa untuk memilih inti dari suatu informasi

dan meringkasnya.

Menarik inferensi (inferring): menemukan suatu

pola dari sederetan contoh atau fakta. Untuk dapat

melakukan inferensi siswa harus terlebih dapat menarik

abstraksi suatu konsep/prinsip berdasarkan sejumlah

contoh yang ada

Membandingkan (comparing): mendeteksi

persamaan dan perbedaan yang dimiliki dua objek, ide,

ataupun situasi. Membandingkan mencakup juga

menemukan kaitan antara unsur-unsur satu objek atau

Page 80: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

69 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

keadaan dengan unsur yang dimiliki objek atau keadaan

lain. Istilah lain untuk membandingkan adalah

Menjelaskan (explaining): mengkonstruk dan

menggunakan model sebab-akibat dalam suatu system.

Termasuk dalam menjelaskan adalah menggunakan model

tersebut untuk mengetahui apa yang terjadi apabila salah

satu bagian sistem tersebut diubah

Pertannyaan untuk memahami

Dapatkah Anda menulis dengan kata-kata Anda

sendiri ... ?

Dapatkah Anda menulis keterangan singkat ... ?

Bagaimana Anda akan menjelaskan…..?

Dapatkah Anda menulis sebuah garis-garis besar

yang jelas……..?

Menurut Anda, apa yang akan terjadi kemudian ... ?

Apa yang kamu pikirkan...?

Apa ide utama ... ?

Dapatkah Anda mengilustrasikan ... ?

Dapatkah Anda memberikan contoh dari apa yang

Anda maksud ... ?

Dapatkah Anda memberikan definisi untuk ... ?

3) Menerapkan (Apply)

Applying Can the student use the information in a new

way? (choose, demonstrate, dramatize, employ, illustrate,

interpret, operate, schedule, sketch, solve, use, and write)

Menerapkan adalah kemampuan menggunakan

prosedur untuk menyelesaikan masalah. Siswa

Page 81: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

70 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

memerlukan latihan soal sehingga siswa terlatih untuk

mengetahui prosedur apa yang akan digunakan untuk

menyelesaikan soal. Kategori menerapkan (Apply) terdiri

dari proses kognitif: kemampuan melakukan (Executing)

dan kemampuan menerapkan (Implementing).

Menjalankan (executing): menjalankan suatu

prosedur rutin yang telah dipelajari sebelumnya. Langkah-

langkah yang diperlukan sudah tertentu dan juga dalam

urutan tertentu. Apabila langkah-langkah tersebut benar,

maka hasilnya sudah tertentu pula.

Mengimplementasikan (implementing): memilih

dan menggunakan prosedur yang sesuai untuk

menyelesaikan tugas yang baru. Karena diperlukan

kemampuan memilih, siswa dituntut untuk memiliki

pemahaman tentang permasalahan yang akan

dipecahkannya dan juga prosedur-prosedur yang mungkin

digunakannya. Apabila prosedur yang tersedia ternyata

tidak tepat benar, siswa dituntut untuk bisa

memodifikasinya sesuai keadaan yang dihadapi.

Pertanyaan untuk menerapkan:

Apakah Anda mengetahui kejadian lain yang ... ?

ini terjadi di ... ?

Dapatkah Anda mengelompok sesuai ciri-cirinya

seperti ... ?

Faktor-faktor manakah yang akan Anda ubah

apabila ... ?

Pertanyaan apa yang akan Anda tanyakan

tentang…..?

Page 82: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

71 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Dari informasi ysng diberikan, dspstksh Anda

mengembnngkn serangkaian arahan tentang….?

4) Menganalisis (Analyze)

Analyzing Can the student distinguish between the

different parts? (appraise, compare, contrast, criticize,

differentiate, discriminate, distinguish, examine,

experiment, question, test assemble, construct, create,

design, develop, formulate, and write long familiar

Bloom's Taxonomy)

Menganalisis meliputi kemampuan untuk memecah

suatu kesatuan menjadi bagian-bagian dan menentukan

bagaimana bagian-bagian tersebut dihubungkan satu

dengan yang lain atau bagian tersebut dengan

keseluruhannya. Analisis menekankan pada kemampuan

merinci sesuatu unsur pokok menjadi bagian-bagian dan

melihat hubungan antar bagian tersebut. Di tingkat

analisis, seseorang akan mampu menganalisa informasi

yang masuk dan membagi-bagi atau menstrukturkan

informasi ke dalam bagian yang lebih kecil untuk

mengenali pola atau hubungannya dan mampu mengenali

serta membedakan faktor penyebab dan akibat dari sebuah

skenario yang rumit. Ada tiga macam proses kognitif yang

tercakup dalam menganalisis: membedakan

(differentiating), mengorganisir (organizing), dan

menemukan pesan tersirat (attributting)

Membedakan (differentiating): membedakan

bagian-bagian yang menyusun suatu struktur berdasarkan

relevansi, fungsi dan penting tidaknya. Oleh karena itu

Page 83: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

72 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

membedakan (differentiating) berbeda dari

membandingkan (comparing). Membedakan menuntut

adanya kemampuan untuk menentukan mana yang

relevan/esensial dari suatu perbedaan terkait dengan

struktur yang lebih besar.

Mengorganisir (organizing): mengidentifikasi

unsur-unsur suatu keadaan dan mengenali bagaimana

unsur-unsur tersebut terkait satu sama lain untuk

membentuk suatu struktur yang padu.

Menemukan pesan tersirat (attributting):

menemukan sudut pandang, bias, dan tujuan dari suatu

bentuk komunikasi. Contoh: menganalisis mengapa

seseorang menulis di surat kabar bahwa hutan di Jawa

Barat masih cukup luas.

Pertanyan untuk menganalisis

Bagian mana yang seharusnya tidak terjadi…..?

Apabila…..terjadi, bagaimanakah akhir cerita akan

terjadi…….?

Bagaimana ini ……sama dengan…..?

Apa tema yang mendasari ... ?

Apa yang Anda pikirkan sebagai kemungkinan hasil

lainnya ?

Mengapa ..... perubahan terjadi ?

Dapatkah Anda membandingkan Anda ... dengan

yang disajikan di ... ?

Apa permasalahan dari ...?

Anda membedakan antara ... ?

Apa saja sebab motif di balik ... ?

Page 84: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

73 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Apa yang mengubahnya…. ?

Apa masalahnya dengan ... ?

5) Menilai (Evaluate)

Evaluating Can the student justify a stand or decision?

(appraise, argue, defend, judge, select, support, value,

and evaluate)

Menilai didefinisikan sebagai kemampuan

melakukan judgement berdasar pada kriteria dan standar

tertentu. Kriteria sering digunakan adalah menentukan

kualitas, efektifitas, efisiensi, dan konsistensi, sedangkan

standar digunakan dalam menentukan kuantitas maupun

kualitas. Evaluasi mencakup kemampuan untuk

membentuk suatu pendapat mengenai sesuatu atau

beberapa hal, bersama dengan pertanggungjawaban

pendapat itu yang berdasar kriteria tertentu. Ada dua

macam proses kognitif yang tercakup dalam kategori ini:

memeriksa (checking) dan mengritik (critiquing)

Memeriksa (Checking): Menguji konsistensi atau

kekurangan suatu karya berdasarkan kriteria internal

(kriteria yang melekat dengan sifat produk tersebut).

Contoh: Memeriksa apakah kesimpulan yang ditarik telah

sesuai dengan data yang ada.

Mengritik (Critiquing): menilai suatu karya baik

kelebihan maupun kekurangannya, berdasarkan kriteria

eksternal. Contoh: menilai apakah rumusan hipotesis

sesuai atau tidak (sesuai atau tidaknya rumusan hipotesis

dipengaruhi oleh pengetahuan dan cara pandang penilai).

Page 85: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

74 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Pertanyaan untuk menilai

Adakah solusi yang tepat untuk ... ?

Ukurlah nilai dari....Apa yang Anda pikirkan

tentang…..?

Dapatkah Anda mempertahankan posisi Anda

tentang ... ?

Menurut Anda . ... sesuatu yang baik atau buruk ?

Bagaimana anda mengatasi ... ?

Perubahan apa yang ... apa yang Anda

rekomendasikan ?

Apakah Anda percaya…? Bagaimana yang Anda

rasakan apabila….?

Apa sajakah konsekwensinaya ?

Pengaruh apakah yang akan….pada kehidupan kita?

Apa sajakah pro dan kontra dari ... ?

Seberapa efektifkah ... ?

Mengapa ….berharga?

Apa sajakah afternatif?

Siapa yang akn mendapatkan dan iapa yang akan

kehilangan?

6) Berkreasi(Create)

Creating Can the student create new product or point

of view? (assemble, construct, create, design, develop,

formulate, and write)

Create didefinisikan sebagai menggeneralisasi ide

baru, produk atau cara pandang yang baru dari sesuatu

kejadian. Create di sini diartikan sebagai meletakkan

Page 86: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

75 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

beberapa elemen dalam satu kesatuan yang menyeluruh

sehingga terbentuklah dalam satu bentuk yang koheren

atau fungsional. Siswa dikatakan mampu Create jika dapat

membuat produk baru dengan merombak beberapa

elemen atau bagian ke dalam bentuk atau stuktur yang

belum pernah diterangkan oleh guru sebelumnya. Proses

Create umumnya berhubungan dengan pengalaman belajar

siswa yang sebelumnya. Ada tiga macam proses kognitif

yang tergolong dalam kategori ini, yaitu: membuat

(generating), merencanakan (planning), dan memproduksi

(producing).

Membuat (generating): menguraikan suatu

masalah sehingga dapat dirumuskan berbagai

kemungkinan hipotesis yang mengarah pada pemecahan

masalah tersebut.

Contoh: merumuskan hipotesis untuk memecahkan

permasalahan yang terjadi berdasarkan pengamatan di

lapangan.

Merencanakan (planning): merancang suatu

metode atau strategi untuk memecahkan masalah.

Contoh: merancang serangkaian percobaan untuk menguji

hipotesis yang telah dirumuskan.

Memproduksi (producing): membuat suatu

rancangan atau menjalankan suatu rencana untuk

memecahkan masalah.

Pertanyan untuk berkreasi

Dapatkah Anda merancang sebuah... untuk ... ?

Dapatkah Anda memberikan solusi yang

memungkinkan untuk ... ?

Page 87: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

76 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Jika Anda menggunakan seluruh sumber,

bagaimanakah Anda akan melakukannya dengan ... ?

Mengapa tidak Anda temukan cara Anda sendiri

untuk ... ?

Ada berapa cara yang dapat Anda ... ?

Dapatkah Anda menciptakan kegunaan baru dan

tidak biasa untuk ... ?

Taksonomi Bloom revisi kadang-kadang juga

disebut sebagai taksonomi Anderson dan Krathwohl yang

berkaitan erat dengan dimensi pengetahuan yang lain yaitu

pengetahuan faktual, pengetahuan konseptual,

pengetahuan prosedural, dan pengetahuan metakognisi.

Lihat Tabel 4.2 berikut.

Tabel 4.2 Taksonomi Bloom revisi Tingkatan Berpikir Tingkat

Tinggi

Komunikasi

Menciptakan (Creating)

Menggeneralisasikan (generating), merancang (designing), memproduksi (producing), merencanakan kembali (devising)

Negosiasi (negotiating), memoderatori (moderating), kolaborasi (collaborating)

Mengevaluasi (Evaluating)

Mengecek (checking), mengkritisi (critiquing), hipotesis (hypothesising), eksperimen (experimenting)

Bertemu dengan jaringan/mendiskusikan (net meeting), berkomentar commenting), berdebat (debating)

Page 88: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

77 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Menganalisis (Analyzing)

Memberi atribut (attributeing), mengorganisasikan (organizing), mengintegrasikan (integrating), mensahihkan (validating)

Menanyakan (Questioning), meninjau ulang (reviewing)

Menerapkan (Applying)

Menjalankan prosedur (executing), mengimplementasikan (implementing), menyebarkan (sharing)

Posting, blogging, menjawab (replying)

Memahami/ mengerti (Understanding)

Mengklasifikasikan (classification), membandingkan (comparing), menginterpretasikan (interpreting), berpendapat (inferring)

Bercakap (chatting), menyumbang (contributing), networking,

Mengingat (Remembering)

Mengenali (recognition), memanggil kembali (recalling), mendeskripsikan (describing), mengidentifikasi (identifying)

Menulis teks (texting), mengirim pesan singkat (instant messaging), berbicara (twittering)

Berpikir Tingkat Rendah

Selanjutnya untuk lebih jelas letak perbedaan

antara taksonomi Bloom original dan taksonomi Bloom

revisi dapat kita melihat dalam gambar 4.4.

Page 89: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

78 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Gambar 4.4. Taksonomi Bloom original dan revised

Perbandingan antara ranah kognitif taksonomi

Bloom asli dengan ranah lognitif taksonomi Bloom revisi

dapat kita lihat dalam Tabel 4.4 berikut.

Tabel 4-4. Perbandingan antara ranah kognitif Bloom asli dengan ranah kognitif Bloom revisi

Ranah kognitif Original (asli) Revised (revisi)

C1 Knowledge (Pengetahuan)

Remembering (Mengingat)

C2 Comprehension (Pemahaman)

Understanding (Memahami)

C3 Apply (Aplikasi)

Applying (Mengaplikasikan)

C4 Analysis (Analisis)

Analyzing (Menganalisis)

C5 Synthesis (Sintesis)

Evaluating (Mengevaluasi)

C6 Evaluation (Evaluasi)

Creating (Mencipta)

Page 90: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

79 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Gambar 4.5 di bawah memperlihatkan kombinasi

cognitive process dan knowledge dimensions (Heer, 2012)

Gambar 4.5. Kombinasi antara cognitive process dan

knowledge dimensions

Page 91: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

80 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 5 TAKSONOMI TUJUAN AFEKTIF

DAN PSIKOMOTOR

A. Taksonomi Ranah Afektif

Taksonomi afektif yang paling terkenal adalah yang

dikembangkan oleh Krathwohl, Bloom dan Masia (1964).

Ranah Afektif mencakup segala sesuatu yang terkait

dengan emosi, misalnya perasaan, nilai, penghargaan,

semangat,minat, motivasi, dan sikap. Lima kategori ranah

ini diurutkan mulai dari perilaku yang sederhana hingga

yang paling kompleks. Taksonomi ini menggambarkan

proses seseorang di dalam mengenali dan mengadopsi

suatu nilai dan sikap tertentu yang menjadi pedoman

baginya bertingkah laku. Krathwohl mengurutkan tujuan

afektif ke dalam 5 tingkatan dari yang paling sederhana

Page 92: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

81 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

sampai kompleks, yaitu Penerimaan (receiving), tanggapan

(responding), penghargaan (valuing), pengorganisasian

(organization), dan pengamalan (charakterization)

1) Penerimaan (Receiving) adalah semacam kepekaan

dalam menerima rangsangan (stimulasi) dari luar yang

datang kepada siswa dalam bentuk masalah, situasi,

gejala dan lain-lain. Dalam tipe ini termasuk kesadaran,

keinginan untuk menerima stimulus, control dan

seleksi gejala atau rangsangan dari luar. Receiving juga

diartikan sebagai kemauan untuk memperhatikan

suatu kegiatan atau suatu objek. Pada jenjang ini siswa

dibina agar mereka bersedia menerima nilai-nilai yang

diajarkan kepada mereka dan mereka mempunyai

kemauan menggabungkan diri ke dalam nilai itu atau

mengidentifikasi diri dengan nilai itu.

Contoh: siswa mendengarkan penjelasan guru dengan

penuh perhatian.

Contoh kata kerja kunci:

menanyakan, mengikuti, memberi,

menahan/mengendalikan diri, mengidentifikasi,

memperhatikan, menjawab:

2) Tanggapan (Responding) adalah suatu sikap yang

menunjukkan adanya partisipasi aktif atau

kemampuan menanggapi, kemampuan yang dimiliki

seseorang untuk mengikutsertakan dirinya secara aktif

dalam fenomena tertentu dan membuat reaksi

terhadapnya dengan salah satu cara. Hal ini mencakup

Page 93: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

82 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

ketepatan reaksi, perasaan, kepuasan dalam menjawab

stimulus dari luar yang datang kepada dirinya.

Contoh: siswa mengerjakan pekerjaan rumah,

berpartisipasi dalam diskusi kelas, memberikan

presentasi, bertanya terhadap ide-ide, konsep, atau

model baru untuk lebih memahaminya.

Contoh kata kerja kunci:

Menjawab, membantu, mentaati, memenuhi,

menyetujui, mendiskusikan, melakukan, memilih,

menyajikan, mempresentasikan, melaporkan,

menceritakan, menulis, menginterpretasikan,

menyelesaikan, mempraktekkan.

3) Penilaian (Valuing), atau menghargai artinya

memeberikan nilai atau memberikan penghargaan

terhadap suatu kegiatan atau objek, sehingga apabila

kegiatan itu idak dikerjakan kan memebrikan suatu

penyesalan. Dalam kaitannya dengan proses

pembelajaran peserta didik tidak hanya mau

menerima nilai yang diajarkan mereka telah

berkemampuan untuk menilai konsep atau fenomena

baik atau buruk.

Contoh: siswa menunjukkan kepercayaan terhadap

proses kerja kelompok dalam pemecahan masalah.

Contoh kata kerja kunci:

Page 94: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

83 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Menunjukkan, mendemonstrasikan, memilih,

membedakan, mengikuti, meminta, memenuhi,

menjelaskan, membentuk, berinisiatif, melaksanakan,

memprakarsai, menjustifikasi, mengusulkan,

melaporkan, menginterpretasikan, membenarkan,

menolak, menyatakan/ mempertahankan pendapat,

4) Organisasi (Organization) yakni pengembangan dari

nilai ke dalam suatu sistem organisasi, termasuk

hubungan suatu nilai dengan nilai yang lain,

pemantapan dan prioritas nilai yang telah dimilikinya.

Yang termasuk kedalam organisasi ialah konsep

tentang nilai, organisasi sistem nilai dan lain-lain.

Contoh: siswa mengenali kebutuhan akan

keseimbangan kebebasan dan tanggungjawab dalam

kelompok kooperatif untuk memecahkan masalah

dalam pembelajaran.

Contoh kata kerja kunci:

Mentaati, mematuhi, merancang, mengatur,

mengidentifikasikan, mengkombinasikan,

mengorganisisr, merumuskan, menyamakan,

mempertahankan, menghubungkan, mengintegrasikan,

menjelaskan, mengaitkan,

5) Pengamalan (Characterization) adalah keterpaduan

semua sistem nilai yang telah dimiliki seseorang, yang

mempengaruhi pola kepribadian dan tingkah lakunya.

Page 95: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

84 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Proses internalisasi nilai telah menempati tempat

tertinggi dalam hierarki nilai.

Contoh: siswa dapat bekerjasama dalam kelompok

kooperatif (menampilkan kerja tim), menggunakan

pendekatan obyektif dalam pemecahan masalah, dan

merevisi penilaiannya berdasarkan bukti baru.

Contoh kata kerja kunci:

Melakukan, melaksanakan, memperlihatkan

membedakan, memisahkan, menunjukkan,

mempengaruhi, mendengarkan, memodifikasi,

mempraktekkan, mengusulkan, merevisi,

memperbaiki, membatasi, mempertanyakan,

mempersoalkan,

B. Taksonomi Ranah Psikomotor

Ranah Psikomotorik meliputi gerakan dan

koordinasi jasmani, keterampilan motorik dan

kemampuan fisik. Ketrampilan ini dapat diasah jika sering

melakukannya. Perkembangan tersebut dapat diukur sudut

kecepatan, ketepatan, jarak, cara/teknik pelaksanaannya.

Bloom (1979) menyatakan bahwa ranah psikomotor

berhubungan dengan hasil belajar yang pencapaiannya

melalui keterampilan manipulasi yang melibatkan otot dan

kekuatan fisik. Singer (1972) menambahkan bahwa mata

pelajaran yang berkaitan dengan psikomotor adalah mata

pelajaran yang lebih beorientasi pada gerakan dan

menekankan pada reaksi–reaksi fisik dan keterampilan

tangan. Jadi, hasil belajar psikomotor tampak dalam bentuk

keterampilan (skill) dan kemampuan bertindak.

Page 96: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

85 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Ada beberapa ahli yang mengemukakan level atau

tingkatan hasil belajar psikomotor, di antaranya yang

sering digunakan adalah hasil belajar psikomotor yang

dikembangkan oleh Dave, Simpson dan Harrow.

Menurut Dave (1967) hasil belajar psikomotor

dapat dibedakan menjadi lima tahap, yaitu: imitasi,

manipulasi, presisi, artikulasi, dan naturalisasi.

Imitasi adalah kemampuan melakukan kegiatan-

kegiatan sederhana dan sama persis dengan yang dilihat

atau diperhatikan sebelumnya. Contohnya, seorang siswa

dapat memukul bola dengan tepat karena pernah melihat

atau memperhatikan hal yang sama sebelumnya.

Manipulasi adalah kemampuan melakukan

kegiatan sederhana yang belum pernah dilihat tetapi

berdasarkan pada pedoman atau petunjuk saja. Sebagai

contoh, seorang siswa dapat memukul bola dengan tepat

hanya berdasarkan pada petunjuk guru atau teori yang

dibacanya.

Presisi adalah kemampuan melakukan kegiatan‐

kegiatan yang akurat sehingga mampu menghasilkan

produk kerja yang tepat. Contoh, siswa dapat mengarahkan

bola yang dipukulnya sesuai dengan target yang

diinginkan.

Artikulasi adalah kemampuan melakukan kegiatan

yang komplek dan tepat sehingga hasil kerjanya

merupakan sesuatu yang utuh. Sebagai contoh, siswa dapat

mengejar bola kemudian memukulnya dengan cermat

sehingga arah bola sesuai dengan target yang diinginkan.

Dalam hal ini, siswa sudah dapat melakukan tiga kegiatan

Page 97: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

86 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

yang tepat, yaitu lari dengan arah dan kecepatan tepat

serta memukul bola dengan arah yang tepat pula.

Naturalisasi adalah kemampuan melakukan

kegiatan secara reflek, yakni kegiatan yang melibatkan fisik

saja sehingga efektivitas kerja tinggi. Sebagai contoh tanpa

berpikir panjang siswa dapat mengejar bola kemudian

memukulnya dengan cermat sehingga arah bola sesuai

dengan target yang diinginkan.

Tujuan kawasan psikomotor yang dikembangkan

oleh Simpson (1972) mulai dari tingkat yang sederhana

hingga tingkat yang rumit, yaitu: Persepsi (Perception),

Kesiapan/Set, Respon terpimpin (Guided respons),

Mekanisme (Mechanism), Complex Overt Respons, dan

Originasi (Origination)

Persepsi (Perception) adalah berhubungan

dengan penggunaan indera untuk mengarahkan kegiatan

motorik. Mulai dari kesadaran ada stimulus sampai kepada

memilih tugas yang relevan untuk menterjemahkannya ke

dalam suatu kegiatan (performance) tertentu. Contoh:

menurunkan suhu AC saat merasa suhu ruangan panas

Kesiapan/Set, adalah Kemampuan untuk

mempersiapkan diri, baik mental, fisik, dan emosi, dalam

menghadapi sesuatu. Contoh: melakukan pekerjaan sesuai

urutan, menerima kelebihan dan kekurangan seseorang

Respon terimpin (Guided respons) adalah langkah

permulaan dalam mempelajari keterampilan yang

kompleks, meliputi: menirukan, trial and error. Ketetapan

dari performance ditentukan oleh instruktur atau oleh

kriteria yang sesuai. Contoh: Mengikuti arahan dari

instruktur.

Page 98: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

87 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Mekanisme (Mechanism) mekanisme

(Mechanism), merupakan performance yang menunjukkan

bahwa respons yang dipelajari telah menjadi kebiasaan

dan gerakangerakan dapat dilakukan dengan penuh

kepercayaan dan kemahiran. Ini merupakan performance

dari bermacam-macam keterampilan. Contoh:

menggunakan computer

Complex Oert Respons yaitu performance yang

sangat terampil dan gerakan motorik yang memerlukan

pula gerakan kompleks. Kemahiranya ditunjukkan dengan

cepat, lancar, dan tepat dengan energi minimum, tanpa

ragu-ragu dan otomatis (dilakukan dengan mudah dan

terkontrol baik). Conth: Keahlian bermain piano.

Originasi Origination), yaitu penciptaan pola-pola

gerakan yang baru untuk menyesuaikan dengan

situasi/masalah yang khusus. Hasil belajarnya ditekankan

pada kreativitas yang didasarkan pada keterampilan

tingkat tinggi.

Harrow (1972) mengemukakan bahwa ranah hasil

belajar psikomotot terdiri atas: Gerakan reflex, Gerakan-

gerakan fundamental, Kemampuan perceptual,

Kemampuan fisis, Gerakan keterampilan, dan Komunikasi

tanpa kata-kata.

Gerakan refleks, yaitu gerakan yang dilakukan

tanpa disadari yang tertuju kepada suatu rangsang

tertentu, (mengedipkan mata, menggeliat, menguap,

membegkokkan badan, dan meyesuaikan sikap badan).

Gerakan-gerakan fundamental. Merupakan pola-

pola gerakan yang terbentuk dari gabungan gerakan-

gerakan refleks dan menjadi dasar gerakan keterampilan

Page 99: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

88 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

yang kompleks (berjalan, lari, melompat, meluncur,

membungkuk, melengkung, berputar, memegang,

menggerakan jari, dsb).

Kemampuan perseptual. Kemampuan

menafsirkan rangsangan dari berbagai cara untuk

menyesuaikan diri dengan lingkungannya (‘mendengarkan’

mengikuti perintah verbal, ‘gerakan terkoordinasi’, loncat

tali, menangkap, kinestetik discrimination, visual, auditory,

dan tactile discrimination).

Kemampuan fisis. Karakteristik organik yang

esensial untuk mengembangkan gerakan keterampilan

tinggi, termasuk ketahanan, kekuatan, fleksibilitas, dan

ketangkasan (lari jarak jauh, berenang, angkat berat, gulat,

ballet, membengkokkan/melengkungkan punggung,

menyentuh jari kaki, mengetik).

Gerakan keterampilan. Adanya tingkatan efisiensi

pada saat melakukan tugas-tugas gerakan kompleks secara

utuh, meliputi semua gerakan keterampilan yang terbentuk

atas pola-pola gerakan locomotor dan manipulatif,

termasuk keterampilan adaptif sederhana, adaptif

majemuk, dan adaptif kompleks

Komunikasi tanpa kata-kata. Komunikasi yang

dilakukan dengan cara gerakan-gerakan tubuh sampai

dengan koreografis yang canggih (sikap badan, gerak

tangan, ekspresi raut muka, gerakan dansa, gerakan tari)

Menurut Lunerta (Jihad & Haris, 2008) bentuk tes

untuk ranah psikomotor yaitu dapat berupa tes paper and

pencil, tes identifikasi, tes simulasi, dan tes unjuk kerja.

(1) Tes paper and pencil : meskipun berupa tes tulis,

namun sasarannya adalah kemampuan siswa dalam

Page 100: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

89 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

menampilkan karya, seperti desain alat, desain

grafis, atau lainnya

(2) Tes identifikasi; tes ini dimaksudkan untuk

mengukur kemampuan siswa dalam

mengidentifikasi sesuatu hal, misalnya menemukan

bagian yang rusak dari suatu alat, dan sebagainya

(3) Tes simulasi: tes ini dilakukan jika tidak ada alat

sesungguhnya yang dapat dipakai untuk

memperagakan penampilan siswa, sehingga melalui

simulasi dapat dinilai apakah siswa sudah

menguasai keterampilan dengan bantuan peralatan

tiruan ini

(4) Tes unjuk kerja: tes ini dilakukan dengan alatyang

sesungguhnya dan tujuannya untuk mengetahui

apakah siswa sudah menguasai/terampil

menggunakan alat tersebut.

Untuk mendapat data melalui tes tersebut dapat

digunakan daftar cek (check list) atau skala

penilaian/kiraan (rating scale).

Page 101: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

90 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

UNIT III INSTRUMEN EVALUASI DAN

TEKNIK PENILAIAN

Ditinjau dari alat ukur atau instrumen yang

digunakan untuk melakukan pengukuran, secara umum

dibedakan menjadi dua, yaitu berbentuk tes atau non-tes.

Alat pengukuran yang berbentuk tes bisa dibedakan menjadi

tiga macam, yaitu tes lisan, test tertulis, dan tes perbuatan.

Tes lisan bisa diselenggarakan secara individual atau

kelompok. Tes tertulis bisa berbentuk esai (uraian) atau

obyektif. Sedangkan tes perbuatan bisa dilaksanakan secara

individual atau juga kelompok.

Alat pengukuran (penilaian) yang non-tes, yang

biasanya menyertai dalam pelaksanaan proses belajar

mengajar sangat banyak macamnya. Di antaranya bisa

disebutkan adalah observasi (baik dengan cara langsung, tak

langsung, maupun partisipasi), wawancara (terstruktur atau

bebas), angket (tertutup atau terbuka), sosiometri, checklist,

Page 102: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

91 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

concept map, portfolio, student journal, pertanyaan-

pertanyaan, dan sebagainya. Dilihat dari wilayah atribut

yang diungkap, secara umum alat ukur dapat dikategorikan

menjadi dua wilayah yaitu wilayah kognitif dan wilayah

non kognitif (Suryabrata, 2000)

Teknik penilaian adalah cara-cara yang ditempuh

untuk memperoleh informasi mengenai proses dan produk

yang dihasilkan dari pembelajaran yang dilakukan siswa.

Ada beberapa teknik yang dapat dilakukan dalam rangka

penilaian ini, secara garis besar dapat dikategorikan

sebagai teknik tes & nontes, baik untuk mengakses proses

belajar maupun hasil belajar. Teknik tes merupakan cara

untuk memperoleh informasi melalui pertanyaan yang

memerlukan jawaban benar atau salah, sedangkan teknik

nontes adalah suatu cara untuk memperoleh informasi

melalui pertanyaan yang tidak memerlukan jawaban benar

atau salah, tetapi hanya digradasi positif – negatif, suka –

tidak suka, atau setuju – tidak setuju.

Page 103: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

92 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 6 INSTRUMEN TES

A.Pengertian Tes

Secara sederhana tes dapat diartikan sebagai

himpunan pertanyaan yang harus dijawab atau

pernyataan-pernyataan yang harus dipilih atau ditanggapi,

atau tugas-tugas yang harus dilakukan oleh peserta tes

dengan tujuan untuk mengukur pengetahuan,

keterampilan, kecerdasan, atau kemampuan suatu aspek

tertentu dari peserta tes.

Kata “tes” berasal dari bahasa Latin “testum”, alat

untuk mengetahui kandungan-kandungan tanah. Dalam

bahasa Perancis, tes adalah alat atau piring untuk

menyisihkan logam mulia dari bahan-bahan lain seperti

pasir, batu, tanah, dan sebagainya. Kemudian diadopsi

dalam psikologi dan pendidikan untuk menjelaskan sebuah

alat ukur yang dikembangkan untuk dapat melihat dan

mengukur peserta tes yang memenuhi kriteria tertentu.

Page 104: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

93 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Untuk memperoleh gambaran yang lebih jelas

tentang pengertian tes, beberapa pengertian tes yang

dibuat para ahli dikemukakan di bawah ini:

(1) ”Test is a systematic procedure for observing a

person’s behaviour and describing it with the aid of

a numerical scale or a category system. Tes adalah

suatu prosedur sistematik untuk mengamati

tingkah laku seseorang dan mendeskripsikannya

dengan menggunakan skala numerik atau sistem

kategori (Cronbach , 1970).

(2) “Test is a standard procedure for obtaining a sample

of behavior from a specified domain” Tes adalah

suatu proses baku untuk memperoleh sampel

tingkah laku dari suatu ranah tertentu (Crocker

dan Algina, 1986).

(3) Test as a systematic procedure for measuring a

sample of behavior. Tes adalah suatu prosedur

sistematik yang dipakai untuk mengukur tingkah

laku atau karakteristik seseorang (Brown, 1981).

(4) Test is procedure in which a sample of an individual’s

behavior is obtained, evaluated, and scored using

standardized procedures. Tes adalah suatu

prosedur dimana suatu sampel perilaku induvidu

diperoleh, dievaluasi, dan diskor dengan

menggunakan prosedur standar (Reynold,

Livingston, & Wilson, 2010).

Page 105: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

94 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(5) Test is defined as an instrument of systematic

procedure for observing and describing one or more

chaaracteristics of a student using either a

numerical scale or a clasification scheme. Tes

didefinisikan sebagai suatu instrumen prosedur

sistematis untuk mengamati dan menggambarkan

satu atau lebih karakteristik siswa yang

menggunakan skala numerik atau skema

klasifikasi (Nitko & Brookhart, 2007)

(6) Dalam Encyclopedia of Educational Evaluation,

tes diartikan; “any series of questions or exercises or

other means of measuring the skill, knowledge,

intelligence, capacities or aptitudes of an individual

or group”.Artinya seperangkat pertanyaan atau

latihan atau alat pengukur kemampuan,

pengetahuan, kepandaian, kapasitas atau

kecerdasan lain dari suatu kelompok atau individu

(Anderson, et. al,1981).

Dari pendapat-pendapat di atas dapat disimpulkan

bahwa yang dimaksud dengan tes adalah prosedur yang

sistematis yang terdiri atas seperangkat pertanyaan atau

tugas-tugas untuk mengukur suatu perilaku tertentu pada

peserta didik dengan menggunakan bantuan skala numerik

atau kategori tertentu.

Kata “prosedur sistematik” yang terdapat pada

kelima pengertian di atas bermakna bahwa suatu tes itu

harus disusun, dilaksanakan, dan diskor (diberi angka)

berdasarkan aturan-aturan yang telah ditentukan

Page 106: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

95 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

sebelumnya. Istilah “tingkah laku” berarti bahwa suatu tes

itu menghendaki agar peserta didik (siswa) menunjukkan

apa yang sudah diketahui dengan cara menjawab butir-

butir tes atau mengerjakan tugas yang terdapat dalam tes.

Melalui jawaban yang diberikan atau cara melakukan

tugas-tugas, tersebut akan terungkap berbagai informasi

mengenai aspek psikologis tertentu dari orang yang

dikenai tes Informasi yang diperoleh selanjutnya akan

dijadikan dasar untuk membuat penilaian.

Selain pengertian tes sebagai prosedur sistematis,

tes juga dianggap sebagai suatu alat. Karena itu tes dapat

dinyatakan sebagai sejumlah pertanyaan yang harus

dijawab atau serangkaian tugas yang harus dikerjakan oleh

peserta tes yang hasilnya digunakan untuk mengukur

perubahan tingkahlaku dari ranah tertentu. Tes adalah

seperangkat pertanyaan atau tugas-tugas untuk

menentukan bentuk-bentuk respon yang berkenaan

dengan perilaku peserta didik yang dicari (Salvia dan

Ysseldyke,1994). Pada tes hasil belajar yang diukur adalah tingkah

laku ranah kognitif yaitu kemajuan belajar siswa, tingkat

pemahaman dan penguasaannya terhadap cakupan materi

yang dipersyaratkan dan sesuai dengan tujuan

pembelajaran tertentu.

B. Tujuan Tes

Terkait dengan tujuan tes dalam evaluasi

pendidikan/pembelajaran banyak para ahli menjelaskan

tentang tujuan dari tes. Rangkumannya antara lain yaitu:

Page 107: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

96 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

1) Untuk mengetahui kemajuan belajar siswa setelah

mengikuti kegiatan pembelajaran dalam jangka

waktu tertentu.

2) Untuk mengetahui efektivitas metode pembelajaran.

3) Untuk mengetahui kedudukan siswa dalam

kelompoknya.

4) Untuk memperoleh masukan atau umpan balik bagi

guru dan siswa dalam rangka perbaikan.

5) Untuk mendeskripsikan kemampuan belajar siswa.

6) Untuk mengetahui tingkat keberhasilan PBM

7) Untuk menentukan tindak lanjut hasil penilaian

8) Untuk memberikan pertanggung jawaban

(accountability)

9) Untuk mengetahui tingkat kemampuan siswa

10) Untuk mengukur pertumbuhan dan perkembangan

siswa

11) Untukmendiagnosa kesulitan belajar siswa

12) Untuk mengetahui hasil pengajaran

13) Untuk mengetahui hasil belajar

14) Untuk mengetahui pencapaian kurikulum

15) Untuk mendorong siswa belajar

16) Untuk mendorong pendidik mengajar yang lebih baik

C. Klasifikasi Tes

Tes dapat diklasifikasikan dengan beberapa macam,

tergantung dari tujuannya (Anastasi dan Urbina, 1997).

1.Tes Kinerja Maksimum dan tes Kinerja Tipikal

Page 108: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

97 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Menurut Cronbach (1970) tes dapat dibedakan

dalam dua kelompok besar yaitu (1) tes yang mengukur

kinerja maksimum (Maximum Performance Tests), dan (2)

Tes yang mengukur kinerja tipikal (Typical Performance

Tests).

Tes-tes kinerja maksimal adalah tes dimana

responden didorong untuk berusaha sekuat tenaga agar

mendapatkan skor tertinggi. Tes inteligensi, tes bakat dan

tes prestasi belajar merupakan contoh tes kinerja

maksimal.

Tes-tes kinerja tipikal tidak digunakan untuk

mengetahui apa yang mampu dilakukan oleh seseorang

tetapi untuk mengetahui apa yang cenderung dilakukan

seseorang. Pada tes kinerja tipikal responden didorong

untuk melaporkan secara jujur keadaan dirinya dalam

variabel yang diukur. Tes-tes kepribadian, tes minat, semua

skala sikap adalah termasuk dalam kelompok tes kinerja

tipikal.

Dalam tes-tes kinerja maksimal, jawaban subyek

adalah jawaban benar atau jawaban salah, sedangkan pada

tes-tes kinerja tipikal jawaban subyek adalah positif atau

negatif.

2.Tes Acuan Norma dan Tes Acuan Kriteria

Tes dapat dibedakan menjadi: tes acuan norma

(norm-referenced test) dan tes acuan patokan (criterion-

referenced test). Tes acuan norma atau sering disebut

Page 109: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

98 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

sebagai tes acuan normatif adalah tes yang penafsiran

hasilnya atas dasar kinerja relatif seseorang terhadap

kinerja orang lain dalam kelompoknya..Tujuannya adalah

untuk membeda-bedakan seorang individu dengan

individu lainnya agar peringkat dapat dilakukan

berdasarkan hasil masing-masig. Seorang guru ingin

mengetahui prestasi seorang siswa dalam suatu pelajaran

tertentu, misalnya pelajaran fisika, prestasi siswa itu dapat

dibandingkan dengan siswa-siswa lain dalam kelasnya.

Gambaran prestasi yang diperoleh demikian adalah relatif

dan karenanya tes acuan norma juga dikenal sebagai tes

relatif.

Tes-tes acuan patokan adalah tes yang penafsiran

hasilnya atas dasar kinerjanya sendiri tanpa

membandingkan dengan kinerja orang lain. Pada tes acuan

patokan ini hasil tes atau skor seseorang dibandingkan

terhadap suatu acuan tertentu yang ditetapkan. Guru

menetapkan kriteria atau standar minimum yang harus

dicapai oleh setiap peserta didik. Sesudah pembelajaran,

penguasaan dan prestasi siswa dalam pelajaran tersebut di

tes. Keputusan hasil tes itu dibandingkan dengan kriteria

yang telah ditetapkan.

3.Tes Buatan Guru dan Tes Standar

Berdasarkan cara penyusunan tes, Cangelosi (1995)

membedakan tes menjadi 2 macam, yaitu tes buatan guru

(teacher-made test) dan tes terstandar (standardized test).

Page 110: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

99 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Tes buatan guru (teacher-made test) adalah tes yang

disusun dan dikembangkan oleh guru mata pelajaran untuk

untuk keperluan pengukuran dan penilaian di kelasnya

sendiri guna memperoleh informasi tentang kemajuan

belajar siswanya. Efektivitas dan kualitas jenis tes ini

bergantung kepada ketrampilan dan kemampuan guru

dalam merancang sutu tes. Tes buatan guru ini bisa sebagai

ujian kenaikan kelas, sebagai tes satuan pelajaran, atau

sebagai kuis-kuis. Butir-butirnya dapat disajikan dalam

bermacam format: pilihan ganda, betul-salah, jawaban

singkat, melengkapi, atau soal-soal esai. Cirikhas tes ini

adalah dikonstruksi oleh guru kelas untuk mengukur

tujuan khusus pada kelas tertentu.

Tes Standar (Standardized Test) adalah tes yang

dirancang oleh ahli tes yang bekerja sebagai ahli kurikulum

sekaligus sebagai guru. Tes tersebut distandarisasi dalam

arti pengelolaan dan penyekoran yang dilakukan

berdasarkan standar dan asumsi kondisi yang seragam

sehingga hasil dari penilaian dapat dibandingkan untuk

kelas atau sekolah yang berbeda. Beberapa jenis tes

standar berdasarkan jenis normanya, yaitu tes inetelegensi,

tes bakat, tes prestasi akademik, tes minat dan sikap serta

tes kepribadian (Sax, 1980)

Sax (1980) menunjukkan perbedaan antara tes

buatan guru dan tes standar, adalah seperti dalam Tabel

6.1

Tabel 6.1.Perbandingan antara Tes Buatan Guru

dengan tes Standar Karakteristik Tes Buatan Guru Tes Standar

Page 111: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

100 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

1) Spesifikasi tujuan

Tujuan tes spesifik untuk keperluan penilaian siswa suatu kelas

Tujuan tes berlaku umum untuk siswa lintas kelas atau sekolah

2) Isi

Isi dapat diambil dari dari berbagai muatan kurikulum. Butir-butir tes dapat ditambah, dikurangi dan dimodifikasi sesuai pertimbangan guru

Butir-butir soal tetap dan tidak dapat dimodifikasi, dan hany mencakup suatu muatan tertentu dari kurikulum

3) Aturan pengelolaan dan penskoran

Aturan bergantung kepada guru. Mereka dapat melakukan tes secara seragam untuk seluruh siswa, tetapi dapat juga diadaptasi sesuai dengan kondisi siswa

Aturan bergantung kepada pihak yang membuat tes (publisher), mereka menyajikan aturan dan petunjuk dalam sebuah manual

4) Norma

Tidak ada norma yang menjadi acuan, tetapi norma itu dapat dikembangkan sendiri oleh guru

Norma dikembangkan oleh pembuat tes (publisher) untuk seluruh guru untuk membandingkan kinerja suatu kelas berdasarkan usia dan tingkatan siswa

5) Penilaian tes

Kualitas dari tes dapat dinilai sendiri oleh guru

5 Data yang berupa kualitas dari suatu hasil tes dikeluarkan oleh pembuat tes (publisher)

D. Jenis-Jenis Tes 1. Berdasarkan Klasifikasi Psikologi

Dalam psikologi, tes dapat diklasifikasikan menjadi

empat jenis, yaitu: (1) tes yang mengukur intelegensi

umum, (2) tes yang mengukur kemampuan khusus atau tes

Page 112: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

101 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

bakat, (3) tes yang mengungkap aspek kepribadian

(personality test) (4) tes yang mengukur prestasi.

a. Tes Inteligensi

Tes Inteligensi dirancang untuk mengukur

kemampuan umum seseorang dalam suatu tugas. Kita akan

ingat bahwa kecerdasan merupakan kemampuan untuk

berpikir dan belajar dari pengalaman. Hal ini diduga

tergantung pada kemampuan mewarisi dan lingkungan

dimana seseorang dibesarkan. Suatu tes kecerdasan

memberikan indikasi tentang kemampuan umum individu.

Tes kecerdasan biasanya mencakup berbagai macam tes

sebagai sampel beberapa aspek fungsi kognitif.

b. Tes Bakat

Tes bakat dibuat untuk mengungkap kemampuan

potensial dalam bidang tertentu. Jadi, tes-tes

bakat mengukur kemampuan-kemampuan khusus

dan potensi untuk belajar atau melakukan tugas-tugas

baru yang mungkin relevan dengan belajar atau kinerja di

bidang tertentu. Oleh karena itu tes bakat berorientasi ke

masa depan.

Tes bakat yang digunakan untuk memprediksi kesuksesan

dalam suatu program khusus disebut tes bakat khusus. Tes

bakat sering juga disebut tes bakat skolastik atas tes

kecerdasan bakat. Tes bakat sering digunakan untuk

proses seleksi dan penempatan. Bakat-bakat yang dapat di

tes seperti : bakat menulis, mekanik, musik, seni,

kreativitas

Page 113: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

102 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh tes bakat adalah Ujian Masuk Bersama ke Sekolah

Kejuruan.

c. Tes Kepribadian

Tes kepribadian yang bertujuan mengungkap

karakteristik individual subjek dalam aspek yang diukur,

seperti ciri-ciri cara berfikir, merasakan atau berperilaku

Beberapa tes kepribadian mengukur sikap, yaitu

cara seseorang menanggapi orang lain, benda, atau situasi

secara emosional atau secara rasional. Beberapa tes

kepribadian mengukur minat, misalnya minat terhadap

pekerjaan. Tes kepribadian yang lain didesain untuk

mengukur keadaan emosional seseorang, atau mengukur

pola perilaku yang menyimpang atau abnormal dan

menunjukkan penyimpangan psikologis.

d. Tes Hasil Belajar (Achievement Test)

Tes hasil belajar dimaksudkan tes yang digunakan

untuk mengevaluasi hal yang telah diperoleh dalam suatu

kegiatan. Menurut Brown (2004) tes hasil belajar

merupakan “a test to see how far students achieve materials

addressed in a curriculum within a particular time frame”.

Suatu tes untuk mengetahui (mengungkap) seberapa jauh

siswa-siswa telah menguasai materi yang ditentukan dalam

kurikulum pada kurun waktu tertentu.

Tes hasil belajar adalah berkaitan dengan tujuan

pengajaran, yaitu apa yang telah diajarkan. Tes ini

bertujuan untuk mengetahui (1) sejauhmana siswa

menguasai materi pelajaran yang telah diajarkan, (2)

kualitas atau tingkatan yang dicapai, (3) perubahan dan

Page 114: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

103 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

kemajuan pembelajaran, dan (4) keefektifan strategi

pengajaran. Menurut Azwar (2010), tes ini bertujuan untuk

mengukur prestasi atau hasil yang dicapai siswa dalam

belajar

Tes hasil belajar biasanya terdiri dari sejumlah butir

soal yang memiliki tingkat kesukaran bervariasi, mudah,

sedang, dan sukar. Tes hasil belajar disusun secara

terencana untuk mengungkap kemampuan siswa dalam

menguasai materi-materi yang yang telah diajarkan.. Tes

hasil belajar berisi butir pertanyaan atau tugas untuk

mengukur apakah pengetahuan atau keterampilan yang

telah dipelajari/dimiliki siswa dapat ditampilkan dan

dikuasai siswa secara baik..

Gronlund (1976) menyatakan bahwa tes prestasi

berfungsi sebagai alat untuk penempatan, fungsi formatif,

fungsi diagnostik dan fungsi sumatif.

Tes Penempatan: adalah tes yang diselenggarakan

menjelang dimulainya suatu program pengajaran, dengan

maksud untuk menempatkan seseorang pada kelompok

yang sesuai dengan tingkat kemampuan yang dimilikinya.

Tes Formatif: adalah tes untuk mendapatkan

informasi tentang kemajuan siswa. Tujuan tes ini adalah

untuk mengukur penguasaan siswa terhadap pokok

bahasan atau topik tertentu.Tes ini dapat dilakukan melalui

kuis-kuis atau tes pokok bahasan. Tes formatif dilakukan

pada setiap periode waktu tertentu dan digunakan untuk

memonitor kemajuan siswa (Silverius, 1991).

Tes Diagnostik: adalah tes yang dilaksanakan

untuk mendiagnosis atau mengidentifikasi kesukaran-

kesukaran dalam belajar, mendeteksi faktor-faktor yang

Page 115: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

104 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

menyebabkan terjadinya kesukaran belajar yang dihadapi

siswa, dan menetapkan cara mengatasi kesukaran atau

kesulitan belajar tersebut. Hasil tes diagnostik dapat

digunakan sebagai dasar penyelenggaraan pengajaran

yang lebih sesuai dengan kemampuan siswa sebenarnya,

termasuk kesulitan-kesulitan belajarnya.

Tes Sumatif: adalah tes untuk mengetahui hasil

pengajaran secara keseluruhan. Karena tes ini menekankan

pada hasil pengajaran secara keseluruhan, maka butir

tesnya meliputi seluruh materi yang telah disampaikan.

Lazimnya, tes sumatif diberikan di akhir suatu pelajaran,

atau akhir semester. Hasilnya untuk menentukan

keberhasilan siswa. Tingkat keberhasilan dinyatakan

dengan skor atau nilai, pemberian sertifikat, dan

sejenisnya.

2. Berdasarkan Cara Mengerjakan

Berdasarkan cara pelaksanaannya tes dapat dibagi

menjadi tiga jenis, yaitu (1) Tes lisan (oral test), (2) Tes

Tertulis (written test), dan (3) Tes perbuatan (skill test atau

performance test.

(1)Tes lisan: adalah tes yang pelaksanaanya dilakukan

dengan mengadakan tanya jawab secara langsung antara

pendidik dan peserta didik (berbentuk tanya jawab secara

tatap muka). Tes lisan pada umumnya digunakan untuk

mengevaluasi hasil belajar dalam bentuk kemampuan

dalam mengemukakan ide-ide dan pendapat-pendapatnya

secara lisan Tes lisan memiliki kelebihan dan kelemahan.

Page 116: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

105 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Kelebihannya adalah: (a) dapat menilai kemampuan dan

tingkat pengetahuan yang dimiliki peserta didik, sikap,

serta kepribadiannya karena dilakukan secara berhadapan

langsung; (b) bagi peserta didik yang kemampuan

berpikirnya relatif lambat sehingga sering mengalami

kesukaran dalam memahami pernyataan soal, tes bentuk

ini dapat menolong sebab peserta didik dapat menanyakan

langsung kejelasan pertanyaan yang dimaksud; (c) hasil tes

dapat langsung diketahui peserta didik. Kelemahannya

adalah (a) subjektivitas pendidik sering mencemari hasil

tes, (b) waktu pelaksanaan yang diperlukan relatif cukup

lama.

(2)Tes tertulis: adalah tes yang dilakukan secara tertulis

baik soal maupun jawabannya. Pada tes tertulis soal‐

soalnya harus dijawab peserta didik dengan memberikan

jawaban tertulis. Tes yang disampaikan secara lisan dan

dikerjakan atau dijawab secara tertulis masih digolongkan

ke dalam jenis tes tertulis. Ujian tertulis ini biasanya

dilakukan secara berkelompok dengan mengambil tempat

di suatu ruangan tertentu.

(3)Tes perbuatan: Tes yang penugasannya disampaikan

dalam bentuk lisan atau tertulis dan pelaksanaan tugasnya

dinyatakan dengan perbuatan atau unjuk kerja. Menurut

Winkel (1983) Tes perbuatan adalah “tes yang persoalan

atau pertanyaan disampaikan dalam bentuk tugas yang

harus dikerjakan oleh peserta didik. Alat yang dapat

digunakan tes ini adalah berupa observasi atau

Page 117: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

106 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

pengamatan terhadap tingkah laku tersebut, yang hasilnya

kemudian diserahkan pada guru”.

Alat yang dapat digunakan untuk melakukan tes ini

adalah lembar pengamatan atau lembar observasi terhadap

tingkah laku tersebut Tes bentuk perbuatan ini pada

umumnya dapat digunakan untuk menilai proses maupun

hasil (produk) dari suatu kegiatan praktik. Untuk tes

perbuatan yang sifatnya individual, sebaiknya

menggunakan format pengamatan individual. Untuk tes

perbuatan yang dilaksanakan secara kelompok digunakan

format tertentu yang sudah disesuaikan untuk keperluan

pengamatan kelompok.

Selain itu, Heaton (1988) membagi jenis tes menjadi

4 bagian utama, yaitu: (1) tes hasil belajar (achievement

test), (2) tes penguasaan (proficiency test), (3) tes bakat

(aptitude test), dan (4) tes diagnostik (diagnostic test).

E. Bentuk-Bentuk Tes Hasil Belajar

Tes yang merupakan salah satu alat ukur hasil

belajar memiliki berbagai bentuk. Wiersma dan Jurs (1990)

menyatakan bahwa terdapat dua bentuk utama butir tes,

yang disebut tes objektif dan esai, yang masing-masing

memiliki format yang bervariasi. Gronlund (1976)

menyatakan “The items used in classroom tests are typically

divided into two general categories: (1) the objective item

which is highly structured and requires the pupil to suplply a

word or two or to select the correct answer from among a

limited number of alternatives, and (2) the essay question

Page 118: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

107 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

which permits the pupil to select, organize, and present his

essay form. Tes yang digunakan dalam ruang kelas (tes

hasil belajar) secara umum dibagi menjadi dua kategori,

yaitu: 1) butir objektif yang terstruktur dan meminta

siswa untuk mengisi satu atau dua kata atau memilih

jawaban benar dari sejumlah pilihan, dan 2) pertanyaan

esai (uraian) yang memungkinkan siswa untuk memilih,

mengatur, dan menyajikan bentuk uraiannya.

F. Keterbatasan Tes Sebagai Alat Ukur

Keterbatasan tes sebagai alat ukur muncul karena

langkah-langkah mengukur atribut itu dilakukan secara

tidak langsung. Oleh karena keakuratan informasi yang

diperoleh dari hasil tes tergantung pada keterwakilan dan

kecukupan sampel butir-butir tes terhadap perilaku yang

terkait dengan atribut. Dengan kata lain, tes sebagai alat

ukur harus memiliki sampel yang representatif dari butir-

butir yang mengukur semua dan apa yang ingin

diukur. Selain itu, tidak seperti pengukuran fisik,

instrumen atau alat ukur tes tidak mutlak. Nilai nyata dari

skor 0 persen tidak berarti bahwa peserta didik memiliki

prestasi nol dan karena itu tidak belajar apa-apa.

Kita telah mengetahui bahwa seorang siswa yang

memiliki skor 60 dalam tes tertentu memiliki kemampuan

lebih daripada yang siswa lain yang memiliki skor 30.

Namun, kita mengetahui seberapa besar lebuhnya itu. Oleh

karena itu, skor-skor tes perlu diinterpretasikan dengan

hati-hati.

Page 119: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

108 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

G. Fungsi Tes 1. Sebagai alat untuk mengukur hasil belajar siswa.

Sebuah tes dapat digunakan untuk mengetahui

sejauh mana materi ajar telah dikuasai oleh siswa.

Misalnya, jika guru mengajar topik tertentu di kelas,

pada akhirnya guru memberikan tes dan banyak siswa

memperoleh skor yang tinggi. Ini merupakan indikasi

bahwa mereka telah memahami topik dengan sangat

baik.Tetapi jika skor mereka yang sangat rendah, ini

menunjukkan bahwa usaha kita sia-sia. Karenanya, kita

perlu melakukan pembelajaran yang lebih baik. Hasil tes

inilah yang akan membantu guru memutuskan apakah

akan melanjutkan ke topik berikutnya atau mengulang

topik yang sama.

2. Sebagai motivator dalam pembelajaran.

Menurut Ebel (1991), bahwa tes kadang-kadang

dapat dianggap sebagai motivator dari luar diri

(ekstrinsik). Pengalaman menunjukkan bahwa para

siswa akan lebih giat belajar jika mengetahui bahwa

diakhir program nanti akan dilakukan tes. Tanpa tes,

akan banyak siswa yang enggan untuk belajar secara

mandiri, sementara beberapa siswa lainnya

berkemungkinan kurang memberi perhatian saat guru

sedang mengajar. Kita dapat membayangkan jika ada

guru yang tidak memberikan tes maka hal itu sama

seperti siswa mendengarkan khutbah di masjid.

Page 120: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

109 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

3. Sebagai upaya perbaikan kualitas pembelajaran.

Melalui penggunaan tes penempatan, tes diagnostik, dan

tes formatif dapat memperbaiki kualitas pembelajaran,

4. Sebagai penentu berhasil atau tidaknya siswa sebagai

syarat untuk melanjutkan pendidikan ke jenjang yang

lebih tinggi dengan melaksanakan tes sumatif

H. Karakteristik Tes yang Baik

Sebuah tes dikatakan tes yang baik jika tes tersebut

memiliki ciri-ciri antara lain memiliki validitas, reliabilitas,

objektivitas, praktikabilitas, dan ekonomis.

1. Memiliki validitas. Tes dikatakan memiliki validitas

jika tes tersebut dengan secara tepat, secara benar,

secara shahih, atau secara absah dapat mengukur

apa yang seharusnya diukur, yaitu mengukur hasil

belajar yang telah dicapai oleh siswa setelah mereka

menempuh proses belajar mengajar dalam jangka

waktu tertentu.

2. Memiliki reliabilitas. Tes dikatakan memiliki

reliabilitas jika hasil-hasil pengukuran yang

dilakukan dengan menggunakan tes tersebut secara

berulang kali terhadap subjek yang sama,

menunjukkan hasil yang tetap atau sifatnya ajeg dan

stabil.

3. Memiliki objektivitas. Tes dikatakan memiliki

objektivitas jika tes tersebut disusun dan

dilaksanakan menurut tujuan instruksional khusus

yang telah ditentukan, bukan atas kemauan dan

kehendak dari tester, serta dalam pemberian skor

Page 121: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

110 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dan penentuan nilai harus terhindar dari unsur-

unsur subjektivitas tester.

4. Memiliki praktikabilitas. Tes dikatakan memiliki

praktikabilitas jika tes tersebut praktis (mudah

dilaksanakan, mudah pemeriksaannya, dan

dilengkapi dengan petunjuk-petunjuk yang jelas)

dan mudah mudah pengadministrasiannya.

5. Memiliki ekonomis. Tes dikatakan memiliki

ekonomis jika pelaksanaan tes tersebut tidak

membutuhkan ongkos/biaya yang mahal, tenaga

banyak, dan waktu yang lama

Selain ciri-ciri tersebut , masih ada ciri tambahan

agar tes dapat dipandang sebagai tes yang baik, yaitu:

mudah dilaksanakan dan mudah untuk diskor (Basuki dan

Hariyanto, 2014).

Page 122: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

111 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 7

Page 123: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

112 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BENTUK TES HASIL BELAJAR

A. Tes Objektif 1.Pengertian Tes Objektif

Nelson (1970) menyatakan “The objective test is

highly structured. The examinee is presented with items for

which he must select answers from the alternatives given

rather than construct the answers himself”, tes objektif

adalah tes yang sangat terstruktur. Peserta tes disajikan

dengan butir-butir dimana mereka harus memilih jawaban

dari pilihan-pilihan yang diberikan tanpa menyusun

jwaban sendiri.

Pengertian kata “objektif” di sini dimaksudkan

bahwa tes jenis ini, objektif dilihat dari sistem

penskorannya, artinya siapa saja yang memeriksa lembar

jawaban tes akan menghasilkan skor yang sama. Jadi, tes

objektif adalah tes yang sistem penskorannya objektif.

Tes objektif merupakan perangkat tes yang butir-butir

soalnya mengandung alternatif jawaban yang harus dipilih

oleh peserta tes. Alternatif jawaban telah disediakan oleh

pembuat butir soal. Peserta tes diminta memilih jawaban

dari alternatif jawaban yang telah disediakan. Karenanya,

pemberian skor terhadap jawaban soal dapat dilakukan

secara objektif oleh pemeriksa. (Hopkins dan Antes, 1989)

mengemukakan bahwa dalam butir soal objektif,

pemeriksaan tes tidak memberikan penilaian tentang mutu

Page 124: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

113 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

jawaban siswa, tetapi hanya mencocokkan jawaban siswa

dengan kunci jawaban

Tes objektif mempunyai beberapa keunggulan yang

dapat digunakan dalam pembelajaran di sekolah. Pertama,

tes objektif itu singkat dan siswa tidak perlu menulis

banyak dalam menjawab. Kedua, materi dan tujuan

pengajaran dapat terwakili dengan baik. Ketiga, tes objektif

adalah reliabel. Keempat, tes objektif dapat digunakan pada

kelas dengan jumlah siswa yang banyak, dan dalam

melakukan penyekoran dapat akurat, hanya menggunakan

kunci jawaban yang dapat dilakukan oleh orang atau mesin

(Brown dan Thornton, 1971).

Tes objektif digunakan untuk mengevaluasi hasil

belajar berupa kemampuan-kemampuan:

a) Mengingat dan mengenal kembali fakta-fakta

b) Memahami hubungan antara dua hal atau lebih

c) Mengaplikasikanprinsip-prinsip

d) Menganalisis

e) Mengsintesis

f) mengevaluasi

2. Kelebihan Tes Objektif

Tes objektif meningkatkan skor jawaban siswa pada

butir-butir tes karena penskoran tidak dipengaruhi

oleh bias penskor ketika penskoran dilakukan tetapi

oleh kebenaran jawabannya.

Penskoran tes objektif adalah mudah dan

membutuhkan sedikit waktu. Penskoran juga dapat

Page 125: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

114 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dilakukan oleh komputer dan memberikan efesiensi

yang tinggi bagi besar peserta tes.

Hasil tes objektif terutama tes pilihan ganda dapat

digunakan untuk tujuan diagnostik karena tes

objektif dapat memberi petunjuk terhadap

kesalahan-kesalahan faktual dan kesalah pahaman

yang memerlukan perbaikan.

Untuk pengambilan sampel materi pada tes objektif

adalah cukup karena lebih representatif mewakili isi

materi dan luas bahan karena memungkinkan

jumlahnya butirnya yang banyak Hasilnya

memberikan kemampuan peserta tes lebih valid dan

reliabel.

Tes objektif efisien untuk mengukur pengetahuan

tentang fakta-fakta. Tes objektif dapat juga

dirancang untuk mengukur pemahamn,

ketrerampilan berpikir dan hasil-hasil belajar

kompleks lainnya.

Butir tes objektif dapat menjadi sebagai pretes (tes

awal), disempurnakan melalui analisis butir,

dibakukan, dan digunakan kembali beberapa kali

jika ditangani dengan benar.

Tes objektif adalah adil untuk semua peserta tes

karena tidak bertugas pada keterampilan lain di

luar keterampilan yang dimaksudkan untuk

mengukur. Artinya validitasnya tidak dipengaruhi

oleh tulisan tangan yang baik, atau banyak kata-kata

yang tidak berguna.

3. Kelemahan Tes Objektif

Page 126: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

115 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Tes objektif tidak mendorong pengembangan peserta tes dalam keterampilan yang diinginkan seperti kemampuan untuk memilih, mengatur atau mensitesiskan ide-ide dan menyajikannya secara benar dalam bentuk logis dan koheren.

Tes objektif cenderung mengukur hanya

pengetahuan faktual. Kelemahan ini dapat diatasi

dengan mengembangkan butir-butir untuk butir

objektif secara ketat beradasarkan langkah-langkah

yang terlibat dalam proses pengembangan butir.

Pengembangan butir tes objektif yang baik

memerlukan pelatihan pengembang tes dalam

keterampilan yang diperlukan untuk

mengkonstruksi efektif, butir yang valid dan

relaibel.

Tes objektif membutuhkan waktu, komitmen dan

perencanaan yang memadai

Butir tes objektif memberi kemungkinan untuk

menebak terutama ketika butir tes tidak terampil

dikembangkan. Seorang peserta tes dapat menebak

dengan benar pada beberapa butir dan

mendapatkan angka tidak layak bahkan dalam tes

objektif yang dikonstruk secara baik. Adalah lebih

mudah untuk menipu dalam tes objektif daripada

tes esai jika tes ini kurang dikelola.

4. Klasifikasi Tes Objektif

Menurut Gronlund dan Linn (1990) tes objektif

dapat diklasifikasikan menjadi dua jenis, yaitu (1) soal

Page 127: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

116 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dengan respon pilihan (Selected Response Items) dan (2)

soal dengan respon isian (Supply Response Items)

4.1.Jenis Respon Pilihan

Tes respon pilihan (Selected Response Items) adalah

jenis tes di mana peserta tes memilih jawaban yang paling

sesuai atau pilihan yang benar. Adapun yang termasuk

dalam kelompok ini adalah tes benar-salah, tes

menjodohkan, dan tes pilihan ganda

a. Tes Benar- Salah

Tes bentuk benar-salah (true-false) terdiri

dari sebuah pernyataan atau proposisi yang harus

dinilai oleh peserta tes atau siswa dan kemudian

memberi tanda, apakah benar atau salah. Dalam tes

ini pernyataan disajikan kepada peserta tes dan ia

diminta untuk menyatakan apakah pernyataan itu

Benar atau Salah, Ya atau Tidak, Setuju atau Tidak

Setuju, dan sebagainya.

Kelebihan tes benar-salah:

(1) Sangat mudah untuk mengkonstruksi butir

respon pilihan (alternatif) namun validitas dan

reliabilitas butir tersebut bergantung pada

keterampilan para pengkonstruk butir. Untuk

mengkonstruk butir respon pilihan tidak ambigu,

yang mengukur hasil belajar signifikan, memerlukan

banyak keahlian.(2) Sejumlah besar butir respon

pilihan mencakup materi sampel yang luas dapat

diperoleh dan peserta tes dapat meresponnya

Page 128: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

117 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dalam jangka waktu yang singkat. (3) penilaiannya

objektif.

Kelemahan tes benar-salah:

(1) Tes ini membutuhkan materi pelajaran yang

dapat diutarakan sehingga pernyataan tersebut

benar atau salah tanpa batasan atau pengecualian

seperti dalam ilmu sosial. (2) Tes ini terbatas untuk

hasil belajar dalam bidang pengetahuan saja kecuali

untuk membedakan antara fakta dan pendapat atau

mengidentifikasi hubungan penyebab dan akibat.(3)

Tes ini rentan terhadap menebak dengan peluang

benarnya adalah 50%. (4) Apabila jumlah butir

soalnya sedikit, indeks daya pembeda butir soal

cenderung rendah.

Ada enam variasi tes benar-salah yaitu:

benar-salah (true-false), ya-tidak (yes-no), betul-

salah (right-wrong), pembetulan atau koreksi

(correction),pilihan benar-salah jamak (multiple

true-false), dan ya-tidak dengan penjelasan (yes-no

with explanation). Nitko (1996) mengemukakan

Variasi ”benar-salah” berbentuk proposisi yang

harus dinilai oleh peserta didik, apakah penyataan

itu benar atau salah. Variasi bentuk “ya-tidak”

menanyakan pertanyaan langsung, terhadap mana

peserta didik menjawab atau tidak. Pada variasi

bentuk ”betul-salah,” dikemukakan perhitungan,

persamaan, atau kalimat yang harus dinilai oleh

peserta didik apakah betul atau tidak betul. Variasi

bentuk “koreksi atau pembetulan,” meminta kepada

peserta didik untuk menilai sebuah proposisi,

Page 129: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

118 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

seperti pada bentuk benar-salah, tetapi peserta

didik juga diminta untuk memperbaiki atau

mengoreksi setiap pernyataan yang salah dan

membetulkannya. Variasi bentuk pilihan “benar-

salah” tampaknya sama dengan butir pilihan ganda,

malahan pada saat memilih satu opsi yang benar,

peserta didik memperlakukan tiap opsi sebagai

suatu pernyataan “benar-salah” yang terpisah, yakni

lebih dari satu pilihan bisa benar. Sedangkan pada

variasi “ya-tidak” dengan penjelasan, menanyakan

pertanyaan langsung dan meminta peserta didik

untuk menjawab “ya” atau “tidak,” dan dijelaskan

mengapa pilihannya benar.

Penggunaan tes Benar-Salah:

(1) Jenis tes ini umumnya digunakan untuk

mengukur kemampuan mengidentifikasi kebenaran

dari pernyataan fakta, definisi istilah, pernyataan

prinsip-prinsip dan hasil pembelajaran yang relatif

sederhana. (2) Juga digunakan untuk mengukur

kemampuan membedakan fakta dari pendapat,

tahyul dari keyakinan ilmiah. (3) Tes ini paling baik

digunakan untuk mengukur kemampuan mengenali

hubungan-hubungan penyebab-dan-akibat. (4) Tes

ini paling baik digunakan dalam situasi dimana

hanya ada dua kemungkinan pilihan seperti benar

atau salah, lebih atau kurang, dan sebagainya, dan

/(5) Tes jenis ini berguna ketika sejumlah besar

materi pembelajaran harus segera diuji

b. Tes Menjodohkan

Page 130: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

119 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Tes menjodohkan adalah tes yang terdiri dari

dua kelompok. Kelompok pertama berisi kata-kata

pertanyaan, di mana kata-kata ini memiliki jodoh

atau pasangan pada kelompok kedua. Tugas peserta

tes atau siswa ialah menjodohkan masing-masing

kata atau pertanyaan tersebut dari kelompok satu

dan kelompok ke dua.

Bentuk soal menjodohkan terdiri atas sub

kelompok pernyataan yang pararel. Kedua

kelompok pernyataan ini berada dalam satu

kesatuan. Kelompok sebelah kiri merupakan bagian

yang berisi soal dan kelompok sebelah kanan berisi

jawabannya. Jumlah jawaban dibuat lebih banyak

dari jumlah soal. Kelebihan tes menjodohkan adalah:

(1) Tes menjodohkan bentuknya yang kompak dan

dapat mengukur sejumlah besar hasil belajar yang

berkaitan dengan fakta-fakta, dan mudah

menyusunnya.terdiri Bentuk rapi ini

memungkinkan untuk mengukur sejumlah besar

materi faktual yang terkait dalam waktu yang relatif

singkat.(2) Tes menjodohkan memungkinkan

pengambilan sampel isi materi yang banyak, yang

menghasilkan validitas isi yang relatif lebih

tinggi.(3) Faktor menebak dapat dikontrol jika

terampil dalam mengkonstruksi butir seperti

respon benar setiap stimulus harus berfungsi (4)

Penskorannya sederhana dan objektif, serta dapat

dilakukan dengan komputer

Page 131: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

120 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Kelemahan tes menjodohkan adalah:

1) sukar mengukur proses mental yang tinggi,

2) siswa cenderung untuk membuat tafsiran-

tafsiran,

3) kemungkinan menebak relative tinggi.

Penggunaan tes menjodohkan:

1) Tes ini digunakan ketika hasil pembelajaran

menekankan pada kemampuan untuk

mengidentifikasi hubungan diantara hal-hal

dan sejumlah stimulus yang homogen dan

respon yang dapat diperoleh,

2) Pada dasarnya digunakan untuk

menghubungkan dua hal yang memiliki

dasar logis untuk digabungkan,

3) Tes ini memadai untuk mengukur

pengetahuan faktual seperti pengujian

pengetahuan istilah, definisi, tanggal,

peristiwa, petunjuk ke peta serta diagram-

diagram.

c. Tes Pilihan Ganda

Thorndike dan Hagen (1977)

menyatakan:”the multiple choice item consists of two

parts: the stem which presents the problem, and the

list of possible answers or options. In the standard

from of the item, one of the options is the correct or

the best answer and the others are misleads or foils or

distractors.

Page 132: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

121 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Soal pilihan ganda adalah bentuk soal yang

konstruksinya terdiri atas dua bagian yaitu pokok

soal (stem) dan alternatif jawaban (option). Satu di

antara alternatif jawaban tersebut adalah jawaban

benar atau yang paling benar (kunci jawaban),

sedangkan alternatif jawaban yang lain berfungsi

sebagai pengecoh (distractor).

Stem Item atau Butir Soal Distractor

Option Kunci

Pokok soal dapat dibuat dalam dua bentuk,

yaitu pokok soal dalam bentuk pertanyaan tidak

selesai atau dalam bentuk kalimat tanya. Jumlah

alternatif jawaban yang dibuat biasanya empat atau

lima. Hal ini senada dengan pendapat Thorndike

dan Hagen (1977)” an item must have at least 3

answer choices to be classified as a multiple choice

itemand typical pattern is to have 4 or 5 answe”.

Semakin banyak alternatif jawaban yang dibuat,

maka probabilitas siswa untuk menebak jawaban

semakin kecil. Tata tulis tes pilihan ganda adalah

sebagai berikut (Kemdikbud, 2010).

Page 133: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

122 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(1) Jika pokok soal (stem) ditulis dengan kalimat

tidak selesai, maka awal kalimat ditulis dengan

huruf besar dan awal option ditulis dengan

huruf kecil, dan pada akhir kalimat disertai

dengan empat buah titik.

Perhatikan struktur tes pilihan ganda berikut:

---------------------------------------------------------------------

---------------------------------------------------------------------

Pokok Soal

------------------------------------------....

-----------------------------* Kunci jawaban

----------------------------- Pengecoh

----------------------------- Pengecoh

---------------------------- Pengecoh

(2) Jika pokok kalimat ditulis dengan kalimat

tanya, maka awal kalimat ditulis dengan huruf

kapital dan akhir kalimat diberi tanda tanya.

Setiap awal option dimulaii dengan huruf

kapital dan diakhiri dengan tanda titik.

Perhatikan struktur tes pilihan ganda berikut:

---------------------------------------------------------------------

---------------------------------------------------------------------

Pokok Soal

------------------------------------------?

----------------------------- .* Kunci jawaban

-----------------------------. Pengecoh

Page 134: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

123 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

-----------------------------. Pengecoh

----------------------------. Pengecoh

Petunjuk menulis soal pilihan ganda:

Mengkonstruksi butir soal pilihan ganda yang baik

membutuhkan waktu yang cukup untuk menulis,

menelaah, dan merevisinya. Sebaiknya kita menulis

(mencicil) beberapa soal setiap hari ketika materi

masih segar dalam ingatan setelah mengajar,

dibandingkan dengan menulis soal sekaligus setelah

selesai (di akhir ) penyajian materi.

Menulis Stem:

Stem dari butir soal pilihan ganda memiliki suatu

masalah atau menyatakan sebuah pertanyaan.

Aturan mendasar pada penulisan stem bahwa siswa

harus memahami pertanyaan tanpa harus membaca

beberapa kali dan tanpa membaca semua pilihan

(option).

Menulis Respons (tanggapan):

Soal-soal pilihan ganda biasanya mempunyai empat

atau lima pilihan (option) untuk membuatnya sukar

bagi siswa dalam menebak jawaban yang benar.

Aturan mendasar untuk penulisan respons

(tanggapan) adalah (a) siswa harus dapat memilih

respons yang tepat tanpa harus memilah-milah

kerumitan yang tidak ada hubungannya dengan

mengetahui jawaban yang benar, dan (b) mereka

Page 135: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

124 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tidak harus mampu menebak jawaban yang benar

dari cara respons tersebut ditulis.

Penggunaan tes Pilihan Ganda:

(1) Tes pilihan ganda merupakan bentuk tes yang

paling banyak digunakan dari bentuk tes yang ada.

Tes ini dapat digunakan untuk mengukur berbagai

hasil pembelajaran dari yang sederhana hingga ke

yang kompleks, (2) Tes pilihan ganda dapat

disesuaikan dengan materi dan tujuan pembelajaran

pada tingkat-tingkat pengetahuan dan pemahaman.

(3) Tes pilihan ganda dapat digunakan untuk

mengukur hasil-hasil pengetahuan yang berkaitan

dengan kosa kata, fakta, prinsip, metode dan

prosedur dan juga aspek-aspek pemahaman yang

berhubungan dengan penafsiran fakta-fakta,

prinsip-prinsip dan metode-metode, (4)

Kebanyakan dari tes-tes prestasi dan bakat yang

standar dikembangkan secara komersil

menggunakan jenis tes pilihan ganda.

Tes pilihan ganda dapat digunakan untuk

mengukur pengetahuan, ingatan dan juga pemikiran

tingkat tinggi. Haladyna (1999) mengemukakan

bahwa pertanyaan-pertanyaan pilihan ganda dapat

mengukur empat jenis isi (fakta, konsep, prinsip,

dan prosedur) dan lima jenis perilaku kognitif

(mengingat, memahami, memprediksi,

mengevaluasi, dan menyelesaikan masalah).

Kelebihan tes Pilihan Ganda:

Page 136: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

125 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(1) Tes pilihan ganda adalah penerapannya yang

luas dalam pengukuran bermacam-macam fase

pencapaian, (2) Tes pilihan ganda berguna dalam

mendiagnosis dan memungkinkan membedakan

diantara peserta tes berdasarkan apa yang sedang

diukur yang dimiliki mereka, (3) Dapat mengukur

berbagai jenjang kognitif (dari ingatan sampai

dengan evaluasi (4) Tes pilihan ganda dapat diskor

dengan computer

Kekurangan Tes Pilihan Ganda:

(1) Memerlukan waktu yang relatif lama untuk

menulis soalnya; (2) Sulit membuat pengecoh yang

homogen dan berfungsi ;(3) Terdapat peluang

untuk menebak kunci jawaban. (4) Tes pilihan

ganda membutuhkan waktu respon yang lebih lama

dari pada tes objektif jenis lain

Ragam Tes Pilihan Ganda

Ragam tes pilihan ganda dapat dibedakan

atas: 1) Ragam Tes Pilihan Ganda menurut soalnya,

dan 2) Ragam Tes Pilihan Ganda menurut

jawabannya.

Ragam Tes Pilihan Ganda menurut soalnya:

Terdapat 5 (lima) ragam soal pilihan ganda

berdasarkan soalnya yaitu: (1) pilihan ganda biasa

(melengkapi pilihan), (2) pilihan ganda asosiasi, (3)

Page 137: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

126 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

pilihan ganda analisis hubungan atau sebab akbiat,

(4) Pilihan ganda analisis kasus, dan (5) pilihan

ganda membaca diagram, grafik, tabel. Penggunaan

kelima ragam itu memungkinkan soal pilihan ganda

dapat mengukur aspek kognitif tingkat tinggi

(analisis, sintesis, dan evaluasi).

(1) Tes pilihan ganda melengkapi pilihan.

Soal tes pilihan ganda jenis ini terdiri dari pokok

soal (stem) yang berupa pernyataan yang belum

lengkap atau suatu pertanyaan yang dilengkapi

dengan 4 atau 5 kemungkinan jawaban yang disebut

option. Tugas siswa adalah memilih jawaban yang

benar (sesuai kunci). Ragam ini paling banyak

digunakan. Kekeliruan penggunaan ragam ini

umumnya pada segi kaidah bahasa dan penempatan

pilihan (option).

Petunjuk:

Pililah satu jawaban yang tepat pada soal di bawah

ini dengan memberi tanda silang (X) pada huruf

dilembaran jawaban

Contoh soal:

Untuk pembelajaran yang menuntut pencapaian

kompetensi tertentu sebagaimana diharapkan dan

termuat pada kurikulum saat ini, maka lebih tepat

menggunakan….

Page 138: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

127 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

A. Penilaian Acuan Normatif

B. Penilaian Acuan Patokan

C. Penilaian Berbasis Kelas

D. Penilaian Berbasis Kompetensi

(2) Tes pilihan ganda asosiasi.

Tes jenis ini merupakan modifikasi dari tes pilihan

ganda biasa. Bentuk asosiasi juga terdiri dari satu

pernyataan dan beberapa alternatif jawaban, hanya

saja terdapat lebih dari satu jawaban yang benar.

Soal dengan ragam asosiasi ini mengharuskan siswa

berpikir lebih komprehensif sebab pilihan jawaban

yang benar bisa 3, 2, 1 atau semua salah.

Petunjuk::

Pilihlah:

A. Jika (1), (2), dan (3) betul;

B. Jika (1) dan (3) betul;

C. Jika (2) dan (4) betul;

D. Jika hanya (4) yang betul.

Contoh soal:

Kegiatan evaluasi terdiri dari:

(1) mengukur

(2) menilai

(3) memberikan hasil

(4) persiapan

Page 139: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

128 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(3)Tes pilihan ganda hubungan antar hal atau

sebab akibat

Tes soal ini memuat pernyataan dan alasan, dengan

pola memuat pernyataan dan memuat alasan. Soal

pilihan ganda jenis ini terdiri dari 2 kalimat

pernyataan, yang dihubungkan dengan kata SEBAB.

Kedua kalimat bisa merupakan sebab akibat, bisa

juga keduanya benar tetapi tidak berhubungan, bisa

salah satu benar, dan bisa juga keduanya salah.

Petunjuk:

Pada soal berikut terdapat kalimat-kalimat yang

terdiri atas pernyataan yang diikuti alasan

Pilihlah:

A. Jika pernyataan benar, alasan benar, dan ada

hubungan sebab

akibat

B. Jika pernyataan benar, alasan benar, dan tidak

ada hubungan sebab akibat

C. Jika pernyataan benar, alasan salah

D. Jika pernyataan salah, dan alasan salah

E. Baik pernyataan maupun alasan salah

Page 140: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

129 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh soal:

Motivasi adalah salah satu seni penting yang harus

dikuasai oleh orang pimpinan

SEBAB

Kemampuan memotivasi bawahan adalah salah satu

cara untuk mendapatkan sumberdaya manusia yang

mau dan mampu bekerja

(4) Tes pilihan ganda tinjauan atau analisis

kasus.

Bentuk tes soall tinjauan/ analisis kasus sama

dengan ragam butir 1 (melengkapi atau menjawab

pertanyaan), hanya isi yang terkandung dalam

pokok soal berupa kasus. Peristiwa khusus, hasil

kerja di laboratorium, atau kejadian di sekitar kita

dapat dijadikan kasus.

Petunjuk:

Untuk soal berikut disediakan suatu teks yang harus

dipahami secara cermat. Kemudian menyusul soal

yang memasalahkan hal-hal yang berhubungan

dengan isi teks. Pilihlah satu jawaban yang paling

tepat pada soal yang mengiringi teks.

Page 141: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

130 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh soal:

Sebuah benda digantung dengan pegas, dengan h

adalah tinggi benda dari tanah. Bila sekarang benda

itu ditarik sedikit ke bawah, kemudian dilepaskan,

benda itu akan berayun naik turun secara harmonic

dengan frekuensi ayunan per detik.

Ayunan benda itu disebabkan oleh:

A. Tarikan searah dari pegas

B. Tarikan searah dari gravitasi

C. Interaksi antara pegas dan gaya gesekan udara

D. Interaksiantara gaya gravitasi dan gaya gesekan

udara

(5) Tes pilihan ganda analisis diagram, grafik,

tabel.

Bentuk tes soal ini disajikan berupa diagram,

gambar, grafik atau tabel. Ragam tes pilihan ganda

ini dapat mengukur aspek berpikir lebih tinggi.

Petunjuk:

Dalam menjawab soal berikut ini hendaknya

digunakan table serta data yang ada di dalamnya.

Contoh:

Page 142: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

131 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Tabel di bawah ini menggambarkan rata-rata suhu dan curah hujan di kota X selama 10 bulan Januari s.d Oktober)

Udara

Jan Feb Mar Apr Mei Jun Jul Ag

t

Sep Okt

Suhu

udara

(oC)

Curah Hujan (mm)

28,9

1,0

29,9

4,0

31,3

23,0

29,9

86,0

29,1

27,0

28,6

0,0

27,9

0,0

28

,1

1,

0

28,9

2,0

28,7

42,0

Adopsi dari Zainul & Nasution, 2005.

Pertanyaan: Manakah yang benar untuk kota X ?

A. Bulan yang terpanas suhu udaranya adalah

bulan yang sedikit curah hujannya

B. Setiap bulan selalu turun hujan di kota X

C. Terjadi dua kali musim hujan dalam selam 10

bulan di kota X

D. Waktu yang paling baik untuk menanam padi di

kota X adalah pada bulan Juni

2) Ragam Tes Pilihan Ganda menurut

jawabannya.

Ada tujuh (tujuh) ragam soal pilihan ganda

berdasarkan jawabannya yaitu: (1) jawaban yang

benar; (2) jawaban yang paling tepat/baik; (3)

banyak jawaban yang benar; (4) jawaban sebagai

isian; dan (5) pengecualian negatf.

Page 143: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

132 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(1) Jawaban yang Benar.

Salah satu dari optionnya mutlak benar, sementara

yang lainnya mutlak salah.

Contoh:

Siapakah yang menemukan telepon ?

A. Edison

B. Bell

C. Morse

D. Marconi

(2) Jawaban yang paling tepat/Baik.

Kemungkinan jawaban mempunyai tingkat

kebenaran yang berbeda.Yang paling tinggi tingkat

kebenarannya adalah yang paling benar

Contoh:

Jenis tes yang digunakan untuk mengukur pembelajaran sekolah disebut : A. Sebuah tes diagnostik .

B. Sebuah tes kemampuan .

C. Sebuah tes profil .

D. Sebuah tes prestasi

(3) Banyak Jawaban yang Benar.

Kemungkinan jawaban(option) dapat berisi lebih

dari satu jawaban yang benar.

Contoh:

Page 144: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

133 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Pancasila adalah....

A. Dasar negara Republik Indonesia

B. Lima azas orde baru

C. Falsafah hidup bangsa Indonesia

D. Alat peersatu bangsa Indonesia

(4) Jawaban sebagai Isian.

Ujung dari pertanyaanya terdapat kekosonga

sehingga perlu diisi

Contoh:

Penemu rumus kesetaraan energi dan massa

adalah....

A. Rutherford

B. Einstein

C. Sommerfeld

D. Maxwell

(5) Pengecualian Negatif.

Pada ragam ini jawaban yang paling benar ialah

perkecualian dari pokok soal

Contoh;

Di bawah adalah kebaikan tes bentuk objektif

dibandingkan tes bentuk uraian, kecuali …

A. Cepat dan obyektif dalam memeriksa

jawaban peserta

B. Dapat mewakili bahan atau materi yang telah

dibelajarkan

Page 145: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

134 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

C. Mudah membuat pertanyaanya

dibandingkan tes uraian

D. Waktu yang diperlukan singkat untuk

menjawab satu butir soal

4.2. Jenis Respon Isian

Tes respon isian (Supply Response Items) atau

bentuk tes mengisi jawaban cenderung

menunjukkan kompromi antara tes esai dan tes

objektif. Yang termasuk dalam kelompok ini adalah

butir soal jawaban singkat (short answer) dan butir

soal melengkapi (completion).

a. Tes Jawaban Singkat

Bentuk soal jawaban singkat merupakan soal

yang menghendaki jawaban dalam bentuk kata,

bilangan, kalimat atau simbol dan jawabannya

hanya dapat dinilai benar atau salah. Kaidah utama

dalam menulis bentuk soal jawaban singkat adalah:

soal harus sesuai dengan indikator, jawaban yang

benar hanya satu, dan rumusan kalimat soal harus

komunikatif.

Penggunaan tes Jawaban Singkat:

(1) Sangat cocok mengukur berbagai hasil

pembelajaran yang relatif sederhana seperti

mengingat informasi yang dihafal dan hasil-hasil

pemecahan masalah yang diukur dalam matematika

dan sains.(2) Dapat digunakanuntuk mengukur

Page 146: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

135 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

kemampuan untuk menafsirkan diagram, bagan,

grafik dan data bergambar.(3) Digunakan paling

efektif untuk mengukur hasil belajar tertentu

seperti hasil belajar perhitungan dalam matematika

dan sains.

Kelebihan tes Jawaban Singkat:

(1) sangat mudah menyusunnya, karena secara

relatif biasanya mengukur hasil belajar yang

msederhana (2) Dapat meminimalkan menebak

karena peserta tes harus memberi jawaban dengan

berpikir dan mengingat kembali informasi yang

diminta atau membuat perhitungan yang diperlukan

untuk memecahkan masalah yang disajikan. Hal ini

berbeda dengan butir pilihan dimana sebagian

pengetahuan memungkinkan peserta tes memilih

jawaban yang benar.

Kelemahan tes Jawaban Singkat:

(1) Tidak cocok untuk mengukur hasil belajar yang

kompleks. Ia cenderung untuk mengukur hanya

pengetahuan faktual dan bukan kemampuan untuk

menerapkan pengetahuan tersebut dan mendorong

menghafal jika digunakan berlebihan. (2)

Cenderung mengukur kemampuan mengingat

(simple recall).(3) Tes jawaban singkat tidak dapat

diskor dengan komputer.

Ada dua bentuk soal jawaban singkat, yaitu

bentuk pertanyaan langsung dan bentuk pertanyaan

tidak lengkap.

Page 147: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

136 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh :

1) Berpakah luas segitiga yang panjang alasnya 8

cm dan tingginya 6cm?

2) Luas daerah segitiga yang panjang alasnya 8 cm

dan tingginya 6 cm adalah....

Bentuk soal jawaban singkat cocok untuk

mengukur pengetahuan yang berhubungan dengan

istilah, fakta, prinsip, metode, prosedur dan

penafsiran data sederhana.

b. Tes Melengkapi

Tes melengkapi adalah butir soal yang

meminta peserta didik atau siswa untuk melengkapi

suatu kalimat dengan satu frase, satu angka atau

satu formula.

Penggunaan tes melengkapi:

Tes ini biasanya digunakan dalam tes matematika

dasar, seperti menjumlah, mengurangi, membagi

dan sebagainya. Selain itu, tes ini dapat juga

digunakan untuk menguji kemampuan mengingat

Kelebihan tes Melengkapi:

(1) mudah dikonstruksi, dalam waktu yang relatif

singkat dapat diknstruksi sejumlah butir, (2)

mampu menguji sebagian besar pokok bahasan

dalam waktu yang relatif singkat.

Kelemahan tes Melengkapi:

Page 148: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

137 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(1) Tidak dapat menguji semua tingkat kemampuan

hasil belajar, (2) Terlalu menekankan pada

kemampuan mengingat, sehingga hasil tes tidak

menggambarkan keseluruhan kemampuan hasil

belajar.

5. Kapan Menggunakan Tes Objektif

Tes objektif digunakan ketika tugas yang sangat

terstruktur yang diperlukan untuk membatasi jenis

respon (jawaban) peserta tes dapat membuat dan

memperoleh jawaban yang benar dari siswa dengan

menunjukkan pengetahuan atau keterampilan khusus

yang disebut dalam butir.

Tes objektif digunakan untuk menilai lebih efektif

pencapaian salah satu tujuan hasil belajar

sederhana dan juga hasil kompleks dalam

pengetahuan, pemahaman, dan penerapan, dan

bahkam di tingkat yang lebih tinggi meliputi luasan

materi yang lebih luas jika terampil dikonstruk.

Adalah dimungkinkan untuk menetapkan sebanyak

120 tes objektif tersebar di banyak satuan pelajaran

dan beberapa tingkat kognitif selama satu atau dua

jam.

Tes objektif digunakan ketika yang diinginkan

tujuannya, menskornya mudah dan akurat terutama

bila jumlah peserta tes besar.

Tes objektif digunakan untuk mengukur

pemahaman, keterampilan berpikir dan hasil belajar

kompleks dari siswa

Page 149: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

138 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

B. TES ESAI 1.Pengertian Tes Esai

Tes esai sering disebut tes subjektif, karena proses

pemberian skornya. dipengaruhi oleh opini atau penilaian

dari pendidik atau pemeriksa tes tersebut. Stalnaker

(1951) mengemukakan “ A test item which requires a

response composed by the examinee, usually in the form of

one or more sentences, of a nature that no single response or

pattern of response can be listed as correct, and the accuracy

and quality of which can be judged subjectively only by one

skilled or informed in the subject’’. Esai adalah sebuah tes

yang membutuhkan jawaban yang disusun oleh peserta tes,

biasanya dalam bentuk satu kalimat atau lebih kalimat,

bersifat yang bukan jawaban tunggal atau pola jawaban

dapat terdaftar sebagai benar, dan akurat serta kualitas

yang dapat dinilai subjektif hanya oleh para ahli.

Nurkancana dan Sunartana (1990) mengemukakan “Tes

uraian adalah butir tes yang mengandung pertanyaan atau

tugas yang jawaban atau pengerjaan tes harus dilakukan

dengan cara mengekspresikan pikiran eksamini secara

naratif. Jadi tes esai atau uraian menghendaki peserta tes

atau siswa untuk mengorganisasikan, merumuskan, dan

mengemukakan sendiri jawabannya. Dengan kata lain

bahwa peserta tes atau siswa tidak memilih jawaban, akan

Page 150: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

139 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tetapi memberikan jawaban dengan kata-katanya sendiri

secara bebas.

Berdasarkan pengertian di atas, tes esai adalah tes

yang terdiri dari pertanyaan-pertanyaan atau butir-butir

yang dirancang untuk memperoleh respon dari peserta tes

atau siswa melalui jawaban bebas mereka terhadap materi

yang telah mereka pelajari. Dalam hal ini peserta tes

(peserta ujian) memiliki tanggungjawab pemikiran untuk

merespon atau menanggapi pertanyaan yang diajukan.

Mereka memiliki kebebasan untuk mengekspresikan atau

menyatakan jawabannya dalam kata-kata sendiri. Jawaban

atas pertanyaan-pertanyaan yang diberikan peserta didik

biasanya mempunyai kualitas dan derajat kebenaran yang

bervariasi. Sering kali, jawaban-jawaban mereka tidak

lengkap.

Tes esai memiliki kualitas psikometri atau kualitas

pengukuran yang buruk meskipun populer di kalangan

guru kelas terutama mereka yang kurang terampil dalam

mengkonstruksi butir. Karenanya, seorang guru harus

mengetahui bagaimana cara mengkonstruksi atau

mengembangkan butir-butir esai, dan selanjutnya

mengetahui bagaimana melaksanakan dan cara penskoran

butir-butir untuk meningkatkan validitas dan

reliabilitasnya.

Tes esai digunakan oleh guru untuk mengukur

prestasi pembelajaran di ruang kelas dan sebagainya.

Beberapa ciri khas tes esai adalah:

(1) Siswa menjawab sejumlah kecil pertanyaan. Karena

waktu terbatas, biasanya sekitar 2 atau 3 jam ujian,

siswa diminta untuk menjawab dalam kata-kata

Page 151: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

140 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

sendiri dan tidak lebih dari 5 atau 6 pertanyaan.

Tidak selalu semua topik yang telah dibahas tercakup

oleh tes ini.

(2) Naskah jawaban ditulis dalam gaya siswa sendiri, dan

dengan tulisan tangannya. Dalam beberapa kasus,

kesalahan ejaan dan bahasa serta tulisan tangan yang

buruk mempengaruhi hasil siswa.

(3) Para siswa cukup bebas untuk mengatur jawaban

mereka sendiri, ini menyiratkan bahwa akan ada

jawaban dengan berbagai tingkat akurasi dan

kelengkapan. Tes esai mendorong kreativitas siswa

karena membiarkan mereka bekerja sendiri. Tes esai

menghambat kerja menebak dan mendorong

kebiasaan belajar yang baik pada siswa.

Dalam menggunakan pertanyaan-pertanyaan esai

secara efektif, adalah penting untuk dimengerti kelebihan

atau kelemahan dari tes esai. Tanpa mengetahuinya, guru-

guru mungkin menggunakan pertanyaan esai pada hal

mungkin jenis tes lain lebih cocok.

2. Kelebihan Tes Esai

Beberapa kelebihan tes esai adalah sebagai berikut:

Tes esai mengukur hasil belajar yang kompleks yang

tidak dapat diukur dengan cara-cara lain. Misalnya,

untuk mengukur keterampilan komunikasi siswa.

yaitu, kemampuan siswa untuk menghasilkan

jawaban, mensintesiskan, mengorganisir ide-ide

Page 152: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

141 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dan menyajikannya dalam bentuk logis dan

koheren. Ini merupakan kelebihan utama.

Tes esai memungkinkan pengukuran keterampilan

berpikir divergen dan terorganisir dengan

penekanan pada integrasi dan penerapan berpikir

serta keterampilan memecah masalah, kreativitas

dan orisinilitas.

Tes esai dapat dipakai untuk mengukur hasil-hasil

pembelajaran ranah kognitif pada tingkat-timgkat

tujuan pendidikan yang lebih tinggi seperti

penerapan, analisis, sintesis, dan evaluasi.

Tes esai sangat mudah dan ekonomis untuk

dilaksanakan. Dapat dengan mudah dan nyaman

ditulis di papan tulis karena terdiri dari beberapa

butir saja. Hal ini dapat menghemat bahan dan

waktu untuk menghasilkannya.

Tes esai mudah dikonstruksi (dikembangkan) dan

tidak memerlukan banyak waktu. Keadaan ini harus

dijaga secara serius untuk menghindari konstruksi

pertanyaan-pertanyaan yang dapat menyesatkan

Tes esai dapat digunakan untuk mengukur

pengetahuan yang mendalam terutama dalam

pokok materi sempit

Tes esai tidak mendorong siswa untuk menebak dan

melakukan kecurangan selama testing atau

pengujian

Mehrens dan Lehmann (1984) mengemukakan

kelebihan atau keunggulan tes esai, yaitu: (1) secara relatif

lebih mudah untuk menyiapkan butir soalnya

Page 153: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

142 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dibandingkan dengan menyusun butir soal pilihan ganda,

(2) merupakan alat yang bisa mengukur kecakapan siswa

untuk menyusun jawaban dan mengemukakannya dalam

prosa, (3) dapat membantu siswa untuk melihat kejujuran

dengan memberi tekanan pada kemampuan siswa untuk

mengisi jawaban yang benar, dan (4) dapat membantu

merangsang hasil yang baik bagi pembelajaran siswa..

3. Keterbatasan Tes Esai

Meskipun kelebihan tes esai sudah dijelaskan,

namun tes ini tidak memenuhi dua macam kualitas yang

paling penting sebagai sebuah alat ukur yang baik.

Tes essai tidak memadai dalam pensampelan isi

materi pelajaran dan tujuan pembelajaran karena

memberikan sampel materi yang terbatas.

Penyediaan sedikit pertanyaan mengakibatkan tes

tidak valid dan cakupan tujuan- tujuan

pembelajaran dan materi menjadi sempit.

Selain tidak validnya pengukuran, mengevaluasi

jawaban atas pertanyaan-pertanyaan yang

dikembangkan sembarang cenderung menjadi tugas

membingungkan dan memakan waktu. Hal ini

menyebabkan berkurangnya reliabilitas dalam

penskoran. Penelitian telah menunjukkan bahwa

jawaban-jawaban pertanyaan esai diskor secara

berbeda oleh guru-guru berbeda dan bahkan skor

guru-guru yang sama berbeda pada waktu berbeda.

Seringkali sebuah pertanyaan esai menyiratkan

banyak keterampilan lain yang terukur selain

Page 154: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

143 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

keterampilan yang dimaksudkan untuk diukur. Ini

disebabkan itu peserta tes merespon terhadap

pertanyaan-pertanyaan sama secara berbeda.

Butir tes esai tidak mudah untuk mempelajari

secara empiris kualitas-kualitas butirnya, seperti

tingkat kesulitan dan daya beda.

Hopkins dan Stanley (1981) mengemukakan bahwa

keterbatasan tes esai adalah sebagai berikut. (1) tidak

konsistennya pembaca (reader reliability), (2) adanya efek

dari kecenderungan menilai yang dipengaruhi oleh

keadaan lain (halo effect), (3) akibat yang timbul karena

adanya pengaruh pada jawaban butir soal sebelumnya

(item-to-item carryover effects), (4) akibat yang timbul

karena pengaruh hasil tes sebelumnya (test-to-test

carryover effects), (5) akibat yang timbul karena urutan

penilaian (order effects), dan (6) akibat yang timbul karena

bentuk tulisan atau bahasa (language mechanics effects).

Sedangkan kelebihan tes esai adalah bahwa dengan tes

esai, mampu untuk mengukur tingkat berpikir lebih tinggi

dan kompleks, serta bisa mengembangkan sikap untuk

memecahkan masalah

4. Kapan Menggunakan Tes Esai

Tes esai umumnya paling cocok digunakan untuk

keadaan berikut:

Kita harus menggunakan pertanyaan esai dalam

pengukuran prestasi kompleks ketika berbedanya

cirikhas derajat tanggapan (respons) yang

diperlukan. Siswa bebas memilih, menghubungkan

dan menyajikan ide-ide dalam kata-kata mereka

Page 155: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

144 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

sendiri. Kebebasan ini meningkatkan nilai dari

pertanyaan esai sebagai suatu ukuran prestasi

kompleks meski menimbulkan kesulitan penskoran

yang membuat tes tidak cukup sebagai ukuran

pengetahuan nyata.

Pertanyaan-pertanyaan esai juga harus digunakan

untuk mengukur hasil-hasil pembelajaran yang

tidak dapat diukur dengan butir-butir tes objektif.

Pertanyaan esai dapat dimanfaatkan sepenuhnya

ketika kekurangannya diimbangai oleh kebutuhan

pengukuran itu.

Tes esai harus digunakan ketika hasil pembelajaran

yang berkaitan dengan kemampuan-kemampuan

memilih, mengatur, mengintegrasikan,

menghubungkan, dan mengevaluasi ide-ide

memerlukan kebebasan respons dan keaslian yang

disediakan oleh pertanyaan esai.

5. Klasifikasi Tes Esai

Gronlund & Linn (1990) mengelompokkan tes esai

atau tes uraian menjadi dua bentuk, yaitu tes uraian

terbatas (restricted response items) dan tes uraian bebas

(extended respons items). Kadang-kadang tes uraian

terbatas disebut uraian objektif, sedangkan tes uraian

bebas disebut uraian non-objektif.

5.1. Tes Uraian Terbatas

Pada tes uraian terbatas ini peserta tes dibatasi

pada sifat, panjang atau susunan jawaban untuk dibuat.

Butir-butir jawaban terarah pada jawaban-jawaban yang

Page 156: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

145 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

diperlukan. Menurut Mehrens dan Lehmann (1984)

menyatakan bahwa tes esai jawaban terbatas atau

terstruktur, peserta tes atau siswa lebih dibatasi pada

bentuk dan ruang lingkup jawabannya, karena secara

khusus dinyatakan konteks jawaban yang harus diberikan

oleh peserta tes Hal ini membatasi kebebasan peserta tes

untuk memilih, mengingat, dan mensintesis semua yang

diketahui dan menyajikannya secara logis sebagaimana

yang diinginkan. Jenis tes essai ini paling berguna dalam

mengukur hasil-hasil pembelajaran pada tingkat kognitif

rendah, yaitu, tingkat pengetahuan, pemahaman dan

penerapan.

Berikut diberikan beberapa contoh tes jenis essai

terbatas :

1. Berikan tiga kelebihan dan dua kerugian tes esai

2. Jelaskan empat kegunaan tes dalam pendidikan

Tes uraian terbatas cocok untuk mata pelajaran

yang jawabannya cenderung tidak memiliki variasi

misalnya matematika dan fisika. Agar penskorannya

objektif diperlukan pedoman penskoran. Penskoran

dilakukan pada setiap langkah pengerjaan, misalnya

menuliskan rumus, menghitung hasil, menafsirkan dan

menyimpulkan hasilnya. Penskoran bersifat hirarkis sesuai

dengan langkah pengerjaan soal. Bobot skor untuk tiap

butir tes ditentukan berdasarkan tingkat kesulitan butir

tes. Soal yang sulit, bobotnya lebih besar dibandingkan

dengan soal yang mudah.

Tes uraian terbatas digunaakan untuk mengevaluasi

hasil belajar berupa kemampuan-kemampuan:

a) Menjelaskan hubungan sebab akibat

Page 157: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

146 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

b) Menjelaskan aplikasi prinsip-prinsip

c) Mengajukan argumentasi

d) Merumuskan hipotesis

e) Merumuskan kesimpulan-kesimpulan

f) Merumuskan asumsi-asumsi

g) Menjelaskan metode dan prosedur

5.2. Tes Uraian Bebas

Dalam tes bentuk uraian bebas, peserta tes hanya

dibatasi dengan waktu dan tidak terikat dengan susunan

jawaban. Menurut Mehrens dan Lehmann (1984), pada tes

esai bentuk jawaban bebas atau terbuka, mengijinkan

peserta tes atau siswa untuk mendemonstrasikan

kecakapannya, yaitu: (1) menyebutkan atas pengetahuan

faktual, (2) menilai pengetahuan faktualnya, (3) menyusun

ide-idenya, dan (4) mengemukakan idenya secara logis dan

koheren.

Sebuah contoh pertanyaan dalam kategori ini

adalah sebagai berikut.

“Siswa diberikan seperangkat tes yang di dalamnya

terdapat kesalahan dan kekacauan pada petunjuknya, pada

butir-butirnya, dan dalam susunan butir-butirnya. Tulislah

kritikan evaluasi saudara terhadap tes ini dengan

menggunakan kriteria standar evaluatif konstruksi tes

yang digambarkan dalam buku teks. Rincikan jawaban

saudara tentang kelebihan dan kelemahan tes serta

evaluasilah keseluruhan kualitasnya”

Dalam merespon (menjawab) pertanyaan seperti

pada ujian yang menunjukkan kemampuan untuk memilih

dan mengingat fakta-fakta yang menurutnya berkaitan,

Page 158: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

147 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

menyusun dan menyajikan ide-idenya dalam bentuk yang

logis dan jelas. Jenis tes ini memberi kebebasan untuk

memutuskan mana fakta-fakta yang menurutnya paling

relevan dan menulis sebanyak mungkin sebagai jawaban.

Tes essai jenis ini sebagian besar berguna dalam mengukur

hasil pembelajaran pada tingkat-tingkat kognitif lebih

tinggi seperti tingkat analisis, sintesis, dan evaluasi.

Meskipun demikian, tipe essai bebas juga dibatasi oleh kelemahan, antara lain:

Penskoran respon-respon (jawaban-jawaban)

biasanya sulit dan tak reliabel karena peserta tes

bebas dalam menyusun informasi faktual dari

berbagai-bagai tingkat kebenaran..

Bentuk tes uraian non-objektif/uraian bebas cocok

untuk bidang studi ilmu-ilmu sosial. Meskipun hasil

penskoran tes jenis ini cenderung subjektif, namun, bila

disediakan pedoman penskoran hasilnya dapat lebih

objektif. Sebaiknya setiap soal ditetapkan kata kunci.

Tes uraian bebas digunakan untuk mengevaluasi

hasil belajar yang bersifat kompleks berupa kemampuan-

kemampuan:

a) Menghasilkan, menyusun dan menyatakan ide-

ide

b) Memadukan hsil belajar dari berbagai bidang

studi

c) Merekayasa atau mendesain eksperimen

d) Menjelaskan nilai suatu ide

6. Konstruksi Tes Esai

Page 159: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

148 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Kita menyadari akan kesulitan pertanyaan esai

sebagai sebuat alat ukur. Oleh karena itu, tes esai

merupakan alat (instrumen) pengukuran berguna hanya

sejauh konstruksi, pelaksanaan, dan penskorannya

memiliki objektivitas yang tinggi. Karenanya, butir-butir

tes esai harus terdiri dari butir-butir yang akan menjamin

pemahaman yang sama dari setiap peserta tes. Juga,

respon-respon yang diberikan oleh dua atau lebih penelaah

harus memberikan skor yang sama dan harus menarik

interpretasi yang konsisten,

Kita mengetahui bahwa hal tersebut sulit untuk

dicapai dan membutuhkan banyak usaha. Oleh karena itu

hal-hal berikut disarankan sebagai panduan untuk

mengkonstruksi butir tes esai yang baik yang sesuai

dengan perilaku yang diinginkan.

i. Membatasi penggunaan pertanyaan esai hanya untuk

hasil pembelajaran yang tidak dapat diukur dengan

dengan tes-tes objektif.

ii. Pertanyaan esai harus dirancang sedemikian rupa

sehingga hanya keterampilan yang butir maksudkan

untuk diukur saja yang terukur. Hal ini dapat dicapai

dengan mengungkapkan secara jelas dan tepat

pertanyaan sesuai dengan tujuan pembelajaran.

iii. Sebuah pertanyaan esai harus menentukan secara

tepat apa yang diperlukan dari tes esai tersebut.

Pastikan bahwa tugas peserta tes adalah jelas

ditunjukkan dengan pembatasan daerah yang

dicakup oleh butir, menggunakan kata-kata deskriptif

Page 160: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

149 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

untuk memberikan arahan tertentu terhadap respon

atau jawaban yang diinginkan.

iv. Petunjuk batas waktu perkiraan untuk setiap

pertanyaan. Hal ini diperlukan untuk menunjukkan

waktu yang dialokasikan untuk setiap pertanyaan

guna memungkinkan peserta tes mengatur kecepatan

merekan menulis pada setiap pertanyaan dan untuk

menghilangkan kecemasan yang mungkin timbul.

v. Menghindari penggunaan pertanyaan pilihan, karena

pertanyaan pilihan mungkin mempengaruhi validitas

hasil tes.

7. Cara Mengurangi Subjektivitas Tes Esai

Seperti telah diketahui bahwa subjektivitas

merupakan keterbatasan utama dari tes esai. Namun, kita

bisa mengurangi subjektivitas ini seminimum mungkin

dengan mengikuti langkah-langkah sederhana berikut:

i. Menghindari pertanyaan-pertanyaan terbuka

ii. Membiarkan siswa menjawab pertanyaan yang

sama, untuk menghindari pilihan

iii. Menggunakan nomor siswa, bukan nama

mereka, untuk menyembunyikan identitas

mereka

iv. Menskor semua jawaban untuk setiap

pertanyaan untuk semua siswa pada suatu

waktu

v. Jangan biarkan skor pada suatu pertanyaan

mempengaruhi kita saat menskor berikutnya.

Page 161: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

150 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Selalu mengatur ulang kertas sebelum kita

mengoreksi

vi. Jangan biarkan perasaan atau emosi kita

sehingga mempengaruhi penskoran kita

vii. Menghindari dari gangguan-gangguan ketika

mengoreksi

8. Perbandingan antara tes objektif dengan tes esai

Menurut Gronlund dan Linn (1995) perbadingan

antara tes esei dan tes objektif adalah seperti dalam Tabel

7.1 berikut

Tabel 7.1. Perbandingan antara tes objektif dengan tes esai

Tes Objektif Tes Esei 1.Hasil belajar yang diukur

Baik untuk mengukur hasil belajar pada tingkat pengetahuan tentang fakta, pemahaman, keterampilan berpikir, dan hasil belajar yang kompleks. Tetapi tidak mampu untuk mengukur kemampuan untuk memilah dan menyusun ide-ide, kecakapan menulis, dan beberapa bentuk

Tidak efisien untuk mengukur pengetahuan tentang fakta. Dapat mengukur pemahaman, keterampilan berpikir, dan hasil belajar yang kompleks lainnya (khususnya sangat berguna jika jawaban orisinil yang diinginkan). Cocok untuk memilih dan menyusun ide-ide, keterampilan menulis, dan keterampilan untuk memecahkan masalah yang

Page 162: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

151 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

keterampilan untuk memecahkan masalah

menuntut pemikiran yang orisinil

2.Penyiapan butir soal

Banyak memerlukan waktu untuk menyusun butir soal. Sukar mempersiapkan butir soal yang baik dan memerlukan waktu lama

Hanya sedikit pertanyaan yang diperlukan untuk seperangkat tes. Menyiapkan butir soal relatif mudah, tetapi lebih sulit daripada anggapan orang

3.Mengambil sampel materi pelajaran

Dapat mewakili semua materi pelajaran dan dapat memuat butir soal yang banyak dalam seperangkat tes

Tidak dapat mewakili seluruh materi pelajaran, karena hanya sedikit pertanyaan yang bisa dimasukkan dalam seperangkat tes

4.Kontrol terhadap jawaban peserta didik

Tinggal memilih jawaban yang telah tersedia. Menghindari gertak sambal dan pengaruh keterampilan menulis, bisa menebak jawaban

Bebas menjawab atas dasar kata-katanya sendiri, dan keterampilan menulis mempengaruhi sekor, berpikir menebak bisa dikurangi

5.Pemberian skor

Pensekoran secara objektif dan cepat, mudah, dan konsisten

Pensekoran subjektif dan lambat, sulit, dan tidak konsisten

6.Pengaruh pada proses pembela- jaran

Biasanya mendorong peserta didik untuk mengembangkan pengetahuan

Mendorong peserta didik untuk memusatkan pikiran pada sejumlah besar materi pelajaran,

Page 163: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

152 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tentang fakta-fakta khusus dan kemampuan untuk pembedaan di antara fakta tersebut. Dapat mendorong pengembangan pemahaman, keterampilan berpikir, dan hasil belajar yang kompleks lainnya

dengan penekanan khusus pada kemampuan untuk menyusun, mengintegrasikan, dan mengemukakan ide-ide secara efektif. Dapat mendorong kebiasaan menulis buruk jika waktunya mendesak

7.Reliabilitas Reliabilitas yang tinggi mungkin dicapai, khususnya jika tes disusun secara baik

Reliabilitasnya lebih rendah, terutama karena pensekoran yang tidak konsisten

Page 164: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

153 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 8 INSTRUMEN NONTES

A. Konsep Nontes

Non tes dapat diartikan sebagai teknik penilaian

yang dilakukan tanpa menggunakan tes. Teknik ini

dilakukan melalu piengamatan secara teliti dan tanpa

menguji peserta didik. Non tes biasanya dilakukan untuk

mengukur hasil belajar yang berhubungan dengan apa

yang dapat dibuat atau dikerjakan oleh siswa dari apa yang

diketahui atau dipahaminya. Menurut Widiyoko (2009)

instrumen nontes berhubungan dengan penampilan yang

Page 165: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

154 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dapat diamati dari pada pengetahuan dan proses mental

lainnya yang tidak dapat diamati dengan panca indra.

Instrumen atau alat penilaian yang tergolong nontes

antara lain: a) kuesioner /angket, b) pedoman wawancara

(interview), 3) daftar cocok (check-list), 4) skala penilaian

(Rating Scale), 5) lembar pengamatan/ observasi, 6) jurnal,

7) inventori, 8) penilaian diri (self-assessment), dan 9)

penilaian oleh teman sejawat (peer assessment). Pada

penilaian hasil pembelajaaran, instrumen nontes biasanya

digunakan untuk mengukur pada ranah afektif dan

psikomotorik.

B. Kuesioner (Angket) Kuesioner atau angket adalah sebuah daftar

pertanyaan yang harus diisi oleh orang yang akan diukur

(responden). Pada umumnya tujuan penggunaan

kuesioner dalam proses pembelajaran terutama adalah

untuk memperoleh data mengenai latar belakang siswa

sebagai salah satu bahan dalam menganalisis tingkah laku

dan proses belajar mereka.

1.Kelebihan Kuesioner/ angket

Terdapat beberapa kelebihan kuesioner (angket)

sebagai instrumen evaluasi, di antaranya yaitu:

1) Dengan angket kita dapat memperoleh data dari

sejumlah siswa yang banyak yang hanya

membutuhkan waktu yang singkat.

2) Setiap siswa dapat memperoleh sejumlah

pertanyaan yang sama

Page 166: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

155 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

3) Dengan kuesioner (angket) siswa terhindar dari

pengaruh subjektif dari guru dapat dihindarkan

2. Kelemahan kuesioner atau angket

Di samping kelebihannya, kuesioner atau angket

juga memiliki beberapa kelemahan, di antaranya yaitu:

1) Pertanyaan yang diberikan melalui kuesioner atau

angket adalah terbatas, sehingga apabila ada hal-hal

yang kurang jelas maka sulit untuk diterangkan

kembali

2) Kadang-kadang pertanyaan yang diberikan dalasm

kuesioner tidak dijawab oleh semua siswa atau

mungkin dijawab tetapi tidak sesuai dengan

kenyataan yang sebenarnya,

3) Ada kemungkinan kuesioner atau angket yang

diberikan tidak dapat dikumpulkan semua, sebab

banyak siswa yang merasa kurang perlu hasil dari

kuesioner yang diterima, sehingga tidak

memberikan kembali angketnya.

3.Jenis-jenis kuesioner atau angket:

Ditinjau dari segi isi Kuesioner dibedakan atas 4

bagian yaitu:

1) Pertanyaan fakta adalah pertanyaan yang

menanyakan tentang fakta antara lain eperti

jumlah sekolah, jumlah jam belajar, jumlah siswa ,

jumlah guru, dan sebagainya..

2) Pertanyaan perilaku adalah pertanyaan jika guru

menginginkan tingkah laku seseorang siswa dalam

Page 167: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

156 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

kegiatan di sekolah atau dalam proses belajar

mengajar.

3) Pertanyaan informasi adalah pertanyaan jika guru

menginginkan mengungkapkan berbagai informasi

atau menggunakan fakta.

4) Pertanyaan pendapat dan sikap adalah kuesioner

yang berkaitan dengan perasaan, kepercayaan

predisposisi, dan nilai-nilai yang berhubungan

dengan objek yang dinilai. Sering kuesioner atau

angket jenis ini disebut sebagai skala sikap atau skala

penilaian, padahal antara angket dan skala itu

berbeda.

Skala Sikap yaitu mengenai keadaan atau

perasaan atau penilaian yang bersangkutan, misalnya

menilai sikap siswa terhadap pembelajaran guru, yang

mengisi kuesioner skala sikap tersebut adalah siswa.

Sedangkan skala penilaian adalah mengukur mengenai

keadaan, kemampuan, penampilan, atau kinerja orang

lain. Contohnya ingin mengetahui kinerja guru di dalam

kelas, yang mengisi kuesioner skala penilaian ini adalah

siswa, bukan guru, karena karena siswa yang

mengetahui atau merasakan indikator kinerja gurunya.

Adapun perbedaan antara kuesioner dan skala

sikap (penilaian) yaitu:

1) Data yang diungkap oleh luesioner (angket)

berupa data faktual sedangkan data yang diungkap

oleh skala berupa konstrak atau konsep psikologis

yang menggambarkan kepribadian individu;

2) Pertanyaan dalam angket berupa pertanyaan

langsung terarah kepada informasi mengenai data

Page 168: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

157 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

yang hendak diungkap. Pada skala pertanyaan

sebagai stimulus tertuju pada indikator perilaku

guna memancing jawaban yang merupakan

refleksi dari keadan diri subjek yang biasanya

tidak disadari oleh responden yang bersangkutan.

3) Pada angket responden tahu persis informasi apa

yang dikehendaki oleh pertanyaannya, sedangkan

pada skala responden biasanya tidak menyadari

arah jawaban yang dikehendaki oleh

pertanyaannya.

4) Jawaban terhadap angket tidak dapat diberi skor

melainkan diberi angka coding sebagai klasifikasi

jawaban. Pada skala psikologi dapat diberi skor

melalui proses penskalaan (scaling).

5) Satu angket dapat mengungkap informasi

mengenai banyak hal sedangkan satu skala hanya

diperuntukkan guna mengungkap satu atribut

tunggal (unidimensional)

6) Data hasil angket tidap perlu diuji lagi

reliabilitasnya secara psikometris sedangkan skala

psikologi harus teruji karena relevansi isi dan

konteks kalimat yang digunakan sebagai stimulus

pada skala psikologi lebih terbuka terhadap error.

7) Validitas angket lebih ditentukan oleh kejelasan

tujuan dan lingkup informasi yang hendak

diungkap sedangkan validitas skala psikologi lebih

ditentukan oleh kejelasan konsep psikologis yang

hendak diukur dan operasionalisasinya.

Page 169: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

158 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Agar lebih jelas letak perbedaan antara Angket

dengan Skala maka dapat dilihat dari masing-masing

contohnya berikut..

Contoh Angket/Kuesioner untuk mengetahui

Aktivitas Guru

No Pernyataan Jumlah Jam dalam seminggu < 1 1 - 2 3 - 4 5 - 6 < 6

1 Perencanaan dan Persiapan Materi

2 Menyelesaikan tugas administrasi

3 Pertemuan atau rapat

4 Pengembangan profesi (kursus, seminar, lokakarya

5 Kegiatan dengan siswa (Bimbingan Eskul, Kelompok belajar)

6 Lain-lain, sebutkan ..................................

Contoh Skala untuk mengetahui Kepercayaan Diri

No Pernyataan Respon SS S N TS ST

S 1 Saya merasa orang

lain memiliki kemampuan lebih daripada saya

2 Saya senang berkumpul dengan orang banyak karena dari sana

Page 170: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

159 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

saya dapat memperoleh sesuatu yang baru

3 Saya akan mengembangkan kemampuan saya secara maksimal

4 Saya sulit menjalin kerjasama dengan orang yang baru saya kenal

5 Yang teroenting adalah kemampuan yang saya miliki, bukan sekedar penampilan fisik semata

6 Saya merasa tidak nyaman bila bersama orang-orang yang baru saya kenal

Kuesioner dibedakan juga berdasarkan jenisnya

yaitu :

1) Tertutup, kuesioner yang alternati jawabannya

sudah ditentukan terlebih dahulu. Responden

hanya memilih diantara alternative yang telah

disediakan.

2) Terbuka, kuesioner ini memberikan kesempatan

pada siswa untuk mengemukakan pendapatnya

tentang sesuatu yang ditanyakan sesuai dengan

pandangan dan kemampuannya. Alternatif jawaban

Page 171: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

160 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tidak disediakan. Mereka menciptakan sendiri

jawabannya dan menyusun kalimat dalam bahasa

sendiri

3) Tertutup dan terbuka, kuesioner ini merupakan

gabungan dari kedua bentuk yang telah dibicarakan.

Yang berarti bahwa dalam bentuk ini, di samping

disediakan alternative, diberi juga kesempatan

keoada siswa/mahasiswa untuk mengemukakan

alternative jawabannya sendiri, apabila alternative

yang disediakan tidak sesuai dengan keadaan yang

bersangkutan.

C. Wawancara (Interview)

Menurut Sudijono (2009) wawancara atau interview

adalah cara menghimpun bahan-bahan keterangan yang

dilaksanakan dengan melakukan Tanya jawab lisan secara

sepihak, berhadapan muka, dan dengan arah tujuan yang

terlah ditentukan. Sedangkan menurut Bahri (2008)

wawancara adalah komunikasi langsung antara yang

mewancarai dan yang diwancarai.

Wawancara (interview), dilakukan dengan cara

menentukan tanya jawab langsung antara pewawancara

dengan yang diwawancara tentang segala sesuatu yang

diketahui oleh pewawancara. Agar hasil wawancara sesuai

dengan apa yang diinginkan oleh pewawancara, maka

pewawancara harus:

Page 172: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

161 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(1) Membuat pedoman wawancara, yaitu berupa daftar

pertanyaan yang akan ditanyakan kepada orang

yang diwawancara.

(2) Merekan pelaksanaan wawancara untuk menganalisis

jawaban dari orang yang diwawancara (responden).

1.Kelebihan dan kelemahan wawancara

Kelebihan wawancara yaitu :

1) Wawancara dapat memberikan keterangan keadan

pribadi hal ini tergantung pada hubungan baik

antara pewawancara dengan objek.

2) Wawancara dapat dilaksanakan untuk setiap umur

dan mudah dalam pelaksaannya

3) Wawancara dapat dilaksanakan serempak dengan

observasi. Data tentang keadaan individu lebih

banyak diperoleh dan lebih tepat dibandingkan

dengan observasi dan angket.

4) Wawancara dapat menimbulkan hubungan yang

baik antara si pewawancara dengan objek.

Sedangkan Kelemahan wawancara:

Keberhasilan wawancara dapat dipengaruhi oleh

kesediaan, kemampuan individu yang diwawancarai.

2) Kelancaran wawancara dapat dipengaruhi oleh keadaan

sekitar pelaksaan wawancara.

3) Wawancara menuntut penguasaan bahasa yang baik dan

sempurna dari

pewawancara.

4). Adanya pengaruh subjektif dari pewawancara dapat

mempengaruhi hasil wawancara.

Page 173: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

162 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Keberhasilan wawancara sebagai alat penilaian

sangat dipengaruhi oleh beberapa hal :

a. Hubungan baik pewawancara dengan orang yang

diwawancarai. Dalam hal ini hendaknya pewawancara

dapat menyesuikan diri dengan orang yang

diwawancarai.

b. Keterampilan pewawancara

Keterampilan pewawancara sangat besar pengaruhnya

terhadap hasil wawancara yang dilakukan, karena guru

perlu melatih diri agar meiliki keterampilan dalam

melaksanakan wawancara.

c. Pedoman wawancara

Keberhasilan wawancara juga sangat dipengaruhi oleh

pedoman yang dibuat oleh guru. Sebelum guru

melaksanakan wawancara harus membuat pedoman-

pedoman secara terperinci, tentang pertanyaan yang

akan diajukan.

Contoh Pedoman wawancara

Tujuan: memperoleh informasi mengenai cara

belajar siswa

Bentuk : wawancara bebas

Responden : siswa yang nilainya tinggi

Nama siswa : Oktavia

Pertanyaan Jawaban

Responden

Hasil

wawancara

Page 174: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

163 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

D. Daftar Cocok (check-list)

Yang dimaksud dengan daftar cek adalah sederetan

pertanyaan atau pernyataan yang dijawab oleh responden

dengan membubuhkan tanda cek (√) pada tempat yang

telah disediakan. Check list sangat bermanfaat untuk

mengukur hasil belajar, baik yang berupa produk maupun

proses yang dapat diperinci ke dalam komponen yang lebih

kecil, terdefinisi secara operasional dan sangat spesifik

Check list hanya menyatakan ada atau tidak adanya

suatu hal yang sedang diamati bukan memberikan data

peringkat atau derajat kualitas tertentu. Check list

menghendaki dicantumkannya komponen yang mungkin

diamati baik yang remeh ataupun yang penting. Mutu check

list ditentukan kemampuan menyusun komponen uji dan

kemampuan pengamat dalam menandai ada atau tidaknya

komponen yang diujikan.

Beberapa kelemahan pada checklist, yaitu (1) penilai

atau penskor hanya bisa memilih dua pilihan yang absolut,

yaitu teramati dan tidak teramati, jadi tidak ada nilai di

tengahnya, misalnya apabila sebenarnya kemampuan

siswa tersebut ada di tengahnya; (2) sukar untuk

menyimpulkan kemampuan seseorang dalam satu skor,

misalnya untuk mengurutkan kemampuan beberapa siswa.

Page 175: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

164 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh: Instrumen Penilaian Pidato yang menggunakan Metode Ceklis Nama Siswa: Chitra Dewi

Petunjuk:

Tuliskan centang (√) di belakang huruf dimana kemampuan

siswa teramati pada waktu berpidato

I. Ekspresi Fisik

____ A. Berdiri tegak melihat pada penonton

____ B. Mengubah ekspresi wajah sesuai dengan perubahan

pernyataan yang disajikan

____ C. Mata melihat kepada penonton

II. Ekspresi Suara

____ A. Berbicara dengan kata-kata yang jelas

____ B. Nada suaranya berubah-rubah sesuai pernyataan yang

ditekankan

____ C. Berbicara cukup keras untuk didengar oleh penonton

III. Ekspresi Verbal

____ A. Memilih kata-kata yang tepat untuk menegaskan arti

____ B. Tidak mengulang-ulang pernyataan

____ C. Menggunakan kalimat yang lengkap untuk mengutarakan

satu pikiran

____ D. Menyimpulkan pokok-pokok pikiran yang penting

Sumber: Setiadi, 2008

E. Skala Penilaian (Rating Scale) Skala Penilaian atau Rating Scale merupakan alat

pengukuran/penilaian non-tes yang menggunakan suatu

Page 176: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

165 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

prosedur terstruktur untuk memperoleh informasi tentang

sesuatu yang diobservasi yang menyatakan posisi sesuatu

dalam hubungannya dengan yang lain. Unsur rating scale,

yaitu:

(1) Adanya pernyataan tentang keberadaan atau

kualitas keberadaan dari suatu unsur atau

karakteristik tertentu

(2) Adanya petunjuk penilaian tentang pernyataan

tersebut

(3) Komponen tersebut mirip dengan tes obyektif

adanya stem dan option

Menurut Grounlund (1982) ada tiga jenis rating

scale, yaitu: (1) numerical rating scale; (2) graphic rating

scale; dan (3) descriptive rating scale.

Numerical rating scale terdiri dari deskripsi tentang

aspek kinerja yang disertai dengan angka yang

menunjukkan tingkatan kualitas kinerja yang diases.

Graphic rating scale sama dengan numerical rating scale,

hanya dalam graphic rating scale yang digunakan bukan

angka sebagai tanda kualitas kinerja, tetapi dengan

memberi tanda tertentu pada suatu kontinum baris.

Descriptive rating scale sama dengan graphic rating scale,

tetapi pada setiap skala diberi deskripsi tentang kualitas

kinerja yang diakses.

Contoh :

Instrumen berpidato menggunakan Numerical rating scale

Nama : Chitra Dewi

------------------------------------------------------------------------------

Page 177: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

166 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Petunjuk:

Untuk setiap kemampuan berilah lingkaran pada nomor

1. bila siswa selalu melakukan

2. bila kadang-kadang

3. bila jarang, dan

4. bila tidak pernah

1. Ekspresi Fisik (Physical Expression)

A. Berdiri tegak melihat pada penonton

1 2 3 4

B. Merubah ekspresi wajah sesuai dengan perubahan

pernyataan

yang disajikan

1 2 3 4

Sumber: Setiadi, 2008

Contoh :

Instrumen berpidato menggunakan graphic rating scale

Nama: Chitra Dewi

Page 178: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

167 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

------------------------------------------------------------------------------

Petunjuk:

Tulislah X pada garis dimana kemampuan siswa teramati

pada waktu

Berpidato

I. Ekspresi Fisik (Physical Expression)

A. Berdiri tegak melihat pada penonton

__________ ________________________________________

! ! ! !

! ! ! !

selalu kadang-kadang jarang tidak pernah

B. Merubah ekspresi wajah sesuai dengan perubahan

pernyataan yang

disajikan

__________________________________________________

! ! ! !

! ! ! !

selalu kadang-kadang jarang tidak pernah

Sumber: Setiadi, 2008

Contoh :

Instrumen berpidato menggunakan descriptive rating scale

Page 179: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

168 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Nama: Chitra Dewi

---------------------------------------------------------------------------------

Petunjuk:

Tulislah X pada garis dimana kemampuan siswa teramati pada

waktu

Berpidato

I. Ekspresi Fisik (Physical Expression)

A. Berdiri tegak melihat pada penonton

______________________________________________________________

! ! !

! ! !

berdiri tegak, kadang-kadang berdiri tidak pernah selalu

melihat pada tegak, melihat ke langit- tegak, maka tidak

penonton langit, kadang-kadang pernah kontak dengan

melihat penonton penonton

B. Merubah ekspresi wajah sesuai dengan perubahan

pernyataan yang Disajikan

__________________________________________________________________

! ! !

! ! !

ekspresi wajah ekspresi wajah ekspresi wajah tidak

selalu berubah kadang- kadang pernah berubah

sesuai dengan berubah selama berpidato

suara

Sumber: Setiadi, 2008

F. Pengamatan/Observasi 1. Konsep Dasar

Page 180: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

169 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Pengamatan (observasi) merupakan teknik

penilaian yang dilakukan secara berkesinambungan

dengan menggunakan indera, baik secara langsung

maupun tidak langsung dengan menggunakan pedoman

observasi yang berisi sejumlah indikator perilaku yang

diamati. Observasi langsung dilaksanakan oleh guru secara

langsung tanpa perantara orang lain. Sedangkan observasi

tidak langsung dengan bantuan orang lain, seperti guru

lain, orang tua, siswa, dan karyawan sekolah.

Observasi adalah suatu teknik penilaian non-tes

yang menginventarisasikan data tentang sikap dan

kepribadian siswa dalam kegiatan belajarnya. Observasi

dilakukan dengan mengamati kegiatan dan perilaku siswa

secara langsung. Data yang diperoleh dijadikan bahan

penilaian. Observasi sebagai alat evaluasi banyak

digunakan untuk menilai tingkah laku individu atau proses

terjadinya suatu kegiatan yang dapat diamati. Contoh

observasi utuk tujuan evaluasi adalah observasi untuk

menilai atau mengukur hasil belajar melalui pengamatan

tingkah laku siswa pada saat guru mengajar.

2.Pedoman Observasi

Bentuk instrumen yang digunakan untuk observasi

adalah pedoman observasi yang berupa daftar cek atau

skala penilaian (rating scale) yang disertai rubrik. Daftar

cek digunakan untuk mengamati ada tidaknya suatu sikap

atau perilaku. Sedangkan skala penilaian menentukan

posisi sikap atau perilaku siswa dalam suatu rentangan

sikap.

Page 181: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

170 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Pedoman observasi secara umum memuat

pernyataan sikap atau perilaku yang diamati dan hasil

pengamatan sikap atau perilaku sesuai kenyataan.

Pernyataan memuat sikap atau perilaku yang positif atau

negatif sesuai indikator penjabaran sikap dalam

kompetensi inti dan kompetensi dasar. Rentangan skala

hasil pengamatan antara lain berupa :

1) Selalu, sering, kadang-kadang, tidak pernah

2) Baik sekali, baik, cukup baik, kurang baik

Pedoman observasi dilengkapi juga dengan rubrik

dan petunjuk pensekoran. Rubrik memuat petunjuk/uraian

dalam penilaian skala atau daftar cek. Sedangkan petunjuk

penskoran memuat cara memberikan skor dan mengolah

skor menjadi nilai akhir. Agar observasi lebih efektif dan

terarah hendaknya :

a) Dilakukan dengan tujuan jelas dan direncanakan

sebelumnya, perencanaan mencakup indikator atau

aspek apa yang akan diamati dari suatu proses.

b) Menggunakan pedoman observasi berupa daftar cek

atau skala, model lainnya.

c) Pencatatan dilakukan selekas mungking tanpa

diketahui oleh peserta didik

d) Kesimpulan dibuat setelah program observasi

selesai dilaksanakan.

Contoh 1.

Pedoman Observasi menggunakan Check list

Page 182: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

171 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Pedoman Observasi Sikap Disiplin

Petunjuk :

Lembaran ini diisi oleh guru untuk menilai sikap sosial peserta

didik dalam kedisiplinan. Berilah tanda cek (v) pada kolom skor

sesuai sikap disiplin yang ditampilkan oleh peserta didik,

dengan kriteria sebagai berikut :

Ya = apabila siswa menunjukkan perbuatan sesuai aspek

pengamatan

Tidak = apabila siswa tidak menunjukkan perbuatan sesuai

aspek pengamatan.

Nama Peserta Didik : ………………….

Kelas : ………………….

Tanggal Pengamatan : …………………..

Materi Pokok : …………………..

No Sikap yang diamati Melakukan Keterangan

Ya Tidak

1 Masuk kelas tepat

waktu

2 Mengumpulkan

tugas tepat waktu

3 Memakai seragam

sesuai tata tertib

4 Mengerjakan tugas

yang diberikan

5 Tertib dalam

mengikuti

pembelajaran

6 Mengikuti

praktikum sesuai

Page 183: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

172 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dengan langkah

yang ditetapkan

7 Membawa buku tulis

sesuai mata

pelajaran

8 Membawa buku teks

mata pelajaran

Jumlah

Petunjuk Penskoran :

Siswa memperoleh nilai :

Baik Sekali : apabila terdapat 7 – 8 jawaban YA

Baik : apabila terdapat 5 – 6 jawaban YA

Cukup : apabila terdapat 3 – 4 jawaban YA

Kurang : apabila terdapat 1 – 2 jawaban YA

Contoh 2 Pedoman Observasi menggunakan rating scale

Pedoman Observasi Sikap Tanggung Jawab

Petunjuk :

Lembaran ini diisi oleh guru untuk menilai sikap sosial peserta

didik dalam tanggung jawab. Berilah tanda cek (v) pada kolom

skor sesuai sikap tanggung jawab yang ditampilkan oleh

peserta didik, dengan kriteria sebagai berikut :

4 = selalu, apabila selalu melakukan sesuai pernyataan

3 = sering, apabila sering melakukan sesuai pernyataan dan

kadang-kadang

tidak melakukan

2 = kadang-kadang, apabila kadang-kadang melakukan dan

sering tidak

melakukan

1 = tidak pernah, apabila tidak pernah melakukan

Page 184: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

173 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Nama Peserta Didik :

…………………

Kelas : …………….

Tanggal Pengamatan :

……………….

Materi Pokok : ………………

No Aspek Pengamatan Skor Keterangan

1 2 3 4

1

2

3

4

5

Jumlah Skor

Petunjuk Penskoran :

Peserta didik memperoleh nilai :

Baik Sekali : apabila memperoleh skor 16 - 20

Baik : apabila memperoleh skor 11 - 15

Cukup : apabila memperoleh skor 6 - 10

Kurang : apabila memperoleh skor 1 - 5

3. Langkah-langkah menyusun pedoman observasi

Adapun langkah-langkah menyusun pedoman

Observasi adalah:

1) Merumuskan tujuan

2) Merumuskan kegiatan

3) Menyusun langkah-langkah

4) Menyusun kisi-kisi

5) Menyusun panduan observasi

6) Menyusun alat penilaian

Page 185: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

174 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

G. Jurnal

Jurnal merupakan catatan pendidik/guru di dalam

dan di luar kelas yang berisi informasi hasil pengamatan

tentang kekuatan dan kelemahan siswa yang berkaitan

dengan sikap dan perilaku. Jurnal dapat memuat penilaian

siswa terhadap aspek tertentu secara kronologis.

Adapun Kriteria jurnal yaitu:

Mengukur capaian kompetensi sikap yang

penting.

Sesuai dengan kompetensi dasar dan indikator.

Menggunakan format yang sederhana dan

mudah diisi/digunakan.

Dapat dibuat rekapitulasi tampilan sikap

peserta didik secara kronologis.

Memungkinkan untuk dilakukannya pencatatan

yang sistematis, jelas dan komunikatif.

Format pencatatan memudahkan dalam

pemaknaan terhadap tampilan sikap peserta

didik

Menuntun guru untuk mengidentifikasi

kelemahan dan kekuatan peserta didik

H. Inventori

Inventori; merupakan skala psikologis yang dipakai

untuk mengungkap sikap, minat, dan persepsi peserta

didik terhadap sesuatu objek psikologis. Inventori antara

lain berupa skala Thurstone, skala Likert, atau skala

berdiferensiasi semantik. Penjelasan lebih lanjut ada dalam

BAB 16 pengukuran/penilaian sikap.

Page 186: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

175 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

I. Penilaian diri (self-assessment)

Menurut Rolheiser dan Ross (2005), penilaian diri

adalah suatu cara untuk melihat ke dalam diri sendiri.

Melalui penilaian diri siswa dapat melihat kelebihan

maupun kekurangannya, untuk selanjutnya kekurangan ini

menjadi tujuan perbaikan (improvement goal). Dengan

demikian, siswa lebih bertanggungjawab terhadap proses

dan pencapaian tujuan belajarnya.

Penilaian diri merupakan teknik penilaian dengan

cara meminta siswa mengemukakan kelebihan dan

kekurangan dirinya, penguasaan kompetensi yang

ditargetkan, dan menghargai, menghayati serta

pengamalan perilaku berkepribadian Jujur. Penilaian diri

atau “self assessment” adalah penilaian yang dilakukan

sendiri oleh siswa yang bersangkutan untuk kepentingan

pengelolaan kegiatan belajar mengajar (KBM) di tingkat

kelas. Penilaian diri mampu memainkan aturan dalam

mengarahkan siklus belajar ketika penilaian diri siswa

adalah positif. Penilaian diri positif mendorong siswa

untuk merancang tujuan yang lebih tinggi dan sepakat

lebih personal terhadap sumber-sumber tugas belajar.

Penilaian diri meliputi tiga proses dimana regulasi

diri siswa mengamati dan menafsirkan prilaku dirinya

(Tola, 2008). Pertama, siswa menghasilkan observasi

sendiri yang berfokus pada aspek kinerja khusus yang

relevan dengan standar kesuksesan. Kedua, siswa membuat

pertimbangan sendiri dengan menentukan bagaimana

tujuan umum dan khusus dapat tercapai. Ketiga, siswa

Page 187: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

176 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

melakukan reaksi diri, menafsirkan tingkat pencapaian

tujuan, dan menghayati kepuasan hasil reaksi dirinya. Penilaian diri siswa amat penting karena diantara

hal-hal berikut ini siswa dapat:

1) membandingkan hasil pekerjaannya dari waktu ke

waktu;

2) ) mengkreasi kriteria penilaian pada suatu tugas

yang diberikan;

3) mendiskusikan strateginya untuk melaklukan

tugasnya;

4) bekerja dengan teman sejawat untuk menilai dan

merevisi tugasnya;

5) menimbang kecenderungan tugasnya, dan

menelaahnya;

6) merefleksikan tugas berikutnya.

LEMBAR PENILAIAN DIRI SIKAP DISIPLIN

Nama Siswa : …………………. Kelas : …………………. Materi Pokok : …………………. Tanggal : …………………. Petunjuk : Lembaran ini diisi oleh siswa untuk menilai sikap disiplin diri peserta didik. Berilah tanda cek (√) pada kolom skor sesuai sikap disiplin yang kamu miliki sebagai berikut : Ya = apabila kamu menunjukkan perbuatan sesuai pernyataan Tidak = apabila kamu tidak menunjukkan perbuatan sesuai pernyataan. Nama Siswa : ………………….

Page 188: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

177 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Kelas : …………………. Tanggal Pengamatan : ………………….. Materi Pokok : …………………..

No Sikap yang diamati Melakukan Keterangan Ya Tidak

1 Saya masuk kelas tepat waktu

2 Saya mengumpulkan tugas tepat waktu

3 Saya memakai seragam sesuai tata tertib

4 Saya mengerjakan tugas yang diberikan

5 Saya tertib dalam mengikuti pembelajaran

6 Saya mengikuti praktikum sesuai dengan langkah yang ditetapkan

7 Saya membawa buku tulis sesuai mata pelajaran

8 Saya membawa buku teks mata pelajaran

Jumlah Petunjuk Penyekoran : Peserta didik memperoleh nilai : Baik Sekali : apabila terdapat 7 – 8 jawaban YA Baik : apabila terdapat 5 – 6 jawaban YA Cukup : apabila terdapat 3 – 4 jawaban YA Kurang : apabila terdapat 1 – 2 jawaban YA

Page 189: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

178 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

J. Penilaian oleh teman sejawat (peer

assessment). Penilaian teman sejawat adalah proses di mana

siswa terlibat dan bertanggung jawab dalam penilaian

kerja siswa lain yang setingkat. Penilaian teman sejawat

(antar peserta didik) merupakan teknik penilaian dengan

cara meminta peserta didik untuk saling menilai terkait

dengan pencapaian kompetensi. Instrumen yang

digunakan untuk penilaian teman sejawat adalah daftar cek

dan skala penilaian (rating scale) dengan teknik sosiometri

berbasis kelas.

Penilaian teman sejawat memerlukan para siswa

untuk memberikan nilai atau umpan balik pada teman

mereka mengenai kinerja atau produk mereka berdasarkan

suatu kriteia yang telah dibuat kriteria yang telah dibuat

bersama mereka. Beberapa keuntungan penilaian teman

sejawat antara lain: 1) Dapat meningkatkan hasil belajar, 2)

Dapat meningkatkan kolaborasi belajar melalui umpan

balik dari teman sejawat, 3) Siswa dapat membantu

temanya dalam pemahaman dan belajar /Efektifitas

Penilaian Diri.

Page 190: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

179 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 9 TEKNIK PENILAIAN

A. Penilaian Kinerja (Performance Assessment) Menurut Trespeces (Setiadi, 2008), Performance

Assessment adalah berbagai macam tugas dan situasi di

mana peserta tes diminta untuk mendemonstrasikan

pemahaman dan mengaplikasikan pengetahuan yang

mendalam, serta keterampilan di dalam berbagai macam

konteks sesuai dengan kriteria yang diinginkan. Berk

(1986) menyatakan bahwa penilaian unjuk kerja adalah

proses mengumpulkan data dengan cara pengamatan yang

sistematik untuk membuat keputusan tentang individu.

Jadi Performance Assessment atau penilaian kinerja adalah

suatu penilaian yang meminta peserta tes untuk

mendemonstrasikan dan mengaplikasikan pengetahuan

unjuk kerja ke dalam berbagai macam konteks sesuai

dengan yang diinginkan.

Penilaian unjuk kerja merupakan penilaian yang

dilakukan dengan mengamati kegiatan peserta didik dalam

melakukan sesuatu. Penilaian unjuk kerja cocok digunakan

Page 191: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

180 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

untuk menilai ketercapaian kompetensi yang menuntut

siswa melakukan tugas tertentu, seperti: praktek di

laboratorium, olah raga, presentasi, diskusi, bernyanyi,

membaca puisi/ deklamasi, berpidato dan sebagainya.

Penilaian unjuk kerja dapat dilakukan secara kelompok

dan juga dapat dilakukan secara individual. Pada penilaian

secara kelompok berarti guru menghadapi sekelompok

testee, sedangkan pada penilaian secara individual berarti

seorang guru seorang testee.

Menurut Maertel (1992), penilaian kinerja

mempunyai dua karakteristik dasar yaitu (1) peserta tes

diminta untuk mendemontrasikan kemampuannya dalam

mengkreasikan suatu produk atau terlibat dalam suatu

aktivitas (perbuatan), misalnya melakukan eksperimen

untuk mengetahui tingkat penyerapan dari kertas tisue, (2)

produk dari Performance Assessment lebih penting

daripada perbuatan (performance)-nya.

Hal yang terpenting dalam penilaian unjuk kerja

adalah cara mengamati dan menskor kemampuan kinerja

peserta didik. Guna meminimumkan faktor subyektifitas

keadilan dalam menilai kemampuan kinerja siswa,

biasanya penile i(rater) jumlahnya lebih dari satu orang

sehingga diharapkan hasil penilaian mereka menjadi lebih

valid dan reliabel.

Menurut Setiadi (2008) ada tujuh kriteria yang

harus diperhatikan untuk mengevaluasi apakah penilaian

kinerja sudah dapat dianggap berkualitas baik, yaitu:

a. Generability, artinya apakah kinerja siswa (students’

performance) dalam melakukan tugas yang

Page 192: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

181 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

diberikan guru sudah memadai untuk

digeneralisasikan dengan tugas-tugas lain?

b. Authenticity, artinya apakah tugas yang diberikan

tersebut sudah sesuai dengan apa yang sering

dihadapinya dalam praktek kehidupan sehari-hari?

c. Multiple foci, artinya apakah tugas yang diberikan

kepada peserta tes sudah mengukur lebih dari satu

kemampuan-kemampuan yang diinginkan (more

than one instructional outcomes?)

d. Teachability, artinya apakah tugas yang diberikan

merupakan tugas yang hasilnya semakin baik

karena adanya usaha mengajar guru di kelas? Tugas

yang diberikan dalam penilaian keterampilan atau

penilaian kinerja adalah tugas-tugas yang relevan

dengan yang diajarkan guru di kelas penilaian

kinerja.

e. Fairness, artinya apakah tugas yang diberikan sudah

adil (fair) untuk semua peserta tes, tidak “bias”

untuk semua kelompok jenis kelamin, suku bangsa,

agama, atau status sosial ekonomi.

f. Feasibility, artinya apakah tugas-tugas yang

diberikan dalam penilaianketerampilan atau

penilaian kinerja (“Performance Assessment”)

memang relevan untuk dapat dilaksanakan

mengingat faktor-faktor seperti biaya, ruangan

(tempat), waktu, atau peralatannya?

g. Scorability, artinya apakah tugas yang diberikan

dapat diskor dengan akurat dan reliabel? Karena

memang salah satu yang sensitif dari penilaian

keterampilan atau penilaian kinerja adalah

Page 193: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

182 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

penskorannya. Karena itu nanti pada bagian berikut

dari tulisan ini akan dibahas beberapa contoh

ponskoran dari penilaian keterampilan atau

penilaian kinerja

Dalam Penilaian Kinerja dapat digunakan 2

pendekatan, yaitu: (1) metode holistic, dan (2) metode

analytic. Metode holistic digunakan apabila para penskor

(rater) hanya memberikan satu buah skor atau nilai (single

rating) berdasarkan penilaian mereka secara keseluruhan

dari hasil kinerja peserta tes. Sedangkan pada metode

analytic para penskor (rater) memberikan penilaian (skor)

pada berbagai aspek yang berbeda yang berhubungan

dengan kinerja yang dinilai. Dalam penilaian/penskoran

kinerja (Performance Assessment) dengan metode analytic

antara lain dapat menggunakan (1) checklists; dan (2)

rating scales.

Contoh Instrumen:

Instrumen Penilaian Kinerja (Performance

Assessment) pada saat melaksanakan praktiku/kerja

kelompok.

Page 194: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

183 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Kelompok/Nama Sswa

Tanggal:

No Aspek Kinerja SK K C B SB

1 Menunjukkan

minat/inisiatif beraktivitas

2 Terlibat aktif

melaksanakan kegiatan

3 Ketepatan melakukan

tugas/menggunakan alat

4 Menghargai hak orang lain

5 Menunjukkan kreatifitas

Nilai: SK = 0 – 3,4; K = 3,5 – 5,4; C = 5,5 – 6,4; B = 6,5 – 8,4;

SB = 8,5 – 10

B. Penilaian Produk (Hasil Kerja) Menurut Taufina (2009) penilaian hasil kerja

(produk) adalah penilaian terhadap keterampilan siswa

dalam mengaplikasikan pengetahuan yang dimiliki ke

dalam wujud produk, dan penilaian terhadap kualitas

produk tersebut . Jadi penilaian produk adalah penilaian

terhadap keterampilan siswa dalam menggunakan alat

serta prosedur kerja dalam menghasilkan suatu produk

(karya); dan aspek kualitas teknis dan estetik produk

(karya) tersebut. Penilaian produk tidak hanya diperoleh

dari hasil akhir, namun juga proses pembuatannya.

Page 195: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

184 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Penilaian produk merupakan salah satu teknik penilaian

yang mampu memberikan informasi kemampuan siswa

pada 3 ranah kompetensi, yaitu kognitif, psikomotor, dan

afektif.

Penilaian produk juga memungkinkan siswa

mengembangkan kreativitas, potensi, dan kecakapan yang

dimiliki. Selain itu, mereka dapat mengaplikasikan materi

yang didapat dari kegiatan pembelajaran. Siswa juga

dimungkinkan mampu mengembangkan karakter dan

watak yang diperlukan dalam berkehidupan dan

bermasyarakat.

Adapun Tujuan penilaiam produk adalah:

a. Menilai penguasaan keterampilan siswa yang diperlukan

sebelum

mempelajari keterampilan berikutnya;

b. Menilai tingkat kompetensi yang sudah dikuasai siswa

pada akhir kelas;

c. Menilai keterampilan siswa yang akan memasuki

institusi pendidikan

kejuruan.

Ada tiga cara melakukan penilaian produk, yaitu:

1) Anecdotal: metode yang cocok untuk menilai

pada tahap produk,

2) Skala Penilaian Analitis: metode yang biasa

digunakan untuk tahap perencanaan dan

tahap akhir

3) Skala Penilaian Holistik : metode penilaian

pada tahap akhir.

Page 196: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

185 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh Instrumen Penilaian Produk:

Tahap Deskripsi Skor

Persiapan Kemampuan merencanakan:

Menggali dan mengembangkan gagasan

Mendesain produk, menentukan alat dan bahan

1 - 10

Pembuatan Kemampuan menyeleksi dan menggunakan bahan

Kemampuan menyeleksi dan menggunakan alat

Kemampuan menyeleksi dan menggunakan teknik

1-10

Penilaian Kemampuan siswa membuat produk sesuai kegunaan/fungsi

Produk memenuhi kriteria keindahan

1 -10

C. Penilaian Proyek) 1. Konsep Dasar

Penilaian projek adalah penilaian terhadap tugas

yang harus diselesaikan dalam periode/waktu tertentu.

Tugas tersebut berupa suatu investigasi sejak dari

pengumpulan, pengorganisasian, pengevaluasian, hingga

penyajian data. Karena dalam pelaksanaannya projek

bersumber pada data primer/sekunder, evaluasi hasil, dan

kerjasama dengan pihak lain, projek merupakan suatu

sarana yang penting untuk menilai kemampuan umum

dalam semua bidang. Projek juga akan memberikan

Page 197: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

186 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

informasi tentang pemahaman dan pengetahuan siswa

pada pembelajaran tertentu, kemampuan siswa dalam

mengaplikasikan pengetahuan, dan kemampuan siswa

untuk mengomunikasikan informasi.

Penilaian projek ini dilakukan sejak perencanaan,

proses selama pengerjaan tugas, sampai hasil akhir projek.

Untuk itu guru perlu menetapkan tahapan yang akan

dinilai, seperti penyusunan desain, pengumpulan data,

analisis data, menyiapkan laporan tertulis. Penilaian projek

dapat dilakukan dengan menggunakan daftar cek ataupun

skala rentang.

Adapun manfaat dari kerja projek adalah untuk

menilai kemampuan siswa pada waktu melakukan kerja

individu maupun kerja kelompok, kemampuan dalam

mengatur/ mengorganisasikan waktu dan kemampuan

untuk merancang tugas secara berurutan

Hasil belajar yang dapat dinilai pada tahap proses

pengerjaan projek, antara lain: (1) Kemampuan

merencanakan dan mengorganisasikan penelitian; (2)

Kemampuan bekerja dalam kelompok; dan (3)

Kemampuan untuk melaksanakan tugas secara mandiri.

Sedangkan hasil belajar yang dinilai pada produk suatu

projek, antara lain (1) Kemampuan mengidentifikasi dan

mengumpulkan informasi; (2) Kemampuan menganalisis

dan menginterpretasikan data; dan (3) Kemampuan

melaporkan/ menyampaikan hasil.

2. Perencanaan Penilaian Projek

Ada tiga hal yang perlu dipertimbangkan guru dalam

perencanaan penilaian projek yaitu:

Page 198: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

187 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

a. Kemampuan pengelolaan

Jika siswa diberikan kebebasan yang luas, mereka akan

mendapatkan kesulitan dalam memilih topik yang tepat.

Mereka mungkin memilih topik yang terlalu luas

sehingga sedikit informasi yang dapat ditemukan.

Mereka mungkin juga kurang tepat untuk

memperkirakan waktu pengumpulan data dan

penulisan laporan.

b. Relevansi

Guru harus mempertimbangkan pengetahuan,

keterampilan, dan pemahaman pada pembelajaran agar

projek dapat dijadikan sebagai sumber bukti.

c. Keaslian

Guru perlu mempertimbangkan seberapa besar

petunjuk atau dukungan yang telah diberikan pada

siswa.

Page 199: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

188 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh Instrumen Penilaian Proyek:

Mata Pelajaran : .........

Nama Proyek : ...................

Alokasi Waktu : ................

Nama Siswa: Chintami Kelas : .............

No Aspek* Skor (1 – 5)**

1 Perencanaan:

a. Persiapan

b. Rumusan Judul

2 Pelaksanaan

a. Sistematika Penulisan

b. Keakuratan Sumber

Data/Informasi

c. Kuantitas Sumber Data

d. Analisis Data

e. Penarikan Kesimpulan

3 Laporan Proyek

a. Performans

b. Presentasi / Penguasaan

Total Skor

* Aspek yang dinilai disesuaikan dengan proyek dan

kondisi siswa/sekolah

** Skor diberikan kepada peserta didik tergantung dari

ketepatan dan kelengkapan jawaban yang diberikan.

Semakin lengkap dan tepat jawaban, semakin tinggi

perolehan skor

Page 200: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

189 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

D. Penilaian Portofolio 1. Pengertian Portofolio

Menurut Paulson dan Meyer (1991) Portofolio adalah

kumpulan pekerjaan siswa yang menunjukkan usaha,

perkembangan dan kecapakan siswa dalam satu bidang

studi atau lebih. Kumpulan inii harus mencakup partisipasi

siswa dalam seleksi isi, kriteria seleksi, kriteria penilaian

dan bukti refleksi diri. Sedangkan Gronlund (1976)

mengemukakan portofolio adalah berbagai contoh

pekerjaan siswa yang tergantung pada keluasan tujuan.

Jadi portofolio adalah kumpulan hasil karya siswa yang

didokumentasi secara baik dan teratur. Karya siswa itu

dapat berupa kliping, tugas idividual, hasil wawancara,

piagam penghargaan, karangan-karangan, dll.

Penilaian Portofolio adalah penilaian terhadap

sekumpulan karya siswa yang tersusun secara sistematis

dan terorganisasi yang diambil selama proses

pembelajaran, digunakan guru dan siswa untuk memantau

perkembangan pengetahuan, keterampilan, dan sikap

siswa dalam mata pelajaran tertentu. Dengan demikian

penilaian portofolio memberikan gambaran secara

menyeluruh tentang proses & pencapaian belajar siswa

pada kurun waktu tertentu.

2. Tujuan Portofolio

Tujuan portofolio ditetapkan berdasarkan apa yang

harus dikerjakan dan siapa yang akan menggunakan jenis

portofolio. Dalam penilaian di kelas, portofolio dapat

digunakan untuk mencapai beberapa tujuan, antara lain:

Page 201: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

190 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

a. mengetahui perkembangan yang dialami siswa;

b. mendokumentasikan proses pembelajaran yang

berlangsung;

c. memberi perhatian pada prestasi kerja siswa

yang terbaik;

d. merefleksikan kesanggupan mengambil resiko

dan melakukan ekperimentasi

e. meningkatkan efektifitas proses pembelajaran;

f. bertukar informasi dengan orang tua.wali siswa

dan guru lain;

g. membina dan mempercepat pertumbuhan

konsep diri positif pada siswa;

h. meningkatkan kemampuan melakukan refleksi

diri; dan

i. membantu siswa dalam merumuskan tujuan.

3. Prinsip Portofolio

Menurut Surapranata dan Hatta (2004) ada

beberapa prinsip yang perlu diperhatikan dan dijadikan

sebagai pedoman dalam penggunaan penilaian portofolio

di sekolah, antara lain:

a. Saling percaya (mutual trust) antara guru dan siswa

Dalam proses penilaian portofolio guru dan siswa

harus memiliki rasa saling mempercayai. Mereka harus

merasa sebagai pihak-pihak yang saling memerlukan, dan

memiliki semangat untuk saling membantu. Oleh karena

itu, mereka harus saling terbuka dan jujur satu sama lain.

Dengan demikian, akan terwujud hubungan yang wajar dan

Page 202: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

191 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

alami, yang memungkinkan proses pendidikan berlangsung

dengan baik.

b. Kerahasiaan bersama (confidentiality) antara guru

dan siswa

Kerahasiaan hasil pengumpulan bahan dan hasil

penilaiannya perlu dijaga dengan baik, tidak disampaikan

kepada pihak-pihak lain yang tidak berkepentingan.

Pelanggaran terhadap norma ini, selain menyangkut etika,

juga dapat memberi dampak negatif kepada proses

pendidikan anak/siswa.

c. Milik bersama (joint ownership) antara siswa dan

guru

Guru dan siswa perlu merasa memiliki bersama

berkas portofolio. Oleh karena itu, guru dan siswa perlu

menyepakati bersama di mana hasil karya yang telah

dihasilkan siswa akan disimpan, dan bahan-bahan baru

yang akandimasukkan. Dengan demikian siswa akan

merasa memiliki terhadap hasil kerjanya, dan akhirnya

akan tumbuh rasa tanggung jawab pada dirinya.

d. Kepuasan (satisfaction)

Hasil kerja portofolio seyogyanya berisi keterangan-

keterangan dan/atau buktibukti yang memuaskan bagi

guru dan siswa. Portofolio hendaknya juga merupakan

bukti prestasi cemerlang siswa dan keberhasilan

pembinaan guru.

Page 203: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

192 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

e. Kesesuaian (relevance)

Hasil kerja yang dikumpulkan adalah hasil kerja

yang berhubungan dengan tujuan pembelajaran yang

sesuai dengan tujuan pembelajaran dalam kurikulum.

f. Penilaian proses dan hasil

Penilaian portofolio menerapkan prinsip proses dan

hasil. Proses belajar yang dinilai misalnya diperoleh dari

catatan perilaku hasian siswa (anecdot) mengenai sikapnya

dalam belajar, antusias atidaknya dalam mengikuti

pelajaran dan sebagainya. Aspek lain dari penilaian

portofolio adalah penilaiana hail, yaitu menilai hasil akhir

suatu tugas yang diberikan oleh guru.

4. Bentuk Portofolio

Fosters dan Masters (Surapranata dan Hatta, 2004)

membedakan penilaian portofolio ke dalam tiga kelompok,

yaitu: portofolio kerja (working portfolio), portofolio

dokumentasi (documentary portfolio), dan portofolio

penampilan (show portfolio).

Portofolio kerja adalah usaha mandiri yang telah

dilakukan siswa, atau usaha bersama dari kelompok siswa.

Hal-hal yang harus dilakukan siswa dan dinilai dalam

penilaian portofolio antara lain berupa draft, pekerjaan

yang belum selesai, atau pekerjaan terbaik / kerja bisa

dilakukan siswa. Hasil kerja siswa dalam penilaian

portofolio jenis ini digunakan dalam diskusi antara siswa

dan guru. Ini akan membuat guru mengetahui kemajuan

siswa, dan memungkinkan guru menolong siswa untuk

Page 204: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

193 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

mengidentifikasi kelemahan, kelebihan serta kelayakan

dalam merancang dan meningkatkan pengajaran.

Portofolio dokumentasi adalah koleksi hasil kerja

siswa yang khusus digunakan untuk penilaian.

dokumentari portofolio adalah seleksi hasil kerja terbaik

siswa yang akan diajukan dalam penilaian. Jadi, portofolio

dokumentasi adalah koleksi dari sekumpulan hasil kerja

siswa selama kurun waktu tertentu. Portopolio

dokumentasi tidak hanya berisi hasil kerja siswa, tetapi

semua proses yang digunakan oleh siswa untuk

menghasilkan karya tertentu. Portofolio dokumentasi

misalnya dalam penilaian portofolio bahasa Inggris,

mungkin tidak hanya berisi tentang hasil akhir tulisan

siswa, tetapi juga berbagai macam draf dan komentar

siswa tentang hasil tersebut, termasuk juga proses sampai

di hasilkannya tulisan tersebut

Portofolio penampilan (show fortfolio) digunakan

untuk memilih hal-hal yang paling baik yang menunjukan

bahan/pekerjaan terbaik yang dihasilkan oleh siswa.

Berbeda darii portofolio dokumentasi, portofolio

penampilan hanya berisi pekerjaan siswa yang telah

selesai. Portofolio penampilan tidak mencakup proses

pekerjaan, perbaikan, dan penyempurnaan pekerjaan

siswa. Portofolio penampilan digunakan untuk tujuan

seperti seleksi, sertifikasi, maupun penilaian kelas. Untuk

tujuan yang lebih rumit, yang memerlukan perbandingan,

validitas perbandingan haruslah benar-benar diperhatikan

oleh beberapa penilai salah satunya reliabilitas, yaitu

apakah sektor yang berikan kepada hasil kerja siswa

konsisten.

Page 205: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

194 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh portofolio yang paling sederhana adalah

map dengan kumpulan-kumpulan bukti yang dapat berupa

:

artefact, yaitu dokumen yang dihasilkan selama

proses belajar seperti laporan praktikum,

pekerjaan rumah, proyek penelitian

reproduksi, yaitu foto, film, artikel, buku, copy

attestation, dokumen mahasiswa yang disiapkan

oleh orang lain seperti orang tua, teman, guru

5. Contoh Tugas

Berikut adalah contoh tugas dari guru kepada siswa

untuk membuat portofolio Contoh tugas untuk membuat

portofolio “karya terbaik”.

Kumpulkan dalam satu bendel, karya tulis kamu,

untuk menunjukkan karya terbaik kamu dalam pembuatan

puisi, laporan kunjungan ke objek wisata, artikel dalam

majalah dinding. Jelaskan mengapa masing-masing

merupakan karya terbaik.

Page 206: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

195 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

6. Cara menilai portofolio

Portofolio dapat dinilaii dengan menggunakan

rubrik penilaian, misalnya sebagai berikut:

No Aspek Yang Dinilai Skor

Maksimal

Skor yang

Diperoleh

1 Kelengkapan isi portofolio 3 2

2 Kemampuan siswa dalam

menjelaskan isi

portofolionya

8 7

3 Usaha siswa dalam

menyusun portofolionya

9 3

4 Perkembangan kompetensi

siswa

12 10

Jumlah 32 22

De Fina (Koyan, 2007) membandingkan ciri-ciri

asesmen portofolio dengan tes-tes baku sebagai tabel

berikut ini.

Tabel . Perbandingan antara Asesmen Portofolio dan Tes

Baku No Asesmen Portofolio Tes Baku

1 Terjadi pada situasi

alamiah

Terjadi pada situasi ujian,

tidak

alamiah

2 Memberi kesempatan

kepada

Menunjukkan kelemahan

peserta

Page 207: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

196 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

peserta didik untuk

menunjukkan

kelebihan dan

kelemahannya

didik dalam suatu hal

tertentu

3 Informasinya bersifat

langsung

pada saat proses

pembelajaran

berlangsung

Tidak memberikan informasi

dianostik secara langsung

(informasi

tertunda)

4 Asesmen dilakukan

bersama oleh guru, orang

tua peserta didik , dan

peserta didik itu sendiri

Asesmen dilakukan hanya

oleh

pendidik dan menunjukkan

peringkat

peserta didik

5 Penilaian berlangsung

terus menerus selama

proses

pembelajaran sehingga

memberikan kesempatan

untuk

menilai berbagai

kemampuan

Kesempatan hanya sekali

untuk

menilai kemampuan dalam

hal

tertentu

6 Menilai hal-hal yang

realistik dan

Bermakna

Menilai hal-hal yang

artifisial, tidak

sesuai dengan keseharian

yang ada

7 Memberi kesempatan

kepada

peserta didik untuk

mengadakan

refleksi terhadap hasil

karyanya

Mengharapkan hanya ada

satu

respon tentang pengetahuan

atau

kemampuannya

Page 208: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

197 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

8 Memberikan kesempatan

kepada

orang lain yang

berkepentingan

untuk mengadakan

refleksi tentang

pengetahuan dan karya-

karya

peserta didik

Memberikan data numerik

yang

kadangkala menakutkan dan

tidak

bermakna secara esensial

9 Mendorong terwujudnya

temu

wicara antara pendidik

dan peserta

didik

Mengharuskan pertemuan

antara

pendidik dan administrator

10 Menempatkan peserta

didik

sebagai pusat proses

pembelajaran sehingga

bermanfaat untuk

perbaikan kurikulum dan

pembelajaran

Menempatkan peserta didik

sebagai

objek proses pembelajaran

dan

mendukung kurikulum

sebagai pusat

proses pembelajaran

Page 209: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

198 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 210: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

199 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

UNIT IV KUALITAS INSTRUMEN DAN

ANALISIS BUTIR

Instrumen atau tes yang digunakan untuk

mengukur kemampuan siswa haruslah sebuah tes yang

berkualitas baik. Tes yang berkualitas baik akan mampu

menjadi tolok ukur yang baik untuk mengukur kemampuan

siswa. Untuk mengetahui bagaimanakah kualitas tes, maka

dilakukan analisis kualitas tes. Dengan analisis kualitas tes

guru dapat mengetahui bagaimana kondisi soal yang

digunakan untuk tes. Setidaknya terdapat tiga karakteristik

yang harus dimiliki oleh tes hasil belajar, sehingga tes

Page 211: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

200 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tersebut dapat dinyatakan sebagai tes yang baik. Keempat

karakteristik tersebut adalah validitas, reliabilitas, dan

kualitas butir tes.

Kegiatan menganalisis butir soal merupakan suatu

kegiatan yang harus dilakukan guru untuk meningkatkan

mutu soal yang telah ditulis. Tujuan penelaahan adalah

untuk mengkaji dan menelaah setiap butir soal agar

diperoleh soal yang bermutu sebelum soal digunakan. Di

samping itu, tujuan analisis butir soal juga untuk

membantu meningkatkan tes melalui revisi atau

membuang soal yang tidak efektif, serta untuk mengetahui

informasi diagnostik pada siswa apakah mereka

sudah/belum memahami materi yang telah diajarkan. Soal

yang bermutu adalah soal yang dapat memberikan

informasi setepat-tepatnya sesuai dengan tujuannya di

antaranya dapat menentukan peserta didik mana yang

sudah atau belum menguasai materi yang diajarkan guru.

Dalam melaksanakan analisis butir soal, para

penulis soal dapat menganalisis secara kualitatif, dalam

kaitan dengan isi dan bentuknya, dan kuantitatif dalam

kaitan dengan ciri-ciri statistiknya atau prosedur

peningkatan secara judgment dan prosedur peningkatan

secara empirik. Analisis kualitatif mencakup pertimbangan

validitas isi dan konstruk, sedangkan analisis kuantitatif

mencakup pengukuran kesulitan butir soal dan

diskriminasi soal yang termasuk validitas soal dan

reliabilitasnya.

Page 212: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

201 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 10 VALIDITAS TES

A.Konsep Validitas

Validitas berasal dari Bahasa Inggris dari kata

validity yang berarti sejauh mana ketepatan dan

kecermatan suatu alat ukur dalam melakukan fungsi

ukurnya. Beberapa pengertian validitas adalah sebagai

berikut.

(1) Validity is the adequacy and appropriateness of

the interpretations and uses of assessment result.

Validitas adalah kecukupan dan kelayakan

tafsiran-tafsiran dan hasil penilaian (Miller, Linn,

and Gronlund, 2009)

Page 213: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

202 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(2) Validity is defined as the proportion of true

variance that is relevant to the purpose of the

testing. Validitas didefinisikan sebagai proporsi

varians benar yang relevan dengan tujuan dan

tes (Brown, 1976)

(3) Validity is the extent or the degree to which an

instrument measures what it purports to measure.

Validitas merupakan tingkat atau derajat dimana

suatu instrumen mengukur apa yang akan

diukur (Deblassie, 1974).

(4) Validity refers to the degree to which evidence

and theory support the interpretations of test

scores entailed by proposed uses of test .Validitas

mengacu pada derajat bukti dan teori yang

mendukung penafsiran skor-skor tes yang

diperlukan oleh maksud kegunaan tes

(Thorndike, 1997)

(5) Validity is concerned with the extent to which a

test measures what it purports to measure and is

useful for the purpose for which it was

designed,Validitas berkenaan dengan tingkat

dimana sebuah tes mengukur apa (Wiersma &

Jurs, 1990)

Jadi, validitas adalah suatu konsep yang berkaitan

dengan sejauh mana tes telah mengukur apa yang

seharusnya diukur. Sebagai contoh, jika timbangan

digunakan untuk mengukur berat badan, maka proses

Page 214: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

203 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

pengukuran ini adalah tepat, karena itu keputusannya

adalah valid. Tetapi, jika timbangan itu digunakan untuk

mengukur tinggi badan, tingkat kevalidannya menjadi

rendah. Alasannya adalah timbangan hanya untuk

mengukur berat badan. Perlu dicamkan bahwa penekanan

validitas bukanlah pada tes itu sendiri, tetapi [ada hasil

pengetesan atau skornya.

Suatu alat ukur atau tes dapat dikatakan

mempunyai validitas apabila tes tersebut menjalankan

fungsi ukurnya, atau memberikan hasil ukur sesuai dengan

makna dan tujuan dilakukannya tes tersebut. Misalnya, jika

kita ingin mengetahui berat maka alat ukur yang tepat

adalah timbangan atau neraca, jika kita ingin mengetahui

suhu, maka alat ukur yang tepat adalah termometer. Dapat

dikatakan bahwa timbangan atau neraca merupakan alat

ukur yang valid mengukur berat, termometer adalah alat

ukur yang valid mengukur sihu, dan sebagainya.

Semakin tinggi validitas suatu alat tes maka tes

tersebut semakin mengenai pada sasarannya (sahih), atau

semakin menunjukkan apa yang seharusnya diukur. Tes

yang valid adalah tes yang mampu membantu guru

membuat keputusan yang berguna tentang pengajaran dan

pembelajaran.

Tes yang tidak valid dapat diibaratkan dengan

contoh tembakan seperti pada gambar 7.1.di bawah.

Gambar 10.1 memperlihatkan suatu tembakan yang tidak

mengenai sasaran dari seorang penembak. Demikian juga

skor tes yang tidak mengukur apa yang seharusnya diukur.

Page 215: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

204 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Gambar 10.1. Tembakan yang tidak mengenai

sasaran

Validitas tidak berlaku secara umum bagi semua

pengukuran. Suatu tes mempunyai hasil ukuran yang baik

(valid) untuk suatu tujuan tertentu yang sepesifik tetapi

tidak valid untuk tujuan yang lain atau bahkan untuk

tujuan yang sama pada kelompok yang lain.

Cohen‐Swerdlik (2009) menyatakan “validity, as

applied to a test, is a judgment or estimate of how well a test

measures what it purports to measure in a particular

context. Maksudnya, validitas dalam sebuah tes menjadi hal

yang sangat penting karena akan mengukur kemampuan

peserta didik secara tepat. Tes yang menghasilkan data

yang tidak relevan dengan tujuan pengukuran dikatakan

sebagai tes yang memiliki validitas rendah (Azwar, 2000).

Uji validitas berguna untuk mengetahui valid atau

tidaknya butir-butir pertanyaan dalam alat tes hasil

belajar. Proses pengujian dilakukan dengan cara

Page 216: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

205 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

menganalisis setiap pertanyaan di dalam alat tes hasil

belajar tersebut. Uji validitas digunakan untuk mengetahui

kelayakan butir-butir dalam suatu tes. Menurut Kapplan

dan Saccuzzo (1995), tahap validitas sesuatu pengujian

bergantung kepada ketepatan antara tujuan pengukuran

dengan informasi yang dihasilkan oleh proses pengujian

tersebut.

B. Macam-Macam Validitas Secara garis besar ada dua macam validitas, yaitu

validitas tes dan validitas butir (Sudijono, 2006). Validitas

tes dikelompokkan atas dua macam, yaitu validitas logis

dan validitas empiris. Secara ilustrasi pembagian validitas

ditunjukkan pada gambar 8.2 .

Validitas

Validitas Tes

Validitas

Butir

Validitas

Logis

Validitas Empiris

Validitas

Konstruk

Validitas Prediktif

Validitas Konkurensi

Validitas Isi

Page 217: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

206 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Gambar 8.2:Ilustrasi macam-macam validitas

1. Validitas Logis

Validitas logis menunjuk pada kondisi sebuah alat

ukur valid berdasarkan hasil penalaran. Validitas logis

disebut juga sebagai validitas yang dipertimbangkan secara

rasional. Ada dua macam validitas logis yang dapat dicapai

oleh sebuah alat ukur, yaitu: validitas isi (content validity)

dan validitas konstruk (construct validity).

1) Validitas Isi (Content Validity)

Wiersma dan Jurs (1990) menyatakan bahwa ”

content validity is concerned with the extent to which the

test is reprentative of a defined body of content consisting of

topics and processes. Validitas isi berkaitan dengan

sejuhmana tes ini mewakili dari keseluruhan isi yang

terdiri dari topic dan proses.

Gay (1987) menyatakan bahwa validitas isi (content

validity) adalah derajat pengukuran yang mencerminkan

domain isi yang diharapkan. Validitas isi penting untuk tes

hasil belajar (achievement test)

Validitas isi mencerminkan sejauh mana butir-butir dalam

tes memerupakan materi yang disajikan dalam kurikulum.

Menurut Azwar (2012) validitas isi berarti sejauh mana

suatu perangkat tes mencerminkan keseluruhan

kemampuan yang hendak diukur. Sebuah tes dikatakan

memiliki validitas isi jika butir - butir tes bersifat

representatif terhadap isi materi dalam kurikulum

Page 218: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

207 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tersebut. Jadi, Suatu tes hasil belajar dapat dikatakan valid

jika materi tes tersebut benar-benar bahan yang

representatif terhadap bahan-bahan pelajaran yang

diberikan.

Validitas isi mencakup dua aspek: (1) relevansi isi,

dan (2) liputan isi (Messick, 1989). Lazimnya, dalam

sejumlah literatur, relevansi isi disebut sebagai face validity

(validitas muka) dan liputan isi disebut sebagai logical

validity (validitas logis).

a. Face Validity (Validitas Muka)

Validitas muka adalah validitas yang menilai

keabsahan susunan kalimat atau kata-kata dalam

soal/pernyataan/pertanyaan sehingga jelas pengertiannya

atau tidak menimbulkan tafsiran lain. Apabila isi alat ukur

telah tampak sesuai dengan apa yang ingin diukur, maka

dapat dikatakan validitas muka telah terpenuhi.

b. Logical Validity (Validitas Logis)

Validitas logis atau validitas sampling adalah

validitas yang menunjuk pada sejauhmana isi tes

merupakan representasi dari aspek yang hendak diukur.

Untuk memperoleh validitas logis yang tinggi suatu tes

harus dirancang sedemikian rupa sehingga benar-benar

berisi hanya butir yang relevan dan perlu menjadi bagian

alat ukur secara keseluruhan.

2). Validitas Konstruk (Construct Validity)

Page 219: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

208 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Morris & Gibbon (1986) menyatakan the construct

validity of a test is the extent to which you can be sure it

represent the construct whose name appears in its tittle.

Artinya, validitas konstruk sebuah tes adalah sejauh mana

Anda dapat yakin itu merupakan konstruk yang namanya

muncul dalam judul nya .

Menurut Suryabrata (2000), validitas konstruk

(construct validity) menyatakan sejauh mana skor-skor

hasil pengukuran dengan suatu instrumen itu

merefleksikan konstruk teoretik yang mendasari

penyusunan instrumen tersebut. Sebuah tes dikatakan

mempunyai validitas konstruk apabila butir-butir soal yang

disusun dalam tes mengukur setiap aspek berpikir dari

sebuah variabel yang akan diukur melalui tes tersebut.

Pada suatu instrumen non tes dikatakan mempunyai

validitas konstruk, jika instrumen tersebut dapat

digunakan untuk mengukur variabel sesuai dengan yang

didefinisikan. Misalnya untuk mengukur minat siswa, maka

perlu didefinisikan terlebih dahulu apa itu minat siswa,

demikian juga variabel motivasi atau minat misalnya.

2. Validitas Empiris

Validitas empiris menunjuk pada kondisi instrumen

valid berdasarkan hasil uji secara empiris (pengalaman).

Validitas empiris sama dengan validitas kriteria yang

berarti bahwa validitas ditentukan berdasarkan kriteria,

baik kriteria internal maupun kriteria eksternal. Menurut

Djaali (2008) kriteria internal berarti tes atau instrumen

itu sendiri yang menjadi kriteria, sedangkan kriteria

Page 220: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

209 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

eksternal adalah hasil ukur instrumen atau tes lain diluar

instrumen itu sendiri yang menjadi kriteria.

Validitas empiris dapat dibagi menjadi dua, yaitu

validitas bandingan (concurrent validity) dan validitas

ramalan (predictive validity).

a) Validitas Bandingan ( concurent validity )

Validitas bandingan (concurrent validity) adalah

pengujian validitas yang menggunakan kriteria eksternal di

mana kriteria yang digunakan telah ada pada saat

pengujian tes dilakukan. Sebagai contoh, tes akhir semester

dapat diuji validitasnya menggunakan nilai ulangan harian

sebagai kriteria.

b) Validitas ramalan ( predictive validity)

Validitas ramalan (predictive validity) adalah

pengujian validitas yang menggunakan kriteria eksternal di

mana kriteria pembandingnya belum ada pada saat tes

dikembangkan. Kriteria yang digunakan sebagai

pembanding untuk menguji validitas masih harus

diramalkan menggunakan skor hasil pengukuran tes.

Ringkasan informadi tentang validitas isi, validitas

konkuren, validitas prediktif, dan validitas konstruk, adalah

seperti yang ditunjukkan dalam Tabel 10.1 berikut:

Tabel.10.1 .Ringkasan informasi tentang Validitas-Validitas isi, konstruks, konkuren dan prediktif Jenis Tujuan Bagaimana

menentukan

Validitas Isi Untuk menentukan Melalui suatu analisis

Page 221: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

210 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tingkat mana butir-

butir tes mewakili isi

logis yang memerlukan

kesamaan di antara

butir-butir tes dan isi

Validitas

Konkurensi

Untuk menentukan

tingkat mana satu alat

ukur

Analisis korelasi, skor-

skor dari alat ukur yang

ingin diuji validitasnya

dikorelasi dengan skor-

skor yang diperoleh

dari kriteria pada saat

yang sama

Validitas

Prediktif

Analisis korelasi, skor-

skor dari alat ukur yang

ingin diuji validitasnya

dikorelasi dengan skor-

skor yang diperoleh

pada waktu yang akan

datang

Validitas

Konstruk

Untuk menentukan

sejauh mana alat ukur

dapat dikatakan

mengukur sebuah

konstruk atau sifat

teoritisnya

Analisis logis dan

melalui prosedur

korelasional, seperti

analisis faktor

3. Validitas Butir

Validitas butir disebut pula sebagai validitas

internal. Validitas butir memperlihatkan seberapa jauh

hasil ukur butir tersebut konsisten dengan hasil ukur

instrumen secara keseluruhan.

Validitas butir (Internal) adalah validitas yang ditinjau

berdasarkan hubungannya dengan kategori tertentu. Bryman

(2001) menyatakan bahwa “internal validity is common to

Page 222: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

211 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

refer to the factor that has a causal impact as the

independent variable and the effect as the dependent

variable.” maksudnya, validitas internal pada umumnya

merujuk pada faktor yang memiliki pengaruh sebab

sebagai variabel bebas dan akibat sebagai variabel terikat.

Menurut Sudijono (2003) yang dimaksud dengan validitas

butir dari suatu tes adalah, ketepatan mengukur yang

dimiliki oleh sebutir soal (yang merupakan bagian tak

terpisahkan dari tes sabagai suatu totalitas), dalam

mengukur apa yang seharusnya diukur lewat butir soal

tersebut.

Validitas butir atau internal memperlihatkan

seberapa jauh hasil ukur butir tersebut konsisten dengan

hasil ukur alat ukur secara keseluruhan (Djaali dan

Muljono, 2008). Validitas butir tercermin pada besaran

koefisien korelasi antara skor butir dan skor total alat ukur.

Jika koefisien korelasi antara skor butir dengan skor total

instrumen positif dan signifikan, maka butir tersebut dapat

dianggap valid berdasarkan ukuran validitas internal.

Sebutir soal dapat dikatakan telah memiliki validitas yang

tinggi atau dapat dikatakan valid, jika skor-skor pada butir

soal yang bersangkutan memiliki kesesuaian atau

kesajajaran arah dengan skor totalnya; atau dengan bahasa

statistik : Ada korelasi positif yang signifikan antara skor

butir dengan skor totalnya (Sudijono, 2003)

Untuk menghitung koefisien korelasi validitas

antara skor butir dan skor total pada skor butir kontinum,

maka rumus yang digunakan adalah Pearson Product

Moment sebagai berikut:

Page 223: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

212 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

( )( )

√* ( ) +* ( ) +

dengan : koefisien korelasi product moment

X : skor tiap pertanyaan/ item

Y : skor total

N : jumlah responden

Contoh:Dari hasil ujicoba 5 butir soal esai yang dijawab 10

orang siswa didapat distribusi skor jawaban siswa

adalah seperti yang ditunjukkan dalam Tabel

10.2. Tentukan validitas butir soal nomor 1.

Tabel 10.2. Perhitungan korelasi product moment

No Siswa Nomor butir Skor

total 1 2 3 4 5 1 A 5 7 3 5 7 27 2 B 8 8 6 8 9 39 3 C 4 4 4 3 7 22 4 D 7 6 7 4 7 31 5 E 5 6 5 6 8 30 6 F 8 5 7 7 7 34 7 G 6 5 6 7 7 31 8 H 4 3 5 4 5 21 9 I 8 7 7 8 7 37

10 J 5 6 4 5 7 27

Untuk menentukan valid tidaknya butir No.1 yang menggunakan korelasi product moment, maka dibuatkan terlebih dahulu tabel 10.3 yang memuat soal No.1 (X), skor totalnya (Y) dan menghitung ∑ X2, ∑Y2, dan ∑XY.

Page 224: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

213 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Tabel 10.3 Analisis untuk mencari validitas butir 1

No Siswa Butir 1

(X)

Skor total (Y)

X2 Y2 XY

1 A 5 27 25 729 135 2 B 8 39 64 1521 312 3 C 4 22 16 464 88 4 D 7 31 49 961 217 5 E 5 30 25 900 150 6 F 8 34 64 1156 272 7 G 6 31 36 961 186 8 H 4 21 16 441 84 9 I 8 37 64 1369 296

10 J 5 27 25 729 135 ∑ 60 299 384 9251 1875

Dari Tabel 10.3 diketahui ∑ X =60, ∑Y = 299, ∑ =384,

∑ = 9251, dan ∑ XY = 1875. Nilainilai ini disubtitusikan

ke dalam persmaan

( )( )

√* ( ) +* ( ) +

( )( ) ( )( )

√* ( ) +* ( ) +

√* +* +

√* + * + =

√ = 1,92

Page 225: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

214 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Jika item-item memberikan alternatif jawaban

dikotomi (1,0), maka korelasi antara skor butir dengan

skor total dihitung dengan korelasi titik-biserial (point-

biserial correlation) (Klein, 1986 dikutip Streiner dan

Norman, 2000). Bentuk rumusnya adalah sebagai berikut:

=

x √

dengan:

rpbi = koefisien korelasi point biserial

Mp = rerata skor dari subjek yang menjawab betul

bagi butir yang dicari validitasnya

Mt = rerata skor total

st = standar deviasi dari skor total

p = proporsi peserta didik yang menjawab betul

(banyaknya peserta didik yang menjawab

betul dibagi dengan jumlah seluruh siswa)

q = proporsi peserta didik yang menjawab salah

(q = 1 – p)

Contoh: Hasil ujicoba 10 butir soal pilihan ganda yang

dijawab 10 orang siswa iperoleh distribusi skor

jawaban mereka adalah seperti yang ditunjukkan

dalam Tabel 10.4. Tentukan validitas butir soal

nomor 1.

Tabel 10.4. Perhitungan korelasi point biserial No

Siswa

Skor siswa Skor total 1 2 3 4 5 6 7 8 9 10

1 A 1 1 1 1 1 1 0 1 1 0 8 2 B 1 1 1 1 1 1 1 0 1 0 8

Page 226: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

215 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

3 C 1 1 0 1 1 1 0 1 1 0 7 4 D 1 1 1 1 1 0 1 0 1 0 7 5 E 1 1 1 1 1 0 0 1 1 0 7 6 F 1 0 1 0 0 1 1 0 0 1 5

7 G 1 1 0 0 1 1 0 1 0 1 6 8 H 0 0 1 1 1 0 1 0 0 1 5 9 I 0 1 1 1 0 0 0 1 0 1 5

10 J 1 0 1 0 0 0 1 0 0 1 4 ∑ X 8 7 8 7 7 5 5 5 5 5 62

p 0,8 0.7

0,8 0,7

0,7

0,5

0,5

0,5

0,5 0,5

q 0,2 0,3

0,2 0,3

0,3

0,5

0,5

0,5

0,5 0,5

Untuk menentukan validitas soal No.1 yang

menggunakan korelasi poin biserial, makadi buatkan

terlebih dahulu tabel 10.5 yang memuat soal nomor 1 dan

totalnya.

Tabel 10.5 Analisis untuk mencari validitas butir 1

No Siswa Soal 1 Total (X) 1 A 1 8 2 B 1 8 3 C 1 7 4 D 1 7 5 E 1 7 6 F 1 5 7 G 1 6 8 H 0 5 9 I 0 5

10 J 1 4 ∑ X 8 62 P 0,8

Page 227: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

216 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Q 0,2

Tentukan proporsi menjawab benar (p) dengan persamaan

P =

=

= 0,8

Tentukan nilai q dengan cara

q = 1 – p

q = 1 – 0,8 = 0,2

Tentukan rerata skor total dengan persamaan

Mt =

= 6,2

Tentukan rerata skor siswa yang menjawab benar, yaitu

= ( )

= 6,5

Tentukan Standar Deviasi dengan persamaan

∑ = + = 64+64+49+49+49+25+36+25+25+16 = 402

SD =

( )

=

= 1,76

Menentukan korelasi point biserial dengan rumus

=

x √

x √

= 0,17 x 2 = 0,34

Page 228: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

217 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Untuk menentukan kategori dari validitas alat ukur

dapat dilakukan dengan dua cara, yaitu:

1) membandingkan nilai koefisien validitas yang diuji

(r-hitung) dengan tabel Pearson ( r-tabel) pada

signifikansi α (biasanya dipilih 0,05) dan n =

banyaknya data yang sesuai. Jika r-hitung ≥ r-tabel,

maka instrumen atau item-item pertanyaan

berkolerasi signifikan terhadap skor total (dinyatakan

valid). Jika r-hitung < r-tabel, maka instrumen atau

item-item pertanyaan tidak berkorelasi signifikan

terhadap skor total (dinyatakan tidak valid),

2) melihat pengklasifikasian validitas seperti yang

dikemukakan oleh Guilford (1956) sebagai berikut:

0,80 < rxy 1,00 validitas sangat tinggi (sangat baik)

0,60 < rxy 0,80 validitas tinggi (baik)

0,40 < rxy 0,60 validitas sedang (cukup)

0,20 < rxy 0,40 validitas rendah (kurang)

0,00 < rxy 0,20 validitas sangat rendah (jelek)

rxy 0,00 tidak valid

C. Pengujian Validitas Tes 1. Validitas Isi

Menurut Wiersma dan Jurs (1990), pengujian

validitas isi hanya mendasarkan pada analisis logika.

Artinya, validitas isi suatu tes tidak mempunyai besaran

tertentu yang dihitung secara statistika, tetapi dipahami

bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes.

Untuk menilai apakah suatu tes memiliki validitas isi atau

tidak, dilakukan dengan cara membandingkan kesesuaian

Page 229: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

218 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

antara isi tes tersebut dengan indikator-indikator yang

telah ditetapkan pada setiap topik. Apabila materi/isi tes

tersebut cocok dengan indikator berdasarkan penilaian

para pakar, berarti tes tersebut sudah valid isi, sebaliknya

jika materi/isi tes tersebut menyimpang dari indikator-

indikator, berarti tes tersebut tidak valid. Menurut Skinner

(t.t) salah satu metode penentuan kevalidan tes prestasi

yaitu mempelajari isi tes.

Ada beberapa teknik yang dapat dilakukan untuk

menganalisis validitas isi tes hasil belajar, antara lain:

1) Persentase butir yang cocok dengan indikator

Di sini validitas isi ditentukan dengan cara

menghitung berapa besarnya persentase kecocokan antara

suatu butir dengan indikatornya berdasarkan penilaian

pakar. Butir tes dinyatakaan valid jika kecocokannya

dengan indikator mencapai lebih besar dari 50% (Susetyo,

2011). Rumus yang digunakan adalah:

Persentase =

x 100%

dengan: f = frekuensi cocok menurut penilai

Sebagai contoh cara menghitung kecocokan butir tes

dengan indikator adalah seperti Tabel 10.6 berikut:

Tabel 10.6. Kecocokan antar penilai

Penilai Butir

1 2 3 4 5 1 1 0 I 1 0

Page 230: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

219 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

2 1 0 I 0 0 3 1 0 I 1 0 4 0 0 I 1 0 5 0 0 0 1 1

Jl. Cocok 3 2 4 4 1 Jl. tidak cocok 2 3 1 1 4

Dari Tabel di atas dapat dilihat bahwa:

Persentase butir 1 =

x 100% = 60% (valid)

Persentase butir 2 =

x 1005 = 40% (tidak valid)

1) Perhitungan Rasio validitas isi dari Lawshe

Perhitungan validitas isi juga berdasarkan kecocokan para

ahli yang mendasarkan pada penting atau tidak penting.

Butir dinayatakan valid isi jika terdapat keococokan di

antara penilai di atas 0,50. Rumus yang digunakan adalah

(Susetyo, 2011):

CVR =

=

– 1

dengan: jumlah ahli yang menyatakan penting

M = jumlah ahli yang memvalidasi

Indeks rasio berkisar : -1 ≤ CVR ≤ + 1

Mp <

M CVR < 0

Mp =

M CVR = 0

Mp >

M CVR > 0

Page 231: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

220 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Untuk contoh perhitungan lihat Tabel 10.7 berikut:

Tabel 10.7. Kecocokan antar penilai

Penilai Butir

1 2 3 4 5 1 1 0 I 1 0 2 1 0 I 0 0 3 1 0 I 1 0 4 0 0 I 1 0 5 0 0 1 1 1

Penting 3 2 5 4 1 Tidak Penting 2 3 0 1 4

Perhitungan butir 1:

Mp = 3, M = 5

CVR = (2

) – 1

CVR =(

) – 1 = (

) – 1 = 0,20, butir 1 tidak valid

Perhitungan butir 4:

Mp = 4, M = 5

CVR = (2

) – 1

CVR =(

) – 1 = (

) – 1 = 0,60 ,butir 2 valid

2) Perhitungan validitas isi untuk seluruh butir

Untuk mengetahui validitas isi seluruh butir tes

(bukan butir per butir) dapat dilakukan dengan cara

mengecek alat ukur oleh dua orang penilai (ahli). Indek

Page 232: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

221 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

validitas ditentukan oleh kecocokan hasil penilaian di

antara dua ahli tersebut terhadap keseluruhan butir tes.

Rumus yang digunakan yaitu:

Koefisien validitas isi =

(Gregory dalam

Retnawati, 2015)

Perangkat tes dinyatakan valid jika diperoleh harga

diatas 0,50 (Susetyo, 2011). Adapun bentuk Tabel

kecocokan antar panilai adalah sebagai berikut.

Tabel 10.8. Kecocokan antar penilai

Penilai/Kategori

Penilai 1

Kurang Penting

Penting

Penilai 2

Kurang Penting

A B

Penting

C D

Sebagai contoh, jika hasil penilaian perangkat ukur

oleh dua orang ahli, hasilnya sebagai berikut.

Penilai/Kategori

Penilai 1

Kurang Penting

Penting

Penilai 2

Kurang Penting

5 3

Page 233: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

222 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Penting

2 15

Koefisien validitas isi =

=

= 0,60

Koefisien validitas isi sebesar 0,6 menunjukkan bahwa

validitas isi tes tersebut berada dalam kategori sedang.

2.Validitas Konstruks

Pengujian validitas konstruk merupakan gabungan

dari pendekatan logis dan empiris. Menurut Kerlinger

(2003) ada tiga cara yang dapat digunakan untuk

menentukan validitas konstruk, yaitu (a) konvergensi dan

diskriminabilitas, (b) metode matrik multitrait-multi

method, dan (c) metode analisis faktor. Pendekatan

yang banyak dilakukan dalam pengujian validitas

konstruk sekarang adalah pendekatan analisis faktor.

Analisis faktor adalah kajian tentang

kesalingtergantungan antara variabel-variabel, dengan

tujuan untuk menemukan himpunan variabel-variabel

baru, yang lebih sedikit jumlahnya dari pada variabel

semula, dan menunjukkan yang mana di antara variabel-

variabel semula itu yang merupakan faktor-faktor

persekutuan (Suyanto, 1977). Melalui analisis faktor dapat

melihat apakah spesifikasi konstruk yang dikembangkan

secara teoritik telah sesuai dengan konsep konstruk yang

mendasarinya setelah dilakukan ujicoba di lapangan.

Teknik ini menganalisis butir-butir alat ukur yang

terdapat dalam sejumlah faktor tertentu, butir-butir yang

Page 234: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

223 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

memiliki unsur kebersamaan (common factor) digabung

menjadi suatu faktor baru.

Salah satu prosedur pengujian validitas konstruk

yang tidak terlalu kompleks dapat dilakukan dengan

pendekatan validitas internal atau validitas butir.

3.Validitas Konkurensi

Tuckman (1975) mengemukakan “concurrent

validity tells wheather the degree to which persons show

evidence of a quality on a given test is reflected in or

paralled by their scores on another test of presumably the

same characteristic” maksudnya validitas konkuren

menjelaskan sejauh mana orang menunjukkan bukti dari

kualitas pada tes yang diberikan itu tercermin atau

terhubung dengan skor pada tes lain yang karakteristiknya

sama.

Contoh: Ibu Sari mengembangkan sebuah tes dan dia ingin

mengetahui apakah tesnya itu valid. Ibu Sari

mengambil tes lain yang tersedia yang diketahui

valid dan menggunakan tes itu sebagai kriteria. Dia

memberikan kedua set tes tersebut: tes yang

dikembangkan dan tes sebagai kriteria kepada

kelompok siswa berjumlah 10 orang. Skor-skor

mereka ditunjukkan di bawah. Tentukan validitas

tes ibu Sari tersebut.

Page 235: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

224 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Tes yang dikem

bangkan ibu Sari (X)

Tes yang dijadikan

Kriteria (Y) XY X2 Y2

34 30 1020 1156 900

40 37 1480 1600 1369

35 25 875 1225 625

49 37 1813 2401 1369

50 45 2250 2500 2025

38 29 1102 1444 841

37 35 1295 1369 1225

47 40 1880 2209 1600

38 35 1330 1444 1225

43 39 1677 1849 1521

411 352 14722 17197 12700

( )( )

√* ( ) +* ( ) +

( )( ) ( )( )

√*( )( ) ( ) +*( )( ) ( ) +

( ) ( )

√*( ) ( )+ *( ) ( )+

√( )( ) =

= 0,83

Page 236: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

225 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Suatu koefisien korelasi sebesar 0,83 menunjukkan

bahwa tes yang dikembangkan ibu Sari memiliki validitas

konkurensi

4. Validitas Prediktif

Tuckman (1975) menyatakan “Predictive validity

indicates the degree of correspondence between scores on

the test in question and future outcomes that are expected to

be related to characteristic measured by the test.

Maksudnya, validitas ramalan menunjukkan tingkat

kesesuaian di antara skor-skor pada tes dalam soal dan

hasil mendatang yang diharapkan berkaitan dengan ciri-

ciri yang diukur oleh tes.

Menurut Nurkancana dan Sunartana (1986), cara

yang dipergunakan untuk menilai tinggi rendahnya

validitas prediktif ialah dengan jalan mencari korelasi

antara nilai-nilai yang dicapai oleh oleh siswa dalam tes

tersebut dengan nilai-nilai yang dicapainya kemudian.

Sebagai contoh, untuk menguji validitas tes masuk

Perguruan Tinggi Negeri, Perguruan Tinggi belum memiliki

data tentang prestasi mahasiswa, sehingga kriteria yang

akan dibandingkan belum tersedia. Kriteria pembanding

yang diramalkan oleh tes masuk adalah nilai hasil belajar

mahasiswa setelah diterima dan mengikuti pembelajaran

selama waktu tertentu.

Contoh: Pak Budi ingin mengetahui validitas prediktif

tesnya yang dilaksanakan setahun sebelumnya

melalui korelasi skor-skor dengan peringkat dari

siswa yang sama Skor-skor dan peringkat

Page 237: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

226 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

ditunjukkan di bawah. Tentukan validitas tes pak

Budi.

Peringkat

(X)

Tes (Y) XY X2 Y2

89 40 3560 7921 1600

85 37 3145 7225 1369

90 45 4050 8100 2025

79 25 1975 6241 625

80 27 2160 6400 729

82 35 2870 6724 1225

92 41 3772 8464 1681

87 38 3306 7569 1444

81 29 2349 6561 841

84 37 3108 7056 841

849 354 30295 72261 12908

( )( )

√* ( ) +* ( ) +

( )( ) ( )( )

√*( )( ) ( ) +*( )( ) ( ) +

( ) ( )

√*( ) ( )+ *( ) ( )+

√( )( ) =

= 0,76

Page 238: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

227 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Suatu koefisien korelasi sebesar 0,76 menunjukkan

bahwa tes pak Budi memiliki validitas prediktif.

D. Faktor-faktor yang mempengaruhi Validitas Beberapa aktor yang dapat mempengaruhi validitas

tes adalah:

1. Faktor dari dalam tes itu sendiri, seperti:

(a) petunjuk yang tidak jelas,

(b) Penggunaan kosa kata dan struktur kalimat yang

sulit,

(c) ambiguitas.

(d) alokasi waktu yang tidak cukup,

(e) Penekanan yang berlebihan terhadap aspek

tertentu, menyebabkan mudah ditebak,

(f) Kualitas butir tes yang tidak memadai untuk

mengukur hasil belajar.

(g) Susunan tes yang jelek.,

(h) Tes terlalu pendek,

(i) Penyusunan butir tes yang tidak runtut .

(j) Pola jawaban yang mudah ditebak,

2. Faktor berfungsinya tes dan prosedur mengajar .

3. Faktor administrasi dan penskoran .

4. Faktor tanggapan siswa.

5. Hakikat kelompok dan kriteria.

Page 239: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

228 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 240: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

229 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 11 RELIABILITAS TES

A.Pengertian Reliabilitas Dari segi bahasa, reliabilitas berasal dari kata

reliability yang mempunyai asal kata rely dan ability yang

berarti hal yang dapat dipercaya. Sebuah tes dikatakan

mempunyai reliabilitas berarti tes tersebut dapat

dipercaya karena memberikan data yang tetap atau

konsisten, dan menjadi sandaran pengambilan keputusan.

Beberapa pengertian reliabilitas adalah sebagai berikut:

(1) Reliability refers to the degree to which a

particular test or instrument providee

Page 241: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

230 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

trustworthy or consistent measures of whatever

it does measure. Maksudnya reliabilitas

mengacu pada derjat dimana suatu tes atau alat

ukur tertentu memberikan kepercayaan atau

konsisten dalam mengukur apa yang diukur

(Erickson and Tim,1976)

(2) Reliabilty refers to consistency of measurement-

that is, how consistent test scores or others

evaluation results are from one measurement to

another. Maksudnya reliabilitas mengacu pada

kekonsistenan dari pengukuran, yaitu berapa

konsistenya skor-skor tes atau hasil-hasil

evaluasi lain dari suatu pengukuran untuk

pengukuran lainnya(Gronlund and Linn, 1990)

(3) Reliability is as the extent to which a test measures

consistently what it purports to measure. Artinya,

reliabilitas sebagai derajat dimana suatu tes

mengukur secara konsisten apa yang seharusnya

diukur (Deblassie, 1974)

(4) Reliability refers to the extent to which

measurement results are free of unpredictable

kinds of error. Reliabilitas mengacu pada tingkat

dimana hasil-hasil pengukuran bebas dari

kesalahan-kesalahan yang tidak disangka (Morris

& Gibbon, 1986)

Page 242: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

231 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(5) Reliability refer to the degree to which test scores

are free from errors of measurement .Reliabilitas

mengacu pada derjat dimana skor-skor tes bebas

dari ke kekeliruan pengukuran (Pedhazur dan

Schmelkin, 1991

Jadi reliabilitas (keandalan) suatu alat ukur adalah

keajegan (konsistensi) hasil pengukurannya seandainya

alat ukur tersebut digunakan oleh orang yang sama dalam

waktu yang berlainan atau digunakan oleh orang yang

berlainan dalam waktu yang sama.

Deblassie (1974) menyatakan bahwa “ A test is

reliable if it provides consistent information about

examinees”. Jadi, suatu tes yang reliabel adalah jika tes itu

memberikan informasi yang konsisten atau tetap (ajeg)

tentang peserta tes. Secara singkat reliabilitas dapat

dinyatakan sebagai” sejauhmana alat ukur itu dapat

menghasilkan ukuran yang konsisten”. Konsisten atau

tetap (ajeg) disini tidak berarti harus memiliki skor yang

selalu sama ketika diujikan berkali-kali pada siswa yang

sama, tetapi mengikuti perubahan secara ajeg. Sebagai

contoh, jika skor si A dalam sebuah tes mula-mula lebih

rendah dibandingkan dengan skor si B, maka jika diadakan

pengukuran ulang, si A juga mendapat skor lebih rendah

dari si B. Itulah yang dikatakan tes itu ajeg atau tetap, atau

tes itu reliabel.

B. Jenis-Jenis Reliabilitas Menurut Djaali dab Muljono (2008) reliabilitas

dibedakan atas dua macam, yaitu reliabilitas konsistensi

tanggapan, dan reliabilitas konsistensi gabungan item.

Page 243: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

232 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Reliabilitas konsistensi tanggapan berkaitan dengan

kemantapan tes apabila diujikan beberapa kali akan

memberikan hasil pengukuran (tanggapan) yang relatif

konsisten. Reliabilitas konsistensi tanggapan, kadang-

kadang disebut sebagai external stability. Ada dua metode

untuk mengestimasi reliabilitas tanggapan, yaitu: (1).

metode “test retest” atau tes ulang, dan (2) metode

“alternate forms” atau tes paralel.

Reliabilitas konsistensi gabungan item adalah

berkaitan dengan kemantapan atau konsistensi antara item-

item suatu tes. Reliabilitas ini juga disebut sebagai reliabilitan

konsisten internal. Koefisien reliabilitas konsistensi

gabungan item dapat dihitung dengan dua teknik, (1) kalau

jumlah butir tesnya genap dapat digunakan metode “split-

half” atau belah dua, yang menggunakan formula:

Spearman-Brown, Flanagan, atau Rulon. (2) Jika jumlah

butir tesnya ganjil, maka koefisien reliabilitasnya dihitung

dengan menggunkan formula atau (a) rumus Kuder-

Richardson, yang dikenal dengan nama KR-20 dan KR-21,

(b). Rumus koefisien Alpha Cronbach , dan (c). Rumus

reliabilitas Hoyt. Gambar11.1 memperlihatkan klasifikasi

reliabilitas.

Page 244: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

233 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Gambar 11.1: Ilustrasi jenis-jenis reliabillits

C.Mengestimasi Koefisien Reliabilitas Menurut Suryabrata (2000) reliabilitas alat ukur

yang menunjukkan derajad kekeliruan pengukuran tidak

dapat ditentukan dengan pasti melainkan hanya dapat

diestimasi. Untuk mengestimasi koefisien reliabilitas alat

ukur dapat dihitung dengan menggunakan empat metode.

Keempat metode tersebut adalah, metode “test retest” atau

Reliabilitas

Konsistensi

Internal

Stabilitas

Ekternal

Tes Parale

l

Tes Ulang

Butir Genap

Butir Ganjil

Metode Belah Dua

Spearman Brown

Rumus Flanagan

Rumus Rulon

Alpha

Cronbac

Rumus KR-20

Rumus

KR-21

Page 245: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

234 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tes ulang, metode “alternate forms” atau tes paralel, metode

“split-half” atau belah dua, dan metode “internal

consistency” atau konsistensi internal (Anderson, 1981).

1. Metode Tes Ulang (Test Retest Method)

Test-retest is an obvious to estimate the reliability of

a test is to the same group of individuals on two occasions

and correlate the two sets of scores (Bryman, 2001).

Maksudnya, test-retest ialah suatu kejelasan untuk

memperkirakan tingkat reliabilitas sebuah tes untuk

kelompok yang sama anggota pada dua kesempatan dan

mengkorelasikan dua set skor. Metode tes ulang maksudnya sebuah tes yang sama

diberikan dua kali kepada responden yang sama dengan

jarak waktu tertentu. Estimasi koefisien reliabilitas

diperoleh dengan mengkorelasikan skor pengetesan

pertama dengan skor pengetetesan kedua. Koefisien

korelasi yang diperoleh menunjukkan koefisien reliabilitas

tes tersebut Koefisien atau Indeks reliabilitas berkisar

antara 0 - 1. Semakin tinggi koefisien reliabilitas suatu tes

(mendekati 1), makin tinggi pula keajegan/ ketepatannya.

Untuk mengkorelasi kedua skor hasil pengetesan

dapat rumus menggunakan korelasi Pearson atau

Spearman jika skor kontinu. Bentuk rumus korelasi

Pearson Product Moment adalah sebagai berikut:

Page 246: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

235 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

( )( )

√* ( ) +* ( ) +

dengan : koefisien korelasi product moment

X : skor hasil pengetesan pertama

Y : skor hasil pengetesan kedua

N : jumlah responden

Kelemahan metode tes ulang adalah dalam

penentuan selang waktunya. Jika selang waktu tes terlalu

singkat, kemungkinan besar responden masih mengingat

materi yang diteskan pertama kali, sehingga

berkemungkinan besar skor tes yang kedua lebih baik

daripada skor tes pertama. Sebaliknya jika selang waktu

tes pertama dengan tes kedua terlalu lama dikhawatirkan

banyak faktor serta situasi dan kondisi sudah banyak

berubah dan mempengaruhi skor tes yang kedua.

Contoh: Ibu Eva melaksanakan ujicoba tes Bahasa Inggris

yang dikembangkannya pada 10 orang

mahasiswa semester pertama. Setelah dua

minggu, tes yang sama diberikan lagi pada

mahasiswa yang sama. Skor-skor mereka pada

tes pertama dan tes kedua ditunjukkan di

bawah Hitung reliabilitas tes Bahasa Inggris

yang dikembangkan ibu Eva.

Page 247: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

236 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Siswa

Tes

Pertama

(X)

Tes

Kedua

(Y)

XY X2 Y2

A 40 41 1640 1600 1681

B 35 40 1400 1225 1600

C 30 25 750 900 625

D 20 20 400 400 400

E 19 20 380 361 400

F 20 23 460 400 529

G 37 34 1258 1369 1156

H 38 35 1330 1444 1225

I 40 40 1600 1600 1600

J 25 25 625 625 625

∑ 304 303 9843 9924 9841

( )( )

√* ( ) +* ( ) +

( )( ) ( )( )

√*( )( ) ( ) +*( )( ) ( ) +

( ) ( )

√*( ) ( )+ *( ) ( )+

√( )( ) =

= 0,94

Dari perhitungan didapat koefisien reliabilitas 0,94,

karena itu dapat disimpulkan tes Bahasa Inggris memiliki

reliabilitas tinggi.

Page 248: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

237 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

2. Metode Tes Sejajar (Equivalent Test Method)

Metode tes sejajar maksudnya dua buah tes yang

mempunyai kesamaan tujuan, bobot soal, tingkat

kesukaran, susunan soal yang sama (kecuali butir–butir

soalnya saja yang berbeda) diberikan serentak pada

responden yang sama. Estimasi koefisien relibilitas

diperoleh dengan mengkorelasikan skor tes pertama

dengan skor tes kedua.

Kelemahan metode ini adalah sulitnya

mengkonstruksi dua buah tes yang sama, namun metode

sejajar ini dapat memperbaiki kelemahan pada metode

pertama yaitu terhindarnya dari kondisi siswa masih

mengingat materi tes pertama.

Estimasi koefisien reliabilitas dengan metode tes

ulang dan metode tes sejajar adalah untuk melihat stabil

atau tidak stabilnya skor. Skor disebut stabil bila skor yang

didapat pada suatu waktu dan pada waktu yang lain atau

skor yang didapat dari dua buah tes yang ssejajar hasilnya

relatif sama. Makna lain reliabilitas dalam pengertian

stabilitas adalah subjek yang dikenai pengukuran akan

menempati ranking yang relatif sama pada testing yang

terpisah dengan alat tes yang ekuivalen (Singh, 1986).

Contoh: Pak Iwan melaksanakan ujicoba tes Matematika

yang dikembangkannya pada 10 mahasiswa

semester tiga dengan cara membuat dua macam

bentuk soal yang setara (ekivalen). Soal bentuk

pertama diberikan pagi dan soal bentuk kedua

diberikan satu jam kemudian. Skor-skor bentuk

pertama dan bentuk kedua disajikan di bawah.

Page 249: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

238 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Tentukan reliabilitas tes Matematika yang

dikembangkan Pak Iwan tersebut.

Ter

Bentuk

Pertama

(X)

Tes

Bentuk

Kedua

(Y)

XY X2 Y2

60 48 2880 3600 2304

84 82 6888 7056 6724

40 37 1480 1600 1369

65 72 4680 4225 5184

70 89 6230 4900 7921

33 40 1320 1089 1600

42 37 1554 1764 1369

50 60 3000 2500 3600

70 80 5600 4900 6400

90 74 6660 8100 6400

604 619 40292 39734 41947

( )( )

√* ( ) +* ( ) +

( )( ) ( )( )

√*( )( ) ( ) +*( )( ) ( ) +

( ) ( )

√*( ) ( )+ *( ) ( )+

√( )( ) =

= 0,84

Page 250: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

239 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Nilai rxy yang diperoleh adalah 0,84, yang

menunjukkan hubungan yang sedang. Karena itu, skor-

skor tes dalam kedua bentuk tes matematika adalah

reliabel.

3. Metode Belah Dua (Split-Half Methodl)

Metode belah dua dilakukan dengan cara

memberikan satu bentuk tes yang hanya diberikan sekali

kepada sekelompok subjek dengan tujuan untuk

menghindari kelemahan pada metode tes ulang dan

metode tes sejajar.

Metode belah dua dilakukan bila jumlah butir alat

ukur genap. Pembelahannya dapat dilakukan atas dasar

nomor butir butir ganjil – genap atau nomor butir awal –

akhir. Perhitungan r, menggunakan skor mentah untuk

mengestimasi hubungan butir-butir ganjil (belahan

pertama) dan butir-butir genap (belahan kedua),

digunakan rumus Pearson Product Moment .

Untuk estimasi koefisien reliabilitas belah dua

(Split-Half) ada tiga buah rumus atau formula yang dapat

digunakan, masing-masing yaitu ((1) formula Spearman-

Brown, (2) formula Rulon, dan (3) formula Flanagan.

1) Menggunakan Rumus Spearman-Brown:

Estimasi koefisien reliabilitasnya belah dua dengan

menggunakan rumus Spearman-Brown adalah sebagai

berikut (Streiner dan Norman, 2000):

=

( )

Page 251: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

240 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dengan k adalah jumlah bagian (belahan) butir-

butir r adalah korelasi semula, yaitu korelasi antara skor

belahan 1 dan skor belahan 2

Bentuk khusus rumus Spearman-Brown ketika

diterapkan pada reliabilitas belah dua adalah sebagai

berikut (Pedhazur dan Schmelkin, 1991):

dengan adalah reliabilitas, dan

adalah korelasi

diantara dua belahan

Langkah-langkah estimasi koefisien belah dua

Spearman-Brown adalah:

a. Membagi skor-skor siswa menjadi dua bagian,

misalnya satu bagian butir-butir yang bernomor

ganjil, dan satu bagian lagi butir-butir yang

bernomor genap

b. Menjumlahkan skor-skor dari butir-butir yang

bernomor ganjil yang dimiliki masing-masing

siswa

c. Menjumlahkan skor-skor dari butir-butir yang

bernomor genap yang dimiliki masing-masing

siswa

d. Menghitung koefisien korelasi menggunakan

rumus product-momen, diperoleh

(korelasi

paruh antara belahan ganjil-genap)

( )( )

√* ( ) +* ( ) +

Page 252: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

241 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

e. Menghitung (korelasi penuh) menggunakan

rumus Spearman -Brown

f. Menginterpretasi

Contoh: Ibu Dian membuat 10 butir tes Sains bagi

siswanya di kelas 3. Untuk menentukan

reliabilitas tesnya, ibu Dian menggunakan

metode belah dua Sperman-Brown. Skor-skor

siswa dari nomor butir ganjil dan nomor butir

genap disajikan di bawah. Berapa besar koefisien

reliabilitas tes yang dikembangkan bu Dian itu?.

Ganjil

(X)

Genap

(Y) XY X2 Y2

5 5 25 25 25

4 3 12 16 9

5 4 20 25 16

3 2 6 9 4

3 3 9 9 9

4 0 0 16 0

4 3 12 16 9

3 5 15 9 25

∑X = 31 ∑Y= 25 ∑= 99 ∑ = 125 ∑ = 97

Dari Tabel diatas diketahui : N = 8; = 31; = 25;

= 99 , = 125 dan = 25,

Page 253: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

242 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Subtitusikan nilai-nilai di atas ke dalam rumus

product moment

( )( )

√* ( ) +* ( ) +

( )( ) ( )( )

√*( )( ) ( ) +*( )( ) ( ) +

( ) ( )

√*( ) ( )+ *( ) ( )+

√( )( ) =

= 0,221

Menggunakan rumus Spearman-Brown, reliabilitas

seluruh tes dihitung sebagai berikut:

( )

= 0,361

Koefisien reliabilitas diperoleh adalah sebesar

0,361. Ini berarti bahwa tes yang dikembangkan ibu Dian

itu tidak reliabel.

2) Menggunakan Rumus Rulon

Rumus lain untuk estimasi reliabilitas belah dua

adalah dikembangkan oleh Rulon (1939). Menurut Rulon

Page 254: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

243 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

reliabilitas dapat dipandang dari adanya selisih skor yang

diperoleh pada belahan pertama dengan belahan kedua.

Selisih tersebut yang menjadi sumber variasi eror sehingga

bila dibandingkan dengan variasi skor akan dapat menjadi

dasar untuk melakukan estimasi reliabilitas tes. Rumus

Rulon adalah sebagai berikut:

dengan adalah koefisien reliabilitas

adalah varians perbedaan skor belahan

adalah varians skor total

1 adalah bilangan konstan

Untuk mencari (varians perbedaan skor belahan)

digunakan rumus:

=

( )

Untuk mencari (varians skor total) digunakan rumus:

=

( )

Langkah-langkah estimasi koefisien reliabilitas belah dua

menggunakan

Rumus Rulon adalah:

a. Membagi skor-skor siswa menjadi dua bagian,

misalnya satu bagian butir-butir yang nomor urut

ganjil, dan satu bagian lagi butir-butir yang nomor

urut genap

b. Menghitung perbedaan skor d = X – Y

Page 255: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

244 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

c. Menjumlahkan d, sehingga diperoleh

d. Mengkuadratkan d dan menjumlahkannya, sehingga

diperoleh

e. Menghitung koefisien reliabilitas dengan rumus

Rulon yaitu:

f. Menginterpretasi

Contoh: Ibu Rini membuat 10 butir tes Sains bagi

siswanya di kelas 3. Untuk menentukan

reliabilitas tesnya, ibu Rini menggunakan metode

belah dua Rulon. Skor-skor siswa dari nomor

butir ganjil dan nomor butir genap disajikan di

bawah. Berapa koefisien reliabilitas tes yang

disusun oleh bu Rini tersebut?.

Ganjil (X)

Genap (Y)

d (X-Y)

= X+Y

5 5 0 0 10 100 4 3 1 1 7 49 5 4 1 1 9 81 3 2 1 1 5 25 3 3 0 0 6 36 4 0 4 16 4 16 4 3 1 1 7 49 3 5 -2 4 8 64

∑X =31 ∑Y=25 ∑= 6 ∑= 24

∑= 56 ∑= 420

Page 256: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

245 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Dari Tabel di aatas diketahui :

N = 8; = 31; =25, ∑d= 6,

∑d2 = 24, ∑X t= 56 dan ∑ = 420

Mencari varian perbedaan skor:

=

( )

=

( )

=

= 2,437

Mencari varian skor total:

=

( )

=

( )

=

= 3,50

= 1 -

=1- 0,67 = 0, 329

Koefisien reliabilitas yang adalah diperoleh sebesar

0,329. Ini berarti bahwa tes yang dikembangkan ibu Rini

itu tidak reliabel.

3) Menggunakan Rumus Flanagan:

Selain metode Spearman-Brown dan Rulon, estimasi

reliabilitas belah dua juga dapat digunakan rumus

Flanagan, yaitu

Keterangan :

r11 = koefisien reliabilitas

2

2

2

2

111 12

ts

ssr

Page 257: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

246 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

s12 = varians skor butir belahan pertama

s22 = varians skor butir belahan kedua.

St2 = varians skor total

Untuk mencari (varians belahan pertama) digunakan

rumus:

=

( )

Untuk mencari (varians belahan kedua) digunakan

rumus:

=

( )

Untuk mencari (varians total) digunakan rumus:

=

( )

Langkah-langkah estimasi koefisien reliabilitas belah dua

menggunnakan

Rumus Flanagan adalah:

a. Membagi skor-skor siswa menjadi dua bagian,

misalnya satu bagian butir-butir yang nomor urut

ganjil, dan satu bagian lagi butir-butir yang nomor

urut genap

b. Menghitung (varians belahan pertama)

c. Menghitung (varians belahan kedua)

d. Menghitung (varians belahan total)

e. Menghitung koefisien reliabilitas dengan rumus

Flanagan yaitu:

Page 258: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

247 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

= 2(

)

f. Menginterpretasi

Contoh: Ibu Ayu membuat 10 butir tes IPA bagi siswanya

di kelas 3. Untuk menentukan reliabilitas tesnya,

ibu Ayu menggunakan metode belah dua

Flanagan. Skor-skor siswa dari nomor butir ganjil

dan nomor butir genap disajikan di bawah.

Berapa besar koefisien reliabilitas tes yang

disusun bu Ayu itu?.

Ganjil

(X1) Genap

(X2)

=

X1+X2

5 5 25 25 10 100 4 3 16 9 7 49 5 4 25 16 9 81 3 2 9 4 5 25 3 3 9 9 6 36 4 0 16 0 4 16 4 3 16 9 7 49 3 5 9 25 8 64

∑X =31 ∑Y=25 ∑= 125

∑= 97 ∑= 56 ∑= 420

Dari Tabel di aatas diketahui :

N = 8; = 31; =25, ∑ = 125,

∑ = 97, ∑X t= 56 dan ∑

= 420

Page 259: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

248 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Mencari varian belahan pertama:

=

( )

=

( )

=

= 0,609

Mencari varian belahan kedua:

=

( )

=

( )

=

= 2,359

Menc ri varians total:

=

( )

=

( )

=

= 3,50

Selanjutnya nilai-nilai varians dari kedua belahan dan nilai

varian total disubtitusikan ke dalam rumus Flanagan

diperoleh

= 2(

) = 2(

) =2(1-

)

= 2(0,152) = 0,304

Koefisien reliabilitas diperoleh sebesar 0,304. Ini

berarti bahwa tes yang dikembangkan ibu Ayu itu tidak

reliabel.

Page 260: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

249 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

4. Metode Konsistensi Internal (Consistency Internal

Methodl)

Metode konsistensi internal atau kadang-kadang

disebut metode tes tunggal dilakukan dengan cara

memberikan satu bentuk tes yang hanya diberikan sekali

kepada sekelompok subjek. Untuk estimasi koefisien

reliabilitas metode konsistensi internal dapat digunakan

formula-formula Kuder-Richardson (KR-20 dan KR-21)

dan alpha Cronbach.

1) Rumus Kuder Richardson 20 (KR-20)

Untuk mengetahui koefisien reliabilitas tes atau alat

ukur yang yang mempunyai skor dikotomi (0,1)

seperti bentuk pilihan ganda digunakan rumus

Kuder Richadson 20 (KR-20) seperti berikut

(Wiersma dan Jurs, 1990):

=

(

)

dengan: n adalah jumlah butir tes, p adalah proporsi yang menjawab benar satu butir q adalah proporsi yang menjawab salah satu butir, dan adalah varians skor total.

Hasil perhitungan dengan rumus KR20 lebih teliti,

tetapi perhitungan lebih rumit.

Langkah-langkah estimasi koefisien reliabilitas

menggunnakan rumus KR-20 adalah:

a. Mendistribusikan skor-skor dalam tabel kerja

b. Menghitung ∑ pq

c. Menghitung (varians total) dengan rumus:

Page 261: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

250 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

=

( )

d. Menghitung koefisien reliabilitas dengan rumus KR-

20 yaitu:

=

(

)

e. Menginterpretasi

Contoh:Ibu Eva membuat 10 butir tes pilihan ganda dalam

mata pelajaran Sains bagi siswanya di kelas 3.

Untuk menentukan reliabilitas tesnya, ibu Eva

menggunakan metode konsistensi internal dengan

rumus KR-20. Berapa besar koefisien reliabilitas

tes yang disusun bu Eva ?

Page 262: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

251 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Res

Butir

X X2 1 2 3 4 5 6 7 8 9 10

A 1 1 1 1 1 1 1 1 1 1 10 100

B 1 1 1 1 1 1 1 1 0 1 9 81 C 1 1 1 1 1 1 1 0 1 1 9 81 D 1 1 1 1 1 1 0 0 0 0 6 36

E 1 1 1 1 1 1 1 1 1 0 9 81 F 1 1 1 1 1 0 0 0 0 0 5 25 G 1 1 1 1 0 0 0 0 1 0 4 16

H 1 1 1 0 0 0 1 0 0 0 4 16 I 1 1 0 0 0 0 0 0 0 0 2 4 J 1 0 0 0 0 0 0 0 0 0 1 1

p 1 0,9

0,8

0,7

0,6

0,5

0,3

0,3

0,4

0,3

59 441

q 0 0,1

0,2

0,3

0,4

0.,5

0,7

0,7

0,6

0.7

pq

0 0,09

0,16

0,21

0,24

0,25

0,21

0,21

0,24

0,21

1,82

Dari Tabel di atas dapat diketahu:∑ pq = 1,82. ∑X =

59, ∑ = 441

Varian total menjadi:

=

( )

=

( )

=

= 9,25

Selanjutnya nilai-nila tersebut disubtitusika ke

dalam rumusKR-20

=

(

)

Page 263: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

252 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

=

(

) =( )(1 – 0,196) =

0,892

Koefisien reliabilitas yang diperoleh sebesar 0,802

termasuk dalam kategori tinggi

2) Rumus Kuder Richardson 21(KR-21)

Apabila Indeks Kesukaran Butir (IKB) bersifat

homogen, yang berarti bahwa p relatif konstan

untuk keseluruhan butir, maka indeks reliabilitas

tes dihitung dengan metode KR21. Rumusnya adalah

sebagai berikut (Wiersma dan Jurs, 1990):

: =

(

( )

)

dengan n adalah jumlah butir pada tes

adalah skor rata-rata tes, dan

adalah varians skor total.

Rumus KR21 lebih sederhana dalam

perhitungannya. Kelemahannya adalah kurang teliti

dibandingkan dengan KR20.

Langkah-langkah estimasi koefisien reliabilitas

menggunnakan rumus KR-21 adalah:

a. Mendistribusikan skor-skor dalam tabel kerja

b. Menghitung (varians total) dengan rumus:

=

( )

Page 264: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

253 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

c. Menghitung skor rata-rata tes ( ) d. Menghitung koefisien reliabilitas dengan rumus

KR-21 yaitu:

=

(

( )

)

e. Menginterpretasi

Contoh:Ibu Eli membuat 10 butir tes pilihan ganda dalam

mata pelajaran Biologi bagi siswanya di kelas 3.

Untuk menentukan reliabilitas tesnya, ibu Eli

menggunakan metode konsistensi internal dengan

rumus KR-21. Tentukan koefisien reliabilitas tes

yang dikonstruksi ibu Eli tersebut?

Res Butir X X2

1 2 3 4 5 6 7 8 9 10 A 1 1 1 1 1 1 1 1 1 1 10 100 B 1 1 1 1 1 1 1 1 0 1 9 81

C 1 1 1 1 1 1 1 0 1 1 9 81 D 1 1 1 1 1 1 0 0 0 0 6 36 E 1 1 1 1 1 1 1 1 1 0 9 81

F 1 1 1 1 1 0 0 0 0 0 5 25 G 1 1 1 1 0 0 0 0 1 0 4 16 H 1 1 1 0 0 0 1 0 0 0 4 16

I 1 1 0 0 0 0 0 0 0 0 2 4 J 1 0 0 0 0 0 0 0 0 0 1 1 10 9 8 7 6 5 3 3 4 3 59 441

Page 265: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

254 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Menghitung vaarian total

=

( )

=

( )

=

= 9,25

= 59/10 = 5,9

Menghitung reliabilitas dengan rumus :

=

(

( )

) =

(

( )

( ))

=( ) (

) = 0,82

Koefisien reliabilitas yang diperoleh sebesar 0,82

termasuk dalam kategori tingi

3) Rumus Alpha (α)

Rumus alpha (α) Cronbach merupakan koefisien

konsistensi internal yang paling sering digunakan

untuk analisis reliabilitas. Alpha Cronbach dapat

digunakan untuk item-item dengan respons

kontinum. Bentuk rumus alpha Cronbach yaitu :

(

)

dengan : n adalah jumlah butir,

adalah jumlah varian butir, dan

adalah varian dari skor total

Page 266: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

255 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Pedhazur dan Schmelkin (1991) memperluas rumus

alpha khusus untuk skor dikotomi, yang bentuknya sebagai

beriku:

(

)

dengan p adalah proporsi yang mempunyai skor 1, dan q =

1- p, yaitu proporsi yang mempunyai skor 0.

Langkah-langkah estimasi koefisien reliabilitas

menggunnakan rumus alpha Cronbach adalah:

a. Mendistribusikan skor-skor dalam tabel kerja

b. Menghitung (varians butir) dari setiap butir

dengan rumus:

=

( )

c. Menjumlahkan semua varian butir sehingga

diperoleh

d. Menghitung (varians total) dengan rumus:

=

( )

e. Menghitung koefisien reliabilitas dengan rumus

alpha Cronbach yaitu:

(

)

f. Menginterpretasi

Contoh: Ibu Aini membuat 5 butir tes esei pelajaran

Bahasa Indonesia bagi siswanya di kelas 3. Untuk

Page 267: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

256 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

menentukan reliabilitas tesnya, ibu Aini

menggunakan rumus alpha Cronbach. Skor-skor

siswa disajikan dalam Tabel di bawah. Tentukan

koefisien reliabilitas tes itu ?

Siswa Butir

1 2 3 4 5

A 15 20 17 18 20 90 8100 B 10 7 12 9 10 48 2304 C 5 7 5 8 5 30 900 D 20 20 17 20 18 95 9025 E 15 17 15 18 17 82 6724 F 7 8 7 5 9 36 1296 G 15 17 14 15 15 76 5776 H 20 19 17 20 17 93 8649 I 15 15 16 14 15 75 5625 J 4 3 4 4 3 18 324 ∑ 643 48723

∑ 126 133 124 131 129 ∑

1890 2135 1778 2055 1967

Keterangan:

N = Jumlah responden (siswa)

a. Menghitung varians butir dengan rumus:

=

( )

=

( )

=

= 30,24

=

( )

=

= 36,61

Page 268: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

257 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

=

( )

=

= 24,04

=

( )

=

= 30,29

=

( )

=

= 33,89

∑ =

∑ = 30,24 36,61

b. Menghitung varians total dengan rumus:

=

( )

=

( )

=

= 737,81

c. Menghitung reliabilitas dengan rumus alpha Cronbach:

(

)

(

) = 0,99

Page 269: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

258 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Dapat dilihat bahwa koefisien reliabilitas yang

diperoleh adalah 0,99, yang berada dalam kategori sangat

tinggi.

4) Rumus Hoyt

Selain metode atau rumus-rumus di atas, untuk

menghitung koefisien reliabilitas dapat juga diperoleh

dengan teknik analisis varian yang menggunakan rumus

Hoyt yang bentuknya sebagai berikut.

r = 1 --

dengan : MKbs = varians siswa

MKs = varians responden

r = reliabiltas tes

Langkah-langkah estimasi koefisien reliabilitas jika

menggunakan Rumus Hoyt adalah:

a. Membuat tabel penyebara skor-skor jawaban siswa

b. Menjumlahkan skor-skor butir tes yang betul, juga

menjumlahkan skor –skor tiap siswa ( ) sehingga

diperoleh ∑ ,

c. Mencari jumlah kuadrat total (J ) dengan rumus:

J ) = ∑ -( )

d. Hitung jumlah kuadrat antar butir ( ), dengan

rumus

( )

–( )

e. Hitung jumlah kuadrat antar siswa ( ) dengan

rumus:

Page 270: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

259 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

JKs = ( )

–( )

f. Hitung jumlah kuadrat antar responden-butir ( )

JKbs= JKt – JKb - JKs

g. Hitung rata-rata jumlah kuadrat antar butir (MKb)

dengan rumus:

MKb =

h. Hitung rata-rata jumlah kuadrat antar responden

( ), dengan rumus:

=

i. Hitung rata-rata jumlah kuadrat antar butir-

responden ( )

M =

j. Menghitung ( ) menggunakan rumus

Hoyt, yaitu

r =

k. Menginterpretasi r

Contoh: Pak Fendi membuat 10 butir tes pilihan ganda dalam

mata pelajaran fisika bagi 10 orang siswanya. Untuk

menentukan reliabilitas tesnya, pak Fendi

menggunakan rumus Hoyt. Tentukan reliabilitas

tesnya.

Page 271: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

260 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Res Butir Xt

1 2 3 4 5 6 7 8 9 10

A 1 1 1 1 1 1 1 1 1 1 10 100 B 1 1 1 1 1 1 1 1 0 1 9 81 C 1 1 1 1 1 1 1 0 1 1 9 81

D 1 1 1 1 1 1 0 0 0 0 6 36 E 1 1 1 1 1 1 1 1 1 0 9 81 F 1 1 1 1 1 0 0 0 0 0 5 25

G 1 1 1 1 0 0 0 0 0 0 4 16 H 1 1 1 0 0 0 1 0 0 0 4 16 I 1 1 0 0 0 0 0 0 0 0 2 4 J 1 0 0 0 0 0 0 0 0 0 1 1

B 10 9 8 7 6 5 5 3 3 3 59 441

Dari tabel di atas dapat diketahui:

∑X =59, ∑ = 441, ∑ = 10, ∑ = 9, ∑ = 8, ∑ = 7,

∑ = 6,

∑ = 5, ∑ = 3,∑ = 3, ∑ = 4, ∑ = 3,

N = 100 yaitu: 10 (banyaknya siswa) x 10 (banyaknya

butir)

Menghitung jumlah kuadrat total (J ))

J ) = - ( )

= 59

( )

= 59-

= 24,19

Menghitung jumlah kuadrat antar butir ( )

( )

–( )

= (

+

+

+

+

+

+

+

+

+

) -

( )

Page 272: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

261 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

= 10 + 8,1 +6,4 + 4,9 + 3,6 + 2,5 + 2,5 + 0,9 +1,6 + 0,9 –

34,81

= 41,1 – 34,81 = 6,29

Menghitung jumlah kuadrat antar siswa ( )

JKs = ( )

–( )

= (

+

+

+

+

+

+

+

+

+

)-

( )

= (10 +8,1 + 8,1 + 3,6 +8,1 +2,5+ 1,6 +1,6 +0,4 + 0,10) -

- 34,81

= 44,1 – 34,81 = 9,29

Menghitung jumlah kuadrat antar responden-butir ( )

JKbs= JKt – JKb - JKs

JKbs = 24,19 – 6,29 – 9,29

JKbs = 8,61

Menghitung rata-rata jumlah kuadrat antar butir (MKb)

MKb =

=

0,698

Page 273: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

262 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Menghitung rata-rata jumlah kuadrat antar responden

( )

=

=

=

= 1,03

Menghitung rata-rata jumlah kuadrat antar butir-

responden ( )

M =

=

( )( ) - =

=

= 0,106

Mensubtitusikan data tersebut di atas ke dalam rumus

Hoyt

r =

= 1 --

= 0,897

Dapat dilihat bahwa koefisien reliabilitas yang diperoleh

adalah 0,897, yang berada dalam kategori sangat tinggi.

Tabel 11.2 Hasil Perhitungan Reliabilitas Analisis Varians

SumberVarians JK db MK Koefisien

Reliabilitas Butir 6,29 10 – 1

= 9

0,698

0,807 Responden 9,29 10 – 1

= 9

=

1,03 Keliru (Butir-Responden)

8,61 9 x 9 = 81

=

0,106

Page 274: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

263 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Ringkasan dari jenis-jenis reliabilitas dan cara

mengestimasinya dapat dilihat dalam Tabel 11.2 berikut.

Tabel 11.2 Metode Estimasi Reliabilitas

Bentuk

Reliabilitas

Cara estimasi

1.Tes Ulang

(stabilitas)

• Product moment

dan korelasional

memberikan tes yang sama sebanyak dua kali kepada peserta tes yang sama dalam waktu yang berbeda, skor-skornya dikorelasikan untuk mencari koefisien reliabilitas

2. Paralel

(ekuivalen)

• Product moment

dan korelasi

Intrakelas

memberikan dua tes yang sama kepada peserta tes yang sama dalam waktu yang relatif sama, kedua skor dikorelasikan untuk mencari koefisien reliabilitas

3. Split-half

methods

(metode belah

dua)

• Persamaan split-

half Spearman

Brown Rumus

Flanagan

Rumus Rulon

memberikan satu kali tes lalu dibelah dua, kemudian mengkorelasikan kedua belahan dengan rumus korelasi product moment,

3.Internal

consistency

• Kuder

Richardson(KR-

20)

• Kuder

Berikan sekali tes, kemudian menggunakan rumus KR-20

Berikan sekali tes, kemudian menggunakan rumus KR-21

Berikan sekali tes, kemudian menggunakan rumus

Page 275: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

264 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Richardson(KR-

21)

• Koefisien alpha

Cronbach

alpha Cronbach

• Rumus Hoyt Berikan sekali tes, kemudian menggunakan rumus Hoyt

D. Kesalahan Pengukuran Standar Kesalahan Pengukuran Standar (Standard Error of

Measurement, atau SEM) adalah ukuran yang

mencerminkan tidak akuratnya skor dari tes yang

digunakan untuk mengukur (Purwanto, 2009). Semakin

tinggi koefisien reliabilitas maka semakin akurat dan

makin rendah kesalahan standar pengukuran. Sebaliknya,

semakin rendah koefisien reliabilitas maka makin tinggi

kesalahan standar pengukuran dan makin tidak cermatnya

pengukuran menggunakan tes. Dalam pengumpulan data

hasil belajar di mana skor-skor akan dibandingkan secara

individual sangat penting untuk memperhitungkan

kesalahan standar pengukuran.

Kesalahan standar pengukuran dihitung menggunakan

rumus sebagai berikut :

SEM = SD√

di mana :

SEM = standard error of measurement

SD = standar diviasi

r = koefisien reliabilitas.

Misalnya, Rossa seorang siswa memperoleh skor 50

pada suatu Tes yang mempunyai koefisien reliabilitas

Page 276: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

265 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

sebesar 0,977 yang diperoleh dari kelompok siswa yang

mempunyai standar deviasi 13,51. Bila taraf kepercayaan

yang ditentukan 90 % (atau taraf signifikansi p = 0,10),

berapakah interval kepercayaan terhadap skor murni

Rossa ?

Menggunakan rumus kesalahan standar pengukuran (SEM) di atas, maka

SEM = SD√ = 13,5 √ = 2,049

Jika koefisien reliabilitasnya rendah, misalnya r = 0,64,

maka

SEM = SD√ = 13,5 √ = 8,1, artinya kesalahan

standar menjad besar.

E. Faktor-Faktor yang mempengaruhi

Reliabiltas 1. Panjang tes

Secara umum semakin panjang suatu tes maka akan

semakin tinggi pula reliabilitas tes tersebut. Panjang atau

pendeknya suatu tes ditunjukkan oleh banyak atau

sedikitnya jumlah butir. Alasannya, berdasarkan fakta

bahwa tes yang panjang atau butir-butir tes yang banyak

akan memberikan sampel soal yang mencukupi terhadap

perilaku yang diukur. Selain itu, tes yang panjang,

cenderung untuk mengurangi pengaruh terkaan.

Page 277: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

266 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Untuk menghitung besarnya reliabilitas tes setelah

ada penambahan banyak butir soal dapat digunakan rumus

Spearman-Brown berikut :

=

( )

dimana:

rn = besarnya koefisien reliabilitas sesudah tes tersebut

ditambah butir soal baru.

n = berapa kali butir-butir soal tersebut ditambah.

r1 = besarnya koefisien reliabilitas sebelum butir-butir soal

ditambah

Sebagai contoh, suatu tes yang mempunyai 20 butir

dan koefisien reliabilitasnya (r1) sebesar 0,6. Berapakah

koefisien reliabilitasnya (r2) tes ini jika jumlah butirnya

diperbanyak menjadi 40 ?.

Tes yang mempunyai 40 butir artinya tes ini

ditambah butirnya menjadi 2 kali jumlah butir dari

sebelumnya, yaitu 20 butir.

Menggunakan rumus Spearman-Brown di atas

maka:

r2 =

( )

r2 =

= 0,75

Kalau tes tersebut ditambah lagi butirnya menjadi 3

kali lipat dari semula, maka koefisien reliabilitasnya

menjadi:

Page 278: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

267 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

r3 =

( )

r3 =

= 0,87

2. Penyebaran skor

Koefisien reliabilitas secara langsung dipengaruhi

oleh penyebaran skor dalam kelompok yang diukur.

Semakin besar penyebaran skor maka semakin besar pula

koefisien reliabilitas yang diperoleh.

3. Objektivitas

Objektivitas sebuah alat ukur menyatakan derajad

untuk pemberi skor kompeten yang sama mendapatkan

hasil yang sama. Skor butir-butir tes objektif seperti

pilihan ganda, skor yang dihasilkan tidak dipengaruhi oleh

keputusan dan pendapat pemberi skor. Semakin tinggi

tingkat objektivitas tes semakin tinggi pula tingkat

reliabilitasnya.

4. Metode estimasi reliabilitas

Secara umum, besarnya koefisien reliabilitas

berkaitan erat dengan metode yang digunakan untuk

estimasi reliabilitas. Misalnya, mengestimasi koefeisien

reliabillitas menggunakan metode tes ulang (Test Retest

Method): mungkin hasilnya lebih besar dibandingkan

dengan metode belah dua jika interval waktunya pendek.

F. Hubungan Antara Reliabilitas dan Validitas

Page 279: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

268 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Menurut Anderson (1981) persyaratan bagi suatu

tes adalah validitas dan reliabilitas, dalam hal ini validitas

lebih penting dan reliabilitas ini perlu karena menyokong

terbentuknya validitas. Sebuah tes mungkin reliabel tetapi

tidak valid. Sedangkan sebuah tes yang valid biasanya

reliabel

Gambar: Hubungan antara validitas dan reliabilitas

Keterangan:

Gambar a) hasil tembakan yang valid dan reliabel,

karena hasilnya tepat pada sasaran dan masih

dalam luasan konsisten

Gambar b) hasil tembakan yang tidak valid dan

tidak reliabel, karena sasaran gerak labil dan merata

ke semua luasan target

Gambar c) hasil tembakan yang reliabel tetapi tidak

valid karena hasil tembakan pada luasan konsisten

di luar ketepatan target yang telah ditetapkan.

Page 280: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

269 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 12 ANALISIS BUTIR TES

A.Pengertian Analisis Butir Tes Analisis butir soal didefinisikan sebagai suatu

proses sistematik untuk mengkaji kualitas butir-butir soal

tes terutama tes obyektif. Analisis butir es adalah salah

satu kegiatan yang perlu dilakukan dalam rangka

meningkatkan mutu suatu tes, khususnya mutu tiap butir

soal yang menjadi bagian dari tes itu. Kegiatan

menganalisis butir soal merupakan suatu kegiatan yang

harus dilakukan guru untuk meningkatkan mutu soal yang

telah ditulis. Tujuannya adalah untuk mengkaji dan

Page 281: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

270 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

menelaah setiap butir soal agar diperoleh soal yang

bermutu sebelum soal digunakan. Soal yang bermutu

adalah soal yang dapat memberikan informasi setepat-

tepatnya sesuai dengan tujuannya di antaranya dapat

menentukan peserta didik mana yang sudah atau belum

menguasai materi yang diajarkan guru.

B. Manfaat Analisis ButirTes Anastasi dan Urbina (1997) mengemukakan bahwa

manfaat dilakukannya analisis butir antara lain adalah: (1)

dapat membantu para pengguna tes dalam evaluasi atas tes

yang digunakan, (2) sangat relevan bagi penyusunan tes

informal dan lokal seperti tes yang disiapkan guru untuk

siswa di kelas, (3) mendukung penulisan butir soal yang

efektif, (4) secara materi dapat memperbaiki tes di kelas,

dan (5) dapat meningkatkan validitas soal dan reliabilitas

Linn dan Gronlund (1995) menyatakan bahwa

pelaksanaan kegiatan analisis butir soal didesain untuk

menjawab pertanyaan-pertanyaan sebagai berikut.

1) Apakah fungsi soal sudah tepat?

2) Apakah soal ini memiliki tingkat kesukaran yang

tepat?

3) Apakah soal bebas dari hal-hal yang tidak relevan?

4) Apakah pilihan jawabannya efektif?

Analisis pada umumnya dilakukan melalui dua cara

yaitu (1) analisis butir soal tes secara kualitatif dan (2)

analisis butir soal tes secara kuantitatif. Dalam analisis

butir soal secara kualitatif, aspek yang diperhatikan adalah

Page 282: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

271 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

setiap soal ditelaah dari segi materi, konstruksi, bahasa,

dan kunci jawaban/pedoman penskorannya. Analisis

kualitatif sering pula dinamakan sebagai analisis teoritik

yang dilakukan sebelum soal digunakan untuk melihat

berfungsi tidaknya sebuah soal. Sedangkan analiis butir

soal secara kuantitatif adalah penelaahan butir soal

didasarkan pada data empirik dari butir soal yang

bersangkutan. Data empirik ini diperoleh dari soal yang

telah diujikan. Analisis secara teoritis adalah telaah soal

yang difokuskan pada aspek materi, konstruksi, dan

bahasa. Aspek materi berkaitan dengan substansi keilmuan

yang ditanyakan serta tingkat berpikir yang terlibat, aspek

konstruksi berkaitan dengan teknik penulisan soal, dan

aspek bahasa berkaitan dengan kekomunikatifan

/kejelasan hal yang ditanyakan (Mardapi, 2004).

1. Analisis Butir Tes Secara Kualitatif

Analisis soal secara teoritik atau analisis kualitatif

dilakukan sebelum diadakan ujicoba, yakni dengan cara

mencermati butir. Telaah soal atau penilaian butir soal

secara kualitatif merupakan analisis teoritis. Menurut

Kartowagiran (2011), dalam analisis soal tes secara teoritik

yang dikaji adalah kesesuaian antara butir-butir soal

dengan tujuan atau indikator dan apakah soal tes sudah

memenuhi validitas isinya. Soal tes juga dicermati

penggunaan bahasa, kejelasan dan kesingkatannya, juga

dilihat kejelasan dan kefungsian tabel dan atau gambar.

Pilihan jawaban juga dicermati homogenitas dan

kejelasannya.

Page 283: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

272 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Caranya adalah kepada beberapa penelaah

diberikan: butir-butir soal yang akan ditelaah, format

penelaahan, dan pedoman penilaian/penelaahannya.

2. Analisis Butir Tes Secara Kuantitatif

Ada dua pendekatan dalam analisis secara

kuantitatif, yaitu pendekatan secara klasik dan modern.

Analisis butir soal secara klasik adalah proses

penelaahan butir soal melalui informasi dari jawaban

peserta didik guna meningkatkan mutu butir soal yang

bersangkutan dengan menggunakan teori tes klasik.

Analisis butir soal secara modern yaitu penelaahan butir

soal dengan menggunakan Item Response Theory (IRT) atau

teori jawaban butir soal. Teori ini merupakan suatu teori

yang menggunakan fungsi matematika untuk

menghubungkan antara peluang menjawab benar suatu

scal dengan kemampuan siswa.

Dalam buku ini yang dibahas adalah analisis butir

menggunakan teori tes klasik. Kualitas butir dalam analisis

butir soal secara teori tes klasik adalah setiap butir soal

direpresentasi oleh tingkat kesukaran butir, daya beda

butir, dan khusus untuk tes pilihan ganda adalah

keefektifan pengecoh (Mehrens & Lehmann, 1984) Ketiga

tahapan tersebut diuraikan sebagai berikut

a. Tingkat Kesukaran

Tingkat kesukaran soal adalah peluang untuk

menjawab benar suatu soal pada tingkat kemampuan

Page 284: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

273 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tertentu yang biasanya dinyatakan dalam bentuk indeks.

Indeks tingkat kesukaran merupakan rasio antara

penjawab item dengan benar dan banyaknya penjawab

butir (Gronlund, 1982). Indeks tingkat kesukaran ini pada

umumnya dinyatakan dalam bentuk proporsi yang

besarnya berkisar 0,00 - 1,00 (Aiken, 1994). Semakin besar

indeks tingkat kesukaran yang diperoleh dari hasil

hitungan, berarti semakin mudah soal itu. Soal dengan

indeks kesukaran 0,00 menunjukkan soal tersebut terlalu

sukar, sebaliknya soal dengan indeks kesukaran 1,00

menunjukkan soal tersebut terlalu mudah. Allen dan Yen

(1979) menyatakan bahwa secara umum indeks kesukaran

suatu butir sebaiknya terletak pada interval 0,3 – 0,7. Pada

interval ini, informasi tentang kemampuan siswa akan

diperoleh secara maksimal. Sedangkan Thomas dan

Dawson (1972) menjelaskan bahwa butir soal yang

memiliki tingkat kesukaran 0,25 - 0,75 sudah dikatakan

baik.

Rumus yang dipergunakan untuk soal obyektif

menurut Nitko (1996). adalah

p =

dengan :

p = Proporsi menjawab benar atau Indeks tingkat

kesukaran

∑ B = banyaknya peserta tes yang menjawab benar.

N = jumlah peserta tes yang menjawab.

Page 285: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

274 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Cara lain menghitung indek kesukaran butir adalah

dengan menggunakan rumus berikut (Gronlund, 1982).

p =

x 100 %

dengan P = Indeks kesukaran butir, R = jumlah jawaban

butir yang betul, dan T = jumlah total butir yang di tes.

Sebagai contoh: Misalkan hanya 30 dari 50 orang

siswa dapat menjawab soal dengan betul, maka indeks

kesukaran soal tersebut adalah:

p =

x 100 = 60 %

Untuk mengetahui tingkat kesukaran soal bentuk

uraian digunakan rumus (Depdiknas, 2008) berikut ini.

TingkatKesukaran =

Mean =

Butir soal yang terlalu sukar sehingga hampir tidak

terjawab oleh semua siswa atau terlalu mudah sehingga

dapat dijawab oleh hampir semua siswa, sebaiknya

dibuang karena tidak bermanfaat. Biasanya indeks

kesukaran (p) diklasifikasikan menurut Asaad & Hailaya

(2004) menjadi sebagai berikut :

Page 286: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

275 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Tabel I. Indeks Kesukaran Butir

Jarak Indeks Tingkat Kesukaran

0,00 – 0,20 Terlalu sukar

0,21 - 0,40 Sukar

0,41 – 0,60 Sedang

0,61 – 0,80 Mudah

0,81 – 1,00 Terlalui mudah

Tingkat kesukaran butir soal sangat penting karena

dapat: (1) mempengaruhi karakteristik distribusi skor

(mempengaruhi bentuk dan penyebaran skor tes atau

jumlah soal dan korelasi antar soal), (2) berhubungan

dengan reliabilitas.

b.Daya Pembeda (D)

Daya pembeda soal adalah kemampuan suatu butir

soal dapat membedakan antara siswa yang telah

menguasai materi yang ditanyakan dan siswa yang

tidak/kurang/belum menguasai materi yang ditanyakan.

Atau dengan kata lain, merupakan indeks perbedaan

antara kelompok berkemampuan tinggi dengan

berkemampuan rendah.

Indeks daya pembeda setiap butir soal biasanya

juga dinyatakan dalam bentuk proporsi. Semakin tinggi

indeks daya pembeda soal berarti semakin mampu soal

yang bersangkutan membedakan siswa yang telah

memahami materi dengan siswa yang belum memahami

materi. Indeks daya pembeda berkisar antara -1,00 sampai

dengan +1,00. Semakin tinggi daya pembeda suatu soal,

maka semakin kuat/baik soal itu. Jika daya pembeda

Page 287: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

276 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

negatif (< 0) berarti lebih banyak kelompok bawah (siswa

yang tidak memahami materi) menjawab benar soal

dibanding dengan kelompok atas (siswa yang memahami

materi yang diajarkan guru). Butir soal yang daya

pembedanya rendah, tidak ada manfaatnya, malahan dapat

merugikan siswa yang belajar sunguh- sungguh. Karena

indeks daya pembeda suatu butir yang kecil nilainya akan

menyebabkan butir tersebut tidak dapat membedakan

siswa yang kemampuannya tinggi dan siswa yang

kemampuannya rendah

Daya pembeda butir soal bentuk pilihan ganda

adalah dengan menggunakan rumus berikut (Gronlund dan

Linn, 1995).

D = ⁄

dengan

D = indeks Diskriminasi

= jumlah jawaban benar kelompok atas

= jumlah jawaban benar kelompok bawah

T=: jumlah siswa kelompok atas atau bawah

Rumus di atas adalah identik dengan rumus Depdiknas

(2008).

D =

atau D =

( )

atau D =

-

Page 288: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

277 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Karena P =

, maka dapat rumus daya beda dapat ditulis

dalam bentuk:

D = PA - PB

dengan

D = daya pembeda soal

BA = jumlah jawaban benar pada kelompok atas

BB = jumlah jawaban benar pada kelompok

bawah

N = jumlah siswa yang mengerjakan tes

2. Langkah-Langkah Menghitung Daya Pembeda

1. Susunlah urutan peserta berdasarkan skor yang

diperolehnya, mulai skor tertinggi sampai skor

terendah

2. Bagilah peserta tes tersebut menjadi 2 (dua)

kelompok yaitu :

* Kelompok A: 27% sebagai kelompok atas

* Kelompok B: 27% sebagai kelompok bawah

3. Hitung jumlah kelompok atas yang menjawab benar

terhadap butir soal yang yang akan dihitung daya

bedanya ( )

4. Hitung jumlah kelompok bawah yang menjawab

benar terhadap butir soal yang yang akan dihitung

daya bedanya ( )

5. Hitung proporsi peserta yang menjawab benar

terhadap butir soal tersebut untuk kelompok atas

dan kelompok bawah

Page 289: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

278 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

6. Menghitung Indeks Daya Pembeda menggunakan

rumus di atas

Menurut Glass and Stanley (1970) selain rumus di

atas, untuk mengetahui daya pembeda soal tes bentuk

pilihan ganda dapat juga digunakan rumus korelasi point

biserial (r pbis) seperti berikut.

keterangan

Xb = rata-rata skor siswa yang menjawab benar

Xs = rata-rata skor siswa yang menjawab salah

SD = simpangan baku skor total

p = adalah proporsi jawaban benar terhadap

semua jawaban siswa, q = I –p

Contoh:

Hasil uji coba 10 butir soal pilihan ganda pada 10

orang siswa, adalah sebagai berikut:

N

o Siswa

Nomor Butir

skor

Tot

al

1 2 3 4 5 6 7 8 9 1

0

1 A 1 1 1 1 1 1 0 1 1 0 8

2 B 1 1 1 1 1 1 1 0 1 0 8

3 C 1 1 0 1 1 1 0 1 1 0 7

4 D 1 1 1 1 1 0 1 0 1 0 7

5 E 1 1 1 1 1 0 0 1 1 0 7

6 F 1 0 1 0 0 1 1 0 0 1 5

7 G 1 1 0 0 1 1 0 1 0 1 6

8 H 0 0 1 1 1 0 1 0 0 1 5

9 I 0 1 1 1 0 0 0 1 0 1 5

Page 290: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

279 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

1

0

J 1 0 1 0 0 0 1 0 0 1 4

∑ X 8 7 8 7 7 5 5 5 5 5 62

P

0,8

0,7

0,8

0,7

0,7

0,5

0,5

0,5

0,5

0,5

Q 0

,2

0,3

0,2

0,3

0,3

0,5

0,5

0,5

0,5

0,5

Ingin dihitung daya beda butir 1, Maka langkah

perhitungannya adalah sebagai berikut:

(1) Menentukan proporsi menjawab benar (p)

dengan rumus

p = ∑ X/N = 8/10 = 0,8

(2) Menentukan nilai q, dengan rumus:

q = 1- p

q = 1-0,8 = 0,2

(3) Menentukan rata-rata skor total dengan

rumus

Mt = (62)/10 = 6,2

(4) Menentukan rata-rata skor siswa yang

menjawab benar, yaitu 8 orang (kecuali H

dan I)

Mp = (8 + 6 +7 + 7 + 7 + 5 + 6 + 4)/8 = 6,50

(5) Menentukan standar deviasi dengan rumus

SD = √ ( )

( ) = √

( )

( ) =

= √ = 1,398

Page 291: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

280 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

∑ = +

+

∑ = 402

(6) Menentukan korelasi dengan persamaan

√ =

√ = 0,496

Angka 0,496 itu disebut indeks diskriminasi

(Suryabrata, 2000), yang menunjukkan derajat kecermatan

soal tersebut dalam membedakan siswa yang tinggi

kemampuannya dari siswa yang rendah kemampuannya.

Demikian dengan cara yang sama, maka indeks

diskriminasi butir-butir 2, 3, 4, 5, 6, 7, 8, 9, 10 dapat

dihitung.

Untuk mengetahui daya pembeda soal bentuk

uraian adalah dengan menggunakan rumus (Tim

Puspendik, 2008) berikut ini.

D =

keterangan

D = daya pembeda soal uraian

Mean A = rata-rata skor siswa pada kelompok atas

Mean B = rata-rata skor siswa pada kelompok bawah

Skor Maks = skor maksmum yang ada pada pedoman

penskoran

Page 292: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

281 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Adapun klasifikasi indeks daya pembeda adalah

seperti Tabel 2 berikut ini (Asaad & Hailaya, 2004).

Tabel 2. Indek Diskriminasi Butir

Jarak Indeks Tingkat Pembeda

Di bawah 0,10 Butir diragukan

0,11 – 0,20 Tidak membeda

0,21 – 0,30 Sedang

0,31 – 0,40 Membeda

0,41 – 1,00 Sangat membeda

Menurut Ebel & Frisbie (1991), pada analisis butir

tes dengan Content‐Referenced Measures, indeks daya

diskriminasi (pembeda) butir tidak terlalu perlu menjadi

perhatian, asalkan tidak negatif

c. Analisis distraktor (pengecoh)

Selain menghitung indeks kesukaran dan daya

pembeda dalam analisis butir soal pilihan ganda juga perlu

diketahui apakah distraktor atau pengecoh yang

disediakan itu tepat atau tidak. Pada soal tes bentuk pilihan

ganda, Option atau pilihan itu jumlahnya berkisar antara 3

sampai dengan 5 buah, dan dari kemungkinan‐

kemungkinan jawaban yang terpasang pada setiap butir

itu, salah satu adalah merupakan jawaban betul (kunci

jawaban), sedangkan sisanya adalah merupakan jawaban

salah yang biasa dikenal dengan istilah distractor

(pengecoh). Menurut Muhson,dkk (2012) menganalisis

fungsi distraktor sering dikenal dengan istilah lain, yaitu:

menganalisis pola penyebaran jawaban item. Suatu

Page 293: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

282 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

kemungkinan dapat terjadi, bahwa dari keseluruhan

alternatif yang ditetapkan pada butir tertentu, sama sekali

tidak dipilih oleh peserta tes. Artinya peserta tes

membiarkan kosong “blangko”. Pernyataan blangko ini

sering dikenal dengan istilah omiet dan biasa diberi

lambang dengan huruf O.

Distraktor dinyatakan telah dapat menjalankan

fungsinya dengan baik apabila distraktor tersebut

sekurang‐kurangnya sudah dipilih oleh 5 % dari seluruh

peserta tes. Menurut Fernandes (1984) distraktor

dikatakan baik apabila paling tidak dipilih oleh 2 % dari

seluruh peserta. Nitko (1996) menyatakan bahwa

distraktor atau pengecoh dikatakan berfungsi apabila

paling tidak dipilih oleh seorang peserta tes dari kelompok

rendah.

Untuk mengetahui berfungsi tidaknya sebuah

pengecoh dapat digunakan rumus:

% =

x 100 %

Pertimbangan terhadap analisis pengecoh:

a. Diterima, karena sudah baik

b. Ditolak, karena tidak baik

c. Ditulis kembali, karena kurang baik

Page 294: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

283 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh:

Pilihan Jawaban

A B C D E O jumlah

Kelompok Atas

5 7 15 3 3 0 33

Kelompok Bawah

8 8 6 5 7 3 37

Jumlah

13 15 21 8 10 3 70

O = Omitted (tidak menjawab), C* = kunci jawaban

Pengecoh

A : 13/70 x 100% > 5% , berfungsi

B : 15/70 x 100% > 5% , berfungsi

D : 8/70 x 100% > 5% , berfungsi

E : 10/70 x 100% > 5% . berfungsi

Menurut Arifin (2009), untuk menentukan indek

pengecoh dapat juga dengan cara menggunakan rumus

IP =

( ) ( ) x 100 %

Keterangan:

IP = Indek pengecoh

P = jumlah siswa yang memilih pengecoh

N = jumlah siswa yang ikut tes

B = jumlah siswa yang menjawab betul pada setiap soal

n = jumlah alternatif jawaban

Adapun cara menafsirkan indeks pengecoh tersebut

(Arifin, 2009) yaitu:

Sangat Baik IP = 76 % - 125 %

Page 295: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

284 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Baik IP = 51 % - 75 % atau 126 % - 150 %

Jurang Baik IP = 26 % - 50 % atau 151 % -175 %

Jelek IP = 0 % - 25 % atau 176 % - 200 %

Sangat Jelek IP = lebih dari 200 %n

Cara lain untuk menentukan indeks pengecoh

adalah dengan menggunakan rumus

Ip = Np (

)

Keterangan:

Np = jumlah siswa yang memilih pengecoh

N = banyak option (pilihan)

N = jumlah siswa yang ikut tes

NB = jumlah siswa yang menjawab benar butir soal yang

bersangkutan

Untuk menafsirkannya adalah berdasarkan ketentuan

berikut.

Kriteria:

> 200% : sangat buruk

0 – 25% atau 176-200% : buruk

26%-50% atau 151-175% : kurang baik

51%-75% atau 126-150% : baik

76%-125% : sangat baik

3. Analisis soal acuan patokan

Tingkat kesukaran soal tes acuan patokan

didasarkan atas berapa jauh tingkat prestasi belajar yang

akan diukur. Apabila tingkat prestasi belajar yang harus

Page 296: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

285 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dicapai siswa tinggi, soal tes disusun dengan tingkat

kesukaran yang tinggi pula. Daya beda soal pada acuan

patokan tidak diperlukan, karena tes acuan patokan bukan

untuk menentukan perbedaan siswa atas dasar prestasi

belajarnya, tetapi untuk menentukan berapa persen

mereka telah menguasai pelajaran yang telah diberikan.

Yang dianalisis pada tes acuan patokan adalah

mengukur efektivitas pengajaran, yaitu apakah pengajaran

yang diberikan betul-betul efektif,atau sudah berapa

persen siswa telah menguasai bahan pelajaran yang

diberikan? Jadi, yang dianalisis pada tes acuan patokan

adalah membandingkan hasil pengukuran antara pretes

dan postes, yang disebut sebagai Indeks Efektivitas

Pengajaran (Sensitivity to Instructional Effect)

Untuk mengukur Indeks Efektivitas Pengajaran

digunakan rumus berikut:

E =

dimana : E = indeks efektivitas pengajaran

Ba = jumlah siswa yang menjawab betul sesudah menerima pengajaran

Bb = jumlah siswa yang menjawab betul sebelum menerima pengajaran T = Total jumlah seluruh peserta tes

Satu contoh analisis efektivitas pengajaran adalah sebagai

berikut;

Page 297: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

286 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Soal 1 2 3 4 5 Pretes (PR) Postes (PT)

PR

PT PR PT PR PT PR PT PR PT

1. A 2. B 3. C 4. D 5. E 6. F

- - - - - -

+ + + + + +

+ + + + + +

+ + + + + +

- - - - - -

- - - - - -

+ + + + + +

- - - - - -

- + - - + -

+ + + + + -

Adopsi dari Joesmani, 1988-

+ = jawaban betul,

- = jawaban salah

Kesimpulan analisinya:

Soal 1 :adalah soal yang ideal, sebelum diajar semua siswa menjawab salah, tetapi setelah diajar semua siswa menjawab betul

Indeks Efektivitas Pengajaran adalah:

E =

= 100

Soal 2: adalah terlalu mudah untuk mengukur hasil pengajaran, karena sebelum dan sesudah diajar siswa telah memberi jawaban betul

Indeks Efektivitas Pengajaran adalah:

E=

= 0,00

Soal 3 :adalah terlalu sukar dan tidak berhasil mengukur

pengajaran, seakan-akan pengajaran yang telah diberikan

Page 298: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

287 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

tidak ada gunanya, sebab sebelum diajarkan jawaban

semua siswa salah, demikiasn pula sesudah diajar.

Indeks Efektivitas Pengajaran adalah:

E =

= 0, 00

Soal 4: adalah soal yang salah atau pengajaran yang salah,

sebab sebelum diajar semua siswa telah memberi jawaban

betul,tetapi setelah diajar semua siswa menjawab salah

Indeks Efektivitas Pengajaran adalah:

E =

= -1, 00

Soal 5 :adalah soal yang efektif, sebab proposisi siswa yang

memberi jawaban betul pada postes lebih banyak daripada

sebelum pretes

Indeks Efektivitas Pengajaran adalah: E =

= 0,50

Page 299: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

288 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 300: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

289 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

UNIT V PENYUSUNAN SOAL DAN

PENSKORAN Keberhasilan pengukuran hasil belajar bukan pada bentuk

/tipe soal, tetapi pada mutu soal; Tes baru akan berarti bila

terdiri dari butir soal yang menguji tujuan yang penting

dan mewakili ranah yang diperlukan; Penyusunan soal

perlu pengetahuan dasar dan latihan; Tes harus

direncanakan dan dipertanggungjawabkan, karena itu

penyusunan soal sagat perlu dan penting dilakukan.

Setelah kita melakukan kegiatan tes terhadap siswa, kegiatan berikutnya adalah memberikan skor pada setiap lembar jawaban siswa. Kegiatan ini harus dilakukan dengan cermat karena menjadi dasar bagi kegiatan

Page 301: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

290 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

pengolahan hasil tes sampai menjadi nilai prestasi. Sebelum melakukan tes, sebaiknya kita sudah menyusun teknik pemberian skor (penskoran). Bahkan sebaiknya kita sudah berpikir strategi pemberian skor sejak perumusan kalimat pada setiap butir soal. Pada Bab berikut ini akan disajikan pemberian skor pada tes domain kognitif. Membuat pedoman penskoran sangat diperlukan, terutama untuk soal bentuk uraian dalam tes domain kognitif supaya subjektivitas kita dalam memberikan skor dapat diperkecil.

Salah satu aspek yang mempengaruhi keakuratan dan keadilan hasil penilaian adalah ketepatan guru dalam mengoreksi hasil jawaban siswa. Koreksi yang dilakukan tanpa hati-hati dan cermat berpotensi menghasilkan skor penilaian yang tidak tepat. Hal ini akan menyebabkan kurang tepatnya penilaian yang diberikan guru pada siswa. Dalam konteks inilah pedoman penskoran penting dan mutlak harus disiapkan sebaik-baiknya oleh guru. Pedoman penskoran merupakan pedoman menentukan skor terhadap hasil pekerjaan siswa. Dengan pedoman penskoran yang baik, guru memiliki pijakan yang jelas dalam memberikan skor terhadap jawaban siswa.

Page 302: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

291 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 13 PENYUSUNAN DAN

PENULISAN SOAL TES

A.Penyusunan Tes 1. Langkah Penyusunan

Pengembangan instrumen tes sebagai alat ukur

ranah kognitif perlu menempuh langkah-langkah tertentu.

Ada sejumlah langkah yang harus ditempuh untuk dapat

mengembangkan tes hasil belajar dengan baik. Brennan (2006)

mengemukakan langkah-langkah umum pengembangan tes

sebagai berikut: 1) penentuan tujuan tes, 2) penyusunan

kisi-kisi tes, 3) penulisan soal, 4) penelaahan soal, 5) uji

coba soal termasuk analisisnya, 6) perakitan soal menjadi

Page 303: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

292 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

perangkat tes, 7) penyajian tes, 8) penskoran, 9) pelaporan

hasil tes, dan 10) pemanfaatan hasil tes.

1). Penentuan tujuan

Tujuan tes harus dirumuskan secara jelas sehingga

dapat memberikan arah dan lingkup pengembangan tes

selanjutnya. Tujuan tes sangat penting karena setiap tujuan

memiliki penekanan yang berbeda-beda. Misalnya, tujuan

tes prestasi belajar, diagnostik, atau seleksi. Tujuan

pemberian tes adalah untuk mengetahui sejauh mana

siswa memahami atau menguasai materi tertentu setelah

diajarkan/dibahas guru di ruang kelas

2). Penyusunan kisi-kisi tes

Setelah tujuan tes dirumuskan, kita perlu membuat

kisi-kisi tes (test blue-print/ table of specification). Tujuan

penyusunan kisi-kisi adalah untuk menentukan ruang

lingkup dan sebagai petunjuk dalam penulisan soal. Kisi-

kisi dapat berupa format atau matriks. Kisi-kisi tes adalah

deskripsi mengenai ruang lingkup dan isi dari apa yang

akan diujikan, serta memberikan rincian mengenai soal-

soal yang diperlukan oleh tes tersebut. Kisi-kisi pada

umumnya berisi (1) rincian materi pembelajaran /aspek

yang akan dievaluasi, (2) tingkah laku yang akan diukur

berikut deskripsi indikatornya, (3) proporsi dan jumlah

soal, serta (4) bentuk soal.

Ada sejumlah langkah yang harus ditempuh untuk

menyusun kisi-kisi tes. Langkah itu adalah: (1).Penentuan

indikator-indikator (2). Pemilihan bentuk tes, dan (3).

Penentuan panjang tes. Butir-butir tes hendaknya dapat

Page 304: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

293 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

mengukur indikator, dan indikator-indikator dapat

mengukur kompetensi dasar. Penentuan bentuk tes yang

tepat ditentukan oleh tujuan tes dan jumlah peserta tes.

Contoh kisi-kisi tes

Mata Pelajaran : Semester : Tahun Ujian : Tipe Tes : Jumlah Butir Tes :

No Pokok

Bahasan Jenjang Kemampuan Jumlah

butir soal

C1 C2 C3 C4 C5 C6

1 2

3 dst

Jumlah

Butir Soal

Persentase 100

3). Penulisan butir soal

Penulisan butir adalah fase yang berat dalam

proses pengembangan tes. Menulis butir-butir dalam suatu

tes atau alat ukur merupakan suatu seni menuangkan

gagasan. Penulisan butir-butir soal merupakan langkah

penting dalam upaya pengembangan alat ukur atau sebuah

tes yang baik Dalam penulisan butir soal, penulis harus

memperhatikan kaidah penulisan soal. Menulis soal adalah

penjabaran indikator kompetensi yang hendak diukur

menjadi pertanyaan-pertanyaan yang karakteristiknya

Page 305: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

294 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

sesuai dengan kisi-kisi. Setiap butir soal yang dibuat harus

jelas apa yang ditanyakan dan jelas pula apa yang dituntut.

Mutu setiap butir soal akan menentukan mutu soal tes

secara keseluruhan.

4). Penelaahan soal

Penelaahan soal adalah mengkaji secara teoritik

soal tes yang telah disusun. Penelaahan ini dilakukan

dengan memperhatikan tiga aspek, yaitu aspek materi,

aspek konstruksi, dan aspek bahasa. Biasanya pada

penelaahan soal dilakukan review dan revisi oleh orang

lain.

5). Uji coba soal dan analisis.

Soal yang sudah dibuat dan sudsah direproduksi

atau diperbanyak itu diujicobakan kepada sejumlah sampel

yang telah ditentukan. Sampel uji-coba harus mempunyai

karakteristik yang kurag lebih sama dengan karakteristik

peserta tes sesungguhnya. Berdasarkan data hasil uji-coba

dilakukan analisis, terutama analisis butir soal yang

meliputi tingkat kesukaran, validita butir, dan fungsi

pengecoh. Soal-soal yang tidak valid akan didrop dan soal-

soal yang valid akan ditetapkan untuk dipakai atau dirakit

menjadi suatu tes yang valid.

6). Perakitan soal menjadi perangkat tes

Dalam perakitan tes perlu mengelompokkan butir

soal itu menurut bentuknya, bukan menurut jenis

materinya atau menurut jenjang pengetahuan yang hendak

diukur. Dengan demikian ada kelompok soal pilihan ganda,

Page 306: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

295 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

ada kelompok soal menjodohkan dan sebagainya. Di

samping pengaturan menurut bentuk itemnya, soal itu

hendaknya diatur pula menurut taraf kesukarannya. jadi,

ada baiknya soal tes disajikan mulai dari butir mudah ke

yang sukar, pengelompokan rapi, tata letak bagus dan tidak

terpotong-potong kalimatnya, dan kemasannya menarik.

Untuk merakit soal menjadi suatu paket tes yang

tepat, para guru perlu memperhatikan langkah-langkah

perakitan soal sebagai berikut:

a) Mengelompokkan soal-soal yang mengukur

kompetensi dan materi yang sama, kemudian soal

soal itu ditempatkan dalam urutan yang sama.

b) Memberi nomor urut soal didasarkan nomor urut

soal dalam kisi-kisi.

c) Mengecek setiap soal dalam satu paket tes apakah

soal-soalnya sudah bebas dari kaidah “Setiap soal

tidak boleh memberi petunjuk jawaban terhadap

soal yang lain”.

d) Membuat petunjuk umum dan khusus untuk

mengerjakan soal.

e) Membuat format lembar jawaban.

f) Membuat lembar kunci jawaban dan petunjuk

penilaiannya.

g) Menentukan/menghitung penyebaran kunci

jawaban (untuk bentuk pilihan ganda), dengan

menggunakan rumus berikut.

Penyebaran kunci jawaban =

± 3

Page 307: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

296 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

h) Menentukan soal inti (anchor items) sebanyak 10 %

dari jumlah soal dalam satu paket

i) Menentukan besarnya bobot setiap soal (untuk soal

bentuk uraian)

7). Penyajian tes,

Setelah diperoleh tes terstandar, naskah tes siap

diberikan atau disajikan kepada peserta tes. Hal-hal yang

perlu diperhatikan dalam penyajian tes adalah waktu

penyajian, petunjuk yang jelas mengenai cara menjawab

atau mengerjakan tes, ruangan dan tempat duduk peserta

tes. Pada prinsipnya, hal-hal yang menyangkut segi

administratif penyajian tes harus diperhatikan sehingga

pengujian dapat terselenggara dengan lancar dan baik.

8). Penskoran

Penskoran adalah proses menentukan angka

melalui:

(a) Kunci Jawaban (menentukan jawaban benar)

(b) Kunci Skoring (menyeleksi jawaban benar dan salah)

(c) Pedoman Penilaian (menentukan angka)

Penskoran dilakukan menurut bentuk tes atau soal.

Untuk butir-butir soal bentuk esai, terdapat dua metoda

penskorannya. Yang pertama adalah point method, dan

kedua adalah rating method. Pada point method setiap

jawaban dibandingkan dengan jawaban ideal yang telah

ditetapkan dalam kunci jawaban dan skor yang diberikan

kepada setiap jawaban akan tergantung pada derajat

Page 308: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

297 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

kepadanannya dengan kunci jawaban. Soal esei dengan

jawaban terbatas penskoran dilakukan dengan point

method, maka perlu menggunakan rambu-rambu jawaban

Sedangkan dalam rating method, setiap jawaban

siswa ditetapkan dalam salah satu kelompok yang sudah

berdasarkan mutunya selagi jawaban tersebut dibaca. Soal

esei dengan jawaban terbuka, penskoran dengan rating

method, maka perlu menggunakan kriteria/rubric

penilaian

Dalam memeriksa dan menilai jawaban siswa dilakukan

dengan cara soal demi soal, bukan bukan siswa demi siswa,

untuk menghindari halo effect. Selanjutnya, dalam

mengevaluasi jawaban soal esei, adalah tanpa mengetahui

identitas siswa yang mengerjakan.

9). Pelaporan Hasil Tes

Setelah pelaksanaan tes dan penskorannya, maka

hasil tes tersebut perlu dilaporkan, Laporan tersebut

misalnya kepada siswa yang bersangkutan, kepada orang

tua/wali siswa, kepada Kepala Sekolah, dan sebagainya.

Laporan hasl tes tersebut menjadi informasi yang berguna

dan penting guna penentuan kebijakan selanjutnya.

10). Pemanfaatan Hasil Tes

Hasil tes yang tidak lain adalah hasil pengukuran

dapat dimanfaatkan untuk perbaikan sistem, metode, atau

strategi belajar mengajar, di samping dapat dimanfaatkan

untuk penentuan kebijakan.

Page 309: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

298 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

B. Kaidah Penulisan Soal

1. Tes Pilihan Ganda

Menurut Depdiknas (2007) kaidah penulisan soal

pilihan ganda adalah sebagai berikut.

a. Materi

Soal harus sesuai dengan indikator (artinya soal

harus menanyakan perilaku dan materi yang hendak

diukur sesuai dengan rumusan indikator dalam kisi-kisi),

pengecoh harus berfungsi, dan setiap soal harus

mempunyai satu jawaban yang benar (artinya, satu soal

hanya mempunyai satu kunci jawaban).

b. Konstruksi

a) Pokok soal harus dirumuskan secara jelas dan tegas.

Artinya, kemampuan/ materi yang hendak

diukur/ditanyakan harus jelas, tidak menimbulkan

pengertian atau penafsiran yang berbeda dari yang

dimaksudkan penulis. Setiap butir soal hanya

mengandung satu persoalan/gagasan

b) Rumusan pokok soal dan pilihan jawaban harus

merupakan pernyataan yang diperlukan saja.

Artinya apabila terdapat rumusan atau pernyataan

yang sebetulnya tidak diperlukan, maka rumusan

atau pernyataan itu dihilangkan saja.

c) Pokok soal jangan memberi petunjuk ke arah

jawaban yang benar. Artinya, pada pokok soal

jangan sampai terdapat kata, kelompok kata, atau

Page 310: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

299 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

ungkapan yang dapat memberikan petunjuk ke arah

jawaban yang benar.

d) Pokok soal jangan mengandung pernyataan yang

bersifat negatif ganda. Artinya, pada pokok soal

jangan sampai terdapat dua kata atau lebih yang

mengandung arti negatif. Hal ini untuk mencegah

terjadinya kesalahan penafsiran peserta didik

terhadap arti pernyataan yang dimaksud. Untuk

keterampilan bahasa, penggunaan negatif ganda

diperbolehkan bila aspek yang akan diukur justru

pengertian tentang negatif ganda itu sendiri.

e) Pilihan jawaban harus homogen dan logis ditinjau

dari segi materi. Artinya, semua pilihan jawaban

harus berasal dari materi yang sama seperti yang

ditanyakan oleh pokok soal, penulisannya harus

setara, dan semua pilihan jawaban harus berfungsi.

f) Pilihan jawaban jangan mengandung pernyataan

“Semua pilihan jawaban di atas salah" atau "Semua

pilihan jawaban di atas benar". Artinya dengan

adanya pilihan jawaban seperti ini, maka secara

materi pilihan jawaban berkurang satu karena

pernyataan itu bukan merupakan materi yang

ditanyakan dan pernyataan itu menjadi tidak

homogen.

g) Panjang rumusan pilihan jawaban harus relatif

sama. Kaidah ini diperlukan karena adanya

kecenderungan peserta didik memilih jawaban yang

paling panjang karena seringkali jawaban yang lebih

panjang itu lebih lengkap dan merupakan kunci

jawaban.

Page 311: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

300 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

h) Pilihan jawaban yang berbentuk angka atau waktu

harus disusun berdasarkan urutan besar kecilnya

nilai angka atau kronologis. Artinya pilihan jawaban

yang berbentuk angka harus disusun dari nilai

angka paling kecil berurutan sampai nilai angka

yang paling besar, dan sebaliknya. Demikian juga

pilihan jawaban yang menunjukkan waktu harus

disusun secara kronologis. Penyusunan secara unit

dimaksudkan untuk memudahkan peserta didik

melihat pilihan jawaban.

i) Gambar, grafik, tabel, diagram, wacana, dan

sejenisnya yang terdapat pada soal harus jelas dan

berfungsi. Artinya, apa saja yang menyertai suatu

soal yang ditanyakan harus jelas, terbaca, dapat

dimengerti oleh peserta didik. Apabila soal bisa

dijawab tanpa melihat gambar, grafik, tabel atau

sejenisnya yang terdapat pada soal, berarti gambar,

grafik, atau tabel itu tidak berfungsi.

j) Rumusan pokok soal tidak menggunakan ungkapan

atau kata yang bermakna tidak pasti seperti:

sebaiknya, umumnya, kadang-kadang.

k) Butir soal jangan bergantung pada jawaban soal

sebelumnya. Ketergantungan pada soal sebelumnya

menyebabkan peserta didik yang tidak dapat

menjawab benar soal pertama tidak akan dapat

menjawab benar soal berikutnya.

c. Bahasa/budaya

Setiap soal harus menggunakan bahasa yang sesuai

dengan kaidah bahasa Indonesia. Kaidah bahasa Indonesia

Page 312: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

301 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dalam penulisan soal di antaranya meliputi: a) pemakaian

kalimat: (1) unsur subjek, (2) unsur predikat, (3) anak

kalimat; b) pemakaian kata: (1) pilihan kata, (2) penulisan

kata, dan c) pemakaian ejaan; (1) penulisan huruf, (2)

penggunaan tanda baca. Bahasa yang digunakan harus

komunikatif, sehingga pernyataannya mudah dimengerti

peserta didik. Pilihan jawaban jangan mengulang

kata/frase yang bukan merupakan satu kesatuan

pengertian. Letakkan kata/frase pada pokok soal.

Hopkin dan Antes (1990) juga memberikan

petunjuk yang lebih rinci dan praktis dalam menyusun tes

pilihan ganda, yaitu: (1) definisikan tugas-tugas dalam

stem secara jelas, (2) tulis alternatif jawaban pada akhir

pertanyaan, (3) tempatkan sebanyak mungkin kata-kata

dalam stem, (4) hindari penggunaan kata-kata negatif, (5)

hindari stem yang mengarah pada alternatif jawaban yang

salah atau benar, (6) buat alternatif jawaban yang paralel,

(7) tulis alternatif jawaban secara vertikal, (8) hindari

jawaban “semua di atas”, (9) buat alternatif jawaban sama

panjang, (10) hilangkan petunjuk ke arah jawaban benar,

(11) buat pengecoh yang masuk akal, (12) usahakan

stemnya dalam bentuk pertanyaan, (13) kontrol tingkat

kesulitan soal sehingga persentase jawaban benar kira-kira

separuhnya, (14) hindari kemungkinan menebak, (15)

gunakan jawaban “tidak ada jawaban benar” hanya kalau

tidak ada jawaban lain, (16) susun alternatif jawaban

sesuai dengan abjad . 19 atau urutan lainnya, (17) letakkan

jawaban benar secara acak, dan (18) usahakan memiliki

empat sampai lima alternatif jawaban

Page 313: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

302 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Dengan memperhatikan petunjuk tersebut,

diharapkan para guru dapat menyusun butir tes pilihan

ganda yang baik

2. Tes Dua Pilihan Jawaban (Benar-Salah, Ya-Tidak)

Menurut Tim Puspendik (2008) Kaidah penulisan

soal bentuk dua pilihan jawaban perlu adalah sebagai

berikut.

a) Hindari penggunaan kata: terpenting, selalu, tidak

pernah, hanya, sebagian besar, dan kata-kata lain

yang sejenis, karena dapat membingungkan peserta

tes dalam menjawab. Rumusan butir soal harus

jelas, dan pasti benar atau pasti salah.

b) Jumlah rumusan butir soal yang jawabannya benar

dan salah hendaknya seimbang.

c) Panjang rumusan pernyataan butir soal hendaknya

relatif sama.

d) Susunan pernyataan benar dan pernyataan salah

secara random, tidak sistematis mengikuti pola

tertentu. Misalnya: B B S S, atau B S B S, dan

sebagainya. Susunan yang terpola sistematis seperti

itu dapat memberi petunjuk kepada jawaban yang

benar.

e) Hindari pengambilan kalimat langsung dari buku

teks. Pengambilan kalimat langsung dari buku teks

lebih mendorong siswa untuk menghafal daripada

memahami dan menguasai konsep dengan baik.

Page 314: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

303 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

3. Tes Menjodohkan

Kaidah penulisan soal bentuk menjodohkan (Tim

Puspendik, 2008) adalah seperti berikut:

a. Tulislah seluruh pernyataan dalam lajur kiri sejenis,

dan pernyataan dalam lajur kanan juga sejenis.

Dengan kata lain: pernyataan dalam lajur sebelah

kiri isinya homogen, demikian juga pernyataan

dalam lajur sebelah kanan isinya harus homogen.

b. Tulislah pernyataan jawaban lebih banyak dari

pernyataan soal. Hal ini penting, untuk memperkecil

probabilitas peserta tes menjawab soal secara

menebak dengan benar. Seperti contoh berikut,

pernyataan soal yang ada di lajur kiri adalah lima

butir, pernyataan jawaban yang ada di lajur kanan

adalah enam butir.

c. Susunlah jawaban yang berbentuk angka secara

berurutan dari besar ke kecil atau sebaliknya.

Apabila alternatif jawabannya berupa tanggal dan

tahun terjadinya peristiwa, maka susunlah tanggal

dan tahun tersebut berurutan secara kronologis,

seperti dalam penulisan soal pilihan ganda.

d. Tulislah petunjuk mengerjakan tes yang jelas dan

mudah dipahami oleh peserta tes. Oleh karena itu,

dalam perumusan kalimat dan penggunaan

kosakata perlu memperhatikan perkembangan

kemampuan bahasa peserta tes.

4. Tes Isian

Kaidah penulisan soal bentuk isian adalah seperti berikut (Tim Puspendik, 2008):

Page 315: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

304 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

a. Soal harus sesuai dengan indikator b. Soal harus menggunakan bahasa yang baik dan

benar, serta kalimat singkat dan jelas, sehingga peserta tes dapat memahami dengan muda.

c. Jawaban yang dituntut oleh soal harus singkat dan pasti yaitu berupa kata, frase, angka, simbol, tempat, atau waktu.

d. Soal tidak merupakan kalimat yang dikutip langsung dari buku.

e. Soal tidak memberi petunjuk ke kunci jawaban. f. Bagian kalimat yang harus dilengkapi sebaiknya

hanya satu bagian dalam ratio butir soal, dan paling banyak dua bagian, supaya tidak membingungkan siswa.

5.Tes Esai atau Uraian

Kaidah penulisan soal uraian menurut Depdiknas

(2008) sebagai berikut.

a. Materi

Soal harus sesuai dengan indikator, setiap pertanyaan

harus diberikan batasan jawaban yang diharapkan, materi

yang ditanyakan harus sesuai dengan tujuan pengukuran,

dan materi yang ditanyakan harus sesuai dengan jenjang

dan jenis sekolah atau tingkat kelas.

b. Konstruksi

Soal menggunakan kata tanya/perintah yang menuntut

jawaban terurai, ada petunjuk yang jelas tentang cara

mengerjakan soal, setiap soal harus ada pedoman

Page 316: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

305 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

penskorannya, dan tabel, gambar, grafik, peta, atau yang

sejenisnya disajikan dengan jelas, terbaca, dan berfungsi

c. Bahasa

Rumusan kalimat soal harus komunikatif,

menggunakan bahasa Indonesia yang baik dan benar

(baku), tidak menimbulkan penafsiran ganda, tidak

menggunakan bahasa yang berlaku setempat/tabu, dan

tidak mengandung kata/ungkapan yang menyinggung

perasaan peserta didik.

6. Tes Jawaban Singkat

Kaidah penulisan bentuk soal jawaban singkat adalah seperti berikut:

a. Menggunakan kalimat pertanyaan langsung atau kalimat perintah.

b. Pertanyaan atau perintah harus jelas, agar mendapat jawaban yang singkat.

c. Panjang kata atau kalimat yang harus dijawab oleh siswa pada semua soal diusahakan relatif sama.

d. Hindari penggunaan kata, kalimat, atau frase yang diambil langsung dari buku teks, sebab akan mendorong siswa untuk sekedar mengingat atau menghafal apa yang tertulis dibuku.

e. Buatlah pedoman penskoran untuk digunakan pada waktu menskor.

B

C. Penulisan Soal Penalaran Tinggi Taksonomi Bloom dianggap merupakan dasar bagi

berpikir tingkat tinggi. Pemikiran ini didasarkan bahwa

Page 317: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

306 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

beberapa jenis pembelajaran memerlukan proses kognisi

yang lebih daripada yang lain, tetapi memiliki manfaat-

manfaat lebih umum. Dalam Taksonomi Bloom sebagai

contoh, kemampuan melibatkan analisis, evaluasi dan

mengkreasi dianggap berpikir tingkat tinggi (Pohl, 2000).

Stein dan Lane (1996) menyatakan bahwa berpikir tingkat

tinggi adalah the use of complex, nonalgorithmic thinking to

solve a task in which there is not a predictable, well-

rehearsed approach or pathway explicitly suggested by the

task, task instruction, or a worked out example, artinya

berpikir tingkat tinggi menggunakan pemikiran yang

kompleks, non algorithmic untuk menyelesaikan suatu

tugas, ada yang tidak dapat diprediksi, menggunakan

pendekatan yang berbeda dengan tugas yang telah ada dan

berbeda dengan contoh.

Karakteristik berpikir tingkat tinggi adalah sebagai

: solving tasks where no algorithm has been taught, where

justification or explanation are required, and where more

than one solution may be possible. Jadi berpikir tingkat

tinggi adalah kemampuan untuk menyelesaikan tugas-

tugas dimana tidak ada algoritma yang telah diajarkan,

yang membutuhkan justifikasi atau penjelasan dan

mungkin mempunyai lebih dari satu solusi yang mungkin

(Lewy, Zulkardi, dan Aisyah, 2009).

Adapun indikator soal untuk mengukur kemampuan

berpikir tingkat tinggi adalah: (1) non algorithmic, (2)

cenderung kompleks (3) memiliki solusi yang mungkin

lebih dari satu (open ended approach), (4) membutuhkan

usaha untuk menemukan struktur dalam ketidakteraturan

Page 318: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

307 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(Lewy, Zulkardi, dan Aisyah, 2009). Sedangkan Krathwohl

(2002) menyatakan bahwa indikator untuk mengukur

kemampuan berpikir tingkat tinggi meliputi:

(1) Menganalisis: yaitu (a) menganalisis informasi yang

masuk dan membagi-bagi atau menstrukturkan informasi

ke dalam bagian yang lebih kecil untuk mengenali pola atau

hubungannya, (b) mampu mengenali serta membedakan

faktor penyebab dan akibat dari sebua skenario yang

rumit, (c)mengidentifikasi/merumuskan pertanyaan

(2) Mengevaluasi: yaitu (a) memberikan penilaian

terhadap solusi, gagasan, dan metodologi dengan

menggunakan kriteria yang cocok atau standar yang ada

untuk memastikan nilai efektivitas atau manfaatnya. (b)

membuat hipotesis, mengkritik dan melakukan pengujian,

(c) menerima atau menolak suatu pernyataan berdasarkan

kriteria yang telah ditetapkan (3) Mengkreasi: yaitu

(a)membuat generalisasi suatu ide atau cara pandang

terhadap sesuatu, (b) merancang suatu cara untuk

menyelesaikan masalah, (c) mengorganisasikan unsur-

unsur atau bagian-bagian menjadi struktur baru yang

belum pernah ada sebelumnya

Penulisan atau penyusunan soal yang menuntut

penalaran tinggi dapat dibedakan atas: (1) mengukur

kemampuan berpikir kritis, dan (2) mengukur

keterampilan pemecahan masalah.

Menurut Depdiknas (2008) untuk menuliskan butir

soal yang menuntut penalaran tinggi, perlu memperhatikan

pedoman berikut:

a. Materi yang akan ditanyakan diukur dengan perilaku:

C2/pemahaman, C3/penerapan, C4/sintesis,C5/analisis,

Page 319: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

308 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

atau C6/evaluasi (bukan hanya C1/ingatan saja). Ingat

Taksonomi Bloom.

b. Setiap pertanyaan diberikan dasar pertanyaan

(stimulus).

Agar butir soal yang ditulis dapat menuntut penalaran

tinggi, maka setiap butir soal selalu diberikan dasar

pertanyaan (stimulus) yang berbentuk sumber/bahan

bacaan seperti: teks bacaan, paragrap, teks drama,

penggalan novel/cerita/dongeng, puisi, kasus, gambar,

grafik, foto, rumus, tabel, daftar kata/simbol, contoh,

peta, film, atau suara yang direkam.

1. Mengukur kemampuan berpikir kritis.

Ada 11 kemampuan berpikir kritis yang dapat

dijadikan dasar dalam menulis butir soal yang menuntut

penalaran tinggi (Depdiknas, 2008).

1) Menfokuskan pada pertanyaan

Contoh indikator soal:

Disajikan sebuah masalah/problem, aturan, kartun, atau

eksperimen dan hasilnya, peserta didik dapat

menentukan masalah utama, kriteria yang digunakan

untuk mengevaluasi kualitas, kebenaran argumen atau

kesimpulan.

2) Menganalisis argumen

Contoh indikator soal:

Disajikan deskripsi sebuah situasi atau satu/dua

argumentasi, peserta didik dapat: (1) menyimpulkan

argumentasi secara cepat, (2) memberikan alasan yang

Page 320: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

309 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

mendukung argumen yang disajikan, (3) memberikan

alasan tidak mendukung argumen yang disajikan.

3) Mempertimbangkan yang dapat dipercaya

Contoh indikator soal:

Disajikan sebuah teks argumentasi, iklan, atau

eksperimen dan interpretasinya, peserta didik

menentukan bagian yang dapat dipertimbangan untuk

dapat dipercaya (atau tidak dapat dipercaya), serta

memberikan alasannya.

4) Mempertimbangkan laporan observasi

Contoh indikator soalnya:

Disajikan deskripsi konteks, laporan observasi, atau

laporan observer/reporter, peserta didik dapat

mempercayai atau tidak terhadap laporan itu dan

memberikan alasannya.

5) Membandingkan kesimpulan

Contoh indikator soal:

Disajikan sebuah pernyataan yang diasumsikan kepada

peserta didik adalah benar dan pilihannya terdiri dari:

(1) satu kesimpulan yang benar dan logis, (2) dua atau

lebihkesimpulan yang benar dan logis, peserta didik

dapat membandingkan kesimpulan yang sesuai dengan

pernyataan yang disajikan atau kesimpulan yang harus

diikuti.

6) Menentukan kesimpulan

Contoh indikator soal:

Page 321: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

310 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Disajikan sebuah pernyataan yang diasumsikan kepada

peserta didik adalah benar dan satukemungkinan

kesimpulan, peserta didik dapat menentukan

kesimpulan yang ada itu benar atau tidak, dan

memberikan alasannya.

7) Mempertimbangkan kemampuan induksi

Contoh indikator soal:

Disajikan sebuah pernyataan, informasi/data, dan

beberapa kemungkinan kesimpulan,peserta didik dapat

menentukan sebuah kesimpulan yang tepat dan

memberikan alasannya.

8) Menilai

Contoh indikatornya:

Disajikan deskripsi sebuah situasi, pernyataan masalah,

dan kemungkinan penyelesaianmasalahnya, peserta

didik dapat menentukan: (1) solusi yang positif dan

negatif, (2) solusi mana yang paling tepat untuk

memecahkan masalah yang disajikan, dan dapat

memberikan alasannya.

9) Mendefinisikan Konsep

Contoh indikator soal:

Disajikan pernyataan situasi dan argumentasi/naskah,

peserta didik dapat mendefinisikan konsep yang

dinyatakan.

10) Mendefinisikan asumsi

Contoh indikator soal

Page 322: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

311 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Disajikan sebuah argumentasi, beberapa pilihan yang

implisit di dalam asumsi, peserta didik dapat

menentukan sebuah pilihan yang tepat sesuai dengan

asumsi.

11) Mendeskripsikan

Contoh indikator soal:

Disajikan sebuah teks persuasif, percakapan, iklan,

segmen dari video klip, peserta didik dapat

mendeskripsikan pernyataan yang dihilangkan

Menurut Linn dan Gronlund Keterampilan Berpikir Kritis adalah: 1). Membandingkan

Jelaskan persamaan dan perbedaan antara ... dan ....

Bandingkan dua cara berikut tentang ....

2). Hubungan sebab-akibat

Apa penyebab utama ....

Apa akibat ....

3). Memberi alasan (justifying)

Manakah pilihan berikut yang kamu pilih, mengapa?

Jelaskan mengapa kamu setuju/tidak setuju dengan

pernyataan tentang

4). Meringkas

Tuliskan pernyataan penting yang termasuk ....

Ringkaslah dengan tepat isi ....

Page 323: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

312 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

5). Menyimpulkan

Susunlah beberapa kesimpulan yang bersasal dari

data ....

Tulislah sebuah pernyataan yang dapat menjelaskan

peristiwa berikut ..

6). Berpendapat (inferring)

Berdasarkan ..., apa yang akan terjadi bila ....

Apa reaksi A terhadap ....

7). Mengelompokkan

Kelompokkan hal berikut berdasarkan ....

Apakah hal berikut memiliki ....

8). Menciptakan

Tuliskan beberapa cara sesuai dengan ide Anda

tentang ....

Lengkapilah cerita ... tentang apa yang akan terjadi

bila ....

9). Menerapkan

Selesaikan hal berikut dengan menggunakan kaidah

....

Tuliskan ... dengan menggunakan pedoman ....

10). Analisis

Manakah penulisan yang salah pada paragraf ....

Daftar dan beri alasan singkat tentang ciri utama ....

Page 324: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

313 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

11). Sintesis

Tuliskan satu rencana untuk pembuktian ....

Tuliskan sebuah laporan ....

12). Evaluasi

Apakah kelebihan dan kelemahan ....

Berdasarkan kriteria ..., tuliskanlah evaluasi tentang

....

2 Mengukur keterampilan pemecahan masalah.

Ada 17 keterampilan pemecahan masalah yang

dapat dijadikan dasar dalam menulis butir soal yang

menuntut penalaran tinggi.

1). Mengidentifikasi masalah

Contoh indikator soal:

Disajikan deskripsi suatu situasi/masalah, peserta

didik dapat mengidentifikasi masalah yang nyata atau

masalah apa yang harus dipecahkan.

2) . Merumuskan masalah dalam bentuk pertanyaan

Contoh indikator soal:

Disajikan sebuah pernyataan yang berisi sebuah

masalah, peserta didik dapat merumuskanmasalah

dalam bentuk pertanyaan.

3). Memahami kata dalam konteks

Contoh indikator soal:

Page 325: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

314 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Disajikan beberapa masalah yang konteks kata atau

kelompok katanya digarisbawahi, peserta didik dapat

menjelaskan makna yang berhubungan dengan

masalah itu dengan kata‐katanya sendiri.

4). Mengidentifikasi masalah yang tidak sesuai

Contoh indikator masalah:

Disajikan beberapa informasi yang relevan dan tidak

relevan terhadap masalah, peserta didik dapat

mengidentifikasi semua informasi yang tidak relevan.

5). Memilih masalah sendiri

Contoh indikator soal:

Disajikan beberapa masalah, peserta didik dapat

memberikan alasan satu masalah yang dipilih sendiri,

dan menjelaskan cara penyelesaiannya.

6) . Mendeskripsikan berbagai strategi

Contoh indikator soal:

Disajikan sebuah pernyataan masalah, peserta didik

dapat memecahkan masalah ke dalam dua cara atau

lebih, kemudian menunjukkan solusinya ke dalam

gambar, diagram, atau grafik.

7). Mengidentifikasi asumsi

Contoh indikator soal:

Disajikan sebuah pernyataan masalah, peserta didik

dapat memberikan solusinya berdasarkan

pertimbangan asumsi untuk saat ini dan yang akan

datang.

Page 326: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

315 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

8) Mendeskripsikan masalah

Contoh indikator soal:

Disajikan sebuah pernyataan masalah, peserta didik

dapat menggambarkan sebuah diagram atau gambar

yang menunjukkan situasi masalah.

9) . Memberi alasan masalah yang sulit

Contoh indikator soal:

Disajikan sebuah masalah yang sukar dipecahkan atau

informasi pentingnya dihilangkan, peserta didik dapat

menjelaskan mengapa masalah ini sulit dipecahkan

atau melengkapi informasi pentingnya dihilangkan.

10) Memberi alasan solusi

Contoh indikator soal:

Disajikan sebuah pernyataan masalah dengan dua atau

lebih kemungkinan solusinya, peserta didik dapat

memilih satu solusi yang paling tepat dan memberikan

alasannya.

11) Memberi alasan strategi yang digunakan

Contoh indikator soal:

Disajikan sebuah pernyataan masalah dengan dua atau

lebih strategi untuk menyelesikan masalah, peserta

didik dapat memilih satu strategi yang tepat untuk

menyelesaikan masalah itu dan memberikan

alasannya.

Page 327: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

316 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

12) Memecahkan masalah berdasarkan data dan

masalah

Contoh indikator soal:

Disajikan sebuah cerita, kartun, grafik atau tabel dan

sebuah pernyataan masalah, peserta didik dapat

memecahkan masalah dan menjelaskan prosedur yang

digunakan untuk menyelesaikan masalah.

13) Membuat strategi lain

Contoh indikator soal:

Disajikan sebuah pernyataan masalah dan satu strategi

untuk menyelesaikan masalahnya, peserta didik dapat

menyelesaikan masalah itu dengan menggunakan

strategi lain.

14) Menggunakan analogi

Contoh indikator soal:

Disajikan sebuah pernyataan masalah dan strategi

penyelesaiannya, peserta didik dapat: (1)

mendeskripsikan masalah lain (analog dengan masalah

ini) yang dapat diselesaikan dengan menggunakan

strategi itu, (2) memberikan alasannya.

15) Menyelesaikan secara terencana

Contoh indikator soal:

Disajikan sebuah situasi masalah yang kompleks,

peserta didik dapat menyelesaikan masalah secara

terencana mulai dari input, proses, output, dan

outcomenya.

Page 328: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

317 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

16) Mengevaluasi kualitas solusi

Contoh indikator soal:

Disajikan sebuah pernyataan masalah dan beberapa

strategi untuk menyelesaikan masalah, peserta didik

dapat: (1) menjelaskan dengan menerapkan strategi

itu, (2) mengevaluasinya, (3) menentukan strategi

mana yang tepat, (4) memberi alasan mengapa strategi

itu paling tepat dibandingkan dengan strategi lainnya.

17) Mengevaluasi strategi sistematika

Contoh indikator soal:

Disajikan sebuah pernyataan masalah, beberapa

strategi pemecahan masalah dan prosedur, peserta

didik dapat mengevaluasi strategi pemecahannya

berdasarkan prosedur yang disajikan (Depdiknas,

2008).

Page 329: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

318 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 330: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

319 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 14 PENSKORAN HASIL TES

A.Penskoran Hasil Tes Penskoran (skoring) atau pemberian skor adalah

proses pengubahan atau jawaban – jawaban soal tes

menjadi angka-angka yang pasti.

1. Penskoran Tes Objektif

a. Soal Bentuk Pilihan Ganda

Dalam penskoran untuk soal bentuk pilihan ganda

ragam biasa, ada 2 macam yaitu dengan hukuman dan

tanpa hukuman.

(1) Pemberian skor tanpa hukuman dengan rumus

berikut:

S = ∑R dengan : S = Score , ∑R = Right, W = Wrong

Page 331: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

320 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Skor yang diperoleh sebanyak jumlah soal yang

benar.

(2) Pemberian skor dengan hukuman menggunakan

rumus, yaitu :

S = ∑R -

dengan: S = skor yang dicari

∑R = jumlah jawaban benar

∑W = jumlah jawaban salah

k = jumlah pilihan jawaban (option)

Contoh:

- Banyaknya soal = 10 buah (T)

- Banyaknya yang betul = 8 buah (R)

- Banyaknya yang salah = 2 buah (W)

- Banyaknya pilihan = 4 buah (k)

- Maka skornya menjadi : 8 - {2 / (4 - 1)} = 8 - (2 /

3) = 7,33

Untuk penskoran (pemberian skor) soal pilihan

ganda selain ragam biasa (ragam-ragam: analisis antar hal,

analisis kasus, komolek, dan membaca diagram) adalah

menggunakan rumus pilihan ganda yang dikalikan bobot.

jadi

(1) Pemberian skor tanpa hukuman dengan rumus

menjadi:

Page 332: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

321 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

S = ∑R x Wt dengan S = Score , ∑R = Right, Wt =

bobot yang diberikan guru pada setiap soal

(2) Pemberian skor dengan hukuman dengan rumus :

S = ∑R - (

) x Wt

b. Soal Bentuk Dua Pilihan

Untuk penskoran soal yang hanya pilihan jawabannya dua, dapat digunakan rumus:

Jika pemberian skor tanpa hukuman/denda

(1) S = ∑R – ∑W

Keterangan: S = skor yang dicari

∑R = jumlah jawaban betul

∑W = jumlah jawaban salah

Contoh:

- Banyaknya soal = 10 buah (T)

- Banyaknya yang betul = 8 buah (R)

- Banyaknya yang salah = 2 buah (W)

- Skornya menjadi (S) : 8 - 2 = 6

Jika pemberian skor dengan hukuman/denda

(2) S = T - 2W (T singkatan dari total, artinya jumlah soal dalam tes)

Contoh .

- Banyaknya soal = 10 buah (T)

- Banyaknya yang betul = 8 buah (R)

- Banyaknya yang salah = 2 buah (W)

Page 333: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

322 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

- Skornya menjadi 10 - (2x2) = 10 - 4 = 6

c. Soal Bentuk Menjodohkan

Untuk penskoran soal menjodohkan dapat digunakan

rumus berikut:

S = R -

( )( )

dengan : S = skor yang dicari

W = jumlah jawaban yang salah

= jumlah butir pada lajur kiri

(soal)

= jumlah butir pada lajur kanan

(jawaban)

Selain itu sering juga penskoran dengan cara

d. Soal Bentuk Jawaban Singkat

Untuk pemberian skor soal jawaban singkat

sebaiknya tiap soal diberi skor 2 (dua).

Dapat juga skornya itu sama dengan skor pada bentuk

betul salah atau pilihan ganda jika memang jawaban yang

diharapkannya ringan atau mudah. Tetapi sebaliknya

apabila jawabarmya bervariasi rnisalnva lengkap sekali,

lengkap dan kurang lengkap, maka angkanya dapat dibuat

bervariasi pula misalnya 2; 1,5; dan 1.

2. Penskoran Tes Essei Ada dua metode yang sering digunakan untuk penskoran

soal Esei,yaitu: a) Metode Analitik, dan b) Metode Rating

(Silverius, 1991)

Page 334: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

323 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

a) Metode Analitik

Langkah-langkah pelaksanaan cara analitik adalah:

(1) Tulislah/buatlah jawaban sempurna dari tiap soal, yaitu

jawaban yang dapat diberikan skor tertinggi

(2) Analisislah dan tetapkan bagian-bagiannya

(3) Skor tertinggi yang hendak diberikan kepada jawaban

sempurna itu dibagi-bagi kepada tiap bagian

(4) Baca jawaban tiap siswa dan berikan skor pada tiap

bagian

(5) Jumlahkan skor tiap bagian itu, dan ini merupakan skor

jawaban siswa untuk soal tersebut.

b) Metode Rating Dalam metode rating, jawaban sempurna tidak

dibagi-bagi kepada bagian-bagian. Guru yang melakukan penskoran membaca dengan sekasama setiap soal, dan menangkap ruang lingkup yang ada dalam jawaban. Langkah-langkah penskorannya adalah:

(1) Membaca jawaban siswa

(3) Mengelompokkan jawaban siswa ke dalam salah

satu kategori yang menunjukkan tingkat kualitas

jawaban (sangat baik, baik, sedang, kurang, sangat

kurang)

(4) Membandingkan jawaban dengan kategori yang

diberikan pada jawaban

(3) Skor yang diberikan sesuai dengan kategori itu

merupakan skor akhir jawaban siswa dari soal

tersebut.

Page 335: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

324 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

B. Konversi Skor Konversi skor adalah proses transformasi skor mentah

yang dicapai peserta didik (siswa) ke dalam skor terjabar

atau skor standar untuk menetapkan nilai hasil belajar

yang diperoleh (Arifin, 2009)

Untuk melakukan konversi skor (pengolahan dan

pengubahan skor mentah hasil tes) menjadi nilai dapat

menggunakan berbagai macam skala, di antaranya :

1) Skala lima (stanfive)

2) Skala sembilan (stannine)

3) Skala seratus

4) Skala sebelas (eleven points standard)

5) Skala Z (Z score)

6) Skala T (T score)

Gronlund dan Linn (1995) mengemukakan bahwa

hasil tes dapat diinterpretasikan dengan dua cara

(metode), yaitu berdasarkan standar absolut (criterion-

referenced interpretation) yang kita kenal dengan PAP

(Penilaian Acuan Patokan), dan standar relatif (norm-

referenced interpretation) yang kita kenal dengan PAN

(Penilaian Acuan Norma)

PAP pada dasarnya adalah penilaian yang

membandingkan hasil pembelajaran peserta didik dengan

Patokan (Batas Lulus) yang telah ditetapkan sebelumnya.

Batas lulus itu tidak diambil dari hasil pengukuran

kelompok (kelas), melainkan atas dasar Tingkat

Penguasaan (Kompetensi) Minimal yang telah ditetapkan

sebelumnya.Yang lulus adalah mereka yang nilainya

melampaui Batas Lulus. Pendekatan PAP adalah

Page 336: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

325 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

pendekatan yang menggunakan Standard Mutlak. Rumus

yang digunakan untuk menghitung nilai adalah sebagai

berikut.

Nilai =

x skala

Pendekatan PAN (Penilaian Acuan Norma ) adalah

penilaian yang menggunakan Norma Kelompok (Kelas)

sebagai Norma Pembanding (Batas Lulus). Pendekatan

PAN adalah pendekatan ” apa adanya ”. Batas lulus-nya

diambil dari kenyataan yang diperoleh dari pengukuran

dan penilaian yang sedang berlangsung. PAN pada

dasarnya menggunakan kurve normal dan hasil-hasil

penghitungannya sebagai dasar penilaian. Sebagai norma

pembanding adalah nilai rata–rata (Mean) dan simpang–

baku (standar–deviasi). Dapat dimengerti bahwa norma

penilaian atas dasar kurve normal ini bersifat relative,

dapat bergeser ke atas atau ke bawah, sesuai dengan kurve

normal yang satu ke kurve normal lainnya. PAN adalah

pendekatan yang menggunakan Standard Relatif. Rumus

yang digunakan untuk menghitung nilai adalah sebagai

berikut.

Nilai =

x skala

1. Penilaian Acuan Patokan

a. Konversi dengan Skala lima

Skala lima adalah suatu pembagian tingkatan yang

terbagi atas lima kategori. Misalnya masing-masing

tingkatan itu adalah A, B, C, D, dan E. Langkah yang

Page 337: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

326 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

ditempuh untuk mengkonversikan skor mentah menjadi

skor standar skala lima adalah sebagai berikut:

1) Mencari skor maksimal ideal (SMI) dari tes.

Skor maksimal ideal adalah skor yang mungkin

dicapai siswa apabila semua butir soal dapat

dijawb dengan benar. Cara mencari skor

maksimal ideal adalah menghitung jumlah butir

serta bobot dari masing-masing butir.

2) Membuat pedoman konversi.

Pedoman konversi skor ini didasarkan pada

tingkat penguasaan terhadap materi yang

diberikan. Pedoman yang lazim digunakan

untuk skala lima adalah:

Tingkat Penguasaan Skor standar

90% - 100% A

80% - 89% B

65% - 79% C

55% - 64% D

0% - 54% E

Contoh: Misalkan skor maksimal ideal (SMI) suatu tes

hasil belajar 90, maka :

Penguasaan 90% skor mentahnya = 90/100 x 90 = 81

Penguasaan 80% skor mentahnya = 80/100 x 90 = 72

Penguasaan 65% skor mentahnya = 65/100 x 90 = 58,5

Penguasaan 55% skor mentahnya = 55/100 x 90 = 49,5

Berdasarkan batas-batas tersebut, dapat dibuat tabel

konversi, yaitu;

Page 338: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

327 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Skor Mentah Skor Standar

81 – 90 A

72 – 80 B

58,5 - 71 C

49,5 – 57,5 D

0 – 48,5 E

Berdasarkan pedoman konversi tersebut, dapatlah

diberikan nilai kepada siswa, misalnya siswa yanag

memperoleh skor mentah 72 akan mendapat skor standar

B, dan bagi siswa yang memperoleh skor mentahnya 71

maka akan mendapat skor standar C, dan seterusnya.

b. Konversi dengan Skala Sembilan

Skala sembilan adalah suatu pembagian tingkatan

yang terbagi atas sembilan kategori. Untuk mengubah skor

mentah menjadi skor standar pada skala sembilan adalah

sama seperti pada langkah skala lima. Jadi skor siswa dapat

dikonversi dengan pedoman berikut;

Tingkat Penguasaan Skor standar

85% - 100% 9

75% - 84% 8

65% - 74% 7

55% - 64% 6

45% - 54% 5

35% - 44% 4

25% - 34% 3

15% - 24% 2

Page 339: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

328 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

0% - 14% 1

Untuk mencari tingkat penguasaan adalah sama seperti

pada skala lima. Misalkan Skor Maksimal Idealnya adalah

90, maka;

Penguasaan 85% skor mentahnya = 85/100 x 90 = 76,5

Penguasaan 75% skor mentahnya = 75/100 x 90 = 67,5

Penguasaan 65% skor mentahnya = 65/100 x 90 = 58,5

Penguasaan 55% skor mentahnya = 55/100 x 90 = 49,5

Penguasaan 45% skor mentahnya = 45/100 x 90 = 40,5

Penguasaan 35% skor mentahnya = 35/100 x 90 = 31,5

Penguasaan 25% skor mentahnya = 25/100 x 90 = 22,5

Penguasaan 15% skor mentahnya = 15/100 x 90 = 13,5

Untuk mengubah skor mentah menjadi skor standar

pada skala sembilan adalah sama seperti pada langkah

skala lima. Jadi skor siswa dapat dikonversi dengan

pedoman berikut.

Skor mentah Skor standar

76,5 – 90 9

67,5 – 75,5 8

58,5 – 66,5 7

49,5 –57,5 6

40,5 – 48,5 5

31,5 – 39,5 4

22,5 – 30,5 3

13,5 – 21,5 2

0,0 - 12,5 1

Page 340: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

329 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Berdasarkan konversi skor mentah menjadi skor

standar tersebut, maka sisw yang mendapat skor mentah

45 akan mendat skor standar 5, dan siswa yang mendapat

skor mentah 52 mndapat skor standar 6, demikian

seterusnya.

c.Konversi dengan Skala Sebelas

Untuk membuaat pedoman konversi skala sebelas

adalah sama seperti konversi pada skala sepuluh, jadi

pedoman konversi skala sebelas adalah:

Tingkat Penguasaan Skor standar

95 % - 100 % 10

85 % - 94 % 9

75 % - 44 % 8

65 % - 74 % 7

55 % - 64 % 6

45 % - 54 % 5

35 % - 44 % 4

25 % - 34 % 3

15 % - 24 % 2

5 % - 14 % 1

0 % - 4 % 0

Untuk mencari tingkat penguasaan adalah sama

seperti pada skala sembilan. Misalkan Skor Maksimal

Idealnya adalah 90, maka

Penguasaan 95% skor mentahnya = 95/100 x 90 = 85,5

Penguasaan 85% skor mentahnya = 85/100 x 90 = 76,5

Penguasaan 75% skor mentahnya =75/100 x 90 = 67,5

Page 341: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

330 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Penguasaan 55% skor mentahnya =65/100 x 90 = 58,5

Penguasaan 55% skor mentahnya = 55/100 x 90 = 49,5

Penguasaan 45% skor mentahnya = 45/100 x 90 = 40,5

Penguasaan 35% skor mentahnya =35/100 x 90 = 31,5

Penguasaan 25% skor mentahnya =25/100 x 90 = 22,5

Penguasaan 15% skor mentahnya =15/100 x 90 = 13,5

Penguasaan 5% skor mentahnya = 5/100 x 90 = 4,5

Untuk mengubah skor mentah menjadi skor standar

pada skala sebelas adalah sama seperti pada langkah skala

sepuluh. Jadi skor siswa dapat dikonversi dengan pedoman

berikut.

Skor mentah Skor standar

85,5 – 90 10

76,5 – 84,5 9

67,5 – 75,5 8

58,5 –66,5 7

49,5 – 57,5 6

40,5 – 48,5 5

31,5 – 39,5 4

22,5 – 30,5 2

4,5 - 12,5 1

0,0 - 3,5 0

d. Konversi skor dengan Skala Seratus

Skala seratus (skala persentil) adalah skala yang

bergerak antara nol sampai seratus. Untuk

mengkonversikan skor mentah menjadi skor

standardigunakan rumus berikut.

Page 342: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

331 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

P =

x 100

dengan:

P = persentil

X = skor yang dicapai

Contoh: Misalkan Skor Maksimal Ideal adalah 90. Jika

seorang siswa memperoleh skor mentah 75, maka skor

standar siswa tersebut adalah:

P =

x 100 = 83,33

e. Konversi dengan Z skor

Skala Z skor adalah suatu ukuran yang

menunjukkan berapa besarnya penyimpangan standar

seseorang berada di bawah atau di atas rata-rata dalam

kelompok tersebut . Adapun rumus Z skor adalah:

Z =

dengan: = Skor rata-rata ideal

Langkah-langkah yang ditempuh untuk

mengkonversikan skor mentah menjadi skor standar

dengan Z skor adalah sebagai berikut

a) Mencari skor maksimal ideal (SMI)

b) Mencari angka rata-rata ideal dengan menggunakan

rumus:

= ½ x skor maksimal ideal (SMI)

Page 343: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

332 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

c) Mencari standar deviasi ideal dengan rumus:

= 1/3 x

d) Mengkonversikan skor mentah menjai skor standar,

dengan rumus Z skor.

Contoh . Misalkan Skor Maksimal Ideal adalah 90. Jika

seorang siswa memperoleh skor mentah 40, maka skor

standar siswa tersebut dihitung sebagai berikut:

SMI = 90

= ½ x 90 = 45

, maka

Z =

=

= - 0,33

f.Konversi dengan T skor Yang dimaksud dengan T skor adalah suatu skor

terjabar yang

mempunyai rata-rata (M atau ) = 50 dan besar standar

deviasi (SD) = 10.

Rumusnya adalah:

T = 50 +

x 10 atau T = 50 + 10 Z

Keterangan:

X = skor mentah yang diperoleh siswa

= rata-rata ideal

= standar deviasi ideal

Page 344: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

333 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh: Kita ambil contoh soal di atas, jika siswa

memperoleh skor mentah 40, maka skor standarnya (T

skor) adalah;

T = 50 +

x 10

= 50 +

x 10

= 50 +

x 10

= 50 – 3,3 = 46,7 (dibulatkan 47)

Kelebihan Penilaian Acuan Patokan

Adapun kelebihan menggunakan konversi skor acuan

patokan, yaitu:

a) Dapat membantu guru merancang program remidial

b) Tidak membutuhkan perhitungan statistik yang

rumit

c) Dapat mengukur ketercapaian tujuan pembelajaran

d) Nilainya bersifat tetap selama standar yang

digunakan sama.

e) Hasil penilaian dapat digunakan untuk umpan balik

atau untuk mengetahui apakah tujuan pembelajaran

sudah tercapai atau belum.

f) Banyak digunakan untuk kelas dengan materi

pembelajaran berupa konsep.

g) Mudah menilai karena ada patokan

2. Penilaian Acuan Norma

Dalam Penilaian Acuan Norma (PAN), makna skor

seorang siswa ditentukan dengan cara membandingkan

Page 345: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

334 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

hasil belajarnya dengan hasil belajar siswa lainnya dalam

satu kelompok kelasnya. Soal-soal tes dalam PAP harus

dibuat dengan tingkat kesukaran yang bervariasi, mulai

dari yang mudah sampai dengan yang sukar, sehingga

memungkinkan penyebaran jawaban siswa bervariasi,

sehingga dapat dibandingkan siswa yang satu dengan siwa

lainnya.

Sama seperti halnya pada pendekatan PAP,

pendekatan PAN juga dilakukan konversi skala lima, skala

100, skala sembilan, dan skala sebelas.

a. Konversi dengan Skala lima

Adapun langkah yang ditempuh untuk

mengkonversi skor mentah menjadi skor standar pada

skala lima adalah:

a) Menghitung angka rata-rata (M atau ) skor yang

diperoleh siswa, dengan rumus:

=

atau =

dengan: x = skor peserta tes/siswa

f = frekwensi skor peserta tes/siswa

N = Jumlah peserta tes

b) Mencari Standar Deviasi (SD) dari skor yang

diperoleh siswa dengan rumus:

SD =

( )

atau SD =

--

( )

c) Membuat pedoman konversi skala lima.

Pedoman konversi skala lima berarti membagi nilai

standar menjadi lima skala, atau lima kualifikasi.

Cara menyusun skala lima adalah dengan membagi

Page 346: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

335 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

wilayah di bawah lengkung kurva normal menjadi

lima daerah, lihat gambar 14.1 berikut.

Gambar 14.1. Kurva normal skala lima

Kurva normal di atas terbagi menjadi lima daerah dan

setiap daerah menunjukkan nilai/angka dari kanan ke kiri

A, B, B, C, D dan E. Berdasarkan pembagian itu, pedoman

konversi skala lima dapat disusun sebagai berikut.

+ 1,5 SD

+ 0,5 SD

- 0,5 SD

- 1,5 SD

Contoh: Misalkan skor hasil tes yang dikerjakan oleh

siswa adalah sebagai berikut (Nurkancana &Sunartana,

1990).

A

B

C

D

E

D E B A C

𝑥 - 𝑥 - 𝑥 𝑥 𝑥

Page 347: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

336 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

46 39 32 31 43 32 44

37 24 38 58 17 48 38

51 49 40 45 41 25

42 30 35 36 35 20

34 11 28 27 33 53

Dengan menggunakan langkah-langkah di atas

diperoleh:

a) Mean (M atau ) skor siswa = 36,37

b) Standar Deviasi (SD) skor yang diperoleh siswa

=10,15

c) Berdasarkan pedoman konversi skor skala lima

acuan norma maka dapat disusun pedoman

konversi sebagai berikut:

+ 1,5 SD = 36,37 + 1,5 x 10,15 =50,60

+ 0,5 SD = 36,37 + 0,5 x 10,15 = 41,35

-+ 0,5 SD = 36,37 - 0,5 x 10,15 = 31,20

- 1,5 SD = 36,37 – 1,5 x 10,15= 21,05

Dengan menggunakan pedoman konversi tersebut, maka

siswa yang memperoleh skor mentahnya 52, skor

standarnya menjadi A.

b. Konversi dengan Skala sembilan

Adapun langkah yang ditempuh untuk

mengkonversi skor mentah menjadi skor standar pada

skala sembilan adalah sama seperti langkah pada skor

A

B

C

D

E

Page 348: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

337 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

lima (point: a, dan b), kecuali pada pedoman konversinya.

Pedoman konversi skala sembilan berarti membagi nilai

standar menjadi sembilan skala atau sembilan angka.Cara

menyusun skala sembilan adalah sama dengan skala lima

yaitu dengan membagi wilayah di bawah lengkung kurva

normal menjadi sembilan daerah, lihat gambar 14.2

berikut.

Gambar 14.2. Kurva normal skala sembilan

Kurva normal tersebut terbagi menjadi sembilan daerah

dan setiap daerah menunjukkan nilai/angka dari kiri ke

kanan 1, 2, 3, 4, 5, 6, 7, 8, dan 9. Berdasarkan pembagian

itu, pedoman konversi skala sembilan dapat disusun

sebagai berikut.

+ 1,75 SD

9

8

7

1

𝑥 -

𝑥 -

2 3 4

5

6 7 8 9

𝑥

𝑥 -

𝑥 -

𝑥

𝑥

𝑥

𝑥

Page 349: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

338 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

+ 1,25 SD

+ 0,75 SD

+ 0,25 SD

- 0,25 SD

- 0,75 SD

- 1,25 SD

- 1,75 SD

Contoh: Misalkan skor hasil tes adalah seperti yang ada

pada contoh di atas, dengan: Mean ( ) skor siswa = 36,37,

dan Standar Deviasi (SD) skor =10,15. Menggunakan

pedoman konversi skala sembilan,diperoleh sebagai

berikut.

+ 1,75 SD = 36,37 + 1,75 x 10,15 = 54,13

+ 1,25 SD = 36,37 + 1,25 x 10,15 = 49,06

+ 0,75 SD = 36,37 + 0,75 x 10,15 = 43,98

+ 0,25 SD = 36,37 + 0,25 x 10,15 = 38,91

- 0,25 SD = 36,37 – 0,25 x 10,15 = 33,83

- 0,75 SD = 36,37 – 0,75 x 10,15 = 28,76

- 1,25 SD = 36,37 – 1,25 x 10,15 = 23,68

- 1,75 SD = 36,37 – 1,75 x 10,15 = 18,61

6

5

4

3

2

1

9

8

7

6

5

4

3

2

1

Page 350: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

339 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Dengan pedoman konversi skala sembilan di atas, maka

siswa yang skor mentahnya 30 akan mendapat skor

standarnya 4, sedangkan bagi siswa yang skor mentahnya

40, akan mendapat skor standarnya 6.

b. Konversi dengan Skala sebelas

Untuk mengkonversi skor mentah menjadi skor

standar pada skala sebelas hanya menambah satu interval

lagi ke atas dan satu interval lagi ke bawah pada pedoman

konversi skor sembilan, sehingga ada sebelas interval.

Langkah yang ditempuh untuk mengkonversi skor mentah

menjadi skor standar pada skala sebelas adalah sama

seperti langkah pada skor sembilan (point: a, dan b),

kecuali pada pedoman konversinya. Pedoman konversi

skor sebelas berarti membagi nilai standar menjadi sebelas

skala. Cara menyusun skala sebelas sama dengan skala lima

dan sembilan yaitu dengan membagi wilayah di bawah

lengkung kurva normal menjadi sebelas daerah, perhatikan

gambar 14.3 berikut.

0

𝑥 -

𝑥 -

1 2 3

5

6 7 8 9

𝑥

𝑥 -

𝑥 -

𝑥

𝑥

𝑥

𝑥

4

𝑥 -

𝑥

10

Page 351: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

340 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Gambar 14.3 Kurva normal skala sebelas

Kurva normal tersebut terbagi menjadi sebelas daerah dan

setiap daerah menunjukkan nilai/angka dari kanan ke kiri

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, dan 10. Berdasarkan pembagian itu,

pedoman konversi skala sebelas dapat disusun sebagai

berikut.

+ 2,25 SD

+ 1,75 SD

+ 1,25 SD

+ 0,75 SD

+ 0,25 SD

- 0,25 SD

- 0,75 SD

- 1,25 SD

- 1,75 SD

- 2,25 SD

Contoh: Misalkan skor hasil tes adalah seperti yang ada

pada contoh di atas, dengan: Mean ( ) skor siswa = 36,37,

dan Standar Deviasi (SD) =10,15. Menggunakan pedoman

konversi skala sebelas diperoleh sebagai berikut.

+ 2,25 SD = 36,37 + 2,25 x 10,15 = 59,21

+ 1,75 SD = 36,37 + 1,75 x 10,15 = 54,13

+ 1,25 SD = 36,37 + 1,25 x 10,15 = 49,06

10

9

8

7

6

5

4

3

2

1

0

10

9

8

7

Page 352: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

341 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

+ 0,75 SD = 36,37 + 0,75 x 10,15 = 43,98

+ 0,25 SD = 36,37 + 0,25 x 10,15 = 38,91

- 0,25 SD = 36,37 - 0,25 x 10,15 = 33,83

- 0,75 SD = 36,37 - 0,75 x 10,15 = 28,76

- 1,25 SD = 36,37 - 1,25 x 10,15 = 23,68

- 1,75 SD = 36,37 – 1,75 x 10,15 = 18,61

- 2,25 SD = 36,37 – 2,25 x 10,15 =13,53

Jadi menggunakan pedoman konversi skala sebelas, siswa

yang memperoleh skor mentahnya 40 akan mendapat skor

standarnya 5, sedangkan bagi siswa yang skor mentahnya

50, akan mendapat skor standarnya 8.

d. Konversi dengan Skala Z skor

Rumus Z skor acuan norma adalah sama saja

dengan rumus Z skor acuan patokan. Letak perbedaannya

adalah dalam mencari angka rata-rata (M atau ) dan

Standar Deviasi (SD)nya saja. Kalau pada rumus Z skor acuan

patokan M atau berdasarkan Skor

Maksimal Ideal (SMI), sedangkan pada rumus Z skor acuan

norma M atau berdasarkan distribusi

skor yang ril dicapai oleh peserta tes (Nurkancana dan

Sunartana,1990).

Adapun rumus Z skor untuk acuan norma adalah:

Z =

6

5

4

3

2

1

0

Page 353: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

342 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

dengan: x = skor

= rata-rata

Jadi kalau diketahui Mean ( ) skor siswa = 36,37,

dan Standar Deviasi (SD) =10,15 maka konversi skor

mentah menjadi skor standar (Z skor) adalah sebagai yang

terlihat dalam Tabel berikut:

Contoh: Tabel Konversi skor mentah menjadi skor standar

(Z skor)

Nama Siswa

Skor mentah

Skor standar (Z skor)

Aini 70 (70 – 36,37)/10,15 = 3,31 Budi. 60 (60 – 36,37)/10,15 = 2,32 Dian 55 (55 – 36,37)/10,15 = 1,86 Eka 50 (50 – 36,37)/10,15 = 1,34 Fitri 45 (45 – 36,37)/10,15 = 0,85 Leli 35 (35 – 36,37)/10,15 = -0,13 Sari 30 (30 – 36,37)/10,15 = -0,62

e.Konversi dengan Skala T skor

Rumus T skor untuk acuan norma juga sama dengan

rumus T skor untuk acuan patokan. Juga yang berbeda

hanya dalam cara mencari M atau . Rumus T

skor untuk acuan norma adalah:

T = 50 +

x 10 atau T = 50 + 10 Z

Page 354: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

343 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Keterangan:

x = skor mentah yang diperoleh siswa

= rata-rata skor siswa

= Standar Deviasi

Contoh: Konversi skor mentah menjadi skor standar (T

skor) adalah sebagai yang terlihat pada Tabel berikut.

Tabel konversi skor mentah menjadi skor standar (T

skor)

Nama Siswa Skor mentah

Skor standar (T skor)

Aini 70 50 + 10 x 3,31 = 63,30 Budi. 60 50 + 10 x 2,32 = 62,32 Dian 55 50 + 10 x 1,86 = 61,86 Eka 50 50 + 10 x 1,34 = 61,34 Fitri 45 50 + 10 x 0,85 = 60,85 Leli 35 50 + 10 x -0,13 = 59,87 Sari 30 50 + 10 x -0,62 = 59,38

Kelebihan Penilaian Acuan Norma

a) Dapat digunakan untuk menetapkan nilai secara

maksimal

b) Dapat membedakan kemampuan peserta didik yang

pintar dan kurang pintar. Membedakan kelompok atas

dan bawah.

c) Fleksibel: dapat menyesuaikan dengan kondisi yang

berbeda-beda

d) Mudah menilai karena tidak ada patokan

e) Dapat digunakan untuk menilai ranah kognitif, afektif

dan psikomotor .

Page 355: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

344 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 356: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

345 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

UNIT VI PENGUKURAN DAN

PENILAIAN AFEKTIF

Keberhasilan pembelajaran pada ranah kognitif dan

psikomotor dipengaruhi oleh kondisi afektif siswa. Siswa

yang memiliki minat belajar dan sikap positif terhadap

pelajaran akan merasa senang mempelajari mata pelajaran

tertentu, sehingga dapat mencapai hasil pembelajaran yang

optimal. Ranah afektif menentukan keberhasilan belajar

seseorang. Oleh karena itu semua guru atau pendidik harus

mampu membangkitkan minat semua siswa untuk

mencapai kompetensi yang telah ditentukan. Untuk itu

semua guru dalam merancang program pembelajaran,

Page 357: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

346 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

harus memperhatikan ranah afektif. Pencapai hasil belajar

yang optimal, dalam mencapai program pembelajaran dan

kegiatan pembelajaran bagi peserta didik, pendidik harus

memperhatikan karakteristik afektif siswa. Aderson (1981)

berpendapat bahwa karakteristk manusia meliputi cara

yang tipikal dari berpikir, berbuat, dan perasaan. Tipikal

perasaan berkaitan dengan ranah afektif. Penilaian afektif

dilakukan oleh guru melalui pengamatan terhadap

perkembangan afeksi siswa.

Ada dua hal yang berhubungan dengan penilaian

afektif yang harus dinilai. Pertama, kompetensi afektif yang

ingin dicapai dalam pembelajaran meliputi tingkatan

pemberian respons, apresiasi, penilaian dan internalisasi.

Kedua, sikap dan minat siswa terhadap mata pelajaran dan

proses pembelajaran. Dalam proses pembelajaran terdapat

lima tipe karakteristik afektif yang penting yaitu sikap,

minat, konsep diri dan nilai dan moral. Seorang guru atau

pendidik sebaiknya mengetahui afektif siswa sehingga

dapat diketahui status afektif siswanya. Jika afektif tinggi

maka perlu mempertahankannya, jika rendah perlu upaya

untuk meningkatkannya.

Page 358: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

347 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 15 BENTUK-BENTUK SKALA

PENGUKURAN A.Skala Pengukuran

Skala adalah alat untuk mengukur nilai, sikap, minat

dan perhatian dan lain-lain yang disusun dalam bentuk

pernyataan untuk dinilai oleh responden dan hasilnya

dalam bentuk rentangan nilai sesuai dengan kriteria yang

ditentukan (Sudjana (2009). Skala terbagi tiga, yaitu: skala

penilaian, skala sikap, dan skala minat. Skala terdiri atas

daftar pernyataan/pertanyaan yang disampaikan kepada

responden untuk dijawab secara tertulis.

Ada beberapa model atau bentuk skala yang

dikembangkan oleh para pakar untuk mengukur sikap.

Page 359: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

348 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Beberapa bentuk skala sikap antara lain adalah (1) Skala

Likert (2) Skala Semantik Diferensiasi (3) Skala Guttman,

dan (4) Skala Thrustone.

1.Skala Likert

Skala Likert dikembangkan

oleh Rensis Likert pada tahun 1932

dalam mengukur sikap masyarakat.

Dalam skala ini hanya menggunakan

item yang secara pasti baik dan

secara pasti buruk. Item yang pasti

disenangi, disukai, yang baik, diberi

tanda negatif (-). Total skor

merupakan penjumlahan skor

responsi dari responden yang hasilnya ditafsirkan sebagai

posisi responden.

Skala Likert tersusun atas beberapa pernyataan

positif (favorable statements) dan pernyataan negatif

(unfavorable statements) yang mempunyai lima

kemungkinan jawaban (option) dengan kategori yang

continuum, dari mulai jawaban sangat setuju (strongly

agree) sampai sangat tidak setuju (strongly disagree).

Item-item Likert menyediakan respon dengan

kategori yang berjenjang. Biasanya banyaknya jenjang

adalah lima, yaitu : sangat setuju, setuju, ragu-ragu, tidak

setuju dan sangat tidak setuju. Setiap kategori respon,

Gambar 15.1. Rensis Likert

Page 360: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

349 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

selanjutnya diberi skor. Penskoran untuk skala sikap Likert

dapat dilakukan sebagai berikut.

Pernyataan Positif Pernyataan Negatif

Sangat Setuju (SS) 5 Sangat Setuju (SS) 1

Setuju (S) 4 Setuju (S) 2

Netral (N) 3 Netral (N) 3

Tidak Setuju (TS) 2 Tidak Setuju (TS) 4

Sangat Tidak Setuju

(STS)

1 Sangat Tidak Setuju

(STS)

5

a. Langkah-langkah penyusunan:

Adapun langkah-langkah penyusunan Skala Likert

(Likert Scales) dapat dirinci sebagai berikut.

1. Menentukan objek sikap --- misalnya sikap

terhadap pelajaran fisika.

2. Menyusun kisi-kisi atau konstruk skala sikap berisi

rincian aspek sikap berikut jumlah dan jenis

pernyataan (positif atau negatif).

3. Menulis pernyataan (statement) secara tepat

dengan memperhatikan kaedah sebagai berikut.

a. menghindari kalimat yang mengandung

banyak interpretasi;

b. rumusan pernyataan hendaknya singkat;

c. satu pernyataan hendaknya hanya

mengandung satu pikiran yang lengkap;

d. sedapat mungkin, pernyataan hendaknya

dirumuskan dalam kalimat yang sederhana;

e. menghindari penggunaan kata-kata: semua,

selalu, tidak pernah, dan sejenisnya;

Page 361: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

350 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

4. Mengkaji/menganalisis setiap pernyataan secara

rasional (isi telah mewakili aspek/objek sikap dan

struktur kalimat benar)

5. Menganalisis tingkat kebaikan skala sikap

(reliabilitas, validitas, ketepatan skala

6. Antara pernyataan positif dan pernyataan negatif

hendaknya relatif berimbang.

7. Setiap pernyataan diikuti dengan skala sikap (bisa

genap, misanya 4 atau ganjil, misalnya 5).

b. Penskoran dan Interpretasi

Untuk menghitung total skor tiap responden adalah

dengan cara menjumlahkan skor-skor item yang diperoleh

responden. Oleh karena itu, prosedur penskalaan Likert

sering disebut sebagai : Likert’s Summeted Rating.

Skor yang dicapai oleh siswa adalah jumlah dari

seluruh angka untuk seluruh penyataan yang direspon atau

diberi tanda cek (√). Perbedaan jumlah angka yang dicapai

oleh para siswa dapat ditafsirkan sebagai perbedaan sikap,

positif atau negatif, terhadap objek sikap.

Untuk menilai sikap individu atau kelompok (skor

rata-rata), yaitu dengan cara membanding skor yang

diperoleh dengan kriteria tertentu. Caranya adalah sebagai

berikut. Jika jumlah butir skala sikap 5, maka:

a. Menentukan skor maksimal, yaitu skor jawaban

terbesar di kali banyak item 5 x 5 = 25

b. Menentukan skor minimal, yaitu skor jawaban

terkecil dikali banyak item 1 x 5 = 5

Page 362: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

351 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

c. Menentukan nilai median, yaitu hasil penjumlahan

skor maximal dengan skor minimal dibagi dua (25 +

5) : 2 = 15

d. Menentukan nilai kuartil 1, yaitu hasil penjumlahan

skor minimal dengan median dibagi dua (5 + 15): 2

= 10

e. Menentukan kuartil 3, yaitu hasil penjumlahan skor

maksimal dengan median dibagi dua (25 + 15): 2 =

20

Selanjutnya berdasarkan angka-angka

tersebut dibuatkan skalanya, sebagai berikut.

5 10 15 20 30

Minimal Kuartil 1 Median Kuartil 3 Maksimal

Gambar 15.2. Skala

Berdasarkan gambar skala di atas maka skor dari keempat

kategori

adalah :

Sikap sangat setuju : (kuartil 3 x skor maksimal)

Sikap setuju : (median x < kuartil 3)

Sikap tidak setuju : (kuartil 1 x < median)

Sikap sangat tidak setuju : (skor minimal x kuartil

1)

Page 363: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

352 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

c. Kelebihan skala likert:

1) Dalam menyusun skala, item-item yang tidak jelas

korelasinya masih dapat dimasukkan dalam skala.

2) Lebih mudah membuatnya dari pada skala

thurstone.

3) Mempunyai reliabilitas yang relatif tinggi dibanding

skala thurstone untuk jumlah item yang sama. Juga

dapat memperlihatkan item yang dinyatakan dalam

beberapa responsi alternatif.

4) Dapat memberikan keterangan yang lebih nyata

tentang pendapatan atau sikap responden.

d. Kelemahan skala likert:

1) Hanya dapat mengurutkan individu dalam skala,

tetapi tidak dapat membandingkan berapakali

individu lebih baik dari individu lainya.

2) Kadang kala total skor dari individu tidak

memberikan arti yang jelas, banyak pola responsi

terhadap beberapa item akan memberikan skor

yang sama.

3) Validitas dari skala likert masih memerlukan

penelitian empirik.

2. Skala Semantik Diferensial Teknik Pengukuran semantik differensial

idiperkenalkan oleh Charles Osgood (1957) yang

menekankan pada aspek semantik sebuah kata. Skala ini

merupakan salah satu teknik self report untuk pengukuran

sikap dimana subjek diminta memilih satu kata sifat atau

Page 364: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

353 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

frase dari sekelompok pasangan kata sifat atau pasangan

frase yang disediakan yang paling mampu menggambarkan

perasaan mereka terhadap suatu objek. Teknik semantik

differensial merupakan penyempurnaan dari skala Likert

yang tidak mampu menjangkau respon yang bersifat

multidimensi, misalnya sikap terhadap standar nilai UAN

Skala Diferensiasi Semantik memiliki dua kelebihan

dibandingkan dengan berbagai teknik yang lain. Pertama,

teknik ini dapat digunakan dalam berbagai bidang. Kedua,

teknik ini sederhana dan mudah diimplementasikan dalam

pengukuran dan penilaian sikap, termasuk dalam

pengukuran dan penilaian sikap siswa di kelas.

a.Langkah-langkah pengembangan

Langkah-langkah pengembangan skala Diferensial

Semantik ini adalah sebagai berikut.

1) Menentukan objek sikap yang akan dikembangkan

skalanya, misalnya "Sikap terhadap Mata Pelajaran

Fisika".

2) Memilih dan membuat daftar dari konsep dan kata

sifat yang relevan dengan objek penilaian sikap.

Misalnya: menarik; penting; menyenangkan; mudah

dipelajari; dan sebagainya.

3) Memilih kata sifat yang tepat dan akan digunakan

dalam skala.

4) Menentukan rentang skala pasangan bipolar dan

penskorannya.

b. Penskoran dan interpretasi

Page 365: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

354 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Penskoran untuk skala ini dapat dilakukan dalam

rentang 1 sampai dengan 7. Arah paling kiri adalah paling

besar, yakni diskor 7, karena menunjukkan sikap paling

positif terhadap objek sikap, mata pelajaran Fisika. Arah

paling kanan adalah paling kecil, karena menunjukkan

sikap paling negatif terhadap mata pelajaran tersebut.

Andaikan jumlah pernyataan sikap ada 5 maka:

Skor maksimum adalah: 5 x 7 = 35

Skor minimum adalah: 1 x 7 = 7

Jika siswa memperoleh skor semakin mendekati

angka 7 (skor terendah), dapat diinterpretasikan semakin

negatif sikap siswa terhadap mata pelajaran Fisika.

Sebaliknya, jika siswa memperoleh skor semakin

mendekati angka 35 (skor tertinggi), dapat

diinterpretasikan semakin positif sikap siswa terhadap

mata pelajaran Fisika.

Jika siswa memilih sikap netral terhadap mata

pelajaran Fisika, siswa akan memberi tanda cek pada

interval skala tengah. Pada interval skala ini skor yang

diberikan adalah 3. Dengan demikian, apabila siswa

memilih sikap netral untuk semua pernyataan sikap

(andaikan jumlah pernyataan sikap ada 5), maka siswa

akan memperoleh skor 15. Dengan demikian skor yang

diperoleh siswa dengan skala tersebut dapat

diinterpretasikan sebagai berikut.

Page 366: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

355 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Skor 15 = Sikap siswa adalah netral.

Skor > 15 = Sikap siswa adalah positif.

Skor < 15 = Sikap siswa adalah negatif.

3. Skala Thrustone Skala Thurstone, skala ini mula-mula dikembangkan

oleh L.L Thurstone dari metoda psikofisikal yang bertujuan

untuk mengurutkan responden berdasarkan ciri atau

kriteria tertentu. Skala Thurstone, digunakan untuk

mengukur tentang sikap, persepsi seseorang atau

sekelompok orang tentang fenomena tertentu yang ingin

diketahui. Skala Thurstone memuat jumlah pernyataan

yang harus dipilih oleh responden, yang masing-masing

telah diberi skor (bobot) tertentu.

a. Langkah-langkah penyusunan

1) Pembuat skala menyusun

sebanyak-banyaknya pernyataan yang

berhubungan dengan masalah yang

dinilai ,kira-kira 100-300 butir.

2) Pernyataan yang disajikan

dengan menggunakan skala Thurstone

ini biasanya dibuat sebanyak 9 atau 11

butir.

3) Misalkan pembuat skala menentukan bahwa skor yang

akan dipakai untuk pernyataan yang kontribusinya

Gambar 15. 3. L.L Thurstone

Page 367: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

356 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

paling tinggi adalah 9 dan untuk yang paling rendah

diberi skor 1, sehingga skor tengahnya sama dengan 5

4) Berdasarkan hasil pertimbangannya, ia menetapkan

bahwa pernyataan yang paling tinggi kontribusinya

terhadap sikap positif (misalnya terhadap Fisika) adalah

pernyataan nomor 2 sehingga ia memberi bobot skor 9.

5) Agar hasil pertimbangan itu lebih objektif, ia meminta

bantuan kepada teman seprofesinya yang dianggap

mampu atau lebih mampu daripada dirinya sendiri.

Misalkan ada 4 orang yang diminta pertimbangan itu,

hasil pertimbangan untuk butir nomor 2 dari keempat

orang itu masing-masing 8, 8, 9 dan 9. Dengan demikian

skor untuk butir soal nomor 2 itu adalah

=

8,6

6) Untuk butir nomor 8 pembuat skala memberi skor 2

karena ia menganggap kontribusinya rendah terhadap

sikap siswa Keempat teman lainnya masing-masing

memberi skor 3, 4, 1, 2 sehingga skor untuk butir nomor

8 adalah

= 2,4

Begitulah seterusnya cara pemberian skor untuk setiap

butir pernyataan.

7) Misalkan skor untuk setiap butir soal, berturut-turut

dari butir soal nomor 1

sampai dengan nomor 9 adalah sebagai berikut :

9,0; 8,6; 8,2; 7,6; 4,5; 6,0; 7,6; 2,4; 4,0; 5,3

Setelah skala diberikan kepada responden (siswa),

misalkan Eva memilih butir-butir nomor 1, 4, 6, 7 dan

10. Rerata skor dari Eva adalah

9,0 + 7,6 + 6,0 + 7,6 + 5,3 = 7,1

Page 368: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

357 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

8) Ini berarti sikap Eva terhadap fisika positif, karena

skornya lebih dari skor tengah (= 5).

4. Skala Guttman

Skala Guttman dikembangkan

oleh Louis Guttman. Skala ini

mempunyai ciri penting, yaitu (1)

merupakan skala kumulatif, artinya jika

seseorang mengiakan pernyataan yang

berbobot lebih berat, maka ia juga akan

mengiakan pernyataan yang kurang

berbobot lainnya, (2) dan mengukur

satu dimensi saja dari satu variabel yang multi dimensi,

sehingga skala ini termasuk mempunyai sifat

undimensional.

Skala Guttman ialah skala yang digunakan untuk

jawaban yang bersifat jelas (tegas dan konsisten. Misalnya

yakin-tidak yakin ;ya – tidak; benar-salah; positif – negatif;

pernah-belum pernah ; setuju – tidak setuju; dan

sebagainya.

Pengukuran dengan menggunakan skala Guttman

apabila ingin mendapatkan jawaban jelas (tegas) dan

konsisten terhadap suatu permasalahan yang ditanyakan.

Contoh:

a. Yakin atau tidakkah anda, pergantian Kurikulum

akan dapat meningkatkan mutu pendidikan ?

Gambar 15.4. Louis Guttman

Page 369: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

358 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

1. Yakin

2. Tidak

b. Pernahkah atasan saudara mengajak rembuk

bersama?

1. Pernah

2. Tidak Pernah

Skala Guttman yang disebut juga metode scalogram

atau analisa skala (scale analysis) sangat baik untuk

menyakinkan peneliti tentang kesatuan dimensi dari sikap

atau sifat yang diteliti, yang sering disebut isi universal

(universe of content) atau atribut universal (universe

attribute). Dalam prosedur Guttman, suatu atribut

universal mempunyai dimensi satu jika menghasilkan

suatu skala kumulatif yang sempurna,yaitu semua responsi

diatur sebagai berikut (Nazir,1983):

Pernyataan-pernyataan dalam skala Guttman

disusun sedemikian rupa hingga jika responden menjawab

YA pada butir pernyataan nomor 1, 2, dan 3 kemudian

menjawab TIDAK pada butir nomor 4, untuk butir

berikutnya ia menjawab TIDAK. Jadi diharapkan responden

menjawab YA pada butir-butir awal, sekali ia menjawab

TIDAK pada suatu butir pernyataan maka ia akan

menjawab TIDAK pada butir selanjutnya. Dengan demikian

penilaian cukup dengan mempertimbangkan atau

menghitung batas jawaban YA yang diberikan responden.

Interpretasi untuk menentukan sikap responden bisa

dilakukan dengan cara menghitung persentase banyaknya

jawaban YA dari seluruh butir pernyataan yang disajikan.

Page 370: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

359 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

YA TIDAK

Skor

4

3

2

1

0

4 3 2

1

x x x

x

x x

x

x

x

x

4 3 2 1

x

x x

x x x

x x x x

a. Langkah-langkah penyusunan

1. Susunlah sejumlah pertanyaan yang relevan dengan

masalah yang ingin diselidiki.

2. Lakukan penelitiaan permulaan pada sejumlah

responden dari populasi yang akan diselidiki,

sampel yang diselidiki minimal besarnya 50.

3. Jawaban yang diperoleh dianalisis, dan jawaban

yang ekstrim dibuang. Jawaban yang ekstrim adalah

jawaban yang disetujui atau tidak disetujui oleh

lebih dari 80% responden.

4. Susunlah jawaban pada tabel Guttman.

5. Hitunglah koefisien reprodusibilitas dan koefisien

skalabilitas.

Page 371: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

360 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Koefisien Reprodusibilitas, yang mengukur derajat

ketepatan alat ukur yang telah dibuat (yaitu daftar

pertanyaan) dihitung dengan menggunakan rumus:

Kr = 1-

dengan:

n = total kemungkinan jawaban, yaitu jumlah

pertanyaan x jumlah responden.

e = jumlah error.

Kr = koefisien reprodusibilitas

Sedangkan Koefisien Skalabilitas ditentukan dengan rumus

Ks 1-

dengan:

e = jumlah error.

P = jumlah kesalahan yang diharapkan.

Ks = koefisien skalabilitas.

b . Kelemahan Skala Guttman, yaitu:

1. Skala ini bisa jadi tidak mungkin menjadi dasar yang

efektif baik intuk mengukur sikap terhadap objek yang

kompleks atau pun untuk membuat prediksi tentang

perilaku objek tersebut.

2. Satu skala bisa saja mempunyai dimensi tunggal untuk

satu kelompok tetapi ganda untuk kelompok lain,

ataupun berdimensi satu untuk satu waktu dan

mempunyai dimensi ganda untuk waktu yang lain.

Page 372: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

361 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

B. Pengukuran dan Penilaian Sikap 1.Pengertian Sikap

Edward (1957) mengemukakan “Attitude as the

degree of positive or negative affect associated with some

psychological object “Artinya Sikap adalah afeksi positif

atau negatif yang berhubungan dengan beberapa objek

psikologis. Menurut Thrustone (1970) Sikap adalah

penilaian tentang suka atau tidak suka, tanggapan

positif/negatif terhadap suatu objek psikologis. Anastasi

(Depdiknas, 2007) mendefinisikan sikap sebagai

kecenderungan untuk bertindak secara suka atau tidak

suka terhadap sesuatu objek. Sedangkan menurut Birrent,

et all (1981) mendefinisikan sikap sebagai kumpulan hasil

evaluasi seseorang terhadap objek, orang, atau masalah

tertentu. Jadi sikap adalah suatu bentuk dari perasaan,

yaitu perasaan mendukung atau memihak (favourable)

maupun perasaan tidak mendukung (Unfavourable) pada

suatu objek. Sikap belum merupakan tindakan/aktivitas,

melainkan berupa kecenderungan (tendency) atau

predisposisi tingkah laku. Sikap lebih merupakan

”stereotype” seseorang. Melalui sikap seseorang, kita dapat

mengenal siapa orang itu yang sebenarnya.

Menurut Mouly (1967) sikap memiliki tiga

komponen yaitu (1). Komponen afektif- kehidupan

emosional individu, yakni perasaan tertentu (positif atau

negatif) yang mempengaruhi penerimaan atau penolakan

terhadap objek sikap, sehingga timbul rasa senang-tidak

senang, takun-tidak takut. (2) Komponen kognitif yaitu

aspek intelektual yang berhubungan dengan bilief, idea

Page 373: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

362 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

atau konsep terhadap objek sikap, dan (3). Komponen

behavioral, yakni kecenderungan individu untuk

bertingkah laku tententu terhadap objek sikap.

Menurut Mar’at (1984): (1) Komponen kognisi

berhubungan dengan belief (kepercayaan atau keyakinan),

ide, konsep, persepsi, stereotipe, opini yang dimiliki

individu mengenai sesuatu. (2) Komponen Afeksi

berhubungan dengan kehidupan emosional seseorang,

menyangkut perasaan individu terhadap objek sikap dan

menyangkut masalah emosi, dan (3) Komponen Kognisi

yang merupakan kecenderungan bertingkah laku .

Sikap adalah salah satu tipe karakteristik afektif

yang penting. Tipe karakteristik penting lainnya yaitu :

minat, konsep diri, nilai, dan moral.

2. Sikap dan Objek Sikap yang Perlu Dinilai

Penilaian sikap dalam berbagai mata pelajaran

secara umum dapat dilkakukan dalam berkaitan dengan

berbagai objek sikap sebagai berikut.

a) Sikap terhadap mata pelajaran. Siswa perlu

memiliki sikap positif terhadap mata pelajaran.

Dengan sikap positif dalam diri siswa akan tumbuh

dan berkembang minat belajar, akan lebih mudah

diberi motivasi, dan akan lebih mudah menyerap

materi pelajaran yang diajarkan. Oleh karena itu,

guru perlu menilai tentang sikap siswa terhadap

mata pelajaran yang diajarkannya.

b) Sikap terhadap guru mata pelajaran. Siswa perlu

memiliki sikap positif terhadap guru, yang mengajar

Page 374: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

363 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

suatu mata pelajaran. Siswa yang tidak memiliki

sikap positif terhadap guru, akan cenderung

mengabaikan halhal yang diajarkan. Dengan

demikian, siswa yang memiliki sikap negatif

terhadap guru pengajar akan sukar menyerap

materi pelajaran yang diajarkan oleh guru tersebut.

c) Sikap terhadap proses pembelajaran. Siswa juga

perlu memiliki sikap positif terhadap proses

pembelajaran yang berlangsung. Proses

pembelajaran disini mencakup: suasana

pembelajaran, strategi, metodologi, dan teknik

pembelajaran yang digunakan. Tidak sedikit siswa

yang merasa kecewa atau tidak puas dengan proses

pembelajaran yang berlangsung, namun mereka

tidak mempunyai keberanian untuk menyatakan.

Akibatnya mereka terpaksa mengikuti proses

pembelajaran yang berlangsung dengan perasaan

yang kurang nyaman. Hal ini dapat mempengaruhi

terhadap penyerapan materi pelajarannya.

d) Sikap terhadap materi dari pokok-pokok

bahasan. Siswa juga perlus memiliki sikap positif

terhadap materi pelajaran yang diajarkan, sebagai

kunci keberhasilan proses pembelajaran.

C. Metode Pengukuran Sikap Menurut Zakaria (2008), pengukuran sikap dapat

dilakukan dengan beberapa cara. Cara-cara tersebut antara

Page 375: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

364 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

lain: observasi perilaku, pertanyaan langsung, laporan

pribadi, dan penggunaan skala sikap.

1. Observasi perilaku

Observasi merupakan teknik penilaian yang

dilakukan secara berkesinambungan dengan menggunakan

indera, baik secara langsung maupun tidak langsung

dengan menggunakan pedoman observasi yang berisi

sejumlah indikator perilaku yang diamati. Observasi

langsung dilaksanakan oleh guru secara langsung tanpa

perantara orang lain. Sedangkan observasi tidak langsung

dengan bantuan orang lain, seperti guru lain, orang tua,

siswa, dan karyawan sekolah. Oleh karena itu guru dapat

melakukan observasi terhadap siswa, bisa menggunakan

daftar cek (checklists), kemudian hasil observasi dapat

dijadikan sebagai umpan balik dalam pembinaan.

Observasi dilakukan dengan menggunakan buku catatan

Bentuk instrumen yang digunakan untuk observasi

adalah pedoman observasi yang berupa daftar cek atau

skala penilaian (rating scale) yang disertai rubrik. Daftar

cek digunakan untuk mengamati ada tidaknya suatu sikap

atau perilaku. Sedangkan skala penilaian menentukan

posisi sikap atau perilaku siswa dalam suatu rentangan

sikap. Observasi perilaku di Sekolah dapat dilakukan

dengan Buku Catatan Harian.

Page 376: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

365 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Contoh : Buku Catatan Harian dapat berisi sebagai

berikut :

No Hari/tanggal Nama

Siswa

Kejadian

(positif/negatif)

Tindak

Lanjut

2. Pertanyaan langsung

Guru juga dapat menanyakan secara langsung

tentang sikap siswa berkaitan dengan sesuatu hal.

Berdasarkan jawaban dan reaksi lain dari siswa dalam

memberi jawaban dapat dipahami sikapnya terhadap objek

sikap tersebut.

Jika guru ingin mengetahui sikap siswa terhadap

materi pelajaran yang diampunya dengan cara

menanyakan langsung, maka guru tersebut dapat

menggunakan instrumen penilaian sikap seperti berikut

3. Laporan pribadi

Penggunaan teknik ini di sekolah, misalnya: siswa

diminta membuat ulasan yang berisi pandangan atau

tanggapannya tentang suatu masalah, keadaan, atau hal,

yang menjadi objek sikap. Dari ulasan yang dibuat oleh

Page 377: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

366 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

siswa tersebut dapat dibaca dan pahami kecenderungan

sikap yang dimilikinya.

4. Skala Sikap

Menggunakan skala-skala sikap sebagaimana yang

telah diuraikan di atas, kita dapat menilai sikap siswa. Kita

boleh menggunakan skala Likert atau skala diferensial

semantik. Yang perlu diperhatikan adalah konstruksi butir-

butirnya harus berpedoman pada indikator dari variabel

yang ingin dinilai. Sebagai contoh di bawah, ingin dinilai

sikap siswa terhadap pelajaran fisika.

Contoh sikap siswa terhadap pelajaran fisika

a) Menggunakan skala Likert

No Sikap siswa STS TS R S SS

1 Pelajaran fisika

bermanfaat

2 Pelajaran fisika sulit

3 Tidak semua siswa

harus

Belajar fisika

4 Pelajaran fisika

harus dibuat mudah

5 Harus banyak

latihan pada

Pelajaran fisika

Page 378: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

367 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

b) Menggunakan skala Semantik Differensial

Menarik !------!------!------!-------!------! -------!-------! Membosankan

Bermanfaat !------!------!-------! ------!-------! -------! -------! Sia-sia

Banyak !------!------!-------! -------!------!-------! -------! Banyak

Pemahaman Hafalan

Mudah !-------!------!------! ------!-------!-------! -------! Sukar

Page 379: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

368 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 380: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

369 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 16 PENGEMBANGAN I

NSTRUMEN AFEKTIF A. Prosedur Pengembangan Instrumen

Gable (1986) memberikan secara garis besar 15

langkah kerja yang harus ditempuh dalam

mengembangkan instrumen, yaitu sebagai berikut: (1)

mengembangkan definisi konseptual, (2)

mengembang- kan definisi operasional, (3) memilih

teknik pemberian skala, (4) melakukan review

justifikasi butir, yang berkaitan dengan teknik pemberian

skala yang telah ditetapkan, (5) memilih format respons

atau ukuran sampel, (6) penyusunan petunjuk untuk

respons, (7) menyiapkan draf instrumen, (8)

menyiapkan instrumen akhir, (9) pengumpulan data

ujicoba awal, (10) analisis data ujicoba dengan

Page 381: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

370 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

menggunakan teknik analisis faktor, analisis butir dan

reliabilitas, (11) revisi instrumen, (2) melakukan ujicoba

final, (13) menghasilkan instrumen, (14) melakukan

analisis validitas dan reliabilitas tambahan, dan (15)

menyiapkan manual tes.

Menurut Djaali dan Muljono (2008) langkah-

langkah pengem- bangan instrumen adalah sebagai

berikut: (1) merumuskan konstruk berdasarkan sintesis

dari teori-teori yang dikaji, (2) dari konstruk

dikembangkan dimensi dan indikator variabel yang

hendak diukur, (3) membuat kisi-kisi instrumen dalam

bentuk tabel spesifikasi yang memuat dimensi, indikator,

nomor butir dan jumlah butir, (4) menetapkan besaran

atau parameter dalam suatu rentangan kontinum,

(5) menulis butir-butir instrumen dalam bentuk

pernyataan atau pertanyaan, (6) melakukan proses

validasi, (7) melakukan validasi teoritik, (8) merevisi

berdasarkan hasil panel, (9) melakukan penggandaan

instrumen untuk ujicoba, (10) ujicoba di lapangan

yang merupakan validasi empirik, (11) pengujian validitas

empiris dengan menggunakan kriteria internal

maupun eksternal, (12) berdasarkan kriteria diperoleh

kesimpulan mengenai valid atau tidaknya sebuah butir

atau perangkat instrumen, (13) berdasarkan hasil analisis

butir, butir-butir yang tidak valid dikeluarkan atau

diperbaiki, butir-butir yang valid dirakit kembali, (14)

menghitung koefisien reliabilitas, dan (15) perakitan

kembali butir-butir instrumen yang valid untuk

dijadikan instrumen.

Page 382: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

371 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Dari uraian di atas dapat diimpulkan bahwa dalam

upaya pengembangan instrumen, pertama-tama harus

ditetapkan konstruk variabel yang merupakan sintesis

dari teori-teori yang telah dibahas dan dianalisis.

Kemudian konstruk tersebut dijelaskan dalam

definisi konseptual dan definisi operasional yang

mencakup dimensi/sub dimensi dan indikator dari

variabel yang hendak diukur. Baru kemudian dibuat kisi-

kisi instrumen dan butir-butir instrumen untuk mengukur

indikator-indikator yang telah ditetapkan.

Alur tahapan penyusunan dan pengembangan

instrumen tersebut dapat dilihat pada gambar 16.1

berikut.

Gambar 16.1. Alur Penyusunan dan Pengembangan Instrumen

Variabel

Konstruk

Teori

Definisi Operasional

Definisi Konseptual

Penetapan Instrumen

Analisis Hasil Ujicoba

Perbanyakan Instrumen

Ujicoba Instrumen

Penulisan Butir

Kisi-Kisi Instrumen

Finalisasi

Revisi Instrumen

Page 383: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

372 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

B. Penulisan Butir Instrumen

Terkait dengan penulisannya, Edwards (1957)

memberikan kriteria informal yang dapat digunakan dalam

penulisan pernyataan sikap, adalah sebagai berikut:

(1) menghindari menulis pernyataan yang membicarakan

kejadian yang telah lewat kecuali kalau objek sikapnya

berkaitan dengam masa lalu, (2) menghindari menulis

pernyataan yang berupa fakta atau dapat ditafsirkan

sebagai fakta, (3) menghindari menulis pernyataan yang

dapat menimbulkan lebih dari satu penafsiran, (4)

menghindari menulis pernyataan yang tidak relevan

dengan objek psikologisnya, (5) menghindari menulis

pernyataan yang sangat besar kemungkinannya akan

disetujui oleh hampir semua orang atau hampir tak

seorangpun yang akan menyetujuinya, (6) memilih

pernyataan-pernyataan yang diperkirakan akan mencakup

keseluruhan liputan skala afektif yang diinginkan, (7)

mengusahakan agar setiap pernyataan ditulis dalam

bahasa yang sederhana, jelas, dan langsung, (8) pernyataan

sebaiknya pendek, tidak melebihi dari 20 kata, (9) setiap

pernyataan harus berisi hanya satu ide yang lengkap,

(10) pernyataan yang berisi unsur universal seperti “tidak

pernah, “semuanya”, “selalu”,”tak seorangpun, dan tak

pernah, seringkali menimbulkan penafsiran yang

berbeda-beda, karenanya sedapat mungkin dihindari, (11)

kata-kata seperti “hanya”, “sekedar”, “semata-mata”

dan sejenisnya harus digunakan seperlunya saja, (12)

jika memungkinkan, pernyataan sebaiknya menggunakan

bentuk kalimat sederhana, bukan kalimat umum dan

Page 384: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

373 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

komplek, (13) menghindari kata atau istilah yang

berkemungkinan tidak dimengerti oleh para responden,

(14) menghindari pernyataan yang berisi kata negatif

ganda.

Page 385: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

374 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 386: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

375 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

BAB 17 CONTOH PENGEMBANGAN

INSTRUMEN: KINERJA GURU

A.Instrumen Kinerja Guru Misakan kita ingin mengembangkan instrumen untuk

mengukur kinerja guru, jadi variable disini adalah kinerja

guru. Berdasarkan teori pengembangan pada BAB 16 di

atas, maka langkah pertama adalah membaca sejumlah

literatur untuk mengetahui apa itu kinerja guru, dan apa

indicator-indikatornya.

1. Mencari pengertian kinerja guru dan indikatornya.

Misalkan Rowland (1960) mengemukakan bahwa

kinerja merupakan terjemahan dari kata performance yang

berarti tindakan untuk melakukan suatu pekerjaan.

Page 387: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

376 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Whitmore (1997) mengemukakan pengertian kinerja

sebagai suatu perbuatan, suatu prestasi atau apa yang

diperlihatkan seseorang melalui keterampilannya yang

nyata. Dan Lase (2003) mengemukakan definisi

konseptual kinerja sebagai penilaian seseorang tentang

potensi dan tingkat pemenuhan kerja yang terdiri dari

perbuatan, prestasi, keterampilan di depan umum,

kompetensi, dan juga tuntutan mengemban

tanggungjawab.

Pandangan lain seperti yang dikemukakan King

(1984) menyatakan bahwa kinerja adalah aktivitas

seseorang melaksanakan tugas pokok yang dibebankan

kepadanya. Mengacu pada pandangan ini, dapat

diinterpretasikan bahwa kinerja seseorang dihubungkan

dengan tugas-tugas rutin yang dikerjakannya. Sebagai

guru, misalnya tugas rutinnya adalah mengajar. Hasil yang

dicapai secara optimal dari tugas tersebut merupakan

kinerja guru.

Shackelford dan Henak dalam Soekartawi (1995)

memberikan sepuluh kriteria dalam upaya mendefinisikan

ciri-ciri pengajar yang efektif, yaitu (a) mempunyai

intusiastik, (b) mempunyai keterampilan berkomunikasi,

(c) dapat menjelaskan persoalan atau topik secara jelas, (d)

menguasai bahan ajar, (e) mampu membuat suasana kelas

menjadi hidup, (f) fleksibel, (g) memberikan bahan ajar

terorganisasi secara rapi sesuai dengan silabus, (h) adil

dalam memberi nilai, (i) mau menerima umpan balik, dan

(j) akrab dengan situasi kelas.

Menurut Riyanto (2003) komponen-komponen

mengajar adalah meliputi (1) tujuan, (2) bahan, (3)

Page 388: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

377 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

metode, (4) guru, (5) siswa, (6) fasilitas, (7) interaksi, dan

(8) evaluasi. Sumiyati (2005) mengemukakan bahwa

kinerja guru adalah aktivitas guru dalam melaksanakan

pembelajaran dan yang dapat diamati oleh siswa yang

mencakup: (1) pengelolaan kelas, (2) kualitas personal, (3)

hubungan guru siswa, (4) teknik mengajar, dan (5)

perilaku. Selanjutnya masih terkait dengan proses belajar

mengajar, Mcbeath (1992) mengemukakan bahwa dalam

menyiapkan pembelajaran guru harus: (1) memilih materi,

(2) mengorganisir materi, (3) memilih contoh-contoh

dan sumber-sumber, (4) menyeleksi format penyajian, (5)

membuat kondisi untuk kesuksesan pembelajaran, (6)

melakukan evaluasi keefektifan pembelajaran, (7)

membuat ringkasan, dan (8) memberikan tugas.

Guru adalah sebuah jabatan yang mempunyai tugas

pokok mendidik, mengajar dan melatih. Mendidik berarti

meneruskan dan mengembangkan nilai-nilai hidup,

mengajar berarti meneruskan dan mengembangkan

pemahaman siswa terhadap ilmu pengetahuan dan

teknologi, sedangkan melatih berarti mengembangkan

keterampilan-keterampilan pada siswa. Kinerja guru

adalah kemampuan guru untuk menampilkan atau

mengerjakan tugas guru. Berdasarkan uraian dalam kajian

pustaka di atas, maka dapat disimpulkan bahwa enam

indikator kinerja guru di dalam kelas. Keenam indikator

tersebut masing-masing yaitu: (1) Strategi Pembelajaran,

(2) Penguasaan Materi, (3) Pengelolaan Kelas, (4)

Komunikasi dengan Siswa, (5) Teknik Mengajar, dan (6)

Penilaian Hasil Belajar Siswa.

Page 389: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

378 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

2. Konstruk Instrumen

Konstruk kinerja adalah variabel yang merupakan

sintesis dari teori-teori kinerja yang telah dibahas di atas.

Konstruk tersebut dijelaskan dalam definisi konseptual dan

definisi operasional yang di dalamnya tercakup dimensi,

dan indikator dari variabel kinerja guru yang hendak

diukur.

Definisi Konseptual kinerja guru

Kinerja guru adalah capaian yang diperoleh guru

dalam melaksanakan tugas profesinya sebagai pengajar

yang meliputi antara lain: (1) Strategi Pembelajaran, (2)

Penguasaan Materi, (3) Pengelolaan Kelas, (4) Komunikasi

dengan Siswa, (5) Teknik Mengajar, dan (6) Penilaian Hasil

Belajar Siswa.

Definisi Operasional kinerja guru

Kinerja ukuran satuan kinerja yang dinyatakan

dalam skor yang diperoleh guru atas pelaksanaan tugas

profesinya sebagai pengajar yang ditunjukkan melalui

kegiatan antara lain (1) Strategi Pembelajaran, (2)

Penguasaan Materi, (3) Pengelolaan Kelas, (4) Komunikasi

dengan Siswa, (5) Teknik Mengajar, dan (6) Penilaian Hasil

Belajar Siswa yang diukur berdasarkan penilaian oleh

siswa

.

Pengembangan Dimensi dan Indikator

a. Pengembangan Dimensi (kalau ada)

Dari variabel kinerja guru yang diukur tercakup di

dalamnya dimensi

Page 390: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

379 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

(tidak ada) dan indikator-indikator.

b. Pengembangan Indikator

Adapun indikator yang dikembangkan adalah: (1)

Strategi Pembelajaran, (2) Penguasaan Materi, (3)

Pengelolaan Kelas, (4) Komunikasi dengan Siswa, (5)

Teknik Mengajar, dan (6) Penilaian Hasil Belajar Siswa.

Penetapan Instrumen

Kita misalkan untuk mengembangkan instrument kinerja

guru ini digunakan skala semantic diferensial

Kisi-Kisi Instrumen

Rancangan awal kisi-kisi dan penyebaran nomor

butir instrumen penilaian kinerja guru adalah seperti

terlihat pada Tabel 17. 1 berikut.

Tabel 17.1 Kisi-Kisi Instrumen Penilaian Kinerja Guru

Variabel Indikator No.Butir Jlh.Butir Kinerja

Guru 1. Strategi Pembelajaran

1, 2, 3, 4, 5, 6, 7,8, 9

9

2.Penguasaan Materi

10, 11, 12, 13, 14, 15, 16, 17, 18,

9

3.Pengelolaan Kelas

19, 20, 21, 22, 23, 24, 25, 26, 27,

28, 29

11

4.Komunikasi Guru dengan Siswa

30, 31, 32, 33, 34, 35,

6

Page 391: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

380 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

5.Teknik Mengajar

36, 37, 38, 39, 40, 41,

42

7

6.Penilaian hasil belajar siswa

43, 44, 45, 46, 47

5

Jumlah 47

3. Penulisan Butir

Butir instrumen dibuat untuk setiap indikator.

Setiap indikator dikembangkan menjadi beberapa butir

pernyataan. Dari enam indikator dikembangkan sebanyak

47 butir pernyataan, dengan rincian sebagai berikut. Untuk

indikator strategi pembelajaran ada 9 butir, indikator

penguasaan materi 9 butir, indikator pengelolaan kelas 11

butir, komunikasi dengan siswa 6 butir, teknik mengajar

ada 7 butir, dan indikator penilaian hasil belajar siswa ada

5 butir. Adapun rincian butir-butir instrumen penilaian

kinerja guru.

Indikator: Strategi Pembelajaran

1. Guru mengaitkan materi pembelajaran dengan

realita kehidupan

2. Guru memberikan aplikasi konsep pada

perkembangan kehidupan

3. Dalam mengajar, guru mengaitkan hubungan materi

yang satu dengan materi yang lainnya

4. Guru mengawali pelajaran dengan hal-hal yang

menarik

Page 392: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

381 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

5. Guru mengajukan pertanyaan kepada siswa pada

waktu memulai kegiatan pembelajaran

6. Guru mengecek apakah siswa membawa buku

pelajaran atau tidak pada waktu kegiatan

pembelajaran

7. Guru mengulangi pertanyaan kepada siswa yang

tidak dapat menjawab pertanyaan sebelumnya

8. Guru menggunakan metode pembelajaran yang

bervariasi

9. Prosedur penilaian guru diberitahukan kepada

semua siswa

Indikator Penguasaan Materi

1. Guru menjelaskan pentingnya suatu topik bahasan

pada awal mengajar

2. Guru menjelaskan pokok - pokok bahasan yang

harus dipelajari siswa

3. Guru menjelaskan materi pelajaran dengan lancar

4. Materi yang disajikan guru dapat /mudah dipahami

siswa

5. Guru dapat menjawab pertanyaan-pertanyaan

siswa

6. Guru menjelaskan materi pelajaran secara

berurutan

7. Guru mengulangi materi pelajaran yang kurang

dipahami siswa

8. Di dalam menyajikan materi pelajaran guru

memberikan contoh serta aplikasi yang memadai

9. Guru merangkum materi pelajaran sebelum

kegiatan pembelajaran

Page 393: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

382 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

berakhir

Indikator Pengelolaan Kelas

1. Guru memiliki kesiapan dalam menyajikan materi

pelajaran

2. Guru terbuka terhadap pendapat siswa yang

bersumber dari buku/sumber lain

3. Guru memberi respon terhadap pertanyaan siswa

4. Guru memperhatikan tanggapansiswa terhadap

materi yang disampaikan dalam pembelajaran

5. Guru memberi perhatian secara merata kepada

semua siswa

6. Guru tanggap terhadap masalah yang dihadapi oleh

siswa pada saat berlangsung proses belajar

mengajar

7. Guru mengakhiri pembelajarannya sesuai dengan

waktu yang telah ditentukan

8. Guru bersikap ramah terhadap setiap siswa

9. Guru peduli terhadap siswa yang mengalami

kesulitan pada waktu kegiatan pembelajaran

berlangsung

10. Guru memperhatikan siswa pada waktu kegiatan

pembelajaran berlangsung

11. Guru menghargai gagasan siswa yang berkaitan

dengan usulan untuk menyelesaikan tugas-tugas

Page 394: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

383 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Indikator Komunikasi Guru dengan Siswa

1. Guru memperkuat penyajian materi dengan

memberikan tugas-tugas kepada siswa

2. Guru mengecek siswa apakah telah mengerjakan

tugas-tugas atau belum

3. Guru memberikan soal-soal PR/kuis sesuai dengan

materi pembelajaran yang disajikan

4. Guru mau menjawab pertanyaan - pertanyaan siswa

di luar jam mengajar

5. Guru memberikan balikan kepada siswa dengan

menyerahkan kembali hasil pemeriksaan jawaban

siswa

6. Guru memuji siswa yang dapat menjawab

pertanyaan dengan benar

Indikator Teknik Mengajar

1. Guru memberikan waktu yang cukup kepada siswa

untuk menjawab pertanyaan yang diajukannya.

2. Guru memberikan contoh yang cukup untuk

menanamkan pengertian dalam penjelasannya

3. Guru memberi catatan mengenai hal-hal yang

penting di papan tulis

4. Guru mengelompokkan siswa ke dalam kelompok

belajar untuk mendiskusikan materi

pelajarannya

5. Guru menggunakan metode diskusi pada pokok

bahasan yang menghendaki pemahaman yang

lebih mendalam.

Page 395: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

384 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

6. Guru mendorong siswa untuk menyatakan hal -hal

yang tidak jelas dari penyajian materi ajarnya

7. Guru mendorong siswa untuk berperan aktif

selama proses belajar mengajar

Indikator Penilaian Hasil Belajar Siswa

1. Guru mengumumkan hasil pekerjaan terbaik ketika

melakukan penilaian terhadap kegiatan kerja

kelompok

2. Guru memberitahukan hasil PR/ kuis/ tugas-tugas

siswa

3. Bentuk soal ujian yang dibuat guru hanya satu

macam saja

4. Selainujian melalui tes tertulis, guru juga memberi

ujian secara lisan

5. Guru memberi nilai kepada siswa hanya

berdasarkan hasil ujian saja

4. Uji coba pakar

Setelah draft instrumen selesai dibuat, dilakukan uji

kesesuaian konstruk secara teoritik. Uji ini dilakukan

dengan menanyakan kesesuaian antara butir-butir

pernyataan dengan indikator kinerja guru. Untuk kegiatan

penilaian ini diminta pada pakar-pakar evaluasi. Beberapa

komentar/masukan pakar yaitu: (a) butir 13: materi yang

disajikan guru dapat dipahami siswa, butir ini perlu dibuat

lebih jelas, (b) butir 15: sistematis itu hanya bisa

dijustifikasi oleh orang yang paham, kata sistematis diganti

saja dengan berurutan. Selanjutnya draf instrumen direvisi

Page 396: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

385 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

berdasarkan masukan-masukan dari pakar tersebut,

kemudian diperbanyak guna dilakukan ujicoba lapangan.

5. Uji coba lapangan

Pada pelaksanaan uji coba lapangan (empiris)

instrumen yang digunakan adalah instrumen yang telah

direvisi berdasarkan masukan pakar yang terdiri atas 47

butir pernyataan. Menurut Gabel (1986) jumlah reponden

uji coba instrumen non kognitif adalah: 5, 6, 7, 8, 9 , 10 kali

jumlah butir soal. Karenanya Instrumen ini diujicobakan

kepada 300-an siswa .

` Untuk ujicoba lapangan ini, maka instrumen sudah

dalam format yang lengkap dengan skalanya. Karena yang

digunakan adalah skala semantic dferensial, maka bentuk

instrumen ujicoba adalah seperti berikut

No

P e r n y a t a a n 1 2 3 4 5 6 7

Strategi

Pembelajaran

1

Guru mengaitkan materi pembelajaran dengan realita kehidupan

Tidak Pernah

Selalu

2

Guru memberikan aplikasi konsep pada perkembangan kehidupan

Tidak Pernah

Selalu

3 Dalam mengajar, guru mengaitkan hubungan materi

Tidak Pernah

Selalu

Page 397: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

386 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

yang satu dengan materi yang lainnya

4

Guru mengawali pelajaran dengan hal-hal yang menarik

Tidak Pernah

Selalu

5

Guru mengajukan pertanyaan kepada siswa pada waktu memulai kegiatan pembelajaran

Tidak Pernah

Selalu

6

Guru mengecek apakah siswa membawa buku pelajaran atau tidak pada waktu kegiatan pembelajaran

Tidak Pernah

Selalu

dan seterusnya

42

Guru mendorong siswa untuk berperan aktif selama proses belajar mengajar

Tidak Perna

h

Selalu

Penilaian Hasil Belajar Siswa

43

Guru mengumumkan hasil pekerjaan terbaik ketika melakukan penilaian terhadap kegiatan kerja

Tidak Perna

h

Selalu

Page 398: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

387 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

kelompok

44

Guru memberitahukan hasil PR/ kuis/ tugas-tugas siswa

Tidak Perna

h

Selalu

45

Bentuk soal ujian yang dibuat guru hanya satu macam saja

Tidak Perna

h

Selalu

46

Selain ujian melalui tes tertulis, guru juga memberi ujian secara lisan

Tidak Perna

h

Selalu

47

Guru memberi nilai kepada siswa hanya berdasarkan hasil ujian saja

Tidak Perna

h

Selalu

B. Analisis Hasil Ujicoba

Ada dua cara yang dilakukan untuk menguji

validitas konstruk instrumen afektif (non kognitif) yaitu

(1) korelasi butir dengan totalnya menggunakan rumus

korelasi product moment, dan (2) menggunakan teknik

analisis faktor dengan bantuan program SPSS. Pengujian

validitas konstruk instrumen kinerja guru ini

menggunakan teknik análisis faktor.

Page 399: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

388 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Analisis faktor adalah kajian tentang

kesalingtergantungan antara variabel-variabel, dengan tujuan

untuk menemukan himpunan variabel-variabel baru, yang lebih

sedikit jumlahnya dari pada variabel semula, dan menunjukkan

yang mana di antara variabel-variabel semula itu yang

merupakan faktor-faktor persekutuan (Suyanto, 1988). Adapun

langkah-langkah dalam analisis faktor menurut De Vaus

(Hidayati dan Listyani, 2010:89) adalah (1) memilih variabel

yang akan dianalisis, (2) ekstraksi awal seperangkat faktor, (3)

ekstraksi akhir seperangkat faktor dengan rotasi, dan (4)

menyusun skala untuk digunakan analisis lanjut.

Menurut Gorsuch (1995:82) tujuan penggunaan analisis

faktor yaitu meringkas saling hubungan antar variabel–variabel

yang ada, tetapi dengan arti yang tepat, sebagai suatu

penolong dalam membuat sejumlah pengertian. Metode

tersebut dilakukan dengan bantuan komputer untuk menilai

apakah butir-butir yang beragam dalam suatu survei memiliki

kebersamaan dalam suatu faktor atau skala (Litwin, 1995).

Untuk mengembangkan suatu tes yang sifatnya psikologis,

maka analisis faktor sangat relevan untuk menguji

kesahihan konstruk. Teknik ini dilakukan dengan cara

menganalisis butir-butir instrumen yang terdapat dalam

sejumlah faktor tertentu. Butir-butir yang memiliki unsur

kebersamaan (common factor) digabung menjadi suatu faktor

baru.

Sebagai uji persyaratan untuk menentukan ukuran

kecukupan sampel digunakan rumus Kaiser-Meyer-Olkin (KMO),

yang merupakan suatu indeks untuk membandingkan nilai

koefisien korelasi observasi dengan nilai koefisien korelasi

parsial (Norusis, 1993). Ukuran KMO menyatakan sesuai

tidaknya digunakan analisis faktor terhadap ubahan-ubahan

(butir-butir instrumen). Menurut Kaiser (1974) dalam Jae-On

Page 400: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

389 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Kim dan Charles W. Mueller (1978:54) jika nilai KMO 0,90

termasuk kategori sempurna, 0,80 termasuk baik, 0,70 termasuk

sedang, 0,60 termasuk cukup, 0,50 termasuk kurang, dan di

bawah 0,50 tidak dapat diterima. Jadi untuk dapat melakukan

analisis faktor, persyaratan pokok yang harus dipenuhi ialah

angka KMO Measure of Sampling Adequacy harus di atas 0,50.

Untuk menguji apakah matrik korelasi berasal dari

matrik identitas atau bukan digunakan Bartlett test of spherity (2 ) . Suatu ketentuan bahwa bila matrik korelasi merupakan

matrik identitas (matrik berdiagonal 1, sedang yang lainnya

0) maka tidak dapat digunakan analisis faktor, demikian

sebaliknya bila matrik korelasi bukan matrik identitas maka

dapat digunakan analisis faktor. Sarwono (2006)

mengemukakan jika probabilitas (sig) < 0,05 maka variabel

dapat dianalisis lebih lanjut, dan jika probabilitas (sig) > 0,05

maka variabel tidak dapat dianalisis lebih lanjut.

Banyaknya faktor ditetapkan berdasarkan aturan yang

dikemukakan oleh Jae-On Kim dan Charles W. Mueller (1985:56)

bahwa jumlah faktor diekstraksi harus sama dengan jumlah

faktor yang mempunyai variansi (eigen value) sama atau lebih

besar dari 1,0. Selanjutnya muatan faktor (factor loading)

diseleksi setelah melalui ekstraksi komponen utama dengan

rotasi orthogonal. Butir pernyataan yang akan dipertahankan

bila pada rotasi muatan faktor di atas 0,30, sesuai dengan

aturan bahwa muatan faktor yang lebih dari 0,30 cenderung

signifikan, dan kurang dari 0,30 tidak dapat memberikan

konstribusi yang signifikansi terhadap suatu faktor. Comrey

(1973) yang dikutip Barbara dan Linda S. Fidell menjelaskan

bahwa muatan faktor melebihi 0,71 dianggap istimewa, 0,63

sangat baik, 0,55 baik, 0,45 cukup, dan 0,32 kurang

(Tabachnick and Linda S, 1989).

Page 401: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

390 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Hasil pengujian validitas konstruk instrumen

dengan menggunakan analisis faktor, didapatkan nilai KMO

instrumen sebesar 0,908. Nilai ini lebih besar dari 0,50

berarti analisis faktor dapat dilanjutkan untuk

menganalisis data dalam bentuk matriks korelasi (Santoso,

2003). Di samping itu nilai Bartlett’s test of Sphericity

sebesar 7617,499 pada derajat kebebasan 948 dengan

taraf signifikansi 0,000 < 0,05), dengan demikian matriks

korelasi yang terbentuk bukan matriks identitas, jadi

analisis faktor bisa dilanjutkan.

Tabel 17.2. Hasil Analisis untuk KMO MSA

KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .908

Bartlett's Test of Sphericity

Approx. Chi-Square 7617.499

Df .948

Sig. .000

Pada Tabel Total Variance Explained dari 47 butir

yang dimasukkan dalam analisis faktor didapatkan nilai

akar karakteristik (eigen value) di atas 1 ( 1) ada

sebanyak 7 faktor. Hasil rotated component matrix yang

dilakukan 8 putaran atau iterasi, menunjukkan ada butir

yang melewati muatan faktor “ cut off point” lebih kecil dari

0,30 (< 0,30). Dari jumlah butir 47 yang dianalisis ada 6

butir yang muatan faktornya lebih kecil dari 0,30 sehingga

didrop. Butir-butir yang didrop yaitu butir-butir nomor: 2,

17, 19, 20, 22, dan 46, sehingga butir yang terpilih untuk

instrumen tinggal 41 butir. Distribusi butir yang tinggal

Page 402: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

391 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

hasil analisis yaitu Indikator Strategi Pembelajaran tinggal

8 butir, Penguasaan Materi tinggal 8 butir, Pengelolaan

Kelas tinggal 8 butir, Komunikasi Guru dengan Siswa

tinggal 6 butir, Teknik Mengajar tinggal 7 butir, dan

Penilaian Hasil Belajar Siswa tinggal 4 butir.

Butir yang terpilih untuk instrumen tinggal 41

butir. Distribusi butir hasil analisis yaitu:

Tabel 17.3. Distribusi Butir Instrumen Kinerja Guru

No Komponen Kinerja Guru Nomor Butir 1 Strategi Pembelajaran 1, 2, 3, 4, 5, 6, 7, 8 2 Penguasaan Materi 9, 10, 11, 12, 13, 14, 15, 16, 3 Pengelolaan Kelas 17, 18, 19, 20, 21, 22, 23,

24, 4 Komunikasi Guru dengan

Siswa 25, 26, 27, 28, 29, 30,

5 Teknik Mengajar 31, 32, 33, 34, 35, 36, 37, 6 Penilaian Hasil Belajar

Siswa 38, 39, 40, 41

Perhitungan reliabilitas terhadap 41 butir

instrumen yang dilakukan dengan menggunakan bantuan

program SPSS 391 versión 12.0 Windows diperoleh

koefisien sebesar 0,944. Sebagaimana telah dikemukakan

di atas bahwa koefisien reliabilitas 0,60 ke atas untuk

instrumen dikategorikan baik. Dengan demikian dapat

dinyatakan bahwa instrumen penilaian kinerja guru yang

dikembangkan ini memiliki validitas konstruk yang baik

dan mempunyai reliabilitas yang sangat tinggi. Adapun

instrumen penilaian kinerja guru hasil analisis adalah

seperti berikut.

Page 403: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

392 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

No P e r n y a t a a n 1 2 3 4 5 6 7

1

Guru mengaitkan materi pembelajaran dengan realita kehidupan

Tidak Pernah

Selalu

2

Dalam mengajar, guru mengaitkan hubungan materi yang satu dengan materi yang lainnya

Tidak Pernah

Selalu

3

Guru mengawali pelajaran dengan hal-hal yang menarik

Tidak Pernah

Selalu

4

Guru mengajukan pertanyaan kepada siswa pada waktu memulai kegiatan pembelajaran

Tidak Pernah

Selalu

5

Guru mengecek apakah siswa membawa buku pelajaran atau tidak pada waktu kegiatan pembelajaran

Tidak Pernah

Selalu

6

Guru mengulangi pertanyaan kepada siswa yang tidak dapat menjawab pertanyaan sebelumnya

Tidak Pernah

Selalu

7 Guru menggunakan metode

Tidak Pernah

Selalu

Page 404: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

393 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

pembelajaran yang bervariasi

8

Prosedur penilaian guru diberitahukan kepada semua siswa

Tidak Pernah

Selalu

9

Guru menjelaskan pentingnya suatu topik bahasan pada awal mengajar

Tidak Pernah

10

Guru menjelaskan pokok - pokok bahasan yang harus dipelajari siswa

Tidak Pernah

11 Guru menjelaskan materi pelajaran dengan lancar

Tidak Pernah

Selalu

12

Materi yang disajikan guru dapat /mudah dipahami siswa

Tidak Pernah

Selalu

13

Guru dapat menjawab pertanyaan-pertanyaan siswa

Tidak Pernah

Selalu

14 Guru menjelaskan materi pelajaran secara berurutan

Tidak Pernah

Selalu

15

Guru mengulangi materi pelajaran yang kurang dipahami siswa

Tidak Pernah

Selalu

16

Guru merangkum materi pelajaran sebelum kegiatan pembelajaran berakhir

Tidak Pernah

Selalu

Page 405: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

394 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

17 Guru memberi respon terhadap pertanyaan siswa

Tidak Pernah

Selalu

18

Guru memberi perhatian secara merata kepada semua siswa

Tidak Pernah

Selalu

19

Guru tanggap terhadap masalah yang dihadapi oleh siswa pada saat berlangsung proses belajar mengajar

Tidak Pernah

Selalu

20

Guru mengakhiri pembelajarannya sesuai dengan waktu yang telah ditentukan

Tidak Pernah

Selalu

21 Guru bersikap ramah terhadap setiap siswa

Tidak Pernah

Selalu

22

Guru peduli terhadap siswa yang mengalami kesulitan pada waktu kegiatan pembelajaran berlangsung

Tidak Pernah

Selalu

23

Guru memperhatikan siswa pada waktu kegiatan pembelajaran berlangsung

Tidak Pernah

Selalu

24

Guru menghargai gagasan siswa yang berkaitan dengan usulan untuk

Tidak Pernah

Selalu

Page 406: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

395 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

menyelesaikan tugas-tugas

25

Guru memperkuat penyajian materi dengan memberikan tugas-tugas kepada siswa

Tidak Pernah

Selalu

26

Guru mengecek siswa apakah telah mengerjakan tugas-tugas atau belum

Tidak Pernah

Selalu

27

Guru memberikan soal-soal PR/kuis sesuai dengan materi pembelajaran yang disajikan

Tidak Pernah

Selalu

28

Guru mau menjawab pertanyaan - pertanyaan siswa di luar jam mengajar

Tidak Pernah

Selalu

29

Guru memberikan balikan kepada siswa dengan menyerahkan kembali hasil pemeriksaan jawaban siswa

Tidak Pernah

Selalu

30

Guru memuji siswa yang dapat menjawab pertanyaan dengan benar

Tidak Pernah

Selalu

Page 407: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

396 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

31

Guru memberikan waktu yang cukup kepada siswa untuk menjawab pertanyaan yang diajukannya.

Tidak Pernah

Selalu

32

Guru memberikan contoh yang cukup untuk menanamkan pengertian dalam penjelasannya

Tidak Pernah

Selalu

33

Guru memberi catatan mengenai hal-hal yang penting di papan tulis

Tidak Pernah

Selalu

34

Guru mengelompokkan siswa ke dalam kelompok belajar untuk mendiskusikan materi pelajarannya

Tidak Pernah

Selalu

35

Guru menggunakan metode diskusi pada pokok bahasan yang menghendaki pemahaman yang lebih mendalam.

Tidak Pernah

Selalu

36

Guru mendorong siswa untuk menyatakan hal -hal yang tidak jelas dari penyajian materi ajarnya

Tidak Pernah

Selalu

Page 408: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

397 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

37

Guru mendorong siswa untuk berperan aktif selama proses belajar mengajar

Tidak Pernah

Selalu

38

Guru mengumumkan hasil pekerjaan terbaik ketika melakukan penilaian terhadap kegiatan kerja kelompok

Tidak Pernah

Selalu

39

Guru memberitahukan hasil PR/ kuis/ tugas-tugas siswa

Tidak Pernah

Selalu

40

Bentuk soal ujian yang dibuat guru hanya satu macam saja

Tidak Pernah

Selalu

41

Guru memberi nilai kepada siswa hanya berdasarkan hasil ujian saja

Tidak Pernah

Selalu

Page 409: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

398 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 410: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

399 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

DAFTAR PUSTAKA

Aiken, Lewis R. (1994). Psychological Testing an Assessment,(Eight Edition), Boston: Allyn and Bacon.

Alexander, P., Schallert, D., Hare, V. 1991. Coming to Terms:

How Researcher in Learning and Literacy Talk about Knowledge. Review of Educational Research, 61: 315 – 343.

Allen, M.J. & Yen, W.M. (1979). Introduction to measurement

theory. Monterey, CA: Brooks/Cole Publishing Company.

Anastasi. Anne and Urbina, Susana. (1997). Psicoholological

Testing. (Seventh Edition). New Jersey: Prentice-Hall, Inc.

Page 411: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

400 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Anderson, Scarvia.B, at.all (1981), Encyclopedia Of Education Evaluation, San Francisco: Jossey-Bass, Inc Publishers.

Anderson, L.W and D.R. Krathwohl (Eds). (2001). A

Taxonomy for Learning Teaching and Assessing. Airasian, P. W. (1994). Classroom assessment. New York:

McGraw-Hill. Arifin, Zaenal. (2009). Evaluasi Pembelajaran,. Bandung: PT

remaja Rosdakarya. Asaad, Abubakas,S and Hailaya, Wilham, M (2004).

Measurement And Evaluation, Manila: Rex Nbook Store.

Azwar, Syaifuddin (2010). Tes Prestasi: Fungsi dan

Pengembangan Pengukuran Prestasi Belajar, edisi II, cetakan ke 4 :Pustaka Pelajar.

Azwar, Syaifuddin (2012). Reliabilitas dan Validitas,

Yogyakarta: Pustaka Pelajar. Bahri, Djamarah, Saiful (2008). Psikologi Belajar. Jakarta :

PT Rineka Cipta. Basuki, Ismet dan Hariyanto (2014). Asesmen

Pembelajaran, Bandung: PT Remaja Rosdakarya. Berk, R.A. (1986). Performance assessment. London: The

Johns Hopkins Press Ltd.

Page 412: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

401 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Bloom, B.S., (Ed.). (1956). Taxonomy of educational objectives: The classification of educational goals: Handbook I, cognitive domain. New York: Longman.

Bodgard & Seaborne, 2001. Perfect Empowerment (Edisi

terjemahan) Jakarta : Gramedia Brennan, Robert L (2006). Educational Measurement.

Fourth Editon. Road West, Westport CT: Praeger Publishers.

Butler and McMunn (2006). A Teacher’s Guide to

ClassroomAssessment, San Francisco:Jossey Bass Brown, Frederick G (1981). Measuring Classroom

Achievement, New York: Holt, Rinehart and Winston. Brown, Frederick G (1976). Principles of Educational and

Psychological Testing, New York: Holt, Rinehart and Winston.

Brown, Douglas H. (2004). Language Assessment Principles

and Classroom Practices. New York: Longman. Brown. W. and Thornton. J.W. Jr (1971). College teaching: A

s~\lenirrlic approach (2nd 4.). New York: McGraw-Hill.

Bryman, Alan (2001). Social Research Methods. New York:

Oxford University Press Inc. Cangelosi James S.(1995). Merancang Tes Untuk Menilai

Prestasi Siswa. Bandung: Institut Teknologi Bandung.

Page 413: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

402 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Cohen, R. J., & Swerdlik, M. (Eds.). (2009). Psychological

testing and assessment: An introduction to tests and measurement (7th ed.). Washington DC: McGraw-Hill.

Crocker, L. & Algina, J. (1986). Introduction to Classical and

Modern Test Theory_. New York: Holt, Rinehart and Winston, Inc.

Cronbach, L.I (1990), Essentials of psychological testing,

New York: Harper Collins.

Cronbach, L., J., and others. (1980). Toward reform of program evaluation: aims, methods, and institutional arrangements. San Fransisco: Jossey-Bass.

Dave, R.H. (1967). Taxonomy of educational objectives and

achievement testing. London: University of London Press.

Deblassie, Richard .R (1974). Measuring And Evaluating

Pupil Progress, New York: MSS Information Corporation.

Depdiknas (2008). Pandiuan Penulisdan Butir Soal, Jakarta:

Dirjen Manajemen Pendidikan Dasar dan Menengah.

Depdiknas (2008). Panduan Analisis Butir Soal, Jakarta:

Direktorat Pembinaan SMA. Depdiknas (2007). Panduan Penulisan Soal Pilihan Ganda,

Jakarta: Pusat Penilaian Pendidikan.

Page 414: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

403 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Desmita.(2006).Psikologi Perkembangan. Bandung : PT.

Remaja Rosdakarya. Ditjen Dikti. (2005). Pedoman sistem asesmen berbasis

kompetensi. Jakarta : Depdiknas. Dizney, Henry (1971). Classroom Evaluation for Teachers,

Dubuque, Iowa: Wm. C. Brown Company Publisher. Djaali & Mulyono, Pudji (2007). Pengukuran dalam Bidang

Pendidikan, Jakarta: Grasindo. Djamarah (1994). Prestasi Belajar dan Kompetensi Guru.

Surabaya : Usaha Nasional. Ebel, Robert L. & David A. Frisbie (1991) Essential Of

Educational Measurement (5th Edition). New Delhi: Prentice‐Hall, Inc.

Echols, John M dan Shadily, Hassan (1989). Kamus Inggris

Indonesia, Jakarta: PT Gramedia. Edwards, Allen L (1957). Techniques of Attitude Scale

Construction. New York: Appleton-Century-Croffs, Inc.

Erickson, Richard. C & Tim L.Wentling (1976). Measuring

Student Growth, Boston : Allyn and Bacon, Inc. Fernandes,H.J.X (1984). Testing And Measurement, Jakarta:

National Education Planning, Evaluation and Curriculum Development.

Page 415: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

404 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Gabel, D.L. (1993). Handbook of Research on Science Teaching and Learning.New York: Maccmillan Company.

Gable, Robert K (1986). Instrumen Development in Affective

Domain. Boston: Kluwer-Nijhoff Publishing. Gay, L.R. (1976). Educational research: Competencies for

analysis and application. Columbus, OH: Bell & Howell Company. Gerst.

Glass, Gene V. and Stanley, Julian C. (1970). Statistical

Methods in Education and Psychology. New Jersey: Prentice Hall, Inc.

Gorsuch, Richard L (1983). Factor Analysis. Hillsdale:

Lawrence Erlbaum Associates Publisher. Griffin, P. & Nix, P. (1991). Educational Assessment and

Reporting. Sydney: Harcout Brace Javanovich, Publisher.

Gronlund, N.E. (1982). Constructing Achievement Test, 3rd edition. Eaglewood Cliffs, N.J: prentice–Hall inc.

Gronlund, Norman E. and Linn, Robert L. (1995).

Measurement and Assessment in teaching (Seventh Edition). Ohio: Merrill, an immprint of Prentice Hall.

Gronlund, N.E. (1976). Measurement and evaluation in

teaching. New York: Macmillan Publishing Company. Gronlund, N.E & R.L Linn (1990). Measurement and

Evaluation in Teaching. 6th. Ed. New York: MacMillan Publishing Company.

Page 416: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

405 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Guilford, J. P. (1954). Pychometric Methods. New Delhi: Tata

Mc-Graw Hill Publishing Co.Ltd. Haladyna, Thomas M. (1994). Developing and Multiple-

Choice Test Items. New Jersey: Lawrence Erlbaum Associates, Publishers.

Hamalik, Omar (1983). Strategi Belajar dan Pembelajaran,

Jakarta ; Sinar Utama

Habeyb. (1983). Supervisi Pendidikan, Jakarta: P2LPTK Harrow, A. J. (1972). A taxonomy of the psychomotor

domain: A guided fordeveloping behavioral objective. New York: David Mc Key Company.

Heer, R. 2012. A Model of Learning Objectives (Online).

(www.celt.iastate.edu/teaching/RevisedBlooms1.html,) Heaton, J.B. (1988). Writing English Language Tests. 2nd Edition, 21.

New York: Longman Inc. Herman, J. L. (1997). Large-scale assessment in support of

school reform: Lessons learned in the search for alternative measures. International Journal of Educational Research, 27, 395-413.

Hopkins, Kenneth D. and Julian C. Stanley. (1981).

Educational and Psychological Measurement and Evaluation. Englewood Cliffs, NJ: Prentice-Hall, Inc.

Page 417: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

406 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Hopkins, Charles D. dan Richard L. Antes (1989). Classroom Testing Construction. Illinois: F. E. Peacock.

Jae-On Kim and Charles W. Muller (1978). Factor Analysis:

Statistical Methods and Practical Issues. London: Sage Publication.

Jihat, Asep dan Haris, Abdul (2008). Evaluasi Pembelajaran,

Yogyakarta: Multi Pressindo Joesmani (1988). Pengukuran dan Evaluasi Dalam

Pengajaran, Jakarta: Departemen Pendidikan dan Kebudayaan.

Kapplan, Robert M & Saccuzzo, Dennis P (2001).

Psychological Testing (5th ed). Singapore: Wordworth Thomson Learning.

Kartowagiran, Badrun (2009). Makalah disampaikan pada

Pelatihan penulisan analisis butir dengan pendekatan TTK dan TRB tanggal 11 – 12 April 2009 di Lemlit UNY.

Kemdikbud (2010). Panduan Pengembangan Penulisan

Soal, Jakarta: Direktorat Ketenagaan Dirjen Pendidikan Tinggi.

Kerlinger, Fred N (2003). Azas-Azas.Penelitian Behavioral.

Yogyakarta: Gajah Mada Press. King, Patricia (1984). Performance Planning & Appraisal.

New York: Mc Graw Hill Book Company.

Page 418: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

407 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Koyan, I Wayan (2012). Konstruksi Tes, Singaraja: Universitas Pendidikan Ganesha Press.

Krathwohl, D. R. (2002). A Revision of Bloom’s Taxonomy:

An Review. Theory Into Practice. Volume 41, Number 4. College Education. The Ohio State University.

. Krathwohl, D. R. et.all (1964).Taxanomy of Educational

Objectives, Handbook II; Affective Domain, New York; McKay.

Kumano, Y (2001). Authentic Assessment and Portfolio

Assessment-Its Theory and Practice, Japan: Shizuoka University

Lase, Jason.(2003).Motivasi Berprestasi, Kecerdasan

Emosional, Percaya Diri dan Kinerja. Jakarta: PPs FKIP UKI.

Lewy, Zulkardi, Aisyah (2009). Pengembangan Soal Untuk

Mengukur Kemampuan Berpikir Tingkat Tinggi Pokok Bahasan Barisan dan Deret Bilangan di Kelas IX Akselerasi SMP Xaverius Maria Palembang, Jurnal Pendidikan Matematika, Vol. 3.No.2, Desember 2009

Litwin, Mark S (1995). How To Measure Survey Reliability

and Validity. London: Sage Publications. Lord, F.M. and Novick, M.R. (1974). Statistical Theories of

Mental Test Scores. Reading, MA: Addison-Wesley. Mar’at, (1984). Sikap Manusia :Perubahan Serta

Pengukurannya. Jakarta: Ghalia Indonesia.

Page 419: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

408 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Mardapi, Djemari (2004). Penyusunan tes hasil belajar.

Yogyakarta: Program Pascasarjana Universitas Negeri Yogyakarta.

Mardapi, Djemari (2008). Teknik Penyusunan Instrumen Tes

dan Nontes, Jogyakarta: Mitra Cendekia Press. Maskul (1998). Pembelajaran Remaja, Jakarta ; Raja

Grafindo Persada. McBeath, Ron J (1992). Instructing And Evaluating In Higher Education. New Jersey: Educational Technology Publications Englewood Cliffs, Mehrens, W. A. & Lehmann, I. J. (1984). Measurement and evaluation in education and psychology, Third edition. New York: Holt, Rinehart and Winston.

Messick, S. (1989). “Validity” dalam Linn, R. L. (Eds.),

Educational measurement third edition. (pp. 13-103). New York: McMillan.

Miller, M.David, Robert l.Linn and Norman E. Gronlund

(2009). Measurement and Assessment in Teaching, New Jersey: Pearson Education International.

Morris, L.L. & Fitz Gibbon. C. T. (1978). How to Measure

Achievement. Los Angeles, CA: Sage Publication. Mouly, George J. (1967), Training of Research Center

Personnel, U. S. Department of Health,

Page 420: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

409 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Education,and Welfare, Final Report Project No. 6-2562 , Office of Education Bureau of Research

Mueller, John. (2008). Authentic Assessment Toolbox. North Central Collegehttp://www.noctrl.edu/, Mueller, D. J. (1986). Measuring social attitudes. New York:

Teachers College,Columbia University. Muhamad (1999). Bimbingan Belajar di Perguruan Tinggi,

Jakarta; Depdikbud. Muhson, Ali, dkk (2012). Analisis Butir Soal dengan

Anbuso, Makalah yang disampaikan pada Pelatihan Analisis Butir Soal dan Program Remidial dengan Software AnBuso ,di FE UNY pada tanggal 12‐13 Juli 2012.

Nawawi. (2001). Dasar – Dasar Perencanaan Pengajaran.

Jakarta Raja Grafindo Persada. Nasoetion, Noehi (2006). Tes, Pengukuran dan Evaluasi,

Jakarta:Universitas Terbuka

Nazir, M. (1983). Metode Penelitian. Penerbit Ghalia Indonesia. Nelson, Clarence.H (1970). Measurement and Evaluation in the Classroom, London: The Macillan Company.

Nitko, Anthony J. (1996). Educational Assessment of

Students, Second Edition. Ohio: Merrill an imprint of Prentice Hall Englewood Cliffs.

Page 421: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

410 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Nitko, Anthony J,. & Brookhart, Susan M. (2007). Educational assessment of Student. Pearson Education Inc., Upper Saddle River, New Jersey.

Nitko, Anthony J.(1996). Educational Assessment of

Students. Englewood Cliffs,New Jersey: Prentice-Hall, Inc.

Norusis, Marija J (1993). SPSS for Windows Professional

Statistics Release 6,0 , Chicago: Marketing Department SPSS Inc.

Nurkancana, Wayan & Sumartana (1990). Evaluasi Hasil

Belajar, Surabaya: Usaha Nasional. Paulson, F.Leon, Parsl R & Meyer, Carol A. (1991).What

makes a portofolio? Eight thoughtful guidelines will help educator encourage self-directed lerning. Educatonal Leardership, February 1991

Pedhazur, Elazar J and Liora Pedhazur Schmelkin (1991).

Measurement, Design and Analysis: An Integrated Approach. New Jersey: Lawrence Erlbaum Associates Publishers, 1991.

Pohl . (2000). Learning to Think, Thinking to Learn: tersedia

di www.purdue.edu/geri Popham,W James (1995). Classroom Assessment: What

Teacher Need to Know. Boston: Allyn and Bacon. Purwanto (2009), Evaluasi Hasil Belajar, yogyakarta:

PustakaPelajar.

Page 422: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

411 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Purwanto, Ngalim (1992), Evaluasi Pengajaran, Jakarta Rineka Cipta.

Reynolds, Cecil.R, at.all (2009). Measurement and

Assessment in Education, New Jersey: Upper Saddle River.

Retnawati, Heri (2015). Validitas, Reliabilitas &

Karakteristik Butir, Yogyakarta: Parama Publishing Riyanto, Astin (2003). Proses Belajar Mengajar Efektif di Perguruan Tinggi. Bandung: Yapemdo.

Rolheiser, C. & Ross, J. A. (2005). Student Self-Evaluation:

What Research Says and What Practice Shows. Internet download.

Rowland, Virgil K (1960). Managerial Performance

Standards. New York: Craffsmen,Inc. Sax, Gilbert. (1980). Principles of Educational and

Psychological Measurement and Evaluation.

(2nd

ed.). California : Wadsworth Publishing Company.

Salvia, J. & Ysseldyke, J.E. (1996). Assessment. 6th Edition.

Boston:Houghton Mifflin Company. Setiadi, Hari (2008). Penilaian Kinerja, Jakarta: Pusat

Penilaian Pendidikan, Departemen Pendidikan Nasional.

Silverius, Suke (1991). Evaluasi Hasil Belajar dan Umpan

Balik, Jakarta: PT.Grasindo.

Page 423: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

412 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Singer,R.N (1972). The psychomotor domain: Movement behavior. London: Henry Kimton Publisher.

Simpson, E.J (1972). The Classification of Educational

Objectives, Psychomotor Domain, Ilinois: Teacher of Home Economic.

Singh, Arun Kumar. (1986). Tests, Measurement and

Research Methods in Behavioral Sciences. New Delhi: Tata McGraw Hill.

Skinner, Charles E. (ed.) (t.t), Essentials of Educational

Psichology, (Englewood Cliffs :Prentice-Hall, Inc.Stalnaker, J. M. (1951). The Essay Type of Examination. In E. F. Lindquist (Ed.), Educational Measurement (pp. 495-530). Menasha, Wisconsin: George Banta.

Streiner DL, Norman GR (2000). Health measurement scales: A practical guide to their development and use. Oxford: Oxford University Press.

Sudjana (2005). Dasar-Dasar dalam Proses Belajar

Mengajar. Bandung: Sinar Baru Algesindo. Sudjana, Nana (2009). Perencanaan Pengajaran. Jakarta.

P2LPTK. Sudjana, Nana, (2004). Penilaian Hasil Proses Belajar

Mengajar, Bandung:Remaja Rosdakarya. Soekartawi, dkk. (1995). Meningkatkan Rancangan

Instruksional, Jakarta: PT Raja Grafindo Persada.

Page 424: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

413 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Suyanto (1988). Metode Statistika Multivariat. Jakarta: Departemen Pendidikan dan Kebudayaan.

Suryabrata, Sumadi. (2000). Pengembangan Alat Ukur Psikologis. Yogyakarta: Penerbit Andi.

Susetyo, Budi (2011). Menyusun Tes Hasil Belajar, Bandung:

CV Cakra. Suyanto (1977). Metode Statistika Multivariat, Jakarta: Departemen Pendidikan dan kebudayaan.

Sudijono (2006). Pengantar Evaluasi Pendidikan, Jakarta:

PT Raja Grafindo Persada. Surapranata, Sumarna dan Muhammad Hatta (2006).

Penilaian Portofolio: Implementasi Kurikulum 2004. Bandung: PT Remaja Rosdakarya.

Surapranata, Sumarna. (2005). Analisis, Validitas,

Reliabilitas, dan Interpretasi Hasil Tes. Bandung: PT Remaja Rosdakarya Offset.

Stufflebeam, Daniel L., (l974). Evaluation models. Boston:

Kluwer-nijhoff Publishing. Tabachnick, Barbara G and Linda S. Fidell (1989). Using

Multivariate Statistics. California: Harper Collins Publishers..

Taufina. (2009). Authentic Assesment dalam Pembelajaran

Bahasa Indonesia di Kelas Rendah SD. Pedagogi, IX(1) 113-120. Diperoleh 20 Juni, dari http://www.google.com/url?

Page 425: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

414 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Thomas, G.H & Dawson, J.B. & (1972). Item analysis and examination statics. Birmingham: The Union of Educational Institutions.

Thorndike, Robert M. (1997). Measurement and Evaluation

in Pschology and Education, Sixth Edition. Ohio: Merrill, an imprint of Prentice Hall.

Thorndike, Robert, L., & Hagen, Elizabeth. P. (1977). Measurement and Evaluation in Psychology and Education. New York: John Wiley & Sons.

Tim Puspendik. (2008). Tes Tertulis. Puspendik Balitbang

Depdiknas. Jakarta.

Tola, Burhanuddin (2008). Penilaian Diri, Jakarta: Pusat Penilaian Pendidikan, Departemen Pendidikan Nasional.

Tuckman, B. W (1975). Measuring Educational Outcomes

Fundamentals of Testing. New York: Harcourt Brace Javanovich Inc. Wandt, Edwin and Brown, Gerald, W (1957). Essentials of Educational Evaluation, New York: Holt Rinehart and Winston.

Wiersma, W and Jurs (1990). Educational Measurement And

Testing, Boston: Allyn and Bacon. Widoyoko, S. Eko Putra (2014). Penilaian Hasil

Pembelajaran di Sekolah, Yigyakarta: Pustaka Pelajar.

Page 426: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

415 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Widoyoko, S. Eko Putra (2009). Evaluasi Program Pembelajaran: Panduan Praktis Bagi Pendidik dan Calon Didik, Yogyakarta: Pustaka Belajar.

Wind, Edwind and Brown, Gerald W.(1975). Essential of

Educational Evaluation, New York: Holt Rinehart and Winston

Winkel, W.S.(1983). Psikologi Pendidikan dan Evaluasi

Belajar, Jakarta : PT. Gramedia. Whitmore, John (1997). Coaching For Performace: Seni

Mangarahkan Untuk Mendongkrak Kinerja. terjemahan Y. Dwi Helly Purnomo, Jakarta:Gramedia Pustaka Utama.

Zainul, Asmawi dan Noehi Nasution (2005). Penilaian Hasil Belajar. Pusat Antar Universitas, Direktorat Jenderal Pendidikan Tinggi: Departemen Pendidikan Dan kebudayaan.

Zakaria, Ramli (2006). Pedoman Penilaian Sikap. Jakarta:

Puspendik Balitbang Depdiknas

Page 427: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

416 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Page 428: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

417 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd dilahirkan di

Pidie, Aceh pada 31 Desember 1952.

Setelah lulus Sarjana Pendidikan Fisika

dari FKIE-IKIP Yogyakarta pada 1981,

langsung diangkat menjadi staf pengajar

pada Jurusan Fisika FKIP Universitas

Syiah Kuala, Darussalam-Banda Aceh.

Gelar Magister Pendidikan (bidang

Pendidikan Sains) diperolehnya dari PPs

Universitas Negeri Surabaya (UNESA)

pada tahun 2000. Gelar

Doktor diperolehnya dari PPs Universitas

Negeri Jakarta (UNJ) pada tahun 2008

dalam Bidang Penelitian dan Evaluasi

Pendidikan. Pada thun 2011 diangkat

menjadi Guru Besar bidang ilmu Evaluasi

pendidikan Unsyiah.

Selain mengajar mata kuliah Evaluasi

pengajaran Fisika di FKIP Unsyiah, juga

mengajar mata kuliah Tes dan Pengukuran

pada Program Studi Pendidikan

Keolahragaan, mengajar Language Testing

and Evaluation pada Program Studi

Pendidikan Bahasa Inggris, mengajar

TEN

TAN

G P

ENU

LIS

Page 429: Pengukuran & Evaluasi Hasil Dan Proses Belajar

Prof. Dr. Yusrizal, M.Pd

418 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Evaluasi Pendidikan di Program Studi-

Program Studi: Pendidikan IPA,

Pendidikan Matematika, Pendidikan

Bahasa dan Sastra Indonesia serta di

Program Studi Magister Administrasi

Pendidikan PPs Unsyiah. Bercita-cita

untuk dapat menerbitkan sejumlah buku

mengenai Evaluasi Pendidikan /

Pembelajaran, Buku Pengukuran &

Evaluasi Proses dan Hasil Belajar ini

merupakan buku kedua dari cita-citanya

tersebut.