Tentang Tes Obyektif : Ide untuk Meningkatkan Kualitas Tes Obyektif

Bagi para calon PNS, pelajar, mahasiswa, atau pencari kerja pasti akrab dengan yang namanya tes obyektif. Kita diberikan banyak soal, yang kadang hampir tidak mungkin kita kerjakan semua, diberi batas waktu, dan soalnya pasti pilihan ganda.

Salah satu contoh soal obyektif adalah :
Siapa presiden AS sekarang ?
a. George W Bush
b. George HW Bush
c. Barack H Obama
d. Al Gore
e. John McCain

Tergantung kapan soalnya keluar jawabannya bisa a, b atau c. Atau d jika kamu merasa sebal dengan pemilu AS tahun 2000.

Kelebihan tes obyektif
Kelebihan tes obyektif yang paling kentara adalah, mengoreksinya cepat. Untuk membuat soal memang susah, tergantung ada tidaknya bank soal yang bagus dari pihak pemberi tes.
Selain itu untuk peserta tes, jika tidak ada penalti untuk soal yang salah kita bisa memberi jawaban acak. Kemungkinan benarnya juga cukup bagus 20% (jika lima soal)

Kelemahan tes obyektif
Kelemahan paling mendasar dari tes obyektif adalah semua soal dianggap sama. Apakah susah atau mudah tetap dinilai 1 poin. Hal ini membuat salah satu strategi utama untuk mengerjakan tes obyektif adalah : Kerjakan yang mudah, baru yang susah selama bisa dikerjakan, acak sisanya. Hal ini menurutku gagal menilai dengan baik kemampuan seseorang. Mari kita lihat contohnya.

So ?
Bagaimana cara menilai sebuah soal susah atau mudah ? Sederhana sebenarnya, berapa jumlah orang yang benar dalam menjawab. Misal, ada soal A dan soal B dikerjakan oleh 100 orang. hanya 10 yang benar menjawab soal A, dan 30 orang yang benar menjawab soal B, maka kita bisa menyimpulkan soal A lebih susah dari soal B.

Anehnya, dalam tes obyektif tidak ada pembedaan dalam penilaian kedua soal ini, sama-sama 1 poin. Harusnya, soal A diberi nilai lebih karena lebih susah, di sinilah kelemahan tes obyektif.

Lalu gimana ?
Perkenalkan ide yang memang tidak orisinal, yang saya beri nama Tes Obyektif Relatif (kalau tahu nama aslinya taruh komen ya).
Sistemnya :
1.    Pilihan ganda.
2.    Waktu terbatas
3.    Setiap soal memiliki nilai relatif terhadap tingkat kesulitan.

Bagaimana menentukan nilai dalam poin 3 ? Seperti pada contoh, sesuai keadaan tes saat itu. Semakin sedikit yang menjawab dengan benar, nilai sebuah soal akan semakin tinggi. Rumusnya adalah [jumlah peserta] / [jumlah yang menjawab benar]

Misal untuk soal A nilainya adalah : (100/10) = 10 sedang soal B nilainya adalah (100/30) = 3.33, bagaimana jika tidak ada yang menjawab nilainya akan menjadi 100/0 = 8? Beri saja nilai 100 sebagai bobot maksimum, jadi jika tidak terjawab maka nilainya adalah : (100/1) = 100.

Lalu totalnya ? Misalkan ada Alice, Bob, dan Charlie dan 97 orang lain mengerjakan tes itu, Alice menjawab A benar, B salah, Bob menjawab A salah dan B benar, sedang Charlie menjawab keduanya benar, maka nilai mereka adalah :
Alice = 10 + 0 = 10
Bob = 0 + 3.33 = 3.33
Charlie = 10 + 3.33 = 13.33

Lha kok nggak standar 100% ?
Ya dinormalisasi. Nilai maksimal(jika semua terjawab) adalah 13.33 maka perhitungannya adalah :
Alice = 10/13.33 x 100% =  75%
Bob = 3.33/13.33 x 100% = 25%
Charlie 13.33/13.33 x 100% = 100%

Di sini terlihat walau sama-sama benar menjawab satu soal, nilai Alice dan Bob jauh berbeda.

Keuntungan sistem ini adalah :
1.    Menghadiahi kejujuran. Karena semakin banyak yang menjawab benar maka nilai soal semakin kecil, Hal ini akan mengurangi minat peserta untuk memberi contekan. Relatif sih, karena tambahan satu orang menjawab benar tidak mengurangi poin, 10 orang lain cerita.
2.    Taktik “kerjakan yang mudah dulu” tidak berlaku. Hasilnya adalah kerjakan sebaik mungkin. Berbagai taktik dan teknik tidak berguna di sini.
3.    Memberi penghargaan bagi yang suka tantangan. Mengerjakan soal yang susah itu menantang, dan di sini rewardnya lebih baik daripada yang mudah.
4.    Memberi gambaran cara kerja seseorang. Ini adalah akibat tidak langsung. Dengan tes ini maka kita bisa tahu apakah seseorang itu bertipe suka tantangan atau tipe tekun dan sabar. Untuk yang suka tantangan akan menjawab soal-soal susah, walau cuma dapat sedikit, untuk yang tekun mengerjakan semua soal yang mudah dan banyak dengan harapan mengumpulkan poin dari situ.
5.    Lebih menarik jika ditambahkan sistem penalti. Beri penalti, setiap soal yang salah akan mendapat pengurangan nilai ¼ dari nilai soal dan 0 untuk tidak terjawab, maka menyusahkan untuk memilih acak dan para spekulan.

Setiap sistem pasti punya kelemahan.

Kelemahan sistem ini adalah :
1.    Lebih rumit untuk dikoreksi. Ada dua langkah dalam mengoreksi soal seperti ini, yang pertama untuk menentukan bobot soal (karena relatif) lalu kedua untuk menilai jawaban sesuai bobot soal.
2.    Membuat peserta memilih taktik menghapal jawaban. Granted, bisa jadi peserta hapal karena memang persiapannya jauh lebih matang, dan mengerjakan lebih banyak latihan soal.
3.    Susah diprediksi nilainya. Mengetahui jawaban peserta benar atau salah tidak cukup, peserta juga harus tahu tingkat kesulitan dan bobot soal.
4.    Sejalan dengan nomor tiga, akan ada isu transparansi dan akuntabilitas dalam penilaian tes.
5.    Dalam kasus ekstrim, misalkan ada 1000 peserta tes dan hanya ada satu yang bisa menjawab suatu soal maka nilai soal itu akan menjadi 1000(!)

Untuk yang pertama, berhubung banyak koreksi soal menggunakan komputer, maka software komputer bisa didesain untuk melakukan kedua langkah tersebut, korektor hanya mengawasi.
Solusi lain, bobot penilaian soal disamakan dengan bobot soal yang sama dari hasil tes sebelumnya, ini juga bisa mengurangi isu no 3 dan 4.
Untuk yang kedua, bank soal yang bagus dengan soal yang tidak sama setiap tes bisa menjadi solusi.
Untuk isu kelima, bisa jadi tidak masalah, berarti penguji menemukan orang yang one-in-a-thousand, bukankah tipe soal ini memang dibuat untuk menghargai yang cerdas ? Alternatifnya beri batasan bobot maksimal dari satu soal.

Yang jeli akan mengenali bahwa sistem ini menerapkan prinsip dalam Prisoner Dilemma atau juga dikenal dengan Voting Problem.

Ada yang bisa menemukan kelemahan atau keunggulan lain dari sistem ini, atau cara untuk meningkatkan kualitasnya ? Atau tertarik mencobanya ? Atau ada yang tahu sistem yang mirip ini ? GRE setahuku menggunakannya (ada statistik penjawab benar dalam kunci jawabannya, tapi apakah statistik itu memang digunakan dalam penilaian aku tidak tahu), tapi aku nggak paham dengan sistem penilaiannya.

About dnial

You don't see anything You don't hear anything You don't know anything Move along and pretend nothing happen

Posted on 14 Januari, 2009, in experience, idealist, life and tagged , . Bookmark the permalink. 15 Komentar.

  1. It’s the same, only different.

    -Yogi Berra-

  2. Masalah lain dengan norma penilaian yang relatif seperti ini adalah: Nilai itu hanya berguna di dalam grup peserta tes yang sama dan tidak bisa dibandingkan dengan nilai orang lain dari grup peserta tes yang lain (yang penilaiannya terpisah), karena soal yang sama bisa punya tingkat kesulitan yang berbeda (thus, nilai yang berbeda) jika komposisi kecerdasan peserta tesnya juga berbeda. Dengan kata lain, ada tambahan problem keadilan dan untung2an dari penerapan norma relatif itu.😕

    Ditambah lagi, kalau saya tidak salah ingat akan kuliah psikologi pendidikan saya dulu, penggunaan norma relatif dalam konteks akademik membuat suasana belajar-mengajar jadi terlalu kompetitif dan akhirnya malah merugikan murid/mahasiswa.😦

  3. Kalau penilaiannya menyeluruh enggak akan ada rasa keadilan yang tersakiti, kan?

    Atau memang aturannya dibuat sedemikian hingga penilaiannya memang terbatas di ruangan itu. Misal top 5 di ruangan lolos ke babak selanjutnya.

    Soal psikologi pendidikan? Sek dibaca lagi.😛

  4. saya masih sma.. ga kepikiran ginian..wkwkwk

  5. alice n bob … belajar cryptography maneh, whehehe

  6. @nRa
    Ancen njupuk jenenge soko kono…
    Wekekekeke…
    Alice and Bob karo siji maneh seng biasane dadi penyerangnya.

  7. bagus sih, jadi ingat kuliahnya pak Irfan…. semakin bodoh rata-rata pesertanya.. semakin besar peluang dapet nilai A😛

  8. Penilaian? Memang selalu menjadi hal pelik, bikin pusing.
    Setelah pusing kita butuh rileks.
    Mampir ke Frizzy’s Relaxing Articles Spa sob. Artikel2 untuk baca2 santai.

    Cheers, frizzy2008.

  9. wah,,gw agak tek ngerti tu tes apaan,,(biasa orang kampungan ni)

  10. wah aku radak nggak ngerti ma yang beginian

  11. ada hal yang menarik di sini…..

    Dalam kasus ekstrim, misalkan ada 1000 peserta tes dan hanya ada satu yang bisa menjawab suatu soal maka nilai soal itu akan menjadi 1000</blockquote
    lalu yang ini……..

    Untuk isu kelima, bisa jadi tidak masalah, berarti penguji menemukan orang yang one-in-a-thousand, bukankah tipe soal ini memang dibuat untuk menghargai yang cerdas

    dua kalimat yang menyesatkan…. antara kalimat menemukan one in a thousand dengan kalimat dibuat untuk menghargai yang cerdas. IMHO tidak ada sama sekali korelasi antara kecerdasan dengan ke”one in a thousand”-an.

    Karena banyak atau tidaknya orang yang tidak mampu menjawab sama sekali tidak ada hubungannya dengan kualitas soal tersebut. Hal itu hanay berlaku untuk soal eksakta yang tingkat kesulitannya berbanding lurus dengan kebisaan untuk dijawab.

    misalnya gini, ada soal “Sebutkan prosedur pemerahan susu mulai dari sapi sampai ke botolnya?”. Nah kalau lantas ada seseorang yang bisa menjawab 1 diantara 1000 orang itu berarti bahwa soal tersebut layak mendapatkan bobot 1000? sama sekali tidak menurut saya.

    intinya…. tingkat kesulitan yang bisa diuukur berdasarkan kemampuan untuk dijawab hanyalah pada soal-soal yang menyangkut eksakta dan logika…. sedangkan pada soal-soal lain semuanya hanya bergantung pada wawasan si pengambil tes (setiap orang memiliki wawasan pengetahuan yang berbeda-beda). Dan wawasan sama sekali tidak memuliki korelasi dengan kecerdasan maupun tingkat kesulitan😛

  12. @mardun
    Nah itu dia… Gimana kalau soalnya dihafalin jawabannya? Kan nggak bisa ngukur kemampuan dengan cara itu. IMHO, metode ini cuman bisa dipakai kalau soalnya penalaran dan jawaban akhir ada di pilihan. Kalau hafalan atau wawasan… ya untung2an jadinya, kalau tahu syukur, kalau enggak ya udah.

    Tapi kalau penalaran mending essay.😛

    *jadi bingung*

  13. auk ah…puyeng deh. skalian aja mengarang indah😀

  14. ada satu pertnyaan, tlong penjelasannya.. Apakah ada atau bisa bobot masing-masing item soal objektif dibedakan(tidak 1, bisa 2, 1,5), misalnnya berdasarkan tingkat kesukaran soal, seperti pada uraian/essay ?? trimakasih

  15. bagaimana kalau tes subjektif..??
    bagaimana membuat bobot nilainya jika sudah diketahui tingkat kesukarannya..??

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

%d blogger menyukai ini: