ISSN 2477-1686
Vol. 9 No. 13 Juli 2023
Melihat Kembali Cara Kita Menilai Melalui Teori Tes Klasik
Oleh:
Laurentius Purbo Christianto
Fakultas Psikologi, Universitas Katolik Indonesia Atma Jaya
Mengenal Teori Tes Klasik
Teori tes klasik telah menjadi dasar dalam teori pengukuran selama kurang lebih 100 tahun. Sejak munculnya gagasan tentang adanya kesalahan dalam pengukuran (Spearman, 1904), gagasan ini terus didiskusikan secara akademis, hingga menjadi teori tes klasik. Teori tes klasik, juga biasa disebut sebagai model pengukuran skor murni. Jika dibaca dalam bahasa inggris teori ini disebut classical test theory, kemudian bisa disingkat dengan CTT. Selanjutnya CTT akan digunakan dalam tulisan ini untuk menunjuk teori tes klasik.
Teori dasar dari CTT ialah bahwa skor atau nilai yang didapatkan oleh setiap orang, setelah melakukan tes atau ujian, bukanlah nilai yang sebenarnya (Cohen, dkk., 2022; Kline, 2005; Traub, 2005). Jadi jika seorang siswa mendapatkan nilai 78 pada Ujian Nasional mata pelajaran Bahasa Indonesia, nilai 78 tersebut bukanlah nilai yang mencerminkan pemahaman yang sebenarnya si siswa pada mata pelajaran Bahasa Indonesia. Pada contoh lain, misalnya seseorang mendapatkan skor IQ 120, dari sebuat tes IQ yang ia ikuti; skor 120 itu tidak mencerminkan kapasitas intelektual si orang tersebut yang sebenarnya. Mungkin saja kapasitas intelektual yang sebenarnya lebih kecil atau lebih besar dari 120.
Cohen, Schneider, dan Tobin (2022) memaparkan bahwa CTT menyakini dari setiap hasil pengukuran, setiap orang memiliki true score atau nilai yang sebenarnya menggambarkan kualitas atau kuantitas dari sesuatu yang sedang “diukurkan” kepada orang tersebut. Bila merujuk pada contoh yang telah dikemukakan sebelumnya, maka siswa yang mendapat nilai 78 dari Ujian Nasional Bahasa Indonesia, bisa jadi nilai sebenarnya yang betul-betul menggambarkan kualitas pemahaman akan mata pelajaran Bahasa Indonesia ialah 80 atau malah 75. Di contoh lain, seseorang yang hasil tes IQ nya adalah 120, bisa jadi nilai yang menggambarkan kapasitas kecerdasannya yang sebenarnya 125 atau 118.
CTT menunjukkan bahwa nilai atau skor yang didapatkan dari sebuah pengukuran, tes, ataupun ujian, bukanlah nilai yang sebenarnya. Nilai ini bisa disebut sebagai nilai tampak, atau dalam bahasa inggris disebut sebagai observed score. Disebut sebagai nilai tampak, karena nilai inilah yang pertama-tama dan paling mudah terlihat. Semua nilai yang langsung diperoleh dari sebuah pengukuran disebut nilai tampak. Tetapi walaupun mudah terlihat, nilai ini bukan nilai yang mencerimakan kualitas atau kuantitas yang sebenarnya dari sesuatu yang sedang diukur.
Berbeda dari observed score, true score, lebih sulit diidentifikasi. Sampai saat ini masih ada perdebatan akademik tentang bagaimana cara kita dapat mengidenifikasi true score ini. Walaupun ada perdebatan tentang cara mengidentifikasi true score, tetapi ada satu hal yang disepakati secara umum dari CTT, yaitu bahwa selalu ada kesalahan dalam setap pengukuran, yang membuat true score tidak tampak.
Relasi antara skor tampak (observed score), skor murni (true score), dan kesalahan dalam pengukuran (error) dapat disimbolkan dalam rumus:
X = T + e
X adalah skor tampak/ observed score; T adalah skor murni/ true score, dan e adalah error atau kesalahan dalam pengukuran. CTT melihat bahwa nilai X dan e bisa saja bervariasi, tetapi nilai T akan bersifat tetap. Artinya kualitas/ kuantitas sebenarnya dari seseorang relatif sama dari satu pengukuran ke pengukuran yang berikutnya. Hal yang membuat skor hasil pengukuran berubah-ubah, karena adanya kesalahan dalam pengukuran yang berubah-ubah.
Terkait dengan error atau kesalahan dalam pengukuran, hal ini bisa terjadi karena mungkin saja ada error dari pihak tester, ada error dari pihak testee (orang yang dinilai), ada error dari alat ukurnya, dan bisa jadi error pada situasi atau kondisi saat pengukuran dilakukan. Misalnya saja, seorang siswa mengerjakan ujian saat sedang sakit, sehingga ia tidak bisa mengerahkan kemampuan yang sebenarnya; atau misalnya saat tulisan di lembar ujian tidak terbaca dengan jelas, sehingga testee salah memahami soal. Intinya, banyak kesalahan yang mungkin terjadi saat ujian, sehingga skor murni tidak tampak.
Refleksi Melaui Teori Tes Klasik
CTT menunjukkan kepada para “penilai” untuk tidak menganggap hasil penilaian sebagai “kebenaran” yang utama. Semua penilai, pengukur, dan penguji perlu menyadari bahwa akan selalu ada error di setiap pengukuran atau penilaian. Nilai yang langsung muncul setelah pengukuran dan “tampak di depan mata” bukanlah nilai yang sebenarnya.
Pemahaman seperti ini seharusnya menyadaran agar setiap orang tidak menilai seseorang terlalu cepat atas hasil pengukuran yang mereka dapatkan. Tester ataupun testee perlu bijak melihat hasil penilaian atau pengukuran, karena setiap pihak tidak bisa membuat keputusan hanya dari skor yang tampak tersebut.
Sebenarnya pemahaman yang baik akan konsep CTT akan menghindarkan terjadinya kesalahpahaman akibat penilaian atau pengukuran. Sayang, konsep ini tidak dijelaskan kepada khalayak umum. Jika saja setiap siswa, orangtua dan wali siswa, peserta ujian, peserta assessment, pendidik, dan setap pemangku kebijakan menyadari konsep ini, maka akan muncul persepsi, pemikiran, sikap, dan pengambilan keputusan yang adekuat.
Referensi:
Cohen, R. J., Schneider, W. Joel., & Tobin, Renee. M. (2022). Psychological Testing and Assessment: An Introduction to Tests and Measurement (10th ed.). McGraw Hill LLC.
Kline, T. (2005). Psychological Testing: A Practical Approach to Design and Evaluation. SAGE Publications, Inc. https://doi.org/10.4135/9781483385693
Spearman, C. (1904). The Proof and Measurement of Association between Two Things. The American Journal of Psychology, 15(1), 72. https://doi.org/10.2307/1412159
Traub, R. E. (2005). Classical Test Theory in Historical Perspective. Educational Measurement: Issues and Practice, 16(4), 8–14. https://doi.org/10.1111/j.1745-3992.1997.tb00603.x