Senin, Juni 25, 2007

Korelasi Item Total = Valliditas Item?

Hai! jumpa lagi ya dengan saya. Kali ini saya ingin membahas masalah satu ini nih. Seringkali terdengar entah dalam pembicaraan skripsi atau penelitian,
"Validitasnya antara 0,3 - 0,9".
"Validitas pake apa nih?"
"Validitas item."
Setelah dicek lebih jauh yang dimaksud dengan validitas item adalah korelasi item total. Apakah memang demikian adanya : korelasi item total dapat menggambarkan validitas item?

Ada beberapa pendapat mengenai hal ini :
  1. Korelasi item-total tidak dapat dianggap sebagai validitas. Validitas tes merupakan ukuran seberapa jauh sebuah tes mampu mengukur konstruk yang ingin diukur. Kita akan membutuhkan kriteria luar untuk mengujinya. Jadi tidak mungkin menggunakan kriteria di dalam tes itu sendiri (dalam hal ini skor total tes) untuk menguji validitas tes. Bayangkan misalnya ada sebuah alat yang diklaim sebagai alat untuk mengukur berat badan seseorang. Bagaimana kita yakin bahwa alat tersebut memang mengukur berat badan? Kita tidak mungkin melakukannya hanya dengan melihat angka yang dihasilkan alat itu, bukan? Kita harus membandingkannya dengan kriteria lain di luar alat tersebut. Kriteria ini bisa alat lain yang sudah dipastikan kebenarannya mengukur berat badan atau bentuk tubuh orang yang diukur berat badannya.
  2. Korelasi item-total dapat dianggap sebagai ukuran validitas item. Pengertian validitas mencakup akurasi. Jadi bukan hanya seberapa mampu tes mengukur konstruk yang ingin diukur tapi juga seberapa tepat (akurasi). Kurang tepat kiranya mengukur panjang bakteri menggunakan penggaris dengan ukuran centimeter, karena kita tidak akan memperoleh gambaran cukup akurat mengenai panjang bakteri satu dengan yang lain.
    Dengan kata lain, kita tidak memiliki kemampuan mendiskriminasi (membedakan) panjang bakteri satu dengan yang lain. Oleh karena itu pengukuran perlu juga diuji kemampuannya dalam membedakan orang yang satu dengan yang lain. Nah, estimasi daya diskriminasi ini dapat diperoleh melalui korelasi item-total.
  3. Korelasi item-total dapat memberikan gambaran validitas sejauh skor total tes itu sendiri sudah teruji validitasnya. Atau dengan kata lain, korelasi item-total memberikan informasi seberapa jauh suatu item mengukur apa yang diukur oleh skor totalnya. Jadi jika skor total tes tersebut mengukur kecemasan, maka jika korelasi item total suatu item tinggi (duh beribet banget ya..) kita dapat menyimpulkan bahwa item tersebut juga mengukur kecemasan.
Jadi betul nggak korelasi item-total = validitas item? Menurut saya tergantung bagaimana cara pandangmu terhadap korelasi item-total. Maksud saya, apapun label yang kamu berikan (validitas atau daya diskriminasi dsb) yang lebih penting adalah mengetahui apa yang sebenarnya "diceritakan" oleh korelasi item-total.

Jadi apa yang sebenarnya diceritakan oleh Korelasi Item-Total?Korelasi item-total menggambarkan hubungan antara item dengan total.
  • Jika koefisien yang dihasilkan bernilai negatif, ini berarti semakin tinggi skor item akan diikuti oleh semakin rendahnya skor total. Jadi item tersebut memberikan keterangan yang menyesatkan mengenai keadaan subjek. Dapat juga kita katakan bahwa item itu tidak selaras atau memberikan kontribusi yang merusak kualitas skor total (kualitas yang dimaksud di sini adalah reliabilitas tes). Oleh karena itu item-item ini perlu dibuang agar tidak merusak tes.
  • Jika koefisien yang dihasilkan bernilai positif, ini berarti semakin tinggi skor item akan diikuti oleh semakin tinggi skor totalnya. Item tersebut memberikan keterangan yang akurat mengenai keadaan subjek dan dapat membedakan subjek dengan kemampuan tinggi dan subjek dengan kemampuan rendah. Dapat juga dikatakan item tersebut selaras dengan skor totalnya atau berbicara mengenai hal yang sama dengan totalnya dan memberikan kontribusi yang meningktatkan kualitas skor total.
  • Jika koefisien yang dihasilkan mendekati nol (0) maka item itu tidak memberikan informasi apapun mengenai seseorang. Saya sering menyebutnya item mubazir. Keberadaannya tentu saja juga dapat mengurangi kualitas tes. Oleh karena itu item-item ini perlu diperbaiki atau dibuang.
Oke deh segini dulu ya. Saya bertanya-tanya mengapa sampai hari ini sangat jarang orang yang membaca blog ini. Well saya belum mau menyerah. Someday...Someday...

    Kamis, Juni 07, 2007

    Reliabel Haruskah Ajeg? Pengertian Reliabilitas Pengukuran

    Sering kita dengar baik dalam kuliah atau dalam ruang ujian, jawaban mahasiswa terhadap pertanyaan "Apa yang dimaksud reliabilitas?" seperti ini :
    "Taraf Kepercayaan, yaitu seberapa besar tes dapat dipercaya. Tes yang reliabel akan menghasilkan skor yang relatif sama jika diteskan beberapa kali pada subjek yang sama . Dengan kata lain seberapa ajeg sebuah tes jika diteskan beberapa kali pada subjek yang sama di waktu yang berbeda."

    Jika demikian adanya, maka secara logis, satu-satunya cara untuk mengestimasi reliabilitas adalah dengan melakukan pengetesan paling tidak dua kali pada sekelompok subjek yang sama. Tapi benarkah begitu?

    Pada prakteknya kita mengenal paling tidak ada 3 pendekatan terhadap estimasi reliabilitas. Dan orang yang memberikan jawaban seperti di atas juga memilih metode estimasi reliabilitas yang hanya melakukan 1 kali administrasi tes. Jadi mana tingkat keajegannya?

    Well, mungkin beberapa orang tidak terlalu peduli dengan hal ini. Yang penting ada angka reliabilitasnya, habis perkara. Tapi ijinkan saya mencoba berbagi pemikiran mengenai hal ini.

    ReliabilitasKita mulai dari konsep reliabilitas dulu. Reliabilitas seperti yang sering diucapkan atau ditulis di buku, memiliki arti tingkat kepercayaan. Kita coba pilah kata ini menjadi Rely dan Ability atau dapat dipercaya. Tapi apa maksud dari dapat dipercaya ini? Yang dimaksud dapat dipercaya disini adalah seberapa besar kita bisa mempercayai hasil tes yang kita dapatkan, atau juga seberapa besar tingkat kesalahan yang muncul ketika seseorang mengerjakan suatu tes. Semakin besar tingkat kesalahan yang muncul ketika seseorang mengerjakan suatu tes, hasil yang diperoleh dari tes tersebut makin tidak dapat dipercaya, makin tidak reliabel.

    Misalnya: seseorang dites (tes apa saja, karena reliabilitas tidak terlalu peduli dengan isu materi yang diteskan) kemudian memperoleh hasil sebesar 100. Nah jika tes tersebut reliabel, maka kita bisa yakin bahwa kapasitas orang tersebut memang 100. Atau dengan kata lain, angka 100 itu diperoleh bukan karena faktor lain selain kapasitas orang tersebut. Jika angka 100 ini diperoleh lebih banyak karena faktor lain (faktor lain ini yang disebut error), maka kita akan berkata bahwa tes tersebut tidak reliabel.

    Konsep reliabilitas didasarkan pada asumsi bahwa dalam tiap pengetesan selalu ada
    • X, skor yang kita peroleh dari hasil pengetesan (skor Tampak)
    • T, skor yang menggambarkan kapasitas seseorang yang sesungguhnya (skor Murni)
    • e, faktor lain selain kapasitas yang juga menyumbang terhadap perolehan X yang disebut juga error
    dan ketiganya terkait satu sama lain dalam persamaan seperti ini :
    X = T + e
    Ini dapat dibaca seperti berikut : dalam setiap pengetesan, hasil tes yang kita peroleh merupakan fungsi penjumlahan dari skor Murni dan error. Tes dapat dikatakan reliabel jika Tes menghasilkan error yang kecil, sehingga hasil tes makin mencerminkan kapasitas yang sebenarnya (atau X = T ).

    Nah lalu dari mana ide "keajegan" muncul?

    Diasumsikan bahwa nilai T memiliki sifat ajeg dalam beberapa kali pengukuran pada subjek yang sama. Tapi keajegan ini hanya ada dalam abstraksi teoretik saja, karena keajegan yang dimaksud di sini adalah keajegan T jika memenuhi syarat tertentu :
    • tiap pengetesan bersifat saling independen, pengukuran pertama tidak mempengaruhi pengukuran berikutnya. Jadi anggaplah seseorang dites lalu dihipnotis untuk membuatnya lupa dengan jawaban dan soal yang telah diberikan.
    • Kapasitas orang itu sendiri belum berubah. Jadi keajegan ini hanya mungkin jika setelah dites, orang ini dimasukkan dalam mesin waktu dan dikembalikan ke keadaannya saat dites pertama kali.
    Mustahil? Ya jelas! maka dari itu ide mengenai keajegan ini hanya ada dalam abstraksi teoretik.

    Namun demikian tentu saja kita tetap dapat mengestimasi reliabilitas dengan cara melakukan tes berulang lalu mengkorelasikan hasil tes pertama dengan tes kedua. Dengan mempertimbangkan beberapa kelemahan dan persyaratannya.

    Pendekatan-Pendekatan Estimasi ReliabilitasDari beberapa asumsi yang mendasari pemikiran mengenai reliabilitas, kemudian diturunkanlah beberapa pendekatan untuk mengestimasi reliabilitas.
    • Pendekatan Tes-Retes. pendekatan ini mengestimasi reliabilitas tes dengan melakukan tes ulang, kemudian mengkorelasikan hasil tes pertama dengan hasil tes kedua. Hasil korelasi ini yang merupakan estimasi reliabilitasnya, sering juga disebut sebagai koefisien stabilitas atau keajegan. Jadi definisi reliabilitas =keajegan hanya berlaku untuk pendekatan ini. Tapi tentu saja karena tidak mungkin memenuhi persyaratan di atas, pendekatan ini memiliki beberapa kelemahan
      • hanya dapat diterapkan pada tes yang mengukur konstruk yang bersifat cenderung ajeg, misalnya kepribadian.
      • estimasi reliabilitas akan dipengaruhi oleh adanya carry over effect. Maksudnya, jika jarak pengetesan pertama dan kedua sangat dekat, maka subyek akan cenderung mengingat jawaban yang diberikan pada pengetesan pertama. Ini membuat makin besarnya kemungkinan subyek akan memberikan jawaban pada pengetesan kedua yang cenderung sama dengan jawaban yang diberikan pada pengetesan pertama.Hal ini akan menyebabkan overestimasi reliabilitas, tes terkesan/ terlihat lebih reliabel daripada yang sebenarnya.
      • estimasi reliabilitas juga dipengaruhi adanya practice effect. Ini terjadi ketika subyek, dalam rentang waktu antara tes pertama dan kedua, belajar atau berlatih untuk meningkatkan kapasitasnya, ini terjadi khususnya dalam estimasi reliabilitas tes performansi maksimal seperti tes prestasi. Practice effect akan menyebabkan underestimasi reliabilitas, tes terkesan tidak ajeg karena adanya pembelajaran, sehingga hasil tes kedua akan cenderung lebih baik dari hasil tes pertama.
    • Pendekatan Tes Paralel, pendekatan ini mengestimasi reliabilitas dengan menggunakan dua tes paralel, dua tes yang mengukur hal /konstruk yang sama, kemudian mengkorelasikan hasil pengetesan dari tes pertama dengan hasil tes paralelnya. Koefisien korelasi yang didapatkan disebut juga koefisien ekuivalensi. Namun demikian pendekatan ini sangat jarang (kalaupun ada) dilakukan karena sulitnya menghasilkan dua tes yang benar-benar paralel.
    • Pendekatan Konsistensi Internal, pendekatan ini mengestimasi reliabilitas dengan membelah tes menjadi beberapa bagian, lalu "mengkorelasikan" bagian-bagian tersebut. "Korelasi" di sini sebenarnya tidak benar-benar mengkorelasikan bagian-bagian secara harafiah, tapi menggunakan formula-formula yang dikembangkan untuk mengestimasi reliabilitasnya. Koefisien yang diperoleh dinamai juga koefisien konsistensi internal. Pendekatan inilah yang paling sering digunakan selama ini karena lebih praktis dan ekonomis. Meskipun demikian pendekatan ini tidak dapat mengestimasi error yang diakibatkan oleh keadaan temporer karena hanya dilakukan satu kali. Jadi pendekatan ini memang bukan "jawaban terhadap segala masalah" dalam hal mengestimasi reliabilitas.
    Kesimpulan
    Jadi, reliabilitas apakah sama dengan keajegan?
    Jika kita melihat permasalahan ini dari kacamata asumsi yang mendasari pemikiran reliabilitas di atas, maka reliabel = ajeg. tentu saja dengan persyaratan yang mustahil untuk dipenuhi tadi.
    Tapi jika dilihat dalam konteks aplikasinya, reliabilitas tidak selalu sama dengan keajegan, tergantung dari pendekatan mana yang digunakan untuk mengestimasinya.

    Mungkin akan lebih aman jika kita menyebut reliabilitas sebagai "tingkat kepercayaan, seberapa jauh error yang dihasilkan dari tes, dan seberapa jauh hasil tes dapat dipercaya".

    Well that's it for now. We will continue later.