Statistik Untuk Psikologi: November 2007

Ada sebuah pertanyaan dalam komentar yang saya pikir ada baiknya dibahas secara mendalam dalam satu posting sendiri. Terima kasih buat vensi_arg yang sudah kirim pertanyaan. Pertanyaannya seperti ini:

pak, mohon bantuannya
saya jadi bingung bagaimana mengukur validitas yang benar...
karena setau saya menggunakan korelasi item-total, namun ternyata korelasi tersebut bukan merupakan validitas yang sebenarnya hanya gambaran. lalu pengukuran validitas manakah yang akurat?
ada yang mengatakan dengan melihat coreccted aitem-total corelation pada uji realibilitas alpha crobach

mohon bantuannya pak
terima kasih..

Mengenai korelasi item total baik yang dikoreksi (corrected item total correlation) atau tidak bisa dilihat dalam pembahasan mengenai hal ini dalam posting terdahulu : Korelasi Item Total = Validitas Item?

Baiklah sekarang kita menginjak tema satu ini: (drum role please) Validitas Pengukuran

Pada intinya validitas pengukuran memberikan gambaran mengenai seberapa jauh pengukuran yang kita lakukan itu memang mengukur sesuai yang ingin diukur. Maksudnya apakah pengukuran telah memenuhi tujuannya. Misalnya kita ingin mengukur inteligensi, maka apakah alat yang kita pakai untuk mengukur inteligensi itu memang benar-benar mengukur inteligensi bukan yang lain misalnya seperti yang dicurigai orang selama ini : kemampuan akademik. Atau jika kita ingin mengukur kecemasan, apakah alat yang kita pakai memang mengukur kecemasan bukan depresi misalnya.

Nah untuk validitas ini bisa diestimasi dengan berbagai cara. Saya akan menggunakan pengklasifikasian yang biasa dipakai di kelas yang mengacu buku-buku Saifuddin Azwar dengan sedikit modifikasi:

Validitas tampang; pendekatan ini menggunakan penilaian subjektif dari subjek atau testee mengenai keabsahan tes. Tentunya metode ini hanya dapat digunakan jika tujuan alat ukur memang secara jelas dapat diketahui oleh testee. Misal tes yang digunakan di kelas untuk mengukur hasil belajar.Validitas tampang yang tinggi dapat diperoleh jika testee setuju kalau tes yang mereka kerjakan memang mengukur apa yang ingin diukur. Validitas tampang yang tinggi dapat berarti buruk pada tes atau skala yang tujuan pengetesannya sebaiknya tidak diketahui oleh subjek. Misalnya skala sikap. Jika subjek dapat mengetahui tujuan pengukuran dari melihat tes, maka kita akan meragukan hasil pengukurannya. Karena subjek memiliki kemungkinan untuk memberikan respon yang bias (tidak sesuai dengan apa yang dia alami tapi lebih pada respon yang seharusnya diberikan).
Validitas Isi; pendekatan ini menggunakan kriteria berupa tabel spesifikasi yang berisi domain dari tes. Domain ini dapat berasal dari (1) teori yang mendukung konstruk yang diukur (lihat post Stop Press: Aspek, Indikator, Dimensi dan Faktor),(2) kurikulum, jika pengukuran dilakukan pada hasil prestasi belajar (3) kebutuhan yang menjadi persyaratan, ini khususnya jika pengukuran dimaksudkan sebagai alat seleksi. Dalam hal ini estimasi validitas dilakukan dengan membandingkan teori dengan tabel spesifikasi dan item yang disusun, apakah tabel spesifikasi selaras dengan teori yang mendasarinya, dan apakah item memang mengungkap aspek yang ingin diukur. Penilaian mengenai hal ini dapat dilakukan oleh penilai profesional (professional judgement). Beberapa buku menyebutnya sebagai Validitas Isi Logis .
Validitas Kriteria; pendekatan ini dapat dilakukan dengan mengkorelasikan hasil tes (berupa skor) yang ingin diestimasi validitasnya dengan kriteria berupa hasil tes lain atau perilaku prediksi yang diharapkan. Misalnya kita ingin mengestimasi validitas tes inteligensi yang sudah kita susun. Kita dapat melakukannya dengan mengkorelasikan hasil tes inteligensi kita dengan hasil tes inteligensi lain yang sudah baku. Jika korelasi antara hasil tes inteligensi kita dengan yang sudah baku itu positif dan tinggi, maka dapat dikatakan tes inteligensi kita memiliki validitas yang baik. Metode ini disebut juga concurrent criterion-related validity. Atau kita juga dapat mengestimasi dengan mengkorelasikan hasil tes inteligensi kita dengan perilaku prediksi yang diharapkan, misalnya prestasi belajar siswa di sekolah. Jika hasil korelasi bernilai positif dan tinggi, maka dapat dikatakan tes inteligensi kita memiliki validitas prediktif yang baik terhadap prestasi di sekolah. Ada beberapa syarat yang perlu dipenuhi kriteria yang akan digunakan yaitu: relevan, reliabel, tidak bias, dan dapat diperoleh.
Validitas Konstruk; estimasi validitas konstruk dilakukan dengan membandingkan 'perilaku' skor tes dengan teori yang mendasari tesnya. Misalnya dalam teori dikatakan inteligensi itu memiliki korelasi positif dengan bakat kognitif tapi tidak memiliki korelasi dengan bakat musik. Maka tes inteligensi yang kita buat dapat dikatakan memiliki validitas konstruk jika skor tesnya memiliki korelasi yang positif dengan hasil skor tes bakat kognitif dan tidak memiliki korelasi yang signifikan dengan bakat musik. Ada cukup banyak teknik yang dapat digunakan untuk mengestimasi validitas konstruk ini, misalnya dengan menggunakan Analisis Faktor atau metode Multi-Trait Multi-Method.

Estimasi validitas no 1 dan 2 dapat dilakukan tanpa menggunakan skor tes yang bersangkutan. Sementara no 3 dan 4 kita harus melakukan pengetesan untuk memperoleh skor tes untuk dikorelasikan atau dibandingkan dengan skor tes lain.

Dalam penelitian di jenjang S-1 biasanya mahasiswa tidak dituntut untuk melakukan estimasi validitas menggunakan Validitas Kriteria apalagi Validitas Konstruk. Biasanya hanya dituntut untuk melakukan estimasi dengan menggunakan pendekatan validitas tampang dan isi logis saja.

OK semoga bisa menjawab kegundahan hati vensi_arg mengenai validitas pengukurannya.

Measurement and Evaluation in Psychology and Education (8th Edition)

Educational Measurement Fourth Edition (American Council on Education/Oryx Press Series on Higher Education)

Selasa, November 20, 2007

Validitas Pengukuran