Iklan 1

Senin, Juni 25, 2007

Korelasi Item Total = Valliditas Item?

Hai! jumpa lagi ya dengan saya. Kali ini saya ingin membahas masalah satu ini nih. Seringkali terdengar entah dalam pembicaraan skripsi atau penelitian,
"Validitasnya antara 0,3 - 0,9".
"Validitas pake apa nih?"
"Validitas item."
Setelah dicek lebih jauh yang dimaksud dengan validitas item adalah korelasi item total. Apakah memang demikian adanya : korelasi item total dapat menggambarkan validitas item?

Ada beberapa pendapat mengenai hal ini :
  1. Korelasi item-total tidak dapat dianggap sebagai validitas. Validitas tes merupakan ukuran seberapa jauh sebuah tes mampu mengukur konstruk yang ingin diukur. Kita akan membutuhkan kriteria luar untuk mengujinya. Jadi tidak mungkin menggunakan kriteria di dalam tes itu sendiri (dalam hal ini skor total tes) untuk menguji validitas tes. Bayangkan misalnya ada sebuah alat yang diklaim sebagai alat untuk mengukur berat badan seseorang. Bagaimana kita yakin bahwa alat tersebut memang mengukur berat badan? Kita tidak mungkin melakukannya hanya dengan melihat angka yang dihasilkan alat itu, bukan? Kita harus membandingkannya dengan kriteria lain di luar alat tersebut. Kriteria ini bisa alat lain yang sudah dipastikan kebenarannya mengukur berat badan atau bentuk tubuh orang yang diukur berat badannya.
  2. Korelasi item-total dapat dianggap sebagai ukuran validitas item. Pengertian validitas mencakup akurasi. Jadi bukan hanya seberapa mampu tes mengukur konstruk yang ingin diukur tapi juga seberapa tepat (akurasi). Kurang tepat kiranya mengukur panjang bakteri menggunakan penggaris dengan ukuran centimeter, karena kita tidak akan memperoleh gambaran cukup akurat mengenai panjang bakteri satu dengan yang lain.
    Dengan kata lain, kita tidak memiliki kemampuan mendiskriminasi (membedakan) panjang bakteri satu dengan yang lain. Oleh karena itu pengukuran perlu juga diuji kemampuannya dalam membedakan orang yang satu dengan yang lain. Nah, estimasi daya diskriminasi ini dapat diperoleh melalui korelasi item-total.
  3. Korelasi item-total dapat memberikan gambaran validitas sejauh skor total tes itu sendiri sudah teruji validitasnya. Atau dengan kata lain, korelasi item-total memberikan informasi seberapa jauh suatu item mengukur apa yang diukur oleh skor totalnya. Jadi jika skor total tes tersebut mengukur kecemasan, maka jika korelasi item total suatu item tinggi (duh beribet banget ya..) kita dapat menyimpulkan bahwa item tersebut juga mengukur kecemasan.
Jadi betul nggak korelasi item-total = validitas item? Menurut saya tergantung bagaimana cara pandangmu terhadap korelasi item-total. Maksud saya, apapun label yang kamu berikan (validitas atau daya diskriminasi dsb) yang lebih penting adalah mengetahui apa yang sebenarnya "diceritakan" oleh korelasi item-total.

Jadi apa yang sebenarnya diceritakan oleh Korelasi Item-Total?
Korelasi item-total menggambarkan hubungan antara item dengan total.
  • Jika koefisien yang dihasilkan bernilai negatif, ini berarti semakin tinggi skor item akan diikuti oleh semakin rendahnya skor total. Jadi item tersebut memberikan keterangan yang menyesatkan mengenai keadaan subjek. Dapat juga kita katakan bahwa item itu tidak selaras atau memberikan kontribusi yang merusak kualitas skor total (kualitas yang dimaksud di sini adalah reliabilitas tes). Oleh karena itu item-item ini perlu dibuang agar tidak merusak tes.
  • Jika koefisien yang dihasilkan bernilai positif, ini berarti semakin tinggi skor item akan diikuti oleh semakin tinggi skor totalnya. Item tersebut memberikan keterangan yang akurat mengenai keadaan subjek dan dapat membedakan subjek dengan kemampuan tinggi dan subjek dengan kemampuan rendah. Dapat juga dikatakan item tersebut selaras dengan skor totalnya atau berbicara mengenai hal yang sama dengan totalnya dan memberikan kontribusi yang meningktatkan kualitas skor total.
  • Jika koefisien yang dihasilkan mendekati nol (0) maka item itu tidak memberikan informasi apapun mengenai seseorang. Saya sering menyebutnya item mubazir. Keberadaannya tentu saja juga dapat mengurangi kualitas tes. Oleh karena itu item-item ini perlu diperbaiki atau dibuang.
Oke deh segini dulu ya. Saya bertanya-tanya mengapa sampai hari ini sangat jarang orang yang membaca blog ini. Well saya belum mau menyerah. Someday...Someday...


    34 komentar:

    Ai mengatakan...

    wah mas, bagus bged artikelnya.
    saya mahasiswa psikologi en butuh bged penjelasan kaya gini. makasi yah

    Agung Santoso mengatakan...

    Iya sama-sama untuk komentarnya. Saya menunggu pertanyaan atau komentar lain. Terima kasih.

    Anonim mengatakan...

    mas agung, terimakasih atas penjelasan statistiknya, sangat menolong :). mas agung bisa tolong jelaskan saya lebih lanjut ndak ya bagaimana step melakukan uji validitas produk moment di spss serta uji reabilitas cochran (?) di spss pula. terimakasih sebelumnya ya mas.

    ina

    Agung Santoso mengatakan...

    untuk ina:
    mungkin ina bisa memperjelas yang dimaksud ina dengan uji validitas produk momen? Apakah yang dimaksud menggunakan produk momen untuk menguji validitas? Jika memang benar demikian, saya berencana akan menulis satu psoting sendiri mengenai ini.
    Juga terkait dengan uji reliabilitas cochran. Saya sendiri belum pernah mendengarnya. apakah yang dimaksud menggunakan teknik cochran untuk mengestimasi reliabilitas? Dapatkah ina memberikan gambaran lebih rinci mengenai penelitian yang dilakukan agar saya punya gambaran lebih lengkap?

    Anonim mengatakan...

    Makasih banget artikelnya Mas... Saya kebetulan lagi bingung sama validitas saya, karena mau pake validitas item saja... tapi banyak pendapat yang berbeda, jadi tadinya saya pusing *_*

    Omong2, kalau boleh bertanya, apakah yang dilihat itu kolom corrected item-total correlation atau output dari korelasi pearson antara item dengan total? Saya tadinya berpikir kalo itu sebenarnya sama saja, tapi setelah membandingkan output keduanya saya bingung karena corrected item-total correlation saya rata2 < korelasi Pearson-nya *_*

    Karena itu, ada item yang gak masalah pas menggunakan korelasi Pearson (signifikan2 aja), tapi corrected item-total correlation-nya kecil (<0,2). Saya bingung mau pake yang mana jadinya...

    -tari-

    Agung Santoso mengatakan...

    Terima kasih ya, Tari.

    Menurut saya jauh lebih baik kalo Tari melihat corrected item total correlation karena korelasi ini sudah 'dibersihkan' dari efek spurious overlap karena pengaruh item yang diukur korelasi item totalnya dalam skor total.

    Jika kita melihat hasil korelasi item total dalam korelasi produk momen, hasil korelasinya memang akan cenderung overestimasi dari korelasi 'sebenarnya'. Jadi memang angkanya pasti akan cenderung lebih besar dari corrected item-total correlation

    Anonim mengatakan...

    Sip, terima kasih jawabannya :D

    alm788821 mengatakan...

    goood ini yg q cr sngt brmnft bg saya tp pngin tny tesis yng sdng sy garap tentang penerapan media audio visual pada pembelajaran bercerita studi eksperimen dg anlisis varian tp mash bngng pake anava yg mn y?

    Agung Santoso mengatakan...

    halo alm788821,

    Wah terima kasih atas komentarnya ya. Terkait dengan pertanyaan anda, bisakah memberitahukan desain penelitiannya? karena menentukan analisis statistik tentunya harus melihat desain penelitiannya dulu.

    Anonim mengatakan...

    GREAT! Belajar statistik bisa jadi lebih relax. Pastinya sangat bermanfaat bwt konco2 yang lagi skripsi n tesis (termasuk saya).Klo boleh usul, dimasukkan jg penjelasan ttg analisis dg SEM dunk.. Oiya, saking bagusnya saya print smua artikel yang diposting untuk saya jadikan bahan bacaan untuk membahas analisis saya, boleh khan ya??

    best regards
    -nouring-

    Agung Santoso mengatakan...

    Untuk Nouring,
    Boleh sekali kalau mau diprint dan dibaca2 sendiri. Semoga bisa membantu.

    Kalo untuk SEM, saya memutuskan tidak menulisnya di sini. Karena sasaran utama blog ini adalah mahasiswa s1. Selain itu saya pribadi merasa belum cukup mumpuni untuk bisa menulis tentang SEM. Masih banyak yang harus saya pelajari dulu.

    Btw, terima kasih untuk komentarnya.

    evano mengatakan...

    Bagus nieh mas,,, kalu boleh tahu referensi buku yang saya baca apa yach,,,, akan tetapi kalau tidak salah korelasi item dengan scor total lebih di tujukan pengukuran yang bersifat skala,,, kalau datanya benar salah gimana?

    pu2t mengatakan...

    wuaaahhh, makasih bgt mas!! Q lagi ngubek nyari2 apa bedanya validitas sama daya diskrimasi. alhamdulillah akhirnya ketemu jga lewat blog ni. thx

    Anonim mengatakan...

    Jangan Kwatir Pak Saya akan bertanya.

    jadi apakah Hanya dengan Produc Moment Rumus yang paling tepat untuk menghitung Validitas???, Kalau dengan rumus lain Kenapa ? Range Sperman (apa ini salah nulis) Mungkin

    tks pak.

    Agung Santoso mengatakan...

    untuk evano,
    Wah bukunya apa ya? Sebagian besar ide dalam artikel ini merupakan pendapat pribadi. Jadi saya hanya memperjelas kembali definisi yang ada selama ini mengenai validitas, reliabilitas, korelasi item-total, dll.
    Mengenai korelasi item-total, dalam praktek selama ini orang biasanya menggunakan korelasi produk moment juga. Dalam hal ini, perhitungannya akan berubah menjadi korelasi point biserial. Tetapi sebenarnya akan lebih tepat jika menggunakan korelasi biserial karena 1 dan 0 memiliki makna tingkatan yang dapat diasumsikan kontinum.

    untuk penanya terakhir,
    tidak dapat dikatakan korelasi product moment sebagai satu-satunya yang benar. Tetapi jika baik skor total maupun item bersifat interval, maka korelasi produk moment yang paling pas digunakan (lebih tepatnya korelasi produk moment yang dikoreksi).
    Apakah mungkin menggunakan spearman, menurut saya hasilnya tidak akan jauh berbeda, karena kedua teknik ini bisa dibilang 'saudara'. Dalam arti korelasi spearman itu modifikasi korelasi produk moment untuk menangani data ordinal.

    Anonim mengatakan...

    mas, keren artikelnya. tapi saya bingung, spurious overlap itu apa sih maksudnya? bisa dijelaskan dengan contoh? thanks

    Anonim mengatakan...

    mas, keren artikelnya. tapi saya bingung, spurious overlap itu apa sih maksudnya? bisa dijelaskan dengan contoh? thanks

    Agung Santoso mengatakan...

    Terima kasih. Ya saya akan membahas ini dalam satu posting sendiri saja.

    Anonim mengatakan...

    mau tanya, kalau reliabilitas diatas o,700 dan item total correlation bergerak antara 0,100 - 0,500 (kebanyakan dibawah 0,300)
    apa mungkin terjadi? kira2 kenapa ya?

    Agung Santoso mengatakan...

    Untuk Anonim,

    Hmm... Saya tidak dapat memberikan jawaban meyakinkan, karena saya perlu tahu dulu banyaknya item keseluruhan dan banyaknya item yang rit nya di bawah 0.3.

    Secara teoretik memungkinkan, dalam arti jika item-item dengan rit yang tinggi mencukupi, sangat mungkin untuk mendapatkan reliabilitas di atas 0.7.

    NeedHelp mengatakan...

    saya ingin bertanya, (maaf jika pertanyaan nya banyak)

    1. uji validitas apa yang tepat untuk skripsi saya dengan topik kualitas jasa (menggunakan skala linkert 1-7), saya di suruh dosen pembimbing saya menggunakan KMO, tapi saya tidak mengerti cara menyatakan valid tiap variabelnya..
    2. saya melihat skripsi orang lain, mengukur valid tiap variabel melalui rotated component matrix, yang menjadi pertanyaan dasar2 apa yang di gunakan bahwa tiap variabel tsb valid.
    3. Mas punya referensi diperbolehkan mamakai corrected item total correlation untuk uji valid jika tidak ingin memakai cara KMO, soalnya saya kira lebih mudah menggunakan cara ini.. (saya sangat butuhkan buat sumber jika sidang ditanya nanti) and kira2 boleh tidak memakai cara ini untuk mengukur validitas pada topik saya ?
    thx B4

    Agung Santoso mengatakan...

    Sebenarnya ada banyak cara untuk mengecek validitas alat ukur.
    Cara yang dianjurkan oleh dosen pembimbing sebenarnya kurang pas dalam arti belum selesai.

    Yang dilakukan oleh teman-teman yang lain dengan analisis faktor merupakan salah satu cara pengecekan yang bisa dilakukan.

    KMO sphericity test hanyalah merupakan uji asumsi sebelum dilakukan analisis faktor. Asumsi ini dipenuhi jika nilainya di atas 0.6.

    Korelasi item-total sendiri jarang dianggap sebagai pengecekan validitas. Beberapa ahli menganggap korelasi item-total dapat dijadikan ukuran validitas hanya jika skor totalnya sudah valid terlebih dulu (buku-buku P Sumadi Suryabrata alm.).

    Tapi saya pribadi kurang menganjurkan korelasi item-total dijadikan cara pengecekan validitas. Salah satu artikel dalam blog ini juga membahas mengenai hal ini. Jadi mungkin bisa dibaca :
    http://psikologistatistik.blogspot.com/2007/06/korelasi-item-total-valliditas-item.html

    Anonim mengatakan...

    mas agung sblmny tks atas pnjlsannya..sgt membantu
    yg ingin sy tanyakan, berarti korelasi item total ini bisa dipakai untuk memprediksi mana saja item yang hrs dibuang/direvisi. benarkah?

    ada yg bilang katanya untuk melihat item yang dikoreksi atau tidak itu bisa jg melalui cara melihat item yang dihitung per dimensi. misal jika data ordinal data dihitung dengan korelasi spearman, apa benar?

    jika benar kedua hal tersebut bisa digunakan untuk menseleksi item yang harus dibuang atau dapat direvisi. cara manakah yang lebih tepat?

    tks buat perhatiannya.

    Agung Santoso mengatakan...

    Benar bahwa korelasi item total dapat digunakan sebagai informasi untuk memilih item yang baik.

    Mengenai korelasi per dimensi dengan spearman, saya sendiri kurang paham maksud pertanyaannya. Apakah ini berarti skor total setiap dimensi dikorelasikan satu dengan lain? Atau item dikorelasikan dengan skor total dimensi. Yang manapun dari kedua cara itu tidak perlu menggunakan korelasi spearman. Korelasi produk momen seperti yang digunakan untuk korelasi item-total pun dapat digunakan.

    Anonim mengatakan...

    tks mas agung buat jwbnnya yg dgn cepat direspon & sgt membantu sy. Maksudnya "Mengenai korelasi per dimensi dengan spearman yang mas agung tanyakan", maksud sy adalah semua item yang dikorelasikan dengan skor total dimensi dgn menggunakan cr spearman.

    jadi begini mas, saya mendapati jumlah item yg banyak direvisi setelah saya menggunakan corrected item total correlation, berbeda ktk sy menggunakan cara spearman krn Item yg direvisi atau mjd terbuang lebih sdkt drpd cara ktk menggunakan corrected item total correlation. saya bingung, cara mana yang sebenarnya lebih baik saya gunakan untuk menseleksi item yg direvisi/dibuang? (sbg informasi jumlah item sy dlm kuesioner berjumlah 50)

    -terry-
    (maaf sy lupa mencantumkan identitas sy sblmnya)

    Agung Santoso mengatakan...

    Terry,
    Sebenarnya cara mengkorelasikan antara item dengan skor total dimensi baru bisa dilakukan hanya jika tiap dimensi dianggap terpisah dengan dimensi lain.

    Tentu saja hasilnya akan lebih banyak yang terselamatkan itemnya, karena satu dimensi akan cenderung homogen. Sehingga cenderung tinggi korelasinya. Cara yang dipakai terry, akan cenderung memberikan estimasi yang berlebihan mengenai kualitas item dibanding yang 'corrected'.

    Nah, kalau mana yang perlu dilakukan ya mana yang paling sesuai dengan sifat variabelnya. Misalnya kalau variabelnya cenderung unidimensional, ya lebih tepat dikorelasikan antara item dengan skor total. Tapi kalau sifat variabelnya multidimensional, maka lebih baik jika dikorelasikan per dimensi. Baik uni maupun multi, tetap harus menggunakan korelasi yang 'corrected'. Karena hasilnya akan cenderung lebih 'bersih'.

    Handi mengatakan...

    pak agung, saya mau tanya mengenai korelasi item total. kalau boleh tau angka korelasi item total yang di katakan "bagus" itu berapa ya pak... karena dari penjelasan di atas skor yang minus lebih baik di buang, lalu untuk yang 0.00 di katakan mubazir hehehe... seandainya korelasi item total dibawah 0,3 ambilnya contoh korelasi item menunjukan angka 0.2apkah itu bisa dimasukan... lalu bila reliabilitasnya tinggi sedangkan skor korelasi item total rendah, bagaimana mengambil keputusannya ? apakah item tersebut harus dibuang... terima kasih pak

    Agung Santoso mengatakan...

    untuk Handi,
    Memang idealnya jika korelasi item total lebih kecil dari 0,3 sebaiknya item tersebut dibuang. Namun demikian, menurut saya ada beberapa pertimbangan yang perlu dibuat sebelum membuang item.
    Jika item yang ingin dibuang berkorelasi negatif atau nol, memang ia bisa dibilang tidak memiliki sumbangan yang menguntungkan bagi skala.
    Tapi jika korelasinya di sekitar angka 0,3 (lebih kecil sedikit dari nilai tersebut) maka bisa dipertimbangkan untuk tetap dipertahankan, khususnya jika reliabilitas sudah tinggi. Dan penurunan reliabilitas tidak terlalu banyak.

    rierie mengatakan...

    trimakasih mas.. saya sudah membacanya. bermanfaat sekali.. :)

    Anonim mengatakan...

    Saya dgn arni.mau bertanya ketika sy menguji kevalidan item menggunakan Corrected Item-Total Correlation, tapi hasilnya tidak ada item yg valid atau semua item tdk valid.menurut bpk langkah selanjutnya bgmn?
    Trm ksh.

    Agung Santoso mengatakan...

    Untuk Rierie,
    Terima kasih untuk komentarnya. Semoga berguna untuk yang lain juga ya. Salam.

    Untuk penanya mengenai validitas item, sebenarnya corrected item total correlation tidak sepenuhnya dapat dianggap sebagai validitas begitu saja. Jadi anggapan itu harus agak hati-hati dikaji.
    Kalau semua nilai korelasi item totalnya tidak baik, maka memang mau tidak mau try out harus diulang dengan terlebih dulu memperbaiki item-itemnya. Ini dilakukan dengan teliti agar tidak terjadi lagi terlalu banyak item yang gugur.

    supeRoRo mengatakan...

    mas saya mau nanya..
    untuk uji reliabilitas, jika alpha cronbach saya sudah diatas 0,7 namun di korelasi item totalnya masih ada yang dibawah 0.3 bahkan ada yang minus sebaiknya aitem2 dibuang apakah dipertahankan? mengingat alpha cronbach saya sudah diatas 0.7..
    terima kasih mas :)

    Agung Santoso mengatakan...

    Untuk SupeRoRo,

    Jika analisis item menunjukkan korelasi item total yang rendah bahkan negatif, sebaiknya memang digugurkan atau diperbaiki meskipun angka reliabilitas sudah mencapai 0.7.
    Perlu dilihat juga seberapa besar perubahan nilai reliabilitas skala jika item tersebut digugurkan (alpha if item deleted). Jika perubahannya tidak banyak, maka item itu mungkin masih bisa bertahan, tapi jika perubahannya besar ini berarti item ini memang 'pengganggu' dalam skala sehingga perlu dibuang atau direvisi.

    Anonim mengatakan...

    selamat pagi Pak Agung. sya mau curhat, Pak. mengapa semakin saya bnyak bca sumber justrus sya semakin bingung. saya hnya ingin memastikan sja mana yg hrus sya pegang. apa untuk validitas standartnya memang < 0,3?
    karena ad sumber yg mencantumkan bhwa untuk menentukan valid, tiap item/skor Corrected Item-Total Correlation > df = n-2 (r tabel 5%). dalam try out sya, diperoleh > 0,138. ap ini dpt digunakan sbg stndr data sya?
    lalu pak apa bedanya dk = n-1 dan df = n-2?
    terimaksih sebelumnya, Pak.. GB ^^