Jumat, Januari 18, 2008

Pertanyaan Keempat Seputar Uji Asumsi

Setelah beberapa saat saya menerima pertanyaan keempat dari Bu Susan. Begini pertanyaannya:

satu lagi pertanyaan, Pak... mengapa di buku Hair dkk. itu untuk
residunya menggunakan studentdized residual ya bukan
unstandardized residual?...
Jawab:
Ya ada beberapa macam residual yang dapat diperoleh ketika kita melakukan analisis regresi. Yang pernah saya tuliskan di posting mengenai normalitas dalam regresi adalah unstandardized residual.
Selain studentized, masih ada standardized residual, deleted standardized residual, dan deleted studentized.

Standardized residual.
Standardized residual, seperti namanya, adalah residual yang distandardkan. Maksudnya seperti mencari nilai Z dari residual. Keuntungan menggunakan standardized residual ini adalah tidak terpengaruh terhadap unit ukur, karena semua distandardkan. Jadi pengukuran menggunakan dua skala yang berbeda unit ukurnya (misalnya yang satu skor maksimalnya 10 yang lain skor maksimalnya 100) akan muncul dalam unit yang sama yaitu SD.

Studentized Residual
Kelemahan dari Standardized Residual adalah asumsi bahwa varians untuk semua residu adalah sama. Kenyataannya, semakin jauh sebuah skor dari prediksinya, ia cenderung memiliki variasi yang makin besar. Oleh karena itu diperbaiki dengan menerapkan rumus tertentu (sering disebut leverage atau h) untuk memperbaiki situasi ini. Dengan menggunakan rumus ini, makin jauh residu dari meannya (yang menggambarkan makin jauh individu menyimpang dari prediksinya), makin besar varians residunya. Nah ketika digambarkan dalam grafik, maka studentized residual ini akan mengikuti distribusi t (ini makanya dikasih nama studentized, dari student t distribution).

Deleted Standardized dan Deleted Studentized
Kedua ukuran residu ini sebenarnya memiliki pemikiran yang sama dengan ukuran residu tanpa deleted. Hanya saja, kelemahan Standardized atau Studentized Residual adalah 'turut campur'nya observasi yang didiagnostik dalam perhitungan Standardized atau Studentized Residual. Sehingga jika observasi itu memiliki residu yang besar, ia juga akan memperkecil standardized dan studentized residual. Hal ini tentunya akan membuat kedua ukuran itu menjadi kurang sensitif mendeteksi adanya outlier atau influential observation (untuk sementara sebut saja keduanya observasi yang cari gara-gara atau observasi bermasalah sampai kita membahas mengenai regresi sampai tuntas ...tas...tas...tas...). Mengapa begitu? Pertama, residu yang besar akan memperbesar standard error yang digunakan untuk membagi besarnya residu karena memperbesar mean. Jika standard error membesar, ini berarti hasil bagi antara residu dengan standard error residu akan mengecil. Jadi, residu yang besar akan terlihat tidak terlalu besar dengan ukuran ini.
Oleh karena itu, ketika menghitung standard error residunya, observasi yang akan dianalisis tidak disertakan dalam perhitungan. Ini akan membuat ukuran ini lebih peka terhadap observasi yang bermasalah ini. Inilah makanya disebut sebagai deleted studentized atau deleted standardized.

Dari beberapa ukuran itu, menurut saya, Deleted Studentized Residual merupakan ukuran yang paling sensitif terhadap observasi bermasalah. Jadi jika menghendaki analisis yang peka, memang sebaiknya menggunakan Deleted Studentized. Nah seberapa peka itu terserah pemakainya.
Kelemahan semua ukuran residu ini adalah kita tidak memiliki ukuran pembanding 'kekuatan' observasi bermasalah ini dalam mempengaruhi hasil analisis regresi. Oleh karena itu seringkali peneliti melihat ukuran lain seperti Leverage atau Cook's D, atau bahkan DFBeta dalam melakukan diagnostik. Ukuran residu ini digunakan sebagai 'screening' awal untuk melihat observasi bermasalah yang berpotensi mempengaruhi hasil penelitian, dengan cara memplotkan ukuran residu ini dalam scatter plot, kemudian dilihat mana observasi yang menyimpang sangat jauh dari rekan-rekannya. Kemudian dilakukan diagnostik mendalam menggunakan Leverage atau Cook's D.

terkait dengan uji normalitas menurut saya (lagi-lagi pendapat tidak didasarkan pada kajian atau analisis mendalam dari penelitian. Jadi lagi-lagi ini bisa diangkat jadi penelitian untuk mengkaji adakah perbedaan hasil analisis normalitas untuk keempat ukuran tersebut. Ada yang berminat? Mahasiswa lagi skripsi? Dosen yang lagi getol penelitian?), keempat ukuran itu tidak akan memberikan hasil yang jauh berbeda terkait dengan uji normalitas. Tentu saja jika mencari yang terbaik kita bisa menggunakan Deleted Studentized Residual.

OK demikian jawaban saya Bu Susan. Semoga bisa memberi tambahan ide seputar uji normalitas ini.

4 komentar :

Anonim mengatakan...

Pak, sekedar info. Ketika saya klik; link Topik Analisis Varians. Ketika saya klik di link tersebut, malah muncul halaman situs SearchMachine.com. Sepertinya ada kesalahan address deh. Saat saya klik kanan dan link Copy link location, ternyata addressnya http://http//psikologistatistik.blogspot.com/search/label/Analisis%20Varian. Lalu saya coba copy dan mengetikkannya dengan address: http//psikologistatistik.blogspot.com/search/label/Analisis%20Varian, berhasil deh. Demikian infonya, mudah-mudahan bisa diperbaiki, agar rekan pengunjung bisa mengaksesnya. Terimakasih.

Anonim mengatakan...

Wah maaf Pak, ternyata address di komentar yang saya posting ternyata terpotong/tidak lengkap. Maksud saya, link tersebut memiliki address yang salah ketik, ada 2 http-nya: http://http//,sehingga tidak bisa diakses. Terimakasih.

Unknown mengatakan...

wah terima kasih pak Azwar untuk informasinya. Ternyata memang ada kesalahan di link nya.Sudah saya perbaiki hari ini. Semoga kali ini sudah betul

Anonim mengatakan...

makasih banyak pak penjelasannya, sangat bermanfaat