Minggu, September 16, 2007

Uji Asumsi 1 : Uji Normalitas dalam SPSS

Dua post saya terdahulu tentang Uji Asumsi 1 berbicara hal-hal teoritis mengenai uji normalitas. Sekarang bagaimana prakteknya? Maksud saya dengan praktek tentu saja bagaimana cara menghitungnya.

Dalam kesempatan ini saya akan banyak berbicara mengenai bagaimana cara melakukan uji normalitas menggunakan SPSS. Saya memilih SPSS dengan alasan program ini paling banyak dipakai oleh mahasiswa psikologi sehingga bisa dikatakan paling familiar. Selain itu SPSS termasuk program yang cukup user friendly sehingga cukup mudah digunakan meskipun oleh orang yang tidak mempelajari statistik sangat dalam.

Langkah Awal
Saya berasumsi paling tidak pembaca artikel ini adalah orang yang sudah pernah berurusan dengan SPSS. Paling tidak tahu bagaimana memulai SPSS dan membuka file. Jadi saya akan langsung berkisah mengenai cara melakukan analisis datanya.

Cara Pertama
Ada satu kebiasaan yang saya amati ketika teman-teman hendak melakukan uji normalitas dengan SPSS. Biasanya mereka memilih menu :

Analyze - Non Parametrik Test - 1 Sample KS

Setelah diklik pada menu ini, akan muncul dialog box seperti ini:

Sekarang yang kita lakukan hanya memasukkan variabel yang ingin kita uji normalitasnya ke dalam kotak Test Variable List. Kemudian klik OK. Hasil yang akan didapat kurang lebih seperti ini:

Lalu bagaimana cara membacanya? Untuk kepentingan uji asumsi, yang perlu dibaca hanyalah 2 item paling akhir, nilai dari Kolmogorov-Smirnov Z dan Asymp. Sig (2-tailed).
  • Kolmogorov-Smirnov Z merupakan angka Z yang dihasilkan dari teknik Kolmogorov Smirnov untuk menguji kesesuaian distribusi data kita dengan suatu distribusi tertentu,dalam hal ini distribusi normal. Angka ini biasanya juga dituliskan dalam laporan penelitian ketika membahas mengenai uji normalitas.
  • Asymp. Sig. (2-tailed). merupakan nilai p yang dihasilkan dari uji hipotesis nol yang berbunyi tidak ada perbedaan antara distribusi data yang diuji dengan distribusi data normal. Jika nilai p lebih besar dari 0.1 (baca posting sebelumnya) maka kesimpulan yang diambil adalah hipotesis nol gagal ditolak, atau dengan kata lain sebaran data yang kita uji mengikuti distribusi normal.
  • Jangan terkecoh dengan catatan di bawah tabel yang berbunyi Test distribution is Normal. Catatan ini tidak bertujuan untuk memberitahu bahwa data kita normal, tetapi menunjukkan bahwa hasil analisis yang sedang kita lihat adalah hasil analisis untuk uji normalitas.
Cara Kedua
Cara yang pertama biasanya menghasilkan hasil analisis yang kurang akurat dalam menguji apakah sebuah distribusi mengikuti kurve normal atau tidak. Ini disebabkan uji Kolmogorov Smirnov Z dirancang tidak secara khusus untuk menguji distribusi normal, tetapi distribusi apapun dari satu set data. Selain normalitas, analisis ini juga digunakan untuk menguji apakah suatu data mengikuti distribusi poisson, dsb.

Cara kedua merupakan koreksi atau modifikasi dari cara pertama yang dikhususkan untuk menguji normalitas sebaran data.

Kita memilih menu
Analyze - Descriptive Statistics - Explore...

Sehingga akan muncul dialog box seperti ini:

Yang perlu kita lakukan hanyalah memasukkan variabel yang akan diuji sebarannya ke dalam kotak Dependent List. Setelah itu kita klik tombol Plots... yang akan memunculkan dialog box kedua seperti ini:

Dalam dialog ini kita memilih opsi Normality plots with tests, kemudian klik Continue dan OK. SPSS akan menampilkan beberapa hasil analisis seperti ini:

SPSS menyajikan dua tabel sekaligus di sini. SPSS akan melakukan analisis Shapiro-Wilk jika kita hanya memiliki kurang dari 50 subjek atau kasus. Uji Shapiro-Wilk dianggap lebih akurat ketika jumlah subjek yang kita miliki kurang dari 50.

Jadi bagaimana membacanya? Kurang lebih sama seperti cara pertama. Untuk memastikan apakah data yang kita miliki mengikuti distribusi normal, kita dapat melihat kolom Sig. untuk kedua uji (tergantung jumlah subjek yang kita miliki). Jika sig. atau p lebih dari 0.1 maka kita simpulkan hipotesis nol gagal ditolak, yang berarti data yang diuji memiliki distribusi yang tidak berbeda dari data yang normal. Atau dengan kata lain data yang diuji memiliki distribusi normal.

Cara Ketiga
Jika diperhatikan, hasil analisis yang kita lakukan tadi juga menghasilkan beberapa grafik. Nah cara ketiga ini terkait dengan cara membaca grafik ini.
Ada empat grafik yang dihasilkan dari analisis tadi yang penting juga untuk dilihat sebelum melakukan analisis yang sebenarnya, yaitu:
  • Stem and Leaf Plot. Grafik ini akan terlihat seperti ini:
Grafik ini akan terlihat mengikuti distribusi normal jika data yang kita miliki memiliki distribusi normal. Di sini kita lihat sebenarnya data kita tidak dapat dikatakan terlihat normal, tapi bentuk seperti ini ternyata masih dapat ditoleransi oleh analisis statistik sehingga p yang dimiliki masih lebih besar dari 0.1.
Dari grafik ini kita juga dapat melihat ada satu data ekstrim yang nilainya kurang dari 80 (data paling atas). Melihat situasi ini kita perlu berhati-hati dalam melakukan analisis berikutnya.
  • Normal Q-Q Plots. Grafik Q-Q plots akan terlihat seperti ini:

Garis diagonal dalam grafik ini menggambarkan keadaan ideal dari data yang mengikuti distribusi normal. Titik-titik di sekitar garis adalah keadaan data yang kita uji. Jika kebanyakan titik-titik berada sangat dekat dengan garis atau bahkan menempel pada garis, maka dapat kita simpulkan jika data kita mengikuti distribusi normal.
Dalam grafik ini kita lihat juga satu titik yang berada sangat jauh dari garis. Ini adalah titik yang sama yang kita lihat dalam stem and leaf plots. Keberadaan titik ini menjadi peringatan bagi kita untuk berhati-hati melakukan analisis berikutnya.

  • Detrended Normal Q-Q Plots. Grafik ini terlihat seperti di bawah ini:
Grafik ini menggambarkan selisih antara titik-titik dengan garis diagonal pada grafik sebelumnya. Jika data yang kita miliki mengikuti distribusi normal dengan sempurna, maka semua titik akan jatuh pada garis 0,0. Semakin banyak titik-titik yang tersebar jauh dari garis ini menunjukkan bahwa data kita semakin tidak normal. Kita masih bisa melihat satu titik 'nyeleneh' dalam grafik ini (sebelah kiri bawah).

Sekilas Mengenai Outlier
Dari tadi kita membahas satu titik nyeleneh di bawah sana, tapi itu sebenarnya apa? Dan bagaimana kita tahu itu subjek yang mana?

Titik 'nyeleneh' ini sering juga disebut Outlier. Titik yang berada nun jauh dari keadaan subjek lainnya. Ada beberapa hal yang dapat menyebabkan munculnya outlier ini:
  1. Kesalahan entry data.
  2. Keadaan tertentu yang mengakibatkan error pengukuran yang cukup besar (misal ada subjek yang tidak kooperatif dalam penelitian sehingga mengisi tes tidak dengan sungguh-sungguh)
  3. Keadaan istimewa dari subjek yang menjadi outlier.
Jika outlier disebabkan oleh penyebab no 1 dan 2, maka outlier dapat dihapuskan dari data. Tetapi jika penyebabnya adalah no 3, maka outlier tidak dapat dihapuskan begitu saja. Kita perlu melihat dan mengkajinya lebih dalam subjek ini.

Lalu bagaimana tahu subjek yang mana yang menjadi outlier? Kita bisa melihat pada grafik berikutnya yang dihasilkan dari analisis yang sama, grafik boxplot seperti berikut ini:


Sebelum terjadi kesalahpahaman saya mau meluruskan dulu bahwa tulisan C10,Q1, Median, Q3 dan C90 itu hasil rekaan saya sendiri. SPSS tidak memberikan catatan seperti itu dalam hasil analisisnya. Grafik ini memberi gambaran mengenai situasi data kita dengan menyajikan 5 angka penting dalam data kita yaitu: C10 (percentile ke 10), Q1 (kuartil pertama atau percentil ke 25), Median (yang merupakan kuartil kedua atau percentile 50), Q3 (atau kuartil ketiga atau percentile 75) dan C90 (percentile ke 90).

Selain itu dalam data ini kita juga dapat melihat subjek yang menjadi outlier, dan SPSS memberitahu nomor kasus dari subjek kita ini; yaitu no 3. Jadi jika kita telusuri data kita dalam file SPSS, kita akan menemukan subjek no 3 ini yang menjadi outlier dalam data kita.

Catatan akhir: Sangat penting bagi kita untuk tidak sepenuhnya bergantung pada hasil analisis statistik dalam bentuk angka. Kita juga perlu untuk 'melihat' (dalam arti yang sebenarnya) data kita dalam bentuk grafik bahkan keadaan data kita dalam worksheet SPSS untuk memeriksa kejanggalan-kejanggalan yang mungkin terjadi.

151 komentar :

Anonim mengatakan...

Pak saya belum bisa memberikan komentar apapun, tapi setidaknya saya hanya bisa ngasih bravo wah .. wah .. wah ..
kagum ...
akhirnya ada juga dosen sahar yg bisa membuat blog khusus 4 statistik dgn pemeran utama Pak Bondan, Bu Ni2ng n Bpk sendiri he .. he.. he...
menarik sekali
tapi Pak Bondan n Bu Ni2ng kira2 siapa ya ?
Tapi tetap bersemangat pak cayoooooooo ^_^

Anonim mengatakan...

Terima kasih. Sayangnya anda tidak memberitahu saya nama anda.
Mengenai nama-nama ini saya pilih secara asal saja. Saya mengambil nama saya sendiri supaya mudah jika hendak menampilkan perilaku yang konyol tanpa harus menyinggung orang lain.

Agung Santoso

Anonim mengatakan...

Halo pak, wah makin keren aja blognya. kalau begini terus, akan banyak mahasiswa psikologi yang makin cinta statistik. pokoknya akan kuikuti terus serta mohon ijin kugunakan beberapa materi untuk bahan kuliah. Oh ya, aku masih pengin lihat sisi manusiawi apa saja yang bisa pak agung temukan lewat statistik, seperti pesan pak agung dulu.
(Y.Heri.W)

Anonim mengatakan...

wah boleh banget pak. mungkin ada baiknya dibuat diskusi juga karena mungkin sekali ada pendapat-pendapat yang berbeda dari yang saya paparkan di sini.

Anonim mengatakan...

ira

makasih bgt ya pak.....berguna saat2 lg belajar baca data olahan...
makasih banget,......

Anonim mengatakan...

pak, saya sedang mengerjakan tesis analisa persepsi..
untuk uji validitas+reliabilitas 24 butir pertanyaan (masing2 3butir utk tiap variabel) saya menggunakan sampel 30 responden (karna menurut buku yg saya baca, itu adalah syarat minimal dan representatif untuk mendekati distribusi normal)..
tetapi dosen saya menyalahkan, dan mengatakan utk mengujinya (harus memakai brp responden agar berdistribusi normal)..
apakah uji normalitas ini yg dipakai?
lalu apakah residunya ytg diuji/langsung saja?

trimakasih pak..

-dita-

Unknown mengatakan...

Hai dita,

Pendapat saya sendiri begini: Sebenarnya memang tidak ada batasan berapa jumlah subjek yang dibutuhkan. Dan mengenai uji normalitas, menurut saya juga kurang penting karena keperluan kita saat ini adalah melakukan analisis reliabilitas dan validitas bukan uji hipotesis. Dan dalam analisis reliabilitas ini tidak dilakukan uji hipotesis apapun.

Kalau menurut saya sendiri, jumlah subjek sebanyak 30 orang memang terlalu sedikit, mengingat ada 24 butir pertanyaan. Ada baiknya jika jumlahnya ditambah.

Anonim mengatakan...

thx a lot pak! penjelasannya singkat n padat trus gampang dipahami oleh orang yg baru blajar spss. terus berkarya yah pak! -z-

Unknown mengatakan...

Hai z,

terima kasih juga untuk komentarnya ya. Senang blog ini berguna untukmu.
Salam

Unknown mengatakan...

siang Pak
sy ingin bertnya.
1.sy pernah membaca, bahwa uji normalitas untuk data yang <30 menggunakan kolmogorof-smirnov, tapi jika datanya >=30 menggunakan saphiro wilk. benarkah demikian?tapi, dari sumber yang lain menyatakan bahwa secara umum pengujian normalitas menggunakan kolmogorof-smirnov.
2.saya pernah membaca bahwa pengujian normalitas sebetulnya untuk menguji apakah errornya berdistribusi normal atau tidak. jika benar demikian, bagaimana pengujian normalitas untuk error tersebut?
3.mengapa untuk persamaan regresi, dilakukan pengujian normalitas data hanya untuk variabel terikat saja?
mhon tanggapan dari bapak

Unknown mengatakan...

Halo Marfuah,
Terima kasih untuk pertanyaannya ya.
Jawabannya begini kurang lebih:
1.Sebenarnya tidak ada yang mengharuskan demikian. Memang Shapiro Wilk sendiri memang memiliki kelemahan ketika harus menguji normalitas dengan sampel kecil.Kecil di sini bukan N<30 tapi N<50. Tetapi sebenarnya sudah ada modifikasinya sehingga untuk N<50 pun dapat digunakan. Dalam hal ini tentunya SPSS misalnya kemungkinan besar sudah mengupdate modifikasi ini.

2. Untuk jawaban no 2 ini, ini berlaku khususnya untuk kasus analisis Regresi. Sementara untuk analisis varian atau uji t, yang dicek normalitasnya tetap variabel dependennya saja untuk tiap kelompok. Cara menguji normalitas residu / error dalam teknik analisis regresi dapat dibaca di posting ini:
http://psikologistatistik.blogspot.com/2007/09/uji-asumsi-1-uji-normalitas-regresi.html

3.Dalam hampir semua kasus, memang yang perlu dicek normalitasnya adalah variabel terikatnya.Ini disebabkan variabel terikat inilah yang dianalisis variasinya, untuk diketahui apakah variasi variabel terikat ini mengikuti variabel bebas. Dalam hal ini yang biasanya dianggap sebagai variabel yang bersifat random adalah variabel terikatnya. Oleh karena itu, jika hendak menggunakan statistik parametrik, perlu dipastikan dulu bahwa variasi yang diakibatkan ke'random'annya ini bersifat normal.

Anonim mengatakan...

pak gimana membaca hasil output uji Run test???

uirkasep mengatakan...

menyambung pertanyaan marfuah..
pak saya masih bingung dalam memilih uji normalitas untuk data kurang dari 30..
hasil dari K-S yang didapat dgn cara explorer dengan one sample test berbeda, tolong dijelaskan?
K-S dengan S-W lebih akurat mana pak?
trus saran bapak harus pake yang mana untuk data kurang dari 30?
terimakasih

Unknown mengatakan...

untuk uirkasep,
Ya mungkin sekali berbeda, karena uji one sample KS sendiri tidak dirancang untuk secara khusus menguji normalitas. KS-Z bisa digunakan untuk menguji kesamaan distribusi antara data dengan distribusi acuan. Distribusi acuan ini bisa normal, poisson, dll.

Oleh karena itu, ada kalanya hasil analisisnya tidak sepeka hasil yang didapatkan dari Shapiro Wilk. Oleh karena itu ada baiknya untuk mengecek normalitas dari skewness dan kurtosisnya. Jika tetap tidak normal, maka ada baiknya untuk menggunakan analisis non-parametrik.

Anonim mengatakan...

pak, sy mw tanya, kq hasil regresi sy, residual data nya tdk berdistribusi normal. sy sdh menggunakan cara2 untuk menormalkan residual data sy tp hasilnya masih saja g normal. bagaimana solusinya???
mksh...

princezukin mengatakan...

nice post Pak Agung,
kebetulan saya sdg olah data ttg uji asumsi ini, sekalian nanya y Pak,
u/ analisis korelasi kanonik
(multivariate analysis),
1. bgmna cara menguji normalitas data scra simultan dgn SPSS??apakah sama seperti pada univariate??kemudian gmna cara mengubah taraf ujinya??

2. Jika u/ dependent ada 4 variabel, dan independen jg ada 4 var, gmna cara uji lineritasnya??apakah satu2, sebanyak 16kali??atau ada uji simultannya??

Terimakasih sebelumnya, Pak Agung...

Unknown mengatakan...

untuk Anonim,
Mungkin perlu dilihat dulu polanya ketidaknormalannya bagaimana. Apakah cenderung kurtotik atau juling. Tiap kondisi memerlukan cara mengatasi yang berbeda.

Untuk princezukin,
saya kurang begitu menguasai materi mengenai korelasi kanonik dan asumsi dasarnya. Untuk uji normalitas, biasanya ada dua uji yang dibutuhkan yaitu normalitas univariat maupun multivariat. Kedua uji ini bisa didapatkan di web yang dibuat De Carlo : http://www.columbia.edu/~ld208/

Untuk uji linearitasnya sendiri saya kurang tahu apakah memang perlu diuji satu-satu. Menurut saya mungkin perlu dicek menggunakan Graph-Scatter-Matrix. Sehingga bisa dicek linearitas keempat variabel itu dalam satu gambar.

chie mengatakan...

salam kenal pak,,

kebetulan saya sedang bljr uji spss tp sy kesulitan pada uji outlier..
jk data sy outlier, apa ya pak yg harus sy lakukan???

jk sy memilih untuk me-lognatural-kan data sy, apakah sy harus me-Ln-kan semua variabel atau boleh salah satu variabel saja??? (misalkan data saya 1 variabel dependent dan 2 variabel independent)

Unknown mengatakan...

halo Chie,

Hmm, begini: Chie perlu ngecek dulu penyebab outlier tersebut. Apakah karena salah koding, kesalahan pengisian subjek, atau yang lain. jadi jangan buru-buru di Log dll.

Jika ternyata memang datanya memang demikian, ada baiknya membandingkan hasil analisis antara data yang memasukkan outlier dengan yang mengeluarkan outlier. Jika keduanya tidak terlalu berbeda, maka outliernya dimasukkan saja.

Nah jika ternyata beda banget hasilnya, baru dipikirkan tentang transformasi data. Ini perlu hati-hati karena transformasi akan membuat data berubah. Oleh karena itu perlu mencari transformasi yang sifatnya monotonik seperti Ln atau Log. Untuk itu yang perlu ditransformasi hanya variabel yang bermasalah saja, tidak perlu semuanya.

Salam...

Anonim mengatakan...

assalamualaikum, selamat siang pak..
saya kurnia, dan senang sekali saya menemukan blog seperti bapak, saya masih awam mengenai statistik, dan saya menjadi tertarik dengan statistik,
saya mau bertanya pak pendapat bapak, mengenai misalkan terdapat data 2 tahun sebelum dan 2 tahun setelah, menurut bapak baiknya bagaimana cara menguji normalitasnya, apakah tiap tahun dilakukan uji normalitas (jadi ada 4 uji normalitas), atau data 2 tahun sebelum dan 2 thun setelah masing2 digabungkan baru di uji normalitasnya..
terimakasih :)

Unknown mengatakan...

Untuk Kurnia,
Jika kasusnya demikian, maka data untuk setiap tahun perlu dicek normalitasnya terpisah. Jadi ada 4 kali pengecekan normalitas datanya.

Anonim mengatakan...

kurnia
terimakasih :)

icha mengatakan...

halo pak agung, terima kasih sekali atas blog ini, mata saya sedikit terbuka akan uji normalitas hehehe.
cuma yang saya bingung pak, analisis grafik p-p plot saya, garis diagonalnya tidak dimulai dari titik 0 tapi di titik nilai berikutnya (misalnya di titik 1)
itu bagaimana ya pak, membuat garis diagonal pada titik 0.?

aditya mengatakan...

Blog anda memberi pencerahan saya. Tq. Lagi pecas ndahe pak nggarap tugas stat.istik

aditya mengatakan...

Tq, blog anda memberi pencerahan saya yg lg mumet nggarap tugas statistik..

Tia mengatakan...

Pak saya sedang melakukan penelitian utk tesis saya, saya membandingkan model2 keseimbangan pasar modal utk mengetahui model yang paling representatif dalam menilai saham dilihat dr model yang memiliki nilai residual terkecil. namun saya bingung langkah langkah yang harus saya lakukan dg SPSS. atas jawabannya saya ucapkan terimakasih pak.

Anonim mengatakan...

lalu bagaimana menguji data yang terkena univariate outlier pak? jd misalkan outliers nya berada pada posisi 1 ato 2.. apa harus di hapus datanya pak?

Anonim mengatakan...

Pak, numpang bertanya.. apa maksud dari nilai statistic pada tabel uji normal spss ? trims

Unknown mengatakan...

Untuk penanya mengenai nilai statistic,
Dalam tabel itu nilai di bawah kolom statistic itu berarti nilai dari hasil analisis seperti kolmogorov smirnov atau shapiro-wilk.

semoga membantu

Anonim mengatakan...

Bapak Agung yang saya hormati, mohon berkenan memberikan pencerahan atas masalah saya.

Saya sedang belajar meneliti, experimen ada 2 group, group kontrol 64 partisipan dan group perlakuan 52 partisipan.

Pertanyaan:
Untuk uji normalitas, apakah dilakukan langsung untuk 116 partisipan itu ataukah uji normalitas untuk tiap group sendiri-sendiri?

TErimakasih bapak
Tertanda Yanto D Soedarmono

Anonim mengatakan...

Salam kenal, saya mau tanya apakah kalau tidak ada nilai variabel Y dapat dilakukan uji asumsi klasik (normalitas, hetero, multikol, dan autokorelasi)??
Terima kasih

Guru Pantura mengatakan...

Terima kasih ilmunya pak... :)
Sperti pertanyaan yg sudah pernah ada, saya juga merasa bingung kenapa uji normalitas menggunakan cara pertama dan cara kedua hasilnya beda sangat jauh... sekali...

Unknown mengatakan...

Untuk Guru Pantura,

Terima kasih banyak atas komentarnya, dan maaf kalau saya balasnya lama.

Ya memang cara pertama dan kedua bisa berbeda. Karena cara pertama menggunakan teknik yang sifatnya lebih umum, digunakan untuk mengecek kesesuaian data dengan distribusi tertentu (salah satunya distribusi normal). Sementara cara kedua digunakan scr khusus untuk menguji asumsi normalitas.

Unknown mengatakan...

Untuk Anonim,

pertanyaan anda:
Salam kenal, saya mau tanya apakah kalau tidak ada nilai variabel Y dapat dilakukan uji asumsi klasik (normalitas, hetero, multikol, dan autokorelasi)??

jawaban:
uji asumsi yang dapat dilakukan tergantung pada jenisnya. Misalnya untuk normalitas tetap dapat dilakukan, sementara untuk heteroscedasticity tentu saja tidak bisa karena ini terkait dengan varian dari variabel dependen untuk tiap nilai dari variabel independen. Jadi harus ada 1 variabel dependen, dan 1 variabel independen.

Unknown mengatakan...

Untuk pertanyaan mengenai penelitian eksperimen:
uji asumsi sebaiknya dilakukan di tiap kelompok bukan seluruh subjek. Jadi untuk kelompok kontrol dan perlakuan masing-masing dilakukan uji asumsi.

Qu_Cha mengatakan...

wah, keren, pak agung tetap setia menjawab bahkan hingga mei 2012, padahal banyak blgger lain sudah malas menanngapi pertanyaan-pertanyaan dari -pemirsahnya,

keep posting pak agung
:)

Unknown mengatakan...

Untuk Qu Cha,

Terima kasih untuk tanggapannya. Ya saya merasa perlu menjawab terus, karena ini sarana komunikasi antara saya dengan pembaca (ceileh...).

mungkin dari pertanyaan-pertanyaan ini muncul ide untuk menulis artikel baru.

Salam,

Anonim mengatakan...

terimakasih pak, blog ini sangat berguna bagi saya yang masih awam dalam spss, saya ingin tanya mengenai pp plot dan qq plot itu bagaimana? tujuannya untuk apa? dan memakai variabel apa?

Unknown mengatakan...

Sejauh yang dapat saya pahami, qq plot maupun pp plot di SPSS dapat digunakan untuk mengecek bentuk distribusi data kita. Dalam hal ini misalnya kita mau melihat apakah distribusi data kita mengikuti sebaran data normal.

Variabel yang bermakna jika di-pp plot- kan dan qq plot-kan adalah variabel kontinum. Jadi biasanya qq plot dan pp plot ini digunakan untuk mengecek sebaran data variabel kontinum.

Anonim mengatakan...

Pak Agung yth,

Saya sedang meneliti analisis kepuasan pengguna lulusan. Data yang saya dapatkan hanya 12 responden, apakah perlu saya lakukan uji normalitas, validitas dan reliabilitas?

Jika tidak, dengan apa saya harus mengambil keputusan/kesimpulan?
terima kasih
Wanda

Unknown mengatakan...

Untuk Wanda:

Saya pikir itu tergantung pada tujuan penelitian yang akan dilakukan. Jika tujuan penelitian sifatnya deskriptif, seperti mengetahui mean, median dll, maka uji normalitas tidak dibutuhkan.

Jika hendak melakukan analisis inferensial, menurut saya jumlah 12 respondedn tergolong kecil. Ini dapat mengakibatkan kesalahan pengambilan kesimpulan yang besar.

Untuk estimasi reliabilitas dan validitasnya, ini terkait dengan alat ukur yang hendak digunakan, jadi tidak terkait dengan jumlah subjek penelitiannya. Estimasi reliabilitas dan validitas seharusnya dilakukan sebelum pengambilan data ini dengan jumlah subjek yang memadai.

susi susilawati mengatakan...

assalamualaikum...
bapak saya sedang membuat tesis dan mulai ke proses uji normalitas, homogenitas dll...nah yang saya bingung kenapa semua item saya hasilnya negatif (tidak normal,tidak homogen) padahal dari hasil uji validitas n reliabilitas hasilnya sangat tinggi mendekati 1 sekitar 0,8-0,9...
dan saya harus berbuat apa pak, saya jadi bingung sekali?
terima kasih!

Anonim mengatakan...

Pak Agung Yg baik

Mhn penjelasannya pak.
Saya sdg belajar penelitian eksperimen. Ada dua grup yaitu grup A 68 partisipan dan grup B 65 partisipan yang masing-masing memperoleh perlakuan. Lalu diperoleh data dari dua grup tsb.

Sy ingin membandingkan mean dua grup tsb.

Dr uji normalitas, ternyata tidak memenuhi kriteria normal. Untuk itu saya mau gunakan non parametrik uji Mann Whitney.

Ada teman saya yang bilang, langsung saja pake Independent T Test(paramaterik). Alasananya karena eksperimen maka tidak terlalu penting apakah datanya normal atau tidak.

Mohon tanggapan pak, apakah saya harus pake paramoterik atau non parametrik?

Tks
Saya Azka Baihaqi

Amalia Fauziah mengatakan...

Pak Agung,

distribusi normal data ditentukan oleh signifikansi yang p>0,1

lalu, apa kegunaan dari angka kolmogorov? penjelasan apa yang ditunjukkan angka tersebut? apakah mempengaruhi normalitas distribusi data?

Terima kasih banyak.

Unknown mengatakan...

Untuk Fauziah,

Kebiasaan kita melihat hanya nilai p saja memang akhirnya membuat kita bingung apa fungsi nilai Kolmogorov Z. Nilai ini seperti nilai t yang kita dapatkan dari uji t atau nilai r yang kita dapatkan dari perhitungan korelasi product moment. Dari nilai t atau r atau Z inilah, nilai p dapat diestimasi besarannya.

Meskipun keputusan dibuat berdasarkan nilai p, tapi komputer tidak akan dapat menemukan nilai p ini tanpa nilai Z (walaupun pada akhirnya dari segi praktis, nilai Z ini tidak 'bicara apa-apa'... paling tidak untuk keperluan uji normalitas).

Unknown mengatakan...

Untuk susi susilawati,

Mungkin saya perlu bertanya dulu, mengapa anda melakukan uji normalitas untuk tiap item? Karena biasanya yang diuji normalitas hanya skor total dari skala / tes bukan skor itemnya.

Kalau yang anda lakukan benar, maka memang tidak selalu item yang memiliki korelasi tinggi dengan totalnya, memiliki distribusi yang normal. Atau skala yang reliabel akan berdistribusi normal. Kedua hal ini tidak ada kaitannya.

Anonim mengatakan...

Pak, saya mengikuti cara bapak untuk outlier, tapi saya kesulitan membaca boxplot nya pak, subjek yang mana saja yang salah. Apakah bapak bisa memberi saran?

Unknown mengatakan...

Dalam Box Plot biasanya subjek yang memiliki nilai outlier akan muncul sebagai titik di luar box nya. Bisa dalam bentuk lingkaran kecil atau tanda bintang. Kalau kedua outlier ini tidak muncul, maka kemungkinan memang tidak ada outlier dalam data anda.

Jika salah satu atau kedua outlier ini muncul, SPSS akan memberi angka di dekat titik outlier tersebut. Angka tersebut adalah nomor subjek dalam data.

Jika angka tersebut tidak ditunjukkan, kita bisa klik dua kali pada grafik kemudian klik satu kali pada salah satu titik saja, kemudian klik kanan pada titik tersebut, lalu pilih show data labels. Maka SPSS akan memunculkan nomor subjek dari data tersebut.

Anonim mengatakan...

halo pak..
saya sedang analisis hasil penelitian, tepatnya lg uji asumsi klasik..
nha, saya mengalami kendala uji normalitas di mana hasilnya < 0,05 (pake uji k-s).. untuk mengatasi normalitas, gmn ya caranya?
skala IV=ordinal, DV=nominal..
3 iv dan 1 dv

mohon pencerahan..terima kasih pak
salam, angela

Unknown mengatakan...

Sebelum menjawab pertanyaan, ijinkan saya bertanya dulu ya. Rencananya analisis apa yang akan digunakan, mengingat baik variabel independen maupun dependennya tidak ada yang interval. Jika menggunakan analisis non parametrik, asumsi normalitas tidak perlu dipenuhi karena analisis non parametrik tidak mensyaratkan normalitas sebaran.

Jika menggunakan parametrik, mungkin perlu dipertibangkan karena biasanya analisis parametrik menuntut jenis data variabel dependennya minimal interval.

Soniavivianneari mengatakan...

Halo pak agung,

Saya sedang mengerjakan skripsi pengaruh pelatihan thd kinerja pegawai.
N = 47 (ppulasi mjd sampel)
Pelatihan (X1, X2, X3, X4, X5)
Kinerja (Y)

Pertanyaan saya :
1. Apakah untuk uji normalitas saya bisa menggunakan Kolmogorov Smirnov mengingat sampel hanya 47??
2. Data yang dimasukkan ke Data View pada SPSS merupakan Data yang sudah di MSI, karena dosbing saya menyatakan harus di MSI dulu.
3. Data yang dimasukkan ke Data View merupakan semua data Kuesioner lalu dimasukkan saja semua atau HASIL/JUMLAH dari X1, dst????
4. Untuk peletakan di EXPLORE bagian Dependet untuk Y dan Factor untuk variabel X1, X2, X3, X4 DAN X5. Apakah benar pak???

Sangat ditunggu jawabannya pak, terimakasih

(Sonia)

Unknown mengatakan...

Sonia,
Sebelumnya mohon maaf karena lama sekali saya baru bisa balas komen mu.
Ada beberapa hal yang perlu saya tanyakan dulu untuk memperjelas pertanyaanmu:
1. Ada yang kurang jelas tentang X1, X2 dst... Apakah yang dimaksud X1 adalah kelompok pelatihan yang berbeda dengan X2? atau X1 dst adalah pelatihan pada kelompok yang sama dengan subjek berbeda?

2. Jika X1,X2 dst adalah kelompok yang berbeda, apakah jumlah 47 orang itu untuk tiap X1 atau untuk total?

3. Saya kurang paham dengan apa yang dimaksud dengan data yang sudah di-MSI. Mungkin bisa dijelaskan lebih dulu?

Terima kasih sebelumnya.

Melfina mengatakan...

Halo pak agung
Saya sedang membuat skripsi dengan tema membandingan kinerja keuangan antara bank konvensional dan bank syariah. Saya akan menghunakan uji independent samples T-test. Apakah boleh menguji normalitasnya dengan one sample K S?
Ditunggu jawabannya ya pak. Terimakasih
Melfina

Anonim mengatakan...

selamat siang pak,
saya memiliki 2 variabel dependen, sy ingin menghitung normalitas datanya menggunakan k-s. apakah saya harus menghitung normalitas masing2 data variabel dependen atau bisa dihitung sekalian? terima kasih

Unknown mengatakan...

Untuk Melfina dan penanya terakhir saya jawab pertanyaannya sekaligus ya,

Pengecekan normalitas data bisa dilakukan dengan berbagai cara. Salah satunya dengan one sample KS. Hanya saja, ada baiknya juga menurut saya untuk melihat grafik data dan deskripsi data agar gambaran kita tentang kondisi data kita lebih lengkap. Kalau hanya menggunakan satu cara saja, maka kita memiliki sense yang kurang terhadap data.

Nah apakah harus sekaligus atau satu-satu? Menurut saya harus satu-satu. Karena tidak logis rasanya untuk menggabungkan dua variabel dependen jadi satu padahal mungkin saja unit pengukurannya berbeda. Selain itu jika analisis dua variabel dependen ini akan dilibatkan dalam analisis multivariat, tentunya ada pengecekan tambahan seperti normalitas multivariat yang perlu dilakukan.

Semoga membantu.

alfa wardianto mengatakan...

Siang Pak..
Pak saya sedang menyusun skripsi dan dalam penelitian saya saya hanya meneliti 1 perusahaan saja dengan periode waktu 5 taun. Pertanyaan saya:
1. n saya disini berarti 5. Sedangkan saya menggunakan regresi berganda. Apakah data saya bisa di uji? berhubung n nya kurang dari 30?
2. Apakah tahapan ujinya tetap sama uji asumsi klasik (normalitas,multikolinearitas,autokorelasi, dan heterokedasitas)lalu baru uji hipotesis?

Terima kasih

Unknown mengatakan...

pak saya ingin tanya..
sebenarnya untuk uji normalitas, apakah jika pada grafik sudah menunjukkan data (dianggap) terdistribusi normal tetapi ketika diuji dengan kolmogorov smirnov nilai sig.lebih kecil dari(misal 0,05) maka data tersebut masih tetap dianggap belum terdistribusi normal?

terima kasih

Unknown mengatakan...

Untuk Alfa Wardianto,
Menurut saya regresi tidak bisa dilakukan dengan n sekecil itu. Karena hasil estimasinya akan tidak stabil. Selain itu dalam kasus Alfa, jika data diambil dari perusahaan yang sama berulang kali, maka dipastikan akan terjadi autokorelasi antar tahun. Ini juga melanggar asumsi regresi yang biasa digunakan.

Unknown mengatakan...

Untuk nisa,

Sebenarnya tidak ada aturan untuk memilih informasi mana yang harus diacu oleh peneliti ketika memutuskan akan melakukan analisis atau tidak setelah mengecek asumsi. Artinya, pilihan ada di tangan nisa untuk menganggap asumsi tidak dilanggar atau menganggap asumsi dilanggar. Tentunya masing-masing dengan konsekuensi seperti : kalau nisa menganggap data mengikuti distribusi normal padahal tidak, maka hasil analisis akan meleset dari yang sebenarnya.

Selain itu faktor lain yang perlu dipertimbangkan adalah, pengamatan manusia akan dianggap lebih subjektif daripada hasil uji signifikansi misalnya. Jadi bagaimana nisa akan menjawab pertanyaan orang yang punya anggapan ini (khususnya mereka yang sangat percaya dengan signifikansi?).

Anonim mengatakan...

Selamat malam Pak,

Saya sedanga ada tugas tentang Analisis Klaster 33 Provinsi dengan 5 Varibel Independen. Setelah saya cek ternyata terdapat data yang outlier pada 3 variabel independennya. Cara mengatasinya bagaimana ya Pak? Mengingat adanya data outlier akan sangat sensitif dengan hasil klaster yang terbentuk.

Terima Kasih

Unknown mengatakan...

Untuk Anonim,

Mohon maaf sebelumnya karena saya tidak mengetahui banyak tentang analisis klaster. Sehingga tidak banyak tahu bagaimana cara mengatasi outlier yang biasa dilakukan dalam analisis seperti ini.

Dalam 'kebiasaan' analisis statistik yang selama ini saya pelajari, ada beberapa cara mengatasi outlier, tetapi saya tidak yakin apakah cara-cara ini bisa digunakan juga dalam analisis klaster.

1. Melakukan analisis dua kali sebagai sensitivity test. Yang pertama dengan mengikutkan outlier dan kedua dengan membuang outlier. lalu dibandingkan hasil kedua analisis ini. Apakah ada perbedaan besar atau tidak. Jika tidak, maka kita bisa bilang kalau outlier tidak banyak berpengaruh terhadap peng-klaster-an. Jika ternyata berbeda, maka disajikan dua-duanya sebagai bahan pertimbangan.

2. Melakukan transformasi data dengan memberlakukan suatu fungsi. Misalnya data ditransformasi menggunakan akar kuadrat atau fungsi logaritma. Kelemahan cara ini: interpretasi hasilnya jadi sulit, karena harus didasarkan pada hasil transformasi bukan data aslinya.

3. Menggunakan analisis statistik yang robust. Lagi-lagi saya kurang banyak tahu untuk analisis klaster. Jika di regresi kita bisa menggunakan misalnya 'huber weight' atau pembobotan yang lain yang bisa mengurangi dampak outlier.

Semoga bisa membantu.

Agustinus Marjun mengatakan...

pak agung yg saya hormati senang rasanya bisa belajar diblog bpk. saya ingin bertanya : saat ini saya sedang melakukan penelitian pre- eksperimen menggunakan kamus elektronik untuk membantu siswa melafalkan kata-kata dlm bahasa inggris. pertanyaan saya apakah reliability,validity, uji homogenity, dan uji normality diperlukan dalam penilitian saya pak? mohon sarannya pak. Terimakasih. sukses buat bpk..

Unknown mengatakan...

Untuk Ago,

Jawaban saya tergantung pada apakah penelitian tersebut melibatkan pengukuran dan analisis statistik yang didasari asumsi linearitas, homogenitas, dll.

Jika pertanyaan pertama dijawab Ya, maka pengecekan reliabilitas dan validitas pengukuran menjadi penting karena ini menjadi tolak ukur apakah data yang kita peroleh dari penelitian dapat dipercaya. Misalnya jika reliabilitasnya rendah, maka kita tidak yakin apakah perbedaan antar individu yang terjadi benar karena mereka berbeda atau hanya karena pengukuran yang tidak konsisten.

Jika pertanyaan kedua dijawab Ya, maka pengecekan normalitas dan asumsi lain menjadi penting untuk memastikan bahwa hasil analisis yang diperoleh memang akurat.

Semoga bisa membantu,

Anonim mengatakan...

Pak, saya masih awam sekali nih. Jadi mau tanya kenapa kita harus pakai uji normalitas dan homogenitas?
Saya akan membuat penelitian tentang speaking dengan game.
Kemudian untuk instrumen yang akan saya buat pre test and post test, memangnya harus 30?
Waaahh banyak sekali. Terima Kasih pak

Unknown mengatakan...

Uji normalitas dan homogenitas diperlukan ketika kita melakukan analisis statistik inferensial. Mengapa perlu dilakukan, karena beberapa teknik analisis statistik melakukan inferensi dengan berasumsi bahwa data mengikuti distribusi normal dan homogenitas varian antar kelompok. Jika kita melakukan analisis statistik ini tanpa mengecek normalitas dan homogenitasnya, maka jika ternyata data penelitian kita tidak mengikuti distribusi normal atau tidak memiliki varian yang homogen, hasil analisis yang kita peroleh menjadi tidak dapat dipercaya (hasilnya tidak akurat misalnya).

Nah mengenai 'angka ajaib' 30, biasanya dikenakan pada besarnya sampel (subjek) penelitian. Sebenarnya angka 30 ini tidak memiliki dasar yang kuat, tetapi pada dasarnya untuk melakukan analisis statistik inferensial memang dibutuhkan jumlah subjek yang banyak. Selain karena analisis statistiknya mensyaratkan hal tersebut, semakin banyak subjek juga berarti semakin representatif terhadap populasi. Sehingga hasil penelitian ini dapat digeneralisasikan pada lebih banyak orang.

Anggaplah misalnya game hanya diterapkan pada 5 orang saja, maka akan timbul keraguan apakah 5 orang ini dapat mewakili populasi? Lebih lanjut orang akan meragukan apakah jika game ini diterapkan pada orang lain akan juga memiliki manfaat yang sama?

Anonim mengatakan...

selamat malam pak Agung Santoso yang saya hormati, mohon sekiranya bapak bisa membantu saya pak...

begini pak, saya seorang mahasiswi yang sedang menyusun skripsi hubungan sebab akibat (pengaruh). saya menggunakan dua variabel, sehingga akan menggunakan analisis regresi sederhana. penelitian saya merupakan penelitian populasi (sebanyak 84 siswa). menurut buku yang saya baca teknik analisis data dalam penelitian populasi adalah menggunakan statistik deskriptif. Data dalam penelitian saya merupakan interval.

yang mau saya tanyakan adalah: Apakah dalam penelitian populasi diperlukan uji normalitas dan linieritas pak? mengingat hasil penelitian ini tidak akan digreneralisasikan karena menggunakan populasi sebagai respondennya.

Terimakasih Pak, mohon bantuannya

Unknown mengatakan...

Ijinkan saya memberikan komentar terlebih dulu ya:

Pertama terkait dengan hubungan sebab-akibat, sejauh yang saya tahu hubungan sebab-akibat tidak dapat ditegakkan hanya dengan melakukan analisis regresi. Dibutuhkan desain penelitian yang memadai untuk menegakkan kesimpulan terkait dengan hubungan sebab-akibat: desain ekspreimen dengan random assignment. Ini dapat dibilang satu-satunya desain penelitian yang bisa menegakkan hubungan sebab-akibat secara meyakinkan.

Kedua terkait dengan penelitian populasi. Apakah mbak punya alasan kuat untuk tidak melakukan generalisasi? Karena tanpa generalisasi, maka hasil penelitian hanya berlaku untuk subjek penelitian kita. Atau dengan kata lain, ada keterbatasan manfaat. Ini juga berarti pembahasan tidak dapat dilakukan secara general (misal A mempengaruhi B atau A berkorelasi dengan B. Kita hanya bisa berkata A dan B berkorelasi pada subjek penelitian saya saja, atau A mempengaruhi B hanya pada subjek penelitian saya.). Bahkan ekstrimnya, kita hanya bisa mengatakan hubungan ini ada hanya pada subjek penelitian saya di saat itu. Ini berarti bisa saja kondisi hubungannya berubah di saat yang berbeda. Nah apakah memang ini yang dimaksudkan dalam penelitian yang akan dilakukan?

Jika memang terbatas pada populasi yang jadi subjek penelitian, maka inferensi memang menjadi tidak penting. Dan karenanya pengecekan asumsi tidak lagi perlu dilakukan.

Anonim mengatakan...

Terimakasih atas jawaban yang diberikan pak, penelitian saya termasuk penelitian kuantitatif, yang ex post facto, mungkin lebih banyak dikenal sebagai kontribusi bukan pengaruh, karena kalau pengaruh memang lebih condong ke eksperimen.

untuk penelitian populasi, saya membaca dari bukunya suharsimi arikunto, disitu menyebutkan jika subjek kurang dari 100 maka sebaiknya di ambil semua sehingga penelitiannya merupakan penelitian populasi. iya pak benar yang saya maksudkan untuk tidak melakukan generalisasi sehingga penelitian hanya berlaku pada subjek yang saya teliti saja. judul penelitian saya pengaruh kecerdasan emosi terhadap prestasi belajar matematika pada siswa kelas 5 di SD X pak, bagaimana menurut bapak? apakah penelitian kuantitatif bisa dilakukan tanpa membuat generalisasi? mengingat subjek saya 84 orang. terimakasih pak..... mohon bantuannya

Unknown mengatakan...

Kalau pertanyaannya hanya:"Apakah memungkinkan penelitian kuantitatif tanpa melakukan generalisasi?", jawabannya mungkin saja.

Terkait sumber yang anda sebutkan, interpretasi kalimat tersebut tergantung pada siapa yang disebut subjek penelitian ini? Apakah subjek ini akan dianggap populasi atau sampel. Jika subjek penelitian ini adalah populasi (hasil penelitian hanya akan diberlakukan pada subjek ini saja, dan tidak bisa digunakan untuk mendukung teori yang ada misalnya).

Tetapi jika subjek penelitian ini dipandang sebagai sampel dari populasi yang lebih besar (misal sampel dari populasi siswa di kelas 5 SD secara umum), maka subjek penelitian ini menjadi sampel.

Jika penelitian diterapkan pada populasi, maka sebenarnya tidak lagi dibutuhkan uji normalitas bahkan uji statistik inferensi (seperti uji t dll). Karena kita mendapatkan populasinya (sementara uji t hendak menarik kesimpulan mengenai populasi dari sampel). Jadi kalau sudah dapat populasinya tidak perlu lagi melakukan uji t.

Pertanyaan saya jadi begini: Mengapa tidak mau melakukan generalisasi? Karena alat nya tersedia dan rancangan penelitiannya sejauh yang saya tahu tidak rumit.

Unknown mengatakan...

Pak, saya mau nanya sumber yang menjelaskan bahwa Shapiro Wilk digunakan untuk data <50, sedangkan Kolmogorov Smirnov utk data>=50 yang ada bpk jelaskan sebelumnya, sy sedang dalam penyusunan tugas akhir, kebentur dalam uji normalitas, terimaksih
_Dina_ mahasiswa UPI

Anonim mengatakan...

blog Pak Agung sangat bermanfaat,saya juga ingin bertanya
model regresi saya
Y = X1 + X2 + X3 + X4 + X5 + X6 + D1 + D2 + D3 .... + D7
jadi ada 6 variabel X dan & 7 variabel dummy
apakah semua data harus diuji normalitas (dalam hal ini saya menggunakan pooled data "gabungan antara time series dan cross section" sebanyak 285 baris) dan sudah pasti waktu saya uji normalitas dg K-S hasilnya tidak normal. mohon arahan dari Pak Agung bagaimana cara menormalkan data tersebut?
terima kasih sebelumnya Bapak....

Unknown mengatakan...

Selamat malam pak,
Saya sedang mengerjakan skripsi dengan judul "Pengaruh Sistem Pengendalian Intern Pemerintah Terhadap Kualitas Laporan Keuangan" dengan subjek salah satu dinas. Disini saya mengambil sampel hanya beberapa bagian pada dinas tersebut yang berkaitan dengan judul skripsi saya dengan total 20 responden dan Auditor Internal dengan total 10 responden. Jadi total keduanya adalah 30. Namun karna pada pemerintahan, auditor internal tersebut berada diluar instansi dinas tersebut dan memiliki instansi tersendiri. Yang ingin saya tanyakan apakah bisa kedua sampel tersebut digabungkan pak ? dan apakah sudah benar jika teknik pengambilan sampel yang saya gunakan adalah sampling jenuh ? mengingat jumlah sampel yang saya ambil adalah keseluruhan populasi dari pada beberapa bagian dari dinas tersebut dan auditor internal ?
Terima Kasih .

Rizal Achmad mengatakan...

selamat siang pak,

perkenalkan saya rizal dari madiun. yang saya ingin tanyakan pada bapak, jika kita sudah mendeteksi data outlier misal salah satunya menggunakan nilai zscore, dan jika kita ingin menghapus data diluar rentang yang sudah ditentukan, data manakah yang akan dihapus ? apakah menghapus data asli atau nilai zsscorenya saja ?

Mohon tanggapannya, terima kasih.

Unknown mengatakan...

Untuk Dina Apriyani,

Begini, sepertinya saya agak salah dalam memberi informasi pada Mbak Dina. Saat ini saya pikir uji Shapiro-Wilk tentunya sudah disesuaikan agar bisa mencakup subjek lebih dari 50 orang. Kelemahan pada saat penulisan artikel tentang shapiro wilk, diakibatkan belum adanya komputer yang secanggih sekarang. Sehingga penyusunan tabel nya menjadi sulit. Nah, untuk Kolmogorov Smirnov sendiri, uji ini tidak dirancang khusus untuk mengecek distribusi data mengikuti normal atau tidak. Sehingga sering dianggap tidak cukup sensitif.

Oleh karena itu ada baiknya memang melihat hasil uji normalitas dari beberapa uji, supaya kita bisa mengambil keputusan lebih tepat.

Mohon maaf atas kesalahan info nya.

Unknown mengatakan...

Untuk pertanyaan terkait dengan uji normalitas regresi,

Seperti yang saya sebutkan dalam salah satu artikel di sini tentang uji normalitas regresi, pengecekan normalitas yang perlu dilakukan cukup melihat normalitas residu (atau normalitas dari variabel dependennya). Tidak dibutuhkan untuk melihat normalitas dari variabel independennya.

Sebagai catatan: dari pertanyaan yang saya baca, saya menangkap adanya data time series. Data tersebut tidak bisa dianalisis menggunakan regresi 'biasa' karena mengandung adanya autokorelasi.

Unknown mengatakan...

Untuk Mbak Asti,

Saya ingin tahu lebih banyak mengenai studi yang anda lakukan: apakah dua variabel yang ada dalam penelitian Mbak Asti ada dalam tiap sampel yang diambil? Maksud saya, apakah variabel kualitas laporan keuangan diambil dari sampel Auditor dan sampel Dinas? Juga mengenai variabel lainnya.

Jika ya maka, saya tidak melihat kendala dalam menggabungkan kedua sampel ini, kecuali ada latar belakang teoretik yang menyebutkan / mengimplikasikan bahwa kedua sampel ini memiliki perilaku berbeda dalam variabel-variabel yang diteliti (atau adanya moderasi).

Unknown mengatakan...

Untuk Mbak Asti,

Mengenai sampel, sejauh ini banyak sekali buku bertebaran dengan definisi teknik sampling masing-masing. Saya tidak yakin bisa menjawab dengan baik apakah yang dilakukan mbak Asti ini memang 'bernama' sampling jenuh, karena sejauh pengalaman saya, saya belum pernah membaca tentang sampling jenuh ini.

Dalam pemikiran saya kalau jenuh, maka bukan sampel lagi yang diambil melainkan populasi. Kalau populasi yang diambil, lalu untuk apa melakukan statistik inferensi? Tapi ini pemikiran saya, Mbak. Kemungkinan besar banyak orang yang berbeda pendapat. Jadi saran saya: sejauh apa yang dilakukan Mbak Asti sudah sesuai dengan sumber acuan tertentu, saya pikir apa yang dilakukan dan 'nama' nya bisa dipertanggungjawabkan dalam ujian nanti.

Unknown mengatakan...

Mas Rizal Achmadi,

Komentar saya tentang menghapus outlier: ini praktek buruk dalam analisis statistik. Kalau outlier memang berupa data yang dihasilkan dari pengisian skala yang asal-asalan misalnya, maka menghapus outlier masih bisa ditoleransi. Tetapi jika alasan membuangnya hanya karena mengganggu analisis (misal membuat data tidak normal), maka praktik ini tidak bisa dipertanggungjawabkan.

Keberadaan outlier yang sah (yang memang dihasilkan oleh respon yang benar dari responden), merupakan informasi mengenai kondisi responden. Kalau informasi ini dihapus, berarti hasil analisis yang diperoleh tidak lagi menggambarkan keadaan responden, atau dengan kata lain hasil analisisnya tidak dapat dipercaya.
Ada beberapa cara mengatasi outlier tanpa harus membuangnya, misalnya menggunakan statistik yang robust.

Jika memang outlier tersebut akan dibuang, tentu saja yang dibuang adalah data yang akan dimasukkan dalam analisis: apakah analisis akan menggunakan Z-score atau data mentahnya?
Jika yang digunakan adalah data mentah maka data mentah outlier ini yang dihapuskan.

Unknown mengatakan...

salam pak Agung

saya ingin bertanya terkait transformasi data.
di jawaban salah satu pertanyaan bapak di atas dikatakan bahwa "transformasi hanya variabel yang bermasalah saja" dan di penelitian saya sudah saya praktikan dan ketika saya uji sudah bebas normalitas,
pertanyaan saya: adakah sumber referensi yang dapat saya jadikan rujukan untuk hal tersebut pak?
di beberapa penelitian saya temui ada yang merubah semua, ada pula yang yang hanya 1 variabel. saya membutuhkan referensi terkait hal ini.
terima kasih.

Unknown mengatakan...

Selamat malam pak, saya linda

Mau tanya, apabila data yang kita teliti data time series menggunakan SPSS sudah memenuhi uji normalitas, namun tidak lolos uji autokorelasi. Apakah data tersebut harus di transformasi atau bagaimana pak? terimakasih

Unknown mengatakan...

Assalamualaikum pak saya mau bertanya bagaimana cara membaca data yg sudah di Ln kan (awal data adalah Triliunan) ketika kita deacriptive kan min,max,mean dan std.D .
Terimakaasihhj

dwi mengatakan...

Pak, apakah variabel bebas juga harus diuji normalitasnya, atau hanya variabel terikat saja?

Unknown mengatakan...

Sebelumnya mohon maaf karena kelambanan saya dalam menjawab komentar-komentar anda, dikarenakan kesibukan kemarin yang lumayan banyak. Saya akan coba jawab semampu saya:

Untuk Mas Yusuf,
Saya pribadi kurang ingat sumber yang saya gunakan dalam menulis bagian ini. Biasanya saya mengacu pada tulisan Pedhazur (http://www.amazon.com/Multiple-regression-behavioral-research-Pedhazur/dp/0030728312) terkait dengan regresi. Jadi mungkin mas Yusuf bisa mencoba membaca-baca tulisan Pedhazur ini.

Untuk Mbak Melati Lindasari,
Jika data berupa time series, memang biasanya tidak akan lolos autokorelasi. Justru di sini menariknya data time series ini. Biasanya orang tidak lagi menggunakan regresi 'biasa' melainkan analisis time series. Sejauh yang saya tahu di SPSS ada fungsi untuk melakukan analisis data time series ini yaitu Forecasting. Mungkin bisa coba dilihat-lihat.

Untuk yang menanyakan interpretasi data yang ditransformasi menggunakan fungsi Ln. Memang interpretasinya jadi sulit. Ini mengapa biasanya transformasi bukan pilihan yang paling diinginkan dalam analisis data. Jika analisis berupa uji beda, data yang di-Ln kan bisa diinterpretasi sebagai perbandingan / rasio kelompok yang dibandingkan dengan kelompok pembanding. Namun jika yang ingin diinterpretasi adalah data deskriptif memang jadi sulit mencari maknanya. Usul saya, jangan ditransformasi dengan Ln, melainkan dibagi saja dengan angka 1 triliun (atau angka yang lebih kecil). Sehingga interpretasi dari hasil analisis menjadi lebih mudah.

Untuk dwi, sejauh yang saya pahami, biasanya hanya variabel dependen (atau residu) yang diasumsikan normal, sementara asumsi mengenai distribusi tidak terkait dengan variabel bebasnya.

Unknown mengatakan...

Salam, terimakasih atas respon2 Bapak thd pertanyaan teman2 disini sehingga saya dpt belajar lbh banyak mngenai olah data penelitian.
Saya juga ingin bertanya Pak, apakah dibenarkan apabila mengeluarkan outlier hanya pada tahun yg bersangkutan (trjadi outlier hanya thn 2013) Padahal ini merupakan data time series di thn 2012, 2013, 2014. Atau seharusnya mengeluarkan keseluruhan data perusahaan selama tiga tahun tsb?

Yg kedua, apakah transformasi yg plg baik untuk variabel dependen yg mayoritas berupa data negatif. Mengingat transform ke log natural, square dsb akan justru meniadakan data negatif, shg mengurangi jml sampel penelitian dan krg mencerminkan data sesungguhnya. Padahal "pengobatan" yg sering efektif untuk uji normalitas adalah l(n) tsb. Apakah ada rekomendasi dlm mengatasi hal ini, Pak?

terimakasih banyak atas sharing dr Bapak Agung yg sangat bermanfaat

Unknown mengatakan...

Selamat siang. Perkenalkan saya Vika yang saat ini sedang menempuh skripsi. Begini pak, saya ingin bertanya menganai analisis jakur dan uji linieritas. Apakah dalam analisis jalur harus bisa memenuhi asumsi linieritas? Metode apa saja untuk uji linieritas? Karena data saya tidak bisa dilakukan uji linieritas padahal untuk uji asumsi klasik lainnya sudah terpenuhi. Terima kasih pak sebelumnya atas bantuannya

Unknown mengatakan...

Mbak Naila Hanum,

Mohon maaf saya baru bisa menjawab sekarang. Outlier hanya dapat dihilangkan jika ia terjadi karena kesalahan teknis yang sifatnya random. Artinya, ia tidak memuat informasi yang, jika dihilangkan, dapat menyebabkan kesalahan estimasi parameter-parameter yang hendak diketahui. Jika outlier memang 'sah', dalam arti tidak disebabkan kesalahan teknis, maka seharusnya outlier tidak dihilangkan.

Yang dapat dilakukan adalah mencari teknik estimasi yang robust terhadap keberadaan outlier. Atau, melakukan dua kali analisis: dengan outlier dan tanpa outlier. Kemudian dilihat apakah ada perbedaan yang mencolok dari parameter yang diestimasi. Jika tidak ada, maka kita bisa lebih yakin dengan hasil yang tanpa outlier. Tetapi jika ada perbedaan yang besar, maka mau tidak mau kita tidak bisa membuang outlier begitu saja.

Mengenai transformasi, saya pribadi tidak terlalu menyukai transformasi karena biasanya, selain karena tidak selalu berhasil, juga membuat interpretasi menjadi lebih sulit. Misalnya jika menggunakan fungsi ln (natural log), jika ada hubungan antara data hasil transformasi ln dengan variabel independen, maka kita tidak bisa begitu saja menyatakan ada hubungan antara variabel dependennya dengan variabel independen.

Saya lebih menyukai mencari cara estimasi yang robust. Sayangnya, saya pribadi tidak banyak mempelajari analisis time series sehingga tidak cukup mengetahui analisis dalam time series yang robust ini.

Jadi saran saya begini: jika dimungkinkan untuk menggunakan cara estimasi yang robust, maka ini adalah cara yang paling ideal menurut saya. Jika tidak bisa, maka sebelum melakukan transformasi perlu diketahui dulu seperti apa bentuk distribusi datanya (jika tidak normal, apakah skew di kanan atau di kiri).

Jika ternyata memang dibutuhkan transformasi log atau akar kuadrat (square root), maka semua data perlu ditambah dengan suatu nilai konstan yang akan membuat semua data memiliki nilai yang lebih besar dari 0. Kelemahan cara ini adalah interpretasi yang makin sulit dilakukan. Apalagi jika hendak melakukan prediksi.

Jadi, mohon maaf saat ini saya belum bisa memberikan jawaban yang memadai terhadap permasalahan Mbak Naila.

Unknown mengatakan...

Untuk Mbak Vika,

Ya tentu saja dibutuhkan pengecekan linearitas, karena analisis jalur merupakan ekstensi / pengembangan dari analisis regresi. Asumsi yang digunakan dalam regresi, juga diterapkan dalam mengembangkan analisis jalur.

Mungkin bisa dipaparkan mengapa tidak bisa dilakukan pengecekan linearitasnya?

Salam,

Unknown mengatakan...

Selamat pagi, maaf saya Inas Sausan, sekarang saya sedang mengerjakan skripsi mengenai regresi berganda. Mohon penjelasan untuk kasus transformasi data sebagai solusi data tidak terdistribusi normal. pada model regresi yang saya tau untuk menguji normalitas dengan data residual, ketika saya mentransfomasi var.dependen apakah saya juga harus mentransfomasi var.independennya juga?

Share Your Information mengatakan...

Selamat malam pak, izin bertanya. Dalam penelitian eksperimen, salah satu desain memberikan pretes. setelah nilai pretes dirata2kan selanjutnya dipilih kelas eksperimen dan kelas kontrol.
untuk pemilihan kelas eksperimen sendiri seharusnya dipilih berdasarkan nilai pretes yang rendah atau nilai pretest yang tinggi, ya pak?

selanjutnya apakah perbedaan uji normalitas chi-kuadrat dengan KS itu, ya pak?
terimakasih pak sebelumnya.

Anonim mengatakan...

Salam kenal Pak, saya Vina sedang mengerjakan skripsi keuangan. Saya mau nanya. Kenapa melakukan transformasi data harus dimulai dari variabel terikat? Alasannya apa dan apakah ada buku yang mengatakan seperti itu Pak? Jika variabel terikat sudah ditransformasi dan telah normal, apakah data tersebut sudah boleh dilanjutkan?

Terima Kasih.

Unknown mengatakan...

Untuk Mbak Inas Sausan,

Menurut saya transformasi biasanya hanya dilakukan pada variabel dependen saja, karena distribusi residu akan mengikuti distribusi variabel dependen. Jika variabel dependen sudah ditransformasi dan mengikuti distribusi normal, residu juga akan mengikuti distribusi normal.

Sedikit tambahan: Transformasi sebenarnya bukan solusi yang paling jitu menghadapi ketidaknormalan data. Ini karena hasil transformasi tidak selalu membuat residu mengikuti distribusi normal dan interpretasi hasil analisis harus didasarkan pada unit hasil transformasi. Misalnya kalau ditransformasi menggunakan akar kuadrat, maka interpretasi hasil analisis menggambarkan hubungan antara variabel independen dan akar kuadrat dari variabel dependen.

Cara yang lebih jitu menurut saya adalah dengan menggunakan analisis regresi yang didesain untuk mengatasi ketidaknormalan: misalnya regresi Huber-White yang robust terhadap ketidaknormalan dan kehadiran outlier.

Semoga bisa membantu.

Unknown mengatakan...

Untuk Silmi Kurniasih,

Saya merasa kurang memahami penuh pertanyaan Silmi. Semoga jawaban saya pas ya:
Menurut saya seharusnya kondisi kelompok Kontrol dan Eksperimen adalah sama; keduanya memiliki mean pretes yang sama. Ini dilakukan agar perbedaan skor pada posttest dapat dianggap sebagai hasil treatment, bukan karena kondisi awal (pretest) yang berbeda. Untuk memperoleh kondisi seperti ini,bisa dilakukan random assignment.

Nah, jika pertanyaan Silmi terkait dengan pemilihan subjek penelitian sebelum random assignment, maka pemilihan subjek biasanya didasarkan pada kelompok subjek yang diprediksikan akan memperoleh benefit paling besar dengan pengorbanan waktu yang diberikan. Misalnya kalau treatmentnya adalah training peningkatan siswa, maka dipilih siswa dengan tingkat motivasi yang rendah. Kemudian di-random assignment untuk masuk ke kontrol dan eksperimen.
Kalau treatmentnya adalah terapi untuk mengatasi kecemasan, maka dipilih siswa yang memiliki tingkat kecemasan tinggi. Kemudian dilakukan random assignment untuk masuk ke kelompok kontrol dan eksperimen.

Pertanyaan kedua terkait dengan Chi square dan Kolmogorov Smirnov: keduanya sebenarnya adalah teknik analisis yang tidak secara khusus didesain untuk menguji normalitas sebaran data. Namun demikian dapat digunakan untuk tujuan itu. Keduanya memiliki perbedaan proses cara analisis yang saya sendiri tidak tahu secara detil bagaimana perbedaannya. Pada dasarnya keduanya dapat digunakan untuk menguji normalitas sebaran data. Saya sendiri akan melakukan kedua analisis tersebut dan melihat apakah keduanya melaporkan hasil yang sama. Ini akan memperkaya informasi yang kita miliki tentang data kita.

Unknown mengatakan...

Untuk Vina,

Mengapa variabel terikat, karena asumsi yang mendasari regresi terkait dengan variabel terikatnya, bukan variabel independennya. Dalam model regresi seperi berikut:

Y= a + b*X + e

distribusi e (residu) selalu mengikuti distribusi Y, karena bagian (a + b*X) bersifat konstan (fixed) untuk setiap X. Sehingga satu-satunya yang memiliki distribusi (karena bersifat random) adalah e.

Semoga dapat menjelaskan.

Anonim mengatakan...

Selamat malam Pak.Agung.
Pak nama sy Dyah, ada yg ingin sy tanyakan mengenai statistik non parametrik. Apabila dalam suatu penelitian hanya menggunakan 2 subjek. kemudian diberikan pretest sebanyak 3 kali. perlakuan,dan kemudian diberikan kembali posttest sebanyak 3 kali. Analisa seperti apa yang bisa dipakai untuk statistiknya ya pak. Agung? terima kasih sebelumnya.

Unknown mengatakan...

Pak saya midah sedang mengerjakan skripsi eksperimen dengan kelas kontrol dan eksperimen menggunakan pretest dan post test, pak untuk uji normalitas yang perlu saya uji normalitasnya apa saja? Penguji menyarankan gain score dan post test saja, tapi pembimbing saya menyarankan pretest dan post test? Mohon tanggapannya

Unknown mengatakan...

Selamat sore pak. Pak sayakan sedang menyusun skripsi eksperimen yang saya binggungkan
1.Ingin menganalisis data normalitas dan homogenitas varians. Untuk uji normalitasnya data yang dipake nilai posttest atau pretest ya pak? Dan homogenitas datanya yg dipake apa posttes atau pretest antara kedua kelompok eksperimen dan kontrol?
2. Judul saya pengaruh tetapi di isi pembahasan saya tetap membedakan saya binggung dosen saya menyuruh utk pake rumus yg membedakan contohnya paires sampel t test, tetapi di rumusan masalah saya berbunyi ada pengaruh bla bla bla.. Nah itu menurut bapak bagaimana ya?

Terimakasih pak mohob tanggapannya saya sangat membutuhkan tanggapan dati bapak.

Anonim mengatakan...

Siang, Pak Agung. sebelumnya terima kasih untuk blognya yang sangat bermanfaat.
Saya via, sedang melakukan skripsi dengan 1 var dependen dan 4 var independen dengan metode kuesioner terhadap populasi 43 orang, judul Persepsi auditor terhadap kualitas laporan keuangan pemda
pertanyaan saya:
1. apakah saya wajib melakukan uji asumsi klasik? ada dasar ilmiahnya kah Pak? lalu jika iya, sebaiknya uji asumsi apa saja? apa ke-4 uji asumsi klasik?
2. setelah saya lakukan uji normalitas dengan uji K-S hasil sig 0,001 (dibawah 0,005), namun uji grafik terlihat normal membentuk bel, apa yang sebaiknya saya lakukan? jika saya menggunakan hasil grafik saja bagaimana Pak? apa ini ada pengaruh dengan responden saya yang sedikit?
3. apakah ada referensi buku yang bisa saya baca?

sekian dulu, akan saya sambung jika Bapak telah merespon, terima kasih Pak..

Unknown mengatakan...

permisi pak saya mau bertanya, saya punya data kurang dari 30 dan judul skripsi saya ttg pengaruh variabel x1, x2, x3, dan x4 terhadap variabel y . yang saya ingin tanyakan kalau data seperti itu mengolahnya menggunakan uji apa pak kira2 ? tlg dijawab ya pak . terimakasih .

Edi mengatakan...

Pak Agung saya sedang melakukan uji beda dg data kecil sebelum (6) dan sesudah (6) merger. Apakah perlu uji normalitas..trims

Unknown mengatakan...

Sebelumnya mohon maaf karena respon yang lama terhadap pertanyaan-pertanyaan yang masuk.

Untuk Dyah,
Menurut saya jumlah subjek dan banyaknya amatan yang dilakukan terlalu sedikit untuk dapat memberikan hasil analisis yang dapat dipercaya baik menggunakan parametrik maupun non-parametrik. Kalaupun menggunakan analisis non-parametrik, maka hasil analisis hanya dapat diperlakukan sebagai hasil analisis eksploratoris, atau studi pendahuluan.

Unknown mengatakan...

Untuk Nur Chamidah,
Pengecekan apakah data memenuhi asumsi perlu dilakukan pada data yang akan dianalisis. Misalnya jika akan dilakukan uji t pada gain score, maka yang dibutuhkan adalah pengecekan asumsi pada gain scorenya. Tetapi jika analisis akan dikenakan pada pre-test dan posttest, maka kedua data tersebut yang perlu dicek pemenuhan asumsinya.

Unknown mengatakan...

Untuk Sumiaty Umi,
1. Untuk pertanyaan pertama ini saya kira jawabannya sama dengan pertanyaan dari Nur Chamidah: tergantung apa yang akan dianalisis.
2. Saya pikir ini tergantung bagaimana peneliti dapat menarik garis logika antara uji perbedaan dan pengaruh. Misalnya: jika ada perbedaan signifikan, mengapa kita bisa menyimpulkan adanya pengaruh? Bagaimana logikanya? Apakah persyaratan untuk menegakkan kesimpulan berupa 'pengaruh' ini telah dipenuhi?

Unknown mengatakan...

Untuk Via,

Terima kasih untuk masukan tentang blog nya. Semoga ini membuat saya makin semangat mengupdate blog ini.

Untuk tanggapan pertanyaan Via:

1. Dasar ilmiahnya dapat dilihat di beberapa buku statistik tergantung pada analisis yang digunakan. Misalnya jika menggunakan analisis regresi bisa membaca buku tulisan William Berry tentang Understanding Regression Assumption. Atau membaca buku Statistical Methods for Psychology yang ditulis David C Howell. Saya pernah menulis dua artikel mengenai pengecekan asumsi ini di sini:
a. http://www.anima.ubaya.ac.id/class/openpdf.php?file=1371802549.pdf
b. Bunga Rampai Psikologi 2, tahun 2014, dengan judul Integritas, Keberbedaan, dan Kesejahteraan Psikologis: Kontribusi Psikologi dalam Menjawab Tantangan Bangsa Masa Kini, hal 270 - 293. ISBN 978-602-96634-2-6 dengan judul Mengulas kembali uji asumsi
Alasan mengapa perlu melakukan pengecekan asumsi dapat dilihat dalam dua artikel saya tersebut atau dalam salah satu tulisan saya di blog ini : https://psikologistatistik.blogspot.com/search/label/t-test

2. Penilaian menggunakan grafik memiliki kelemahan terkait dengan subjektivitas: menurut orang yang satu sudah terlihat normal, menurut yang lain belum. Saran saya gunakan lebih dari satu informasi untuk memutuskan apakah bentuk distribusi mengikuti normal. Misalnya menggunakan grafik histogram, qq-plot, signifikansi uji normalitas, dan informasi mengenai skewness dan kurtosis. Menggabungkan semua informasi dari berbagai sumber akan membuat penilaian menjadi lebih baik.

3. Referensi buku sudah saya sebutkan di atas, tetapi ini tergantung teknik analisis apa yang akan digunakan. Secara umum Via bisa membaca buku tulisan Howell di atas.

Unknown mengatakan...

Untuk Santika Dwi Chairani,

Pertama-tama saya perlu menyatakan bahwa belum ada teknik analisis statistik yang dapat memberikan informasi mengenai pengaruh yang cukup meyakinkan. "Pengaruh" satu variabel ke variabel lain hanya dapat ditegakkan dengan meyakinkan menggunakan desain penelitian eksperimen yang melibatkan random assignment. Analisis statistik hanya dapat memberikan informasi mengenai hubungan antar variabel saja.

Terkait dengan analisis apa yang 'cocok', menurut saya tergantung dari pertanyaan penelitian apa yang hendak dijawab, desain penelitian yang digunakan, tipe data dari variabel yang dilibatkan, dan hipotesis penelitian. Tanpa mengetahui ini, maka sulit rasanya untuk dapat menjawab pertanyaan Mbak Santika.

Oleh karena itu, silahkan memberikan keterangan yang lebih detil mengenai penelitian anda agar saya bisa membagikan informasi yang lebih tepat.

Unknown mengatakan...

Untuk mas Edi,

Menurut saya, jika mas Edi hendak melakukan pengujian menggunakan analisis parametrik, maka pengecekan bentuk distribusi merupakan informasi yang dibutuhkan untuk menjustifikasi penggunaan analisis tersebut.

Jika analisis non-parametrik yang akan digunakan, maka pengecekan apakah data memenuhi asumsi dari analisis non-parametrik yang digunakan juga tetap perlu dilakukan.

Unknown mengatakan...

Terimakasih bapak atas tanggapannya...ilmunya sangat bermanfaat

Unknown mengatakan...

Selamat siang Pak, saya mau bertanya..

1.Dalam uji spearman dalam heteroskedastisitas, bisakah kita langsung menggunakan Abs_res dari uji gletjer yang tidak lolos uji dibandingkan dengan unstandarized residual? Lalu apakah korelasi signifikan 0,01 dan 0,05 itu sama?

2. Kalau misalnya uji asumsinya lulus semua Pak, namun di regresi linier bergandanya nilai unstandarized coefficients B: Konstantanya 0,314
x1 -1,010E-14 dan
x2-nya 1,287E-13 
sehingga persamaannya menjadi : 
Y = 0,314 - 1,010E-14 X1 + 1,287E-13 X2 + e
Nilai x-nya hampir mendekati 0 pak, apakah boleh seperti ini?

Mohon sarannya Pak,Terima kasih banyak :)

Unknown mengatakan...

Untuk mayliza tan,

Sebelumnya mohon maaf karena respon saya lama sekali, karena kesibukan saya akhir-akhir ini.
Terkait dengan pertanyaanmu:
1. Saya pribadi tidak terlalu familiar dengan uji gletsjer maupun spearman untuk mengecek heteroskedastisitas. Sejauh yang saya ketahui, kita dapat menggunakan nilai absolut dari selisih y dengan prediksi y dikorelasikan dengan spearman untuk mengecek heteroskedastisitas.
2. Terpenuhinya asumsi oleh data tidak ada kaitannya dengan apakah koefisien yang diperoleh akan mendekati nol atau tidak. Meskipun semua pengecekan asumsi lolos, kita bisa saja tetap memperoleh nilai koefisien yang mendekati nol jika memang tidak ada korelasi antara prediktor yang dimaksud dengan variabel kriterion / dependennya.

Rina mengatakan...

permisi pak, saya rina mau menanyakan tentang;
1. uji post hoc setelah uji kruskal wallis itu pakai apa?
2. adakah teori tentang dasar penggunaan nilai signifikan? soalnya awalnya saya menggunakan nilai signifikansi 0.05%, tetapi ada salah satu hasil yg tidak signifikan. padahal jika dilihat dari datanya sangat berbeda. jika ada teorinya tolong beri tahu saya pak, supaya dapat memperkuat asumsi penelitian.
termiakasih banyak pak :)

Unknown mengatakan...

Sebelumnya mohon maaf untuk Rina karena saya baru bisa membalas komentar anda sekarang karena kesibukan saya akhir-akhir ini.

Demikian respon saya untuk tiap pertanyaan:
1. Uji post-hoc setelah kruskall wallis bisa menggunakan uji parametrik atau non parametrik lainnya. Misalnya menggunakan uji-t (parametrik) jika dua kelompok yang dibandingkan memenuhi asumsi uji-t. Jika tidak, maka dapat menggunakan Mann-Whitney U, dll (ada cukup banyak opsi untuk ini di SPSS). Tentu saja jika pasangan kelompok yang dibandingkan lebih dari 1, perlu melakukan penyesuaian nilai p. Sederhana-nya jika kita melakukan tiga uji, maka nilai p harus lebih kecil dari 0.05/3 baru dikatakan signifikan. Ini untuk mengendalikan familiwise error rate.

2. Penetapan nilai alpha (dalam hal ini yang saya maksud adalah probabilitas melakukan tipe error 1 bukan alpha cronbach untuk reliabilitas skala) sebesar 0.05 merupakan konsensus para ahli. Penetapan alpha ini seharusnya dilakukan SEBELUM pengambilan data atau analisis data. Pernyataan Rina bahwa "padahal jika dilihat dari datanya sangat berbeda", tidak dapat dijadikan dasar untuk menyatakan bahwa seharusnya uji statistiknya signifikan. Ini karena uji signifikansi merupakan alat untuk menarik inferensi mengenai kondisi di populasi, bukan kondisi di sampel. Sangat mungkin kondisi di sampel terlihat berbeda, tetapi perbedaan tersebut tidak cukup besar untuk dijadikan dasar pengambilan kesimpulan mengenai perbedaan di populasi. Hal ini bisa diakibatkan karena variasi di dalam kelompok cukup besar, adanya pelanggaran asumsi homogenitas varian, jumlah sampel yant kecil, dll. Oleh karena itu mengubah alpha untuk memperoleh hasil yang signifikan bukanlah praktek yang baik dalam analisis data. Tindakan ini dapat dianggap tindakan curang untuk mengarahkan hasil mengikuti kemauan kita. Jika ini dilakukan, maka pengetahuan yang kita dapatkan dari penelitian tidak akan memajukan pemahaman kita akan fenomena yang diteliti.

Semoga dapat membantu.

Anonim mengatakan...

Selamat Pagi Pak, saya mahasiswa yg sedang mengerjakan skripsi. Beberapa pertanyaan saya :

1. Bukankah cara pertama yg diuji normalitas adalah nilai residual kah ?
2. Apakah cara kedua dapat dilakukan uji normalitas (untuk memenuhi asumsi klasik) ke dalam uji regresi ?

terima kasih pak.

Mulyadi Tuo mengatakan...

Assalamualaikum, Pak.

Saya mau tanya, jika penelitiannya menggunakan 2 variabel independen dan 2 variabel dependen, haruskah dilakukan uji normalitas?
Jika harus, tolong penjelasannya sedikit tentang caranya..!!!

Mohon Bantuannya,
Terima kasih.

Anonim mengatakan...

ASS, pak saya mau menanyakan ttg data saya yang tidak normal, saya menggunakan statistik non parametrik - one sampel ks, tp data saya tidak melebihi ketentuan yaitu 0,05
saya sudah me-LN kan data saya tp ttap tidak normal,
selain me-Ln kan, saya bisa menggunakan cara apa saja? mohon penjelsannya pak
terimakasih

ade novia p

Unknown mengatakan...

Untuk Alaq Aldillah Ryanta,

1. Dalam tulisan tersebut, uji asumsi normalitas yang dimaksudkan adalah uji asumsi normalitas secara umum, tidak hanya untuk regresi sehingga saya memilih menggunakan data dari skor subjek dan bukan residualnya.
2. Ya, tentu saja. Kita bisa menggunakan cara kedua untuk melakukan uji asumsi normalitas residu dalam regresi. Kita hanya tinggal memasukkan data residu ke dalam Dependent List .

Unknown mengatakan...

Untuk Mulyadi Tuo,

Menurut saya, melakukan uji asumsi tidak terkait dengan banyaknya jumlah variabel, melainkan tergantung dari analisis apa yang hendak dijalankan. Ini karena asumsi melekat pada teknik analisis. Oleh karena itu saya perlu tahu lebih dulu bagaimana mas Mulyadi akan melakukan analisis data ini.

Unknown mengatakan...

Untuk Ade Novia P,

Saya kira ada baiknya mbak Ade melihat lebih dulu bentuk distribusi data yang dimiliki menggunakan histogram misalnya. Ini dilakukan agar kita bisa menentukan transformasi apa yang kiranya dapat mengurangi ketidaknormalan data.

Terkait dengan hal ini, saya pribadi tidak terlalu menyarankan transformasi data karena akan mengubah makna hasil analisis. Kecuali jika memang itu yang diinginkan. Saya lebih menyarankan penggunaan robust statistic sebenarnya, tapi ini tergantung dari teknik analisis apa yang hendak dijalankan. Informasi ini dibutuhkan untuk menentukan alternatif teknik analisis yang lebih robust (tangguh) untuk mengatasi ketidaknormalan data.

jaka mengatakan...

selamat sore pak blognya sangat membantu semoga bapak sehat skluarga amin...
saya mau nanya pak saya ad tugas kuliah ttg kependudukan yg sya mau tanya sya sdh menguji data dan mengikuti sprti blog bapak ttp data sya tdk terdistribusi normal apakah sya ada kslahan dalam data? atau gmn ya? trima ksih

Unknown mengatakan...

Untuk Jaka,

Terima kasih untuk masukan dan doanya.

Distribusi data yang tidak mengikuti distribusi normal tidak selalu diakibatkan adanya kesalahan. Memang kesalahan dalam proses input data dapat menyebabkan ketidak-normalan data. Tetapi, bisa saja terjadi distribusi data yang sesungguhnya memang tidak mengikuti distribusi normal karena cukup banyak model distribusi selain distribusi normal. Misalnya data yang berasal dari proses menghitung frekuensi kejadian mengikuti distribusi poisson, data diskrit seperti jenis kelamin mengikuti distribusi bernoulli, dll.

Nah jika distribusi dari variabel dependen tidak mengikuti distribusi normal, maka yang perlu dilihat adalah apa jenis datanya? Jenis data tertentu biasanya mengikuti distribusi tertentu sehingga memilih analisis yang dapat mengakomodasi jenis distribusi tersebut merupakan solusi yang paling akurat. Misalnya jika data berupa hasil perhitungan frekuensi, maka analisis regresi poisson (dikenal dengan regresi log-linear) dapat dilakukan.

Jika tetap 'dipaksa' menggunakan regresi biasa (regresi biasa di sini berasumsi variabel dependen bersifat kontinum meskipun tidak harus normal) maka kita perlu menggunakan analisis regresi yang robust terhadap pelanggaran ini. Misalnya menggunakan regresi yang dikembangkan oleh Huber-White atau analisis regresi kuantil.

Unknown mengatakan...

Pak agung.. mohon penjelsan.. sy masih sangat awam dan kurang oaham ttg uji statistik...sy mau tanyaaa apakah uji asumsi klasik (normalitas, hetero, multikol, dan autokorelasi) tidak perlu dilakukan dalam sebuah penelitian kuisoner ?? Mohon penjelasannya kenapa tidak perlu dilakukan uji ini? Sedangkan sy pakai uji analisis regresi linier berganda??? Setahu saya harus pakai uji asumsi klasik jika ada uji regresi? Mohon bantuan penjelasannya pak..

Unknown mengatakan...

Halo Mbak Andrea,

Pengecekan asumsi statistik terkait dengan penggunaan analisis statistik tertentu bukan dengan jenis penelitian maupun cara pengambilan data. Oleh karena itu, setiap kali peneliti hendak melakukan analisis statistik perlu mengecek pemenuhan asumsi oleh data terlepas dari jenis penelitiannya / cara pengambilan datanya.

Jadi ketika mbak Andrea melakukan analisis regresi ganda, menurut saya perlu untuk melakukan pengecekan asumsi. Mungkin mbak Andrea bisa memberikan sumber yang menyatakan tidak diperlukannya pengecekan asumsi ini atau memaparkan argumen sumber tersebut?

Unknown mengatakan...

Ass Pak, mohon maaf numpang nanya, apakah ada ketentuan jumlah sampel pada kelas eksperimen dan kelas kontrol harus sama atau hampir sama? Jika boleh berbeda, berapa selisih jumlah sampel pada kelas eksperimen dan kelas kontrol? Tks

Anonim mengatakan...

assallamualaikum pak, nama saya anisa, saat ini saya sedang menyusun skripsi, saya mengalami kendala saat saya melakukan analisis data menggunakan SPSS dimana pada saat saya melakukan apakah data minus dan 0 pada data asli akan berpengaruh pada uji Heterokedastisitas? karena pada saat saya melakukan uji normalitas dan Multikolonieritas tidak mengalami hambatan. kalau berpengaruh lantas tindakan apa yang harus saya lakukan, karena saya masing kebingungan jika harus melakukan transformasi data.
terima kasih
wassallam

Unknown mengatakan...

Salam sejahtera untuk Mbak Aulia dan Mbak Anisa,

Untuk mbak Aulia,

Sejauh yang saya tahu jumlah sampel pada kelas eksperimen dan kontrol dianjurkan sama karena hasil analisis yang dihasilkan akan lebih tangguh seandainya data tidak mengikuti asumsi (misalnya asumsi heterogenitas varian). Jika data memenuhi asumsi analisis, maka perbedaan ini tidak memiliki banyak pengaruh. Namun demikian ini bukan keharusan. Nah seberapa besar perbedaan yang 'diijinkan', saya pribadi belum pernah menemukan buku yang memberikan batasan ini. Kalaupun ada, biasanya batasn diberikan berdasarkan pandangan subjektif tanpa ada pembuktian empiris.
saran saya usahakan untuk memperoleh besar sampel yang sesetara mungkin. Jika jumlahnya benar-benar berbeda (misalnya kelompok satu memiliki jumlah subjek setengah dari yang lain), maka ada baiknya hal ini didiskusikan dalam pembahasan di skripsi sebagai potensi ancaman terhadap keabsahan hasil penelitian.

Unknown mengatakan...

Untuk Mbak Anisa,

Sejauh yang saya tahu, data berupa nilai negatif dan 0 tidak dengan sendirinya menyebabkan heteroskedastisitas. Jadi saya kira bukan itu penyebabnya. Kalau boleh tahu bagaimana prosedur yang dijalankan oleh mbak Anisa dalam melakukan pengecekan heteroskedastisitas?

Unknown mengatakan...

ass pak mohon maaf numpang nanya,sekrang saya sedang mengerjakan skripsi dengan tema kinerja keuangan pada 2 perusahaan prospektor dan defender, yang ingin saya tanyakan, apakah peneliti boleh menggunakan uji normalitas saja dalam pengukuran data?
sedangkan uji asumsi klasik disini kan ada 4 macam salah satunya uji normalitas. dengan menggunakan kolmogorov- spirnov ( uji t dan man whitney) . dengan mengunakn 2 variabel y dan jumlah sampelnya < 30.

Unknown mengatakan...

asslamualaikum pak agung
saya melakkan uji normalitas dengan menggunakan spss
ada dua cara tahapan yang dilakukan
pertama dengan tahapan analyze-nonparametrik-1 K-S
dari hasil yang pertama mennjukkan bahwa nila sig lebih besar dari 0,05
cara yang kedua menggnaka descriptve statistic-explore, hasilnya nilai sig lebih kecil dari 0,05
pertanyaan saya gimana pendapat bapak? saya menggnakan anlisis regresi dalam skripsi yang sedang saya kerjakan dengan sampel 47

ria

Unknown mengatakan...

Pak agung sy mau bertanya. Kenapa hanya uji asumsi klasik normalitas aja yang dipake di regresi sederhana? Seberapa penting asumsi normalitas dibandingkan asumsi klasik yg lain?

Anonim mengatakan...

Selamat Sore Pak,

Saya mau menanyakan,
1. saat saya melakukan uji validitas atas pernyataan kuisioner saya, justru semakin bertambah sample (uji pertama dilakukan dengan 30 sample) nilai validitas berubah, ada yang sebelumnya valid menjadi tidak valid begitu juga sebaliknya, namun ketika sampel mencapai angka 100 lebih, pertanyaan menjadi valid seluruhnya, walau nilainya pada angka 0,5 keatas. Saya menggunakan pernyataan yang telah digunakan oleh penelitian-penelitian sebelumnya. Apakah kondisi demikian perlu dilakukan uji validitas pada sampel 30 (piloting).

2. untuk menguji data outlier pada spss dengan menggunakan zscore, apakah yang dimasukkan adalah hasil seluruh butir pernyataan dari setiap variabel, atau nilai total masing-masing variabelnya Pak?

Terima kasih,

Wilson

Unknown mengatakan...

selamat malam pak, saya melakukan uji asumsi klasik pada data saya. Diketahui dalam bentuk p=plot dan histogram data saya normal. Tetapi setelah saya melakukan uji kolmogrov tidak normal. Apakah data saya bermasalah? atau tidak? terima kasih

Agus K mengatakan...

Selamat pagi Bapak....
Saya sedang mengerjakan tugas akhir...
data yang saya ambil adalah nilai pretes dan postes..
Saya ingin menghitung nilai N-gain dari pretes dan postes tsb
Apakah untuk menghitung nilai N-gain harus uji Normalitas ?
jika harus diuji normalitas, apakah pretesx saja ?, atau postesx saja ? atau dua2nya ? atau residunya ?
terima kasih

Unknown mengatakan...

Malam pak, saya mau tanya nih kalo variabel independent (X) ada 1 dan variabel independent (Y) ada 2 itu perhitungannya gimana ya ?

Unknown mengatakan...

Siang pak, saya mengerjakan TA., dengan menggunakan regresi robust yang mana ciri robust itu terdapat pencilan dan tidak normal.pertanyaan saya, saya punya data yg tidak normal, tp trnyata untuk uji asumsi autokorelasi dan heterokedastisitas nya tidak terpenuhi pak. bagaaimana kah solusinya itu pak? apa perlu transformasi data?

Unknown mengatakan...

Assalamualaikum pak saya mau bertanya saya ingin meneliti tentang uji perbedaan. Data saya normal dan homogen tetapi jumlah subjek dibawah 30, saya harus menggunakan parametrik atau nonparametrik ? Terimakasih

Payara P.AIN mengatakan...

SemarangTesis
Anda Butuh Bantuan olah data skripsi dan tesis
Segera Hubungi kami :
081 22 8 44 13 44

Khoiri mengatakan...

Assalamualaikum pak.. Saya mau bertanya, hipotesis saya tentang ada atau tidak perbedaan hasil belajar setelah menggunakan media saya. Lalu, rumusan masalah tentang hasil belajar dan respon siswa (angket) setelah menggunakan media saya. Saya sudah memperoleh data postest saja untuk hasil belajar dan respon siswa. Untuk pretest hasil belajar saya memperoleh dari guru, sedangkan pretest untuk respon siswa, saya tidak mengambil data tsb. Pertanyaannya, apakah bisa dengan data respon siswa setelah menggunakan media saya itu saja (1 sampel saja) untuk diuji normalitas? Bagaimana solusinya pak? Terima kasih

Unknown mengatakan...

halo pak. berkah dalem. saya Alfredo mahasiswa bapak di Fakultas Psikologi Universitas Sanata Dharma. saya sedang menyusun skripsi saya dan ingin bertanya, apakah ada alasan tertentu (mungkin penjelasan detail begitu) mengapa jika n> 50 menggunakan kolmogorov S? terimakasih sebelumnya pak

Unknown mengatakan...

Maaf pak, saya Devi lagi nyusun skripsi kuantitatif, dengan jumlah responden 35, menurut dosen pembimbing tidak boleh menggunakan kolmogorov smirnov, tapi harus pake chi kuadrat, kira2 mana yg benar pak?

Unknown mengatakan...

Assalamualaikum pak, saya lilis. Gini pak judul skripsi saya tentang pengaruh pilkada dki jakarta terhadap reaksi pasar 2017.pada saat uji normalitas variabel dependent nya tidak saya isi. Jadi pembimbing saya tanya kenapa tidak di isi. Apakah sekiranya bapak tau jawabanya? Saya bingung untuk menjawabnya. Terimakasih pak

Unknown mengatakan...

Kenapa pada normalitas tetap bisa di lakukan pak padahal tidak ada variabel y nya?

Anonim mengatakan...

pak saya mau nanya, judul saya adalah pengaruh penerapan model guided inquiry denngan menggunakan media mind mapping dengan desain one group pretest and posttest. jadi hanya satu kelas. itu uji normlitas dan homogenitas nya pake apa ya?

Unknown mengatakan...

Halo pak, maaf saya ingin bertanya. Bagaimana jika saya telah melakukan uji normalitas data tapi sebaran data saya tetap tidak normal? Sekalipum saya sudah menghapus data ekstrem yang ada. Apakah bisa dilakukan pengujiam normalitas dengan membandingkan skor mean antara penelitian saya dengan akor mean uji normalitas dan vvaliditaa reliabilitas alat ukur yang saya pakai terdahulu? Terima kasih.

Olah_Data_Semarang mengatakan...

Olah Data Semarang
Jasa Olah Data SPSS, AMOS, LISREL, Frontier 4.1
EVIEWS, SMARTPLS, STATA, DEAP 2.1, DLL
Contact Person WhatsApp
Klik Link Dibawah
Contact Person WhatsApp +6285227746673

Tiana mengatakan...

Pak, bisa bantu bagaimana menyampaikan interpretasi yang baik jika hasil kolmogorov tidak normal sedangkan p plot dan histogram telah terdistribusi dengan normal..

Isrini mengatakan...

Saya mau bertanya, bagaimana jika dalam uji asumsi klasik menggunakan cara transformasi yg berbeda beda, misalnya pada uji normalitas da heteroskedastisitas menggunakan Ln, untuk uji multikoleniaritas menggunakan data asli karena jika menggunakan Ln malah terjadi multikolinearitas, lalu untuk uji autokorelasi ditransformasi menggunakan Cochrone Orcutt karena jika menggunakan Ln malah terjadi autokorelasi, apakah boleh?
Lalu untuk uji regresi dan uji hipotesis data mana yg harusnya di gunakan apakah data asli atau transformasi?
Jika menggunakan data transformasi baiknya yg mana yg Ln atau Cochrone Orcutt?

Mutiara mengatakan...

Assalamu'alaikum pak saya ingin bertanya, data hasil skripsi saya tidak normal tetapi berlinear dan berkorelasi. Nah pembahasan karna tidak normal itu bagaimana menjelaskan nya ya pak saya bingung terimakasih

Olah_Data_Semarang mengatakan...

Mengatasi Data Tidak Normal Dengan Central Limit Theorem (CLT)
Apabila Data Tidak Normal Bisa Memakai Central Limit Theorem (CLT)
Sebagai Pendukung Kami Berikan Literatur Berupa Penelitian-Penelitian
Sebelumnya Sebanyak 20 Buah Penelitian
Bagi Yang Membutuhkan Bisa Klik Dibawah Ini Untuk Unduh Literatur Tersebut
https://s.id/UjiCLT

Unknown mengatakan...

Salam kenal pak,
Saya risa,
Saya ingin bertanya:
Pertama Terkait tabel komogorov smirnov, sampel penelitian saya 275. Saya ingin bertanya kapan kita menggunakan asymp. Sig (2 tailed) dengan Monte carlo (2 tailed) ? Kedua saya ingin bertanya Terkait autokorelasi. Pertanyaan saya bagaimana cara mencari nilai tabel durbin watson jika data lebih dari 200 sampel dan harus berurutan bagaimana cara mencari nilainya? Terimakasih

Unknown mengatakan...

salam kenal pak, saya Aulia dari Aceh. pak, saya sedang menyusun skripsi dengan judul Faktor - Faktor yang berhubungan dengan Needlee Stick Injuries dan di sini responden saya berjumlah 27 orang dan distribusi data tidak normal. menurut bapak, uji apa yang harus saya pakai? Dan mohon penjelasannya. terima kasih

Unknown mengatakan...

izin bertanya pak, mengapa dalam uji normalitas yg kita pakai itu residualnya. mengapa bukan data asli?

Olah_Data_Semarang mengatakan...

Uji Normalitas Dengan Uji Kolmogorov Smirnov Menggunakan Microsoft Excel
Berupa Video Tutorial Uji Normalitas Dengan Uji Kolmogorov Smirnov Menggunakan Microsoft Excel, Dilengkapi Dengan File Excel Yang Digunakan, Cukup Klik Link Berikut
http://bit.ly/KSExcel

Olah_Data_Semarang mengatakan...

Olah Data Semarang
Whatsapp 085227746673
Terima Jasa Olah Data
SPSS, EVIEWS, STATA, SmartPLS, DLL
Turnitin Free (Gratis) Berlaku Sampai 2022
Link Download
bit.ly/New32Dec
STATA 17 Full Version
Link Download
dik.si/STATA17
SmartPLS 3.3.3 Full Version
Link Download
dik.si/SM333
Eviews 12 Full Version
Link Download
dik.si/Eviews