Iklan 1

Minggu, September 16, 2007

Uji Asumsi 1 : Uji Normalitas dalam SPSS

Dua post saya terdahulu tentang Uji Asumsi 1 berbicara hal-hal teoritis mengenai uji normalitas. Sekarang bagaimana prakteknya? Maksud saya dengan praktek tentu saja bagaimana cara menghitungnya.

Dalam kesempatan ini saya akan banyak berbicara mengenai bagaimana cara melakukan uji normalitas menggunakan SPSS. Saya memilih SPSS dengan alasan program ini paling banyak dipakai oleh mahasiswa psikologi sehingga bisa dikatakan paling familiar. Selain itu SPSS termasuk program yang cukup user friendly sehingga cukup mudah digunakan meskipun oleh orang yang tidak mempelajari statistik sangat dalam.

Langkah Awal
Saya berasumsi paling tidak pembaca artikel ini adalah orang yang sudah pernah berurusan dengan SPSS. Paling tidak tahu bagaimana memulai SPSS dan membuka file. Jadi saya akan langsung berkisah mengenai cara melakukan analisis datanya.

Cara Pertama
Ada satu kebiasaan yang saya amati ketika teman-teman hendak melakukan uji normalitas dengan SPSS. Biasanya mereka memilih menu :

Analyze - Non Parametrik Test - 1 Sample KS

Setelah diklik pada menu ini, akan muncul dialog box seperti ini:

Sekarang yang kita lakukan hanya memasukkan variabel yang ingin kita uji normalitasnya ke dalam kotak Test Variable List. Kemudian klik OK. Hasil yang akan didapat kurang lebih seperti ini:

Lalu bagaimana cara membacanya? Untuk kepentingan uji asumsi, yang perlu dibaca hanyalah 2 item paling akhir, nilai dari Kolmogorov-Smirnov Z dan Asymp. Sig (2-tailed).
  • Kolmogorov-Smirnov Z merupakan angka Z yang dihasilkan dari teknik Kolmogorov Smirnov untuk menguji kesesuaian distribusi data kita dengan suatu distribusi tertentu,dalam hal ini distribusi normal. Angka ini biasanya juga dituliskan dalam laporan penelitian ketika membahas mengenai uji normalitas.
  • Asymp. Sig. (2-tailed). merupakan nilai p yang dihasilkan dari uji hipotesis nol yang berbunyi tidak ada perbedaan antara distribusi data yang diuji dengan distribusi data normal. Jika nilai p lebih besar dari 0.1 (baca posting sebelumnya) maka kesimpulan yang diambil adalah hipotesis nol gagal ditolak, atau dengan kata lain sebaran data yang kita uji mengikuti distribusi normal.
  • Jangan terkecoh dengan catatan di bawah tabel yang berbunyi Test distribution is Normal. Catatan ini tidak bertujuan untuk memberitahu bahwa data kita normal, tetapi menunjukkan bahwa hasil analisis yang sedang kita lihat adalah hasil analisis untuk uji normalitas.
Cara Kedua
Cara yang pertama biasanya menghasilkan hasil analisis yang kurang akurat dalam menguji apakah sebuah distribusi mengikuti kurve normal atau tidak. Ini disebabkan uji Kolmogorov Smirnov Z dirancang tidak secara khusus untuk menguji distribusi normal, tetapi distribusi apapun dari satu set data. Selain normalitas, analisis ini juga digunakan untuk menguji apakah suatu data mengikuti distribusi poisson, dsb.

Cara kedua merupakan koreksi atau modifikasi dari cara pertama yang dikhususkan untuk menguji normalitas sebaran data.

Kita memilih menu
Analyze - Descriptive Statistics - Explore...

Sehingga akan muncul dialog box seperti ini:

Yang perlu kita lakukan hanyalah memasukkan variabel yang akan diuji sebarannya ke dalam kotak Dependent List. Setelah itu kita klik tombol Plots... yang akan memunculkan dialog box kedua seperti ini:

Dalam dialog ini kita memilih opsi Normality plots with tests, kemudian klik Continue dan OK. SPSS akan menampilkan beberapa hasil analisis seperti ini:

SPSS menyajikan dua tabel sekaligus di sini. SPSS akan melakukan analisis Shapiro-Wilk jika kita hanya memiliki kurang dari 50 subjek atau kasus. Uji Shapiro-Wilk dianggap lebih akurat ketika jumlah subjek yang kita miliki kurang dari 50.

Jadi bagaimana membacanya? Kurang lebih sama seperti cara pertama. Untuk memastikan apakah data yang kita miliki mengikuti distribusi normal, kita dapat melihat kolom Sig. untuk kedua uji (tergantung jumlah subjek yang kita miliki). Jika sig. atau p lebih dari 0.1 maka kita simpulkan hipotesis nol gagal ditolak, yang berarti data yang diuji memiliki distribusi yang tidak berbeda dari data yang normal. Atau dengan kata lain data yang diuji memiliki distribusi normal.

Cara Ketiga
Jika diperhatikan, hasil analisis yang kita lakukan tadi juga menghasilkan beberapa grafik. Nah cara ketiga ini terkait dengan cara membaca grafik ini.
Ada empat grafik yang dihasilkan dari analisis tadi yang penting juga untuk dilihat sebelum melakukan analisis yang sebenarnya, yaitu:
  • Stem and Leaf Plot. Grafik ini akan terlihat seperti ini:
Grafik ini akan terlihat mengikuti distribusi normal jika data yang kita miliki memiliki distribusi normal. Di sini kita lihat sebenarnya data kita tidak dapat dikatakan terlihat normal, tapi bentuk seperti ini ternyata masih dapat ditoleransi oleh analisis statistik sehingga p yang dimiliki masih lebih besar dari 0.1.
Dari grafik ini kita juga dapat melihat ada satu data ekstrim yang nilainya kurang dari 80 (data paling atas). Melihat situasi ini kita perlu berhati-hati dalam melakukan analisis berikutnya.
  • Normal Q-Q Plots. Grafik Q-Q plots akan terlihat seperti ini:

Garis diagonal dalam grafik ini menggambarkan keadaan ideal dari data yang mengikuti distribusi normal. Titik-titik di sekitar garis adalah keadaan data yang kita uji. Jika kebanyakan titik-titik berada sangat dekat dengan garis atau bahkan menempel pada garis, maka dapat kita simpulkan jika data kita mengikuti distribusi normal.
Dalam grafik ini kita lihat juga satu titik yang berada sangat jauh dari garis. Ini adalah titik yang sama yang kita lihat dalam stem and leaf plots. Keberadaan titik ini menjadi peringatan bagi kita untuk berhati-hati melakukan analisis berikutnya.

  • Detrended Normal Q-Q Plots. Grafik ini terlihat seperti di bawah ini:
Grafik ini menggambarkan selisih antara titik-titik dengan garis diagonal pada grafik sebelumnya. Jika data yang kita miliki mengikuti distribusi normal dengan sempurna, maka semua titik akan jatuh pada garis 0,0. Semakin banyak titik-titik yang tersebar jauh dari garis ini menunjukkan bahwa data kita semakin tidak normal. Kita masih bisa melihat satu titik 'nyeleneh' dalam grafik ini (sebelah kiri bawah).

Sekilas Mengenai Outlier
Dari tadi kita membahas satu titik nyeleneh di bawah sana, tapi itu sebenarnya apa? Dan bagaimana kita tahu itu subjek yang mana?

Titik 'nyeleneh' ini sering juga disebut Outlier. Titik yang berada nun jauh dari keadaan subjek lainnya. Ada beberapa hal yang dapat menyebabkan munculnya outlier ini:
  1. Kesalahan entry data.
  2. Keadaan tertentu yang mengakibatkan error pengukuran yang cukup besar (misal ada subjek yang tidak kooperatif dalam penelitian sehingga mengisi tes tidak dengan sungguh-sungguh)
  3. Keadaan istimewa dari subjek yang menjadi outlier.
Jika outlier disebabkan oleh penyebab no 1 dan 2, maka outlier dapat dihapuskan dari data. Tetapi jika penyebabnya adalah no 3, maka outlier tidak dapat dihapuskan begitu saja. Kita perlu melihat dan mengkajinya lebih dalam subjek ini.

Lalu bagaimana tahu subjek yang mana yang menjadi outlier? Kita bisa melihat pada grafik berikutnya yang dihasilkan dari analisis yang sama, grafik boxplot seperti berikut ini:


Sebelum terjadi kesalahpahaman saya mau meluruskan dulu bahwa tulisan C10,Q1, Median, Q3 dan C90 itu hasil rekaan saya sendiri. SPSS tidak memberikan catatan seperti itu dalam hasil analisisnya. Grafik ini memberi gambaran mengenai situasi data kita dengan menyajikan 5 angka penting dalam data kita yaitu: C10 (percentile ke 10), Q1 (kuartil pertama atau percentil ke 25), Median (yang merupakan kuartil kedua atau percentile 50), Q3 (atau kuartil ketiga atau percentile 75) dan C90 (percentile ke 90).

Selain itu dalam data ini kita juga dapat melihat subjek yang menjadi outlier, dan SPSS memberitahu nomor kasus dari subjek kita ini; yaitu no 3. Jadi jika kita telusuri data kita dalam file SPSS, kita akan menemukan subjek no 3 ini yang menjadi outlier dalam data kita.

Catatan akhir: Sangat penting bagi kita untuk tidak sepenuhnya bergantung pada hasil analisis statistik dalam bentuk angka. Kita juga perlu untuk 'melihat' (dalam arti yang sebenarnya) data kita dalam bentuk grafik bahkan keadaan data kita dalam worksheet SPSS untuk memeriksa kejanggalan-kejanggalan yang mungkin terjadi.

55 komentar:

Anonim mengatakan...

Pak saya belum bisa memberikan komentar apapun, tapi setidaknya saya hanya bisa ngasih bravo wah .. wah .. wah ..
kagum ...
akhirnya ada juga dosen sahar yg bisa membuat blog khusus 4 statistik dgn pemeran utama Pak Bondan, Bu Ni2ng n Bpk sendiri he .. he.. he...
menarik sekali
tapi Pak Bondan n Bu Ni2ng kira2 siapa ya ?
Tapi tetap bersemangat pak cayoooooooo ^_^

Agung Santoso mengatakan...

Terima kasih. Sayangnya anda tidak memberitahu saya nama anda.
Mengenai nama-nama ini saya pilih secara asal saja. Saya mengambil nama saya sendiri supaya mudah jika hendak menampilkan perilaku yang konyol tanpa harus menyinggung orang lain.

Agung Santoso

Anonim mengatakan...

Halo pak, wah makin keren aja blognya. kalau begini terus, akan banyak mahasiswa psikologi yang makin cinta statistik. pokoknya akan kuikuti terus serta mohon ijin kugunakan beberapa materi untuk bahan kuliah. Oh ya, aku masih pengin lihat sisi manusiawi apa saja yang bisa pak agung temukan lewat statistik, seperti pesan pak agung dulu.
(Y.Heri.W)

agung santoso mengatakan...

wah boleh banget pak. mungkin ada baiknya dibuat diskusi juga karena mungkin sekali ada pendapat-pendapat yang berbeda dari yang saya paparkan di sini.

Anonim mengatakan...

ira

makasih bgt ya pak.....berguna saat2 lg belajar baca data olahan...
makasih banget,......

Anonim mengatakan...

pak, saya sedang mengerjakan tesis analisa persepsi..
untuk uji validitas+reliabilitas 24 butir pertanyaan (masing2 3butir utk tiap variabel) saya menggunakan sampel 30 responden (karna menurut buku yg saya baca, itu adalah syarat minimal dan representatif untuk mendekati distribusi normal)..
tetapi dosen saya menyalahkan, dan mengatakan utk mengujinya (harus memakai brp responden agar berdistribusi normal)..
apakah uji normalitas ini yg dipakai?
lalu apakah residunya ytg diuji/langsung saja?

trimakasih pak..

-dita-

Agung Santoso mengatakan...

Hai dita,

Pendapat saya sendiri begini: Sebenarnya memang tidak ada batasan berapa jumlah subjek yang dibutuhkan. Dan mengenai uji normalitas, menurut saya juga kurang penting karena keperluan kita saat ini adalah melakukan analisis reliabilitas dan validitas bukan uji hipotesis. Dan dalam analisis reliabilitas ini tidak dilakukan uji hipotesis apapun.

Kalau menurut saya sendiri, jumlah subjek sebanyak 30 orang memang terlalu sedikit, mengingat ada 24 butir pertanyaan. Ada baiknya jika jumlahnya ditambah.

Anonim mengatakan...

thx a lot pak! penjelasannya singkat n padat trus gampang dipahami oleh orang yg baru blajar spss. terus berkarya yah pak! -z-

Agung Santoso mengatakan...

Hai z,

terima kasih juga untuk komentarnya ya. Senang blog ini berguna untukmu.
Salam

Marfuah mengatakan...

siang Pak
sy ingin bertnya.
1.sy pernah membaca, bahwa uji normalitas untuk data yang <30 menggunakan kolmogorof-smirnov, tapi jika datanya >=30 menggunakan saphiro wilk. benarkah demikian?tapi, dari sumber yang lain menyatakan bahwa secara umum pengujian normalitas menggunakan kolmogorof-smirnov.
2.saya pernah membaca bahwa pengujian normalitas sebetulnya untuk menguji apakah errornya berdistribusi normal atau tidak. jika benar demikian, bagaimana pengujian normalitas untuk error tersebut?
3.mengapa untuk persamaan regresi, dilakukan pengujian normalitas data hanya untuk variabel terikat saja?
mhon tanggapan dari bapak

Agung Santoso mengatakan...

Halo Marfuah,
Terima kasih untuk pertanyaannya ya.
Jawabannya begini kurang lebih:
1.Sebenarnya tidak ada yang mengharuskan demikian. Memang Shapiro Wilk sendiri memang memiliki kelemahan ketika harus menguji normalitas dengan sampel kecil.Kecil di sini bukan N<30 tapi N<50. Tetapi sebenarnya sudah ada modifikasinya sehingga untuk N<50 pun dapat digunakan. Dalam hal ini tentunya SPSS misalnya kemungkinan besar sudah mengupdate modifikasi ini.

2. Untuk jawaban no 2 ini, ini berlaku khususnya untuk kasus analisis Regresi. Sementara untuk analisis varian atau uji t, yang dicek normalitasnya tetap variabel dependennya saja untuk tiap kelompok. Cara menguji normalitas residu / error dalam teknik analisis regresi dapat dibaca di posting ini:
http://psikologistatistik.blogspot.com/2007/09/uji-asumsi-1-uji-normalitas-regresi.html

3.Dalam hampir semua kasus, memang yang perlu dicek normalitasnya adalah variabel terikatnya.Ini disebabkan variabel terikat inilah yang dianalisis variasinya, untuk diketahui apakah variasi variabel terikat ini mengikuti variabel bebas. Dalam hal ini yang biasanya dianggap sebagai variabel yang bersifat random adalah variabel terikatnya. Oleh karena itu, jika hendak menggunakan statistik parametrik, perlu dipastikan dulu bahwa variasi yang diakibatkan ke'random'annya ini bersifat normal.

Anonim mengatakan...

pak gimana membaca hasil output uji Run test???

uirkasep mengatakan...

menyambung pertanyaan marfuah..
pak saya masih bingung dalam memilih uji normalitas untuk data kurang dari 30..
hasil dari K-S yang didapat dgn cara explorer dengan one sample test berbeda, tolong dijelaskan?
K-S dengan S-W lebih akurat mana pak?
trus saran bapak harus pake yang mana untuk data kurang dari 30?
terimakasih

Agung Santoso mengatakan...

untuk uirkasep,
Ya mungkin sekali berbeda, karena uji one sample KS sendiri tidak dirancang untuk secara khusus menguji normalitas. KS-Z bisa digunakan untuk menguji kesamaan distribusi antara data dengan distribusi acuan. Distribusi acuan ini bisa normal, poisson, dll.

Oleh karena itu, ada kalanya hasil analisisnya tidak sepeka hasil yang didapatkan dari Shapiro Wilk. Oleh karena itu ada baiknya untuk mengecek normalitas dari skewness dan kurtosisnya. Jika tetap tidak normal, maka ada baiknya untuk menggunakan analisis non-parametrik.

Anonim mengatakan...

pak, sy mw tanya, kq hasil regresi sy, residual data nya tdk berdistribusi normal. sy sdh menggunakan cara2 untuk menormalkan residual data sy tp hasilnya masih saja g normal. bagaimana solusinya???
mksh...

princezukin mengatakan...

nice post Pak Agung,
kebetulan saya sdg olah data ttg uji asumsi ini, sekalian nanya y Pak,
u/ analisis korelasi kanonik
(multivariate analysis),
1. bgmna cara menguji normalitas data scra simultan dgn SPSS??apakah sama seperti pada univariate??kemudian gmna cara mengubah taraf ujinya??

2. Jika u/ dependent ada 4 variabel, dan independen jg ada 4 var, gmna cara uji lineritasnya??apakah satu2, sebanyak 16kali??atau ada uji simultannya??

Terimakasih sebelumnya, Pak Agung...

Agung Santoso mengatakan...

untuk Anonim,
Mungkin perlu dilihat dulu polanya ketidaknormalannya bagaimana. Apakah cenderung kurtotik atau juling. Tiap kondisi memerlukan cara mengatasi yang berbeda.

Untuk princezukin,
saya kurang begitu menguasai materi mengenai korelasi kanonik dan asumsi dasarnya. Untuk uji normalitas, biasanya ada dua uji yang dibutuhkan yaitu normalitas univariat maupun multivariat. Kedua uji ini bisa didapatkan di web yang dibuat De Carlo : http://www.columbia.edu/~ld208/

Untuk uji linearitasnya sendiri saya kurang tahu apakah memang perlu diuji satu-satu. Menurut saya mungkin perlu dicek menggunakan Graph-Scatter-Matrix. Sehingga bisa dicek linearitas keempat variabel itu dalam satu gambar.

chie mengatakan...

salam kenal pak,,

kebetulan saya sedang bljr uji spss tp sy kesulitan pada uji outlier..
jk data sy outlier, apa ya pak yg harus sy lakukan???

jk sy memilih untuk me-lognatural-kan data sy, apakah sy harus me-Ln-kan semua variabel atau boleh salah satu variabel saja??? (misalkan data saya 1 variabel dependent dan 2 variabel independent)

Agung Santoso mengatakan...

halo Chie,

Hmm, begini: Chie perlu ngecek dulu penyebab outlier tersebut. Apakah karena salah koding, kesalahan pengisian subjek, atau yang lain. jadi jangan buru-buru di Log dll.

Jika ternyata memang datanya memang demikian, ada baiknya membandingkan hasil analisis antara data yang memasukkan outlier dengan yang mengeluarkan outlier. Jika keduanya tidak terlalu berbeda, maka outliernya dimasukkan saja.

Nah jika ternyata beda banget hasilnya, baru dipikirkan tentang transformasi data. Ini perlu hati-hati karena transformasi akan membuat data berubah. Oleh karena itu perlu mencari transformasi yang sifatnya monotonik seperti Ln atau Log. Untuk itu yang perlu ditransformasi hanya variabel yang bermasalah saja, tidak perlu semuanya.

Salam...

Anonim mengatakan...

assalamualaikum, selamat siang pak..
saya kurnia, dan senang sekali saya menemukan blog seperti bapak, saya masih awam mengenai statistik, dan saya menjadi tertarik dengan statistik,
saya mau bertanya pak pendapat bapak, mengenai misalkan terdapat data 2 tahun sebelum dan 2 tahun setelah, menurut bapak baiknya bagaimana cara menguji normalitasnya, apakah tiap tahun dilakukan uji normalitas (jadi ada 4 uji normalitas), atau data 2 tahun sebelum dan 2 thun setelah masing2 digabungkan baru di uji normalitasnya..
terimakasih :)

Agung Santoso mengatakan...

Untuk Kurnia,
Jika kasusnya demikian, maka data untuk setiap tahun perlu dicek normalitasnya terpisah. Jadi ada 4 kali pengecekan normalitas datanya.

Anonim mengatakan...

kurnia
terimakasih :)

icha mengatakan...

halo pak agung, terima kasih sekali atas blog ini, mata saya sedikit terbuka akan uji normalitas hehehe.
cuma yang saya bingung pak, analisis grafik p-p plot saya, garis diagonalnya tidak dimulai dari titik 0 tapi di titik nilai berikutnya (misalnya di titik 1)
itu bagaimana ya pak, membuat garis diagonal pada titik 0.?

aditya mengatakan...

Blog anda memberi pencerahan saya. Tq. Lagi pecas ndahe pak nggarap tugas stat.istik

aditya mengatakan...

Tq, blog anda memberi pencerahan saya yg lg mumet nggarap tugas statistik..

Tia mengatakan...

Pak saya sedang melakukan penelitian utk tesis saya, saya membandingkan model2 keseimbangan pasar modal utk mengetahui model yang paling representatif dalam menilai saham dilihat dr model yang memiliki nilai residual terkecil. namun saya bingung langkah langkah yang harus saya lakukan dg SPSS. atas jawabannya saya ucapkan terimakasih pak.

Anonim mengatakan...

lalu bagaimana menguji data yang terkena univariate outlier pak? jd misalkan outliers nya berada pada posisi 1 ato 2.. apa harus di hapus datanya pak?

Anonim mengatakan...

Pak, numpang bertanya.. apa maksud dari nilai statistic pada tabel uji normal spss ? trims

Agung Santoso mengatakan...

Untuk penanya mengenai nilai statistic,
Dalam tabel itu nilai di bawah kolom statistic itu berarti nilai dari hasil analisis seperti kolmogorov smirnov atau shapiro-wilk.

semoga membantu

Anonim mengatakan...

Bapak Agung yang saya hormati, mohon berkenan memberikan pencerahan atas masalah saya.

Saya sedang belajar meneliti, experimen ada 2 group, group kontrol 64 partisipan dan group perlakuan 52 partisipan.

Pertanyaan:
Untuk uji normalitas, apakah dilakukan langsung untuk 116 partisipan itu ataukah uji normalitas untuk tiap group sendiri-sendiri?

TErimakasih bapak
Tertanda Yanto D Soedarmono

Anonim mengatakan...

Salam kenal, saya mau tanya apakah kalau tidak ada nilai variabel Y dapat dilakukan uji asumsi klasik (normalitas, hetero, multikol, dan autokorelasi)??
Terima kasih

Guru Pantura mengatakan...

Terima kasih ilmunya pak... :)
Sperti pertanyaan yg sudah pernah ada, saya juga merasa bingung kenapa uji normalitas menggunakan cara pertama dan cara kedua hasilnya beda sangat jauh... sekali...

Agung Santoso mengatakan...

Untuk Guru Pantura,

Terima kasih banyak atas komentarnya, dan maaf kalau saya balasnya lama.

Ya memang cara pertama dan kedua bisa berbeda. Karena cara pertama menggunakan teknik yang sifatnya lebih umum, digunakan untuk mengecek kesesuaian data dengan distribusi tertentu (salah satunya distribusi normal). Sementara cara kedua digunakan scr khusus untuk menguji asumsi normalitas.

Agung Santoso mengatakan...

Untuk Anonim,

pertanyaan anda:
Salam kenal, saya mau tanya apakah kalau tidak ada nilai variabel Y dapat dilakukan uji asumsi klasik (normalitas, hetero, multikol, dan autokorelasi)??

jawaban:
uji asumsi yang dapat dilakukan tergantung pada jenisnya. Misalnya untuk normalitas tetap dapat dilakukan, sementara untuk heteroscedasticity tentu saja tidak bisa karena ini terkait dengan varian dari variabel dependen untuk tiap nilai dari variabel independen. Jadi harus ada 1 variabel dependen, dan 1 variabel independen.

Agung Santoso mengatakan...

Untuk pertanyaan mengenai penelitian eksperimen:
uji asumsi sebaiknya dilakukan di tiap kelompok bukan seluruh subjek. Jadi untuk kelompok kontrol dan perlakuan masing-masing dilakukan uji asumsi.

Qu_Cha mengatakan...

wah, keren, pak agung tetap setia menjawab bahkan hingga mei 2012, padahal banyak blgger lain sudah malas menanngapi pertanyaan-pertanyaan dari -pemirsahnya,

keep posting pak agung
:)

Agung Santoso mengatakan...

Untuk Qu Cha,

Terima kasih untuk tanggapannya. Ya saya merasa perlu menjawab terus, karena ini sarana komunikasi antara saya dengan pembaca (ceileh...).

mungkin dari pertanyaan-pertanyaan ini muncul ide untuk menulis artikel baru.

Salam,

Anonim mengatakan...

terimakasih pak, blog ini sangat berguna bagi saya yang masih awam dalam spss, saya ingin tanya mengenai pp plot dan qq plot itu bagaimana? tujuannya untuk apa? dan memakai variabel apa?

Agung Santoso mengatakan...

Sejauh yang dapat saya pahami, qq plot maupun pp plot di SPSS dapat digunakan untuk mengecek bentuk distribusi data kita. Dalam hal ini misalnya kita mau melihat apakah distribusi data kita mengikuti sebaran data normal.

Variabel yang bermakna jika di-pp plot- kan dan qq plot-kan adalah variabel kontinum. Jadi biasanya qq plot dan pp plot ini digunakan untuk mengecek sebaran data variabel kontinum.

Anonim mengatakan...

Pak Agung yth,

Saya sedang meneliti analisis kepuasan pengguna lulusan. Data yang saya dapatkan hanya 12 responden, apakah perlu saya lakukan uji normalitas, validitas dan reliabilitas?

Jika tidak, dengan apa saya harus mengambil keputusan/kesimpulan?
terima kasih
Wanda

Agung Santoso mengatakan...

Untuk Wanda:

Saya pikir itu tergantung pada tujuan penelitian yang akan dilakukan. Jika tujuan penelitian sifatnya deskriptif, seperti mengetahui mean, median dll, maka uji normalitas tidak dibutuhkan.

Jika hendak melakukan analisis inferensial, menurut saya jumlah 12 respondedn tergolong kecil. Ini dapat mengakibatkan kesalahan pengambilan kesimpulan yang besar.

Untuk estimasi reliabilitas dan validitasnya, ini terkait dengan alat ukur yang hendak digunakan, jadi tidak terkait dengan jumlah subjek penelitiannya. Estimasi reliabilitas dan validitas seharusnya dilakukan sebelum pengambilan data ini dengan jumlah subjek yang memadai.

susi susilawati mengatakan...

assalamualaikum...
bapak saya sedang membuat tesis dan mulai ke proses uji normalitas, homogenitas dll...nah yang saya bingung kenapa semua item saya hasilnya negatif (tidak normal,tidak homogen) padahal dari hasil uji validitas n reliabilitas hasilnya sangat tinggi mendekati 1 sekitar 0,8-0,9...
dan saya harus berbuat apa pak, saya jadi bingung sekali?
terima kasih!

Anonim mengatakan...

Pak Agung Yg baik

Mhn penjelasannya pak.
Saya sdg belajar penelitian eksperimen. Ada dua grup yaitu grup A 68 partisipan dan grup B 65 partisipan yang masing-masing memperoleh perlakuan. Lalu diperoleh data dari dua grup tsb.

Sy ingin membandingkan mean dua grup tsb.

Dr uji normalitas, ternyata tidak memenuhi kriteria normal. Untuk itu saya mau gunakan non parametrik uji Mann Whitney.

Ada teman saya yang bilang, langsung saja pake Independent T Test(paramaterik). Alasananya karena eksperimen maka tidak terlalu penting apakah datanya normal atau tidak.

Mohon tanggapan pak, apakah saya harus pake paramoterik atau non parametrik?

Tks
Saya Azka Baihaqi

Amalia Fauziah mengatakan...

Pak Agung,

distribusi normal data ditentukan oleh signifikansi yang p>0,1

lalu, apa kegunaan dari angka kolmogorov? penjelasan apa yang ditunjukkan angka tersebut? apakah mempengaruhi normalitas distribusi data?

Terima kasih banyak.

Agung Santoso mengatakan...

Untuk Fauziah,

Kebiasaan kita melihat hanya nilai p saja memang akhirnya membuat kita bingung apa fungsi nilai Kolmogorov Z. Nilai ini seperti nilai t yang kita dapatkan dari uji t atau nilai r yang kita dapatkan dari perhitungan korelasi product moment. Dari nilai t atau r atau Z inilah, nilai p dapat diestimasi besarannya.

Meskipun keputusan dibuat berdasarkan nilai p, tapi komputer tidak akan dapat menemukan nilai p ini tanpa nilai Z (walaupun pada akhirnya dari segi praktis, nilai Z ini tidak 'bicara apa-apa'... paling tidak untuk keperluan uji normalitas).

Agung Santoso mengatakan...

Untuk susi susilawati,

Mungkin saya perlu bertanya dulu, mengapa anda melakukan uji normalitas untuk tiap item? Karena biasanya yang diuji normalitas hanya skor total dari skala / tes bukan skor itemnya.

Kalau yang anda lakukan benar, maka memang tidak selalu item yang memiliki korelasi tinggi dengan totalnya, memiliki distribusi yang normal. Atau skala yang reliabel akan berdistribusi normal. Kedua hal ini tidak ada kaitannya.

Anonim mengatakan...

Pak, saya mengikuti cara bapak untuk outlier, tapi saya kesulitan membaca boxplot nya pak, subjek yang mana saja yang salah. Apakah bapak bisa memberi saran?

Agung Santoso mengatakan...

Dalam Box Plot biasanya subjek yang memiliki nilai outlier akan muncul sebagai titik di luar box nya. Bisa dalam bentuk lingkaran kecil atau tanda bintang. Kalau kedua outlier ini tidak muncul, maka kemungkinan memang tidak ada outlier dalam data anda.

Jika salah satu atau kedua outlier ini muncul, SPSS akan memberi angka di dekat titik outlier tersebut. Angka tersebut adalah nomor subjek dalam data.

Jika angka tersebut tidak ditunjukkan, kita bisa klik dua kali pada grafik kemudian klik satu kali pada salah satu titik saja, kemudian klik kanan pada titik tersebut, lalu pilih show data labels. Maka SPSS akan memunculkan nomor subjek dari data tersebut.

Anonim mengatakan...

halo pak..
saya sedang analisis hasil penelitian, tepatnya lg uji asumsi klasik..
nha, saya mengalami kendala uji normalitas di mana hasilnya < 0,05 (pake uji k-s).. untuk mengatasi normalitas, gmn ya caranya?
skala IV=ordinal, DV=nominal..
3 iv dan 1 dv

mohon pencerahan..terima kasih pak
salam, angela

Agung Santoso mengatakan...

Sebelum menjawab pertanyaan, ijinkan saya bertanya dulu ya. Rencananya analisis apa yang akan digunakan, mengingat baik variabel independen maupun dependennya tidak ada yang interval. Jika menggunakan analisis non parametrik, asumsi normalitas tidak perlu dipenuhi karena analisis non parametrik tidak mensyaratkan normalitas sebaran.

Jika menggunakan parametrik, mungkin perlu dipertibangkan karena biasanya analisis parametrik menuntut jenis data variabel dependennya minimal interval.

Sonia Vivianneari mengatakan...

Halo pak agung,

Saya sedang mengerjakan skripsi pengaruh pelatihan thd kinerja pegawai.
N = 47 (ppulasi mjd sampel)
Pelatihan (X1, X2, X3, X4, X5)
Kinerja (Y)

Pertanyaan saya :
1. Apakah untuk uji normalitas saya bisa menggunakan Kolmogorov Smirnov mengingat sampel hanya 47??
2. Data yang dimasukkan ke Data View pada SPSS merupakan Data yang sudah di MSI, karena dosbing saya menyatakan harus di MSI dulu.
3. Data yang dimasukkan ke Data View merupakan semua data Kuesioner lalu dimasukkan saja semua atau HASIL/JUMLAH dari X1, dst????
4. Untuk peletakan di EXPLORE bagian Dependet untuk Y dan Factor untuk variabel X1, X2, X3, X4 DAN X5. Apakah benar pak???

Sangat ditunggu jawabannya pak, terimakasih

(Sonia)

Agung Santoso mengatakan...

Sonia,
Sebelumnya mohon maaf karena lama sekali saya baru bisa balas komen mu.
Ada beberapa hal yang perlu saya tanyakan dulu untuk memperjelas pertanyaanmu:
1. Ada yang kurang jelas tentang X1, X2 dst... Apakah yang dimaksud X1 adalah kelompok pelatihan yang berbeda dengan X2? atau X1 dst adalah pelatihan pada kelompok yang sama dengan subjek berbeda?

2. Jika X1,X2 dst adalah kelompok yang berbeda, apakah jumlah 47 orang itu untuk tiap X1 atau untuk total?

3. Saya kurang paham dengan apa yang dimaksud dengan data yang sudah di-MSI. Mungkin bisa dijelaskan lebih dulu?

Terima kasih sebelumnya.

Melfina mengatakan...

Halo pak agung
Saya sedang membuat skripsi dengan tema membandingan kinerja keuangan antara bank konvensional dan bank syariah. Saya akan menghunakan uji independent samples T-test. Apakah boleh menguji normalitasnya dengan one sample K S?
Ditunggu jawabannya ya pak. Terimakasih
Melfina

Anonim mengatakan...

selamat siang pak,
saya memiliki 2 variabel dependen, sy ingin menghitung normalitas datanya menggunakan k-s. apakah saya harus menghitung normalitas masing2 data variabel dependen atau bisa dihitung sekalian? terima kasih

Agung Santoso mengatakan...

Untuk Melfina dan penanya terakhir saya jawab pertanyaannya sekaligus ya,

Pengecekan normalitas data bisa dilakukan dengan berbagai cara. Salah satunya dengan one sample KS. Hanya saja, ada baiknya juga menurut saya untuk melihat grafik data dan deskripsi data agar gambaran kita tentang kondisi data kita lebih lengkap. Kalau hanya menggunakan satu cara saja, maka kita memiliki sense yang kurang terhadap data.

Nah apakah harus sekaligus atau satu-satu? Menurut saya harus satu-satu. Karena tidak logis rasanya untuk menggabungkan dua variabel dependen jadi satu padahal mungkin saja unit pengukurannya berbeda. Selain itu jika analisis dua variabel dependen ini akan dilibatkan dalam analisis multivariat, tentunya ada pengecekan tambahan seperti normalitas multivariat yang perlu dilakukan.

Semoga membantu.