Iklan 1

Jumat, September 14, 2007

Uji Asumsi 1 : Uji Normalitas

Setelah cukup lama bingung pilih-pilih tema yang mau diangkat perdana, saya akhirnya mencoba memilih satu tema ini : Uji Asumsi Statistik Parametrik. Uji Asumsi yang pertama akan saya bahas adalah Uji Normalitas.

Apa itu ?

Kita mulai dulu dari apa itu uji normalitas. Uji normalitas adalah uji yang dilakukan untuk mengecek apakah data penelitian kita berasal dari populasi yang sebarannya normal. Uji ini perlu dilakukan karena semua perhitungan statistik parametrik memiliki asumsi normalitas sebaran. Formula/rumus yang digunakan untuk melakukan suatu uji (t-test misalnya) dibuat dengan mengasumsikan bahwa data yang akan dianalisis berasal dari populasi yang sebarannya normal. Ya bisa ditebak bahwa data yang normal memiliki kekhasan seperti mean, median dan modusnya memiliki nilai yang sama. Selain itu juga data normal memiliki bentuk kurva yang sama, bell curve. Nah dengan mengasumsikan bahwa data dalam bentuk normal ini, analisis statistik baru bisa dilakukan.

Bagaimana Caranya?
Ada beberapa cara melakukan uji asumsi normalitas ini yaitu menggunakan analisis Chi Square dan Kolmogorov-Smirnov. Bagaimana analisisnya untuk sementara kita serahkan pada program analisis statistik seperti SPSS dulu ya. Tapi pada dasarnya kedua analisis ini dapat diibaratkan seperti ini :

1. pertama komputer memeriksa data kita, kemudian membuat sebuah data virtual yang sudah dibuat normal.

2. kemudian komputer seolah-olah melakukan uji beda antara data yang kita miliki dengan data virtual yang dibuat normal tadi.

3. dari hasil uji beda tersebut, dapat disimpulkan dua hal :
    • jika p lebih kecil daripada 0,05 maka dapat disimpulkan bahwa data yang kita miliki berbeda secara signifikan dengan data virtual yang normal tadi. Ini berarti data yang kita miliki sebaran datanya tidak normal.
    • jika p lebih besar daripada 0,05 maka dapat disimpulkan bahwa data yang kita miliki tidak berbeda secara signifikan dengan data virtual yang normal. Ini berarti data yang kita miliki sebaran datanya normal juga.

Ukuran inilah yang digunakan untuk menentukan apakah data kita berasal dari populasi yang normal atau tidak.

Bagaimana Jika Tidak Normal?
Tenang...tenang... data yang tidak normal tidak selalu berasal dari penelitian yang buruk. Data ini mungkin saja terjadi karena ada kejadian yang di luar kebiasaan. Atau memang kondisi datanya memang nggak normal. Misal data inteligensi di sekolah anak-anak berbakat (gifted) jelas tidak akan normal, besar kemungkinannya akan juling positif.
Lalu apa yang bisa kita lakukan?

1. Kita perlu ngecek apakah ketidaknormalannya parah nggak. Memang sih nggak ada patokan pasti tentang keparahan ini. Tapi kita bisa mengira-ira jika misalnya nilai p yang didapatkan sebesar 0,049 maka ketidaknormalannya tidak terlalu parah (nilai tersebut hanya sedikit di bawah 0,05). Jika ketidaknormalannya tidak terlalu parah lalu kenapa? Ada beberapa analisis statistik yang agak kebal dengan kondisi ketidaknormalan ini (disebut memiliki sifat robust), misalnya F-test dan t-test. Jadi kita bisa tetap menggunakan analisis ini jika ketidaknormalannya tidak parah.

2. Kita bisa membuang nilai-nilai yang ekstrem, baik atas atau bawah. Nilai ekstrem ini disebut outliers. Pertama kita perlu membuat grafik, dengan sumbu x sebagai frekuensi dan y sebagai semua nilai yang ada dalam data kita (ini tentunya bisa dikerjakan oleh komputer). Nah dari sini kita akan bisa melihat nilai mana yang sangat jauh dari kelompoknya (tampak sebagai sebuah titik yang nun jauh di sana dan nampak terasing...sendiri...). Nilai inilah yang kemudian perlu dibuang dari data kita, dengan asumsi nilai ini muncul akibat situasi yang tidak biasanya. Misal responden yang mengisi skala kita dengan sembarang yang membuat nilainya jadi sangat tinggi atau sangat rendah.

3. Tindakan ketiga yang bisa kita lakukan adalah dengan mentransform data kita. Ada banyak cara untuk mentransform data kita, misalnya dengan mencari akar kuadrat dari data kita, dll.

4. Bagaimana jika semua usaha di atas tidak membuahkan hasil dan hanya membuahkan penyesalan (wah..wah.. nggak segitunya kali ya?) . Maka langkah terakhir yang bisa kita lakukan adalah dengan menggunakan analisis non-parametrik. Analisis ini disebut juga sebagai analisis yang distribution free. Sayangnya analisis ini seringkali mengubah data kita menjadi data yang lebih rendah tingkatannya. Misal kalo sebelumnya data kita termasuk data interval dengan analisis ini akan diubah menjadi data ordinal.
Well, demikian kiranya paparan atau sharing tentang normalitas. Semoga dalam waktu dekat saya bisa tahu gimana caranya meng-upload gambar ke dalam blog ini dalam posisi yang manis jadi penjelasan saya bisa jadi lebih visualized gitu deh. Semoga juga saya juga bisa segera mengubah tampilan SPSS menjadi JPG, jadi kita bisa belajar baca hasil analisis di blog ini, OK? Semoga..... (kayak lagunya katon nih)

54 komentar:

senoaditama mengatakan...

photo dan gambarnya donk....

senoaditama mengatakan...

maksudnya photonya Agung dan gambar ilustrasi secara grafik atau lainnya yang dapat menjelaskan suatu topik statistik (bila memungkinkan lho)..

Aku mengatakan...

kalo mau ubah gambar SPSS ke gambar bisa aku bantu Mas...

agung santoso mengatakan...

Wah terima kasih banyak atas kesediaannya. Tapi 'aku' ini siapa? Saya sudah mencoba menggunakan MS word sampai corel tapi belum memberikan hasil cukup memuaskan. Mungkin ada saran mengenai programnya?

budysd mengatakan...

Terima Kasih Banyak, setelah membaca artikel anda, pengetahuan saya tentang Program SPSS semakin bertambah. Saya belajar SPSS otodidak.

Agung Santoso mengatakan...

Hai budysd,
Wah saya senang sekali jika blog ini bisa berguna buat anda. Ini berarti blog ini sudah mencapai sasarannya.

Terima Kasih atas feedback yang telah diberikan. Saya menunggu komentar atau diskusi dari anda.

andreas mengatakan...

maz agung, saya mau nanya. kalo uji regresi linier sederhana ga pake uji normalitas bisa ga?
data saya menggunakan laba yang rentang perubahannya jauh. (mis thn 1 perusahaan laba 1jt trus tahun kedua bisa laba 1Milliar.)
selain dengan cara menghilangkan data outlier, ada cara lain ga mas agung? mohon bantuannya ya
thx..

Agung Santoso mengatakan...

Hai Andreas,
Sebelumnya terima kasih ya untuk pertanyaannya.

Jika andreas hendak menguji hipotesis , maka normalitas dapat dikatakan sebagai 'keharusan'. Dengan pertimbangan begini, jika data tidak normal, maka hasil uji hipotesisnya (dalam hal ini nilai p nya) akan meleset dari p yang sebenarnya. Misalnya p yang sebenarnya 0.34 tapi dilaporkan oleh SPSS jadi 0.05 karena data sebenarnya nggak normal.

Selain itu yang saya tangkap dari cerita andreas sekilas andre ingin melihat hubungan antara waktu (tahun) dan laba. Jika memang demikian maka regesi linear biasa sepertinya kurang tepat digunakan untuk memecahkan masalah ini karena nanti akan ada masalah autokorelasi. Jauh lebih tepat jika andreas menggunakan regresi time series.

Saayangnya saya sendiri belum tahu banyak mengenai analisis ini jadi belum bisa bercerita banyak. semoga dalam waktu dekat saya bisa mempelajarinya.

andreas mengatakan...

selamat siang pak agung.
terima kasih pak sudah memberi masukan kepada saya.
begini pak, saya lagi meneliti kemampuan laba dalam memprediksi arus kas satu tahun kedepan, menggunakan regresi linier sederhana dgn sampel 70perusahaan.
laba 2007-v independen, arus kas 2008-v dependen.data dari 70prshaan (nilai laba dan arus kasnya) tersebut memiliki rentang yang jauh antara beberapa perusahaan dgn perusahaan lainnya sehingga uji normalitas data tidak bisa terpenuhi.
mohon bantuan dari pak agung mengenai data saya ini.
makasi..

Agung Santoso mengatakan...

Andreas,
kabarnya memang data keuangan seringkali tidak normal. Menurut saya yang bisa dilakukan adalah dengan mentransformasi data, misalnya dengan mencari nilai log dari data.

Ini bisa dilakukan menggunakan menu data->transform di SPSS.

Bisa juga diatasi dengan menggunakan regresi nonparametrik atau regresi kuantil.

dini mengatakan...

malam pak, saya ingin bertanya. saat ini saya sedang melakukan penelitian menggunakan analisis regresi berganda untuk menguji pengaruh dari 4 var indpn. tapi dari hasil analisis tsb nilai Durbin Watson nya sebesar 1,56 apakah itu mengandung gejala autokorelasi? selain itu koef beta salah satu var indpnnya sebesar 0,000. itu artinya apa dan knp bs begitu. apakah data saya cacat?
var dep saya berupa inks rasio
var indep 1 totak aktiva dengan nilai min 1 Milyar
var indep 2-4 berupa rasio. makasih ....

Agung Santoso mengatakan...

Hai Dini,
Sebelumnya, maaf nih lama banget nggak kasih tanggapan. Selain karena sibuk kuliah, saya juga mencoba untuk mencari jurnal terkait untuk menjawab pertanyaanmu.

Saya menemukan 3 jurnal yang terkait, dua ditulis oleh Durbin-Watson sendiri, jadi semoga bisa memberi pencerahan ya.

Pertama terkait dengan hasil durbin watson, sayang sekali Dini tidak menyebutkan jumlah subjeknya. Durbin dalam artikelnya memberikan tabel signifikasi untuk nilai d yang dihasilkan dari analisis ini. Dengan asumsi jumlah subjek sebesar 100, maka nilai 1.56 termasuk nilai yang menggambarkan adanya autokorelasi yang positif dan signifikan.

Kedua, mengenai nilai beta yang sangat kecil. Biasanya untuk data berupa income dan sejenisnya, sebelum melakukan regresi perlu dilakukan log dari data. Karena biasanya data berupa income dan sejenisnya mengikuti distribusi eksponen. Nah kecurigaan saya begini: nilai beta menjadi sangat kecil karena data yang dimiliki Dini berupa data dengan angka yang sangat besar (sampai milyaran).Oleh karena itu perlu untuk mengubah skala datanya, misalnya dengan menggunakan log.

Menurut saya terlalu dini untuk menilai datanya cacat hanya dengan melihat hasilnya. Mungkin Dini bisa memberikan gambaran lebih detil mengenai kondisi datanya? Bisa dikirim ke email saya. Nanti coba saya lihat juga.

Terima Kasih untuk kesabarannya.

andreas mengatakan...

malam pak, saya mau nanya lagi mengenai hasil output spss.
hasil koefisien regresi nilai p-value pada variabel 0.00 tapi pada konstanta > 0.05 (0.971 pada penelitian saya).
menurut pak agung hasil regresinya signifikan atau tidak bila pengambilan keputusan berdasarkan p-value?

Agung Santoso mengatakan...

Untuk Andreas,
Pengujian garis regresi ada dua macam. Pertama pengujian secara menyeluruh lalu pengujian per variabel dan konstanta (intercept).
Nah untuk pengujian menyeluruh, kita melihat tabel Anova bukan tabel yang mencantumkan nilai p untuk tiap variabel. Dalam hal ini kita melihat nilai F nya apakah signifikan atau tidak.

Kemudian jika nilai F signifikan, dapat dilanjutkan dengan melihat nilai t untuk masing2 komponen: variabel dan konstanta. Nilai t yang signifikan untuk tiap variabel memberi informasi mengenai apakah nilai beta dari variabel tersebut sama dengan nol. Jika signifikan ini berarti di populasi, nilai beta tersebut tidak sama dengan nol. Dapat dikatakan juga bahwa variabel itu memberikan sumbangan yang signifikan terhadap variasi variabel dependen.

Nilai t untuk konstanta biasanya tidak terlalu penting untuk diinterpretasikan. Nilai ini memberikan informasi apakah kita dapat mengatakan bahwa jika seorang subjek memiliki nilai nol untuk semua variabel dalam model regresi, maka nilai orang tersebut pada variabel dependennya sebesar nilai konstanta. Jika nilai t untuk konstanta itu tidak signifikan, kita tidak memiliki cukup bukti untuk mengatakan hal tersebut. Karena di populasi nilai konstantanya sama dengan nol.

OK, Andreas semoga bisa membantu ya.

andreas mengatakan...

saya masih belum mengerti pak, begini pak agung, penelitian saya tentang kemampuan prediksi laba terhadap arus kas masa depan(regresi sederhana). saya cuman mau melihat apakah laba memiliki pengaruh terhadap arus kas tapi ga berdasarkan uji-t, saya hanya menggunakan p-value < 0.05 pada tabel koefisien sebagai kriteria pengambilan keputusan saja.
saya bingung, nilai p-value variabel laba 0.00, tapi konstantanya 0.315..pengambilan keputusannya gimana ya pak?

Agung Santoso mengatakan...

Wah maaf ya Andre kalo malah bikin tambah bingung.
Begini,karena yang mau andre lihat adalah 'pengaruh' variabel independennya, maka yang dilihat ya p untuk variabel independennya. Dalam hal ini karena p nya lebih besar dari .05 maka bisa dibilang tidak ada 'pengaruh'.

Konstanta di tabel ini sama dengan intercept. Jadi ketika p nya signifikan, kita hanya bisa bilang interceptnya tidak sama dengan nol.

Ada sedikit catatan di sini: Saya selalu memberi tanda kutip pada pengaruh, karena sebenarnya andre tidak dapat mengatakan adanya pengaruh hanya mengandalkan hasil analisis regresi. Pernyataan mengenai pengaruh hanya dapat diberikan jika penelitian dilakukan melalui desain penelitian tertentu. Hasil analisis regresi hanya memberikan bukti mengenai terpenuhinya salah satu syarat dari pengaruh, yaitu korelasi. Syarat lain seperti variabel independen harus mendahului variabel dependen dan tidak adanya alternatif penjelasan lain yang memungkinkan tidak dapat dipenuhi hanya dengan melihat hasil analsis regresi. Jadi berhati-hatilah melakukan interpretasi hasilnya nanti.

andreas mengatakan...

makasi pak agung tentang masukannya..
sukses selalu ya pak..

Via mengatakan...

pak, saya mau tanya hasil uji normalitas yang saya lakukan dengan kolmogorov smirnov menghasilkan p = 0.001 bahkan ada yang 0.000...data yang saya gunakan adalah data keuangan...jadi bagaimana?

Agung Santoso mengatakan...

Hai Via,

Pertama ada baiknya Via melihat grafik q-q plotnya juga mengingat uji signifikasi sangat terkait dengan jumlah subjek. Berapa banyak jumlah kasus dalam penelitian Via?

Kedua mungkin ada baiknya Via coba membaca artikel di sini:
http://psikologistatistik.blogspot.com/2008/01/tiga-pertanyaan-mengenai-asumsi.html

Ketiga, jika ternyata memang meyakinkan bahwa distribusinya tidak normal, maka Via bisa melakukan beberapa usaha mengatasinya tergantung analisis utama yang akan dilakukan. Kalau Via menggunakan t-test, bisa dilihat di sini:
http://psikologistatistik.blogspot.com/2008/01/t-test-truly-final-encounter-asumsi.html

Sayangnya saya memang belum banyak membahas untuk pelanggaran asumsi normalitas pada teknik analisis lain.

atiek mengatakan...

mas agung, mo tanya. penelitian sy tentang efektifitas permainan tradisional dalam peningkatan kreativitas anak. sampel 30 dibagi 3kelompok, masing2 kelompok 10orang dan masing2 kelompok 1permainan. prosedur penelitiannya adlh pre-test,perlakuan,post-test1,post-test2(rentang wkt antara post-test1 ke post-test2 selama 1bulan).dosen sy menyuruh menggunakan nonparametrik.sy memakai wilcoxon uji dua sampel berpasangan, tul ga mas?ada spesifikasinya ga mas?dan diperoleh, pd permainan 1 yg tidak signifikan hanya antara pre-test ke postest1(yg lain signifikan), permainan ke2 yg tidak signifikan hanya antara pos-test1 ke post-test2, dan pd permainan ke3 yg tidak signifikan hanya antara post-test1 ke post-test2,mengapa bisa begitu ya mas?dan kalo begitu, permainan yg paling efektif dlm meningkatkan kreativitas anak yg mn ya mas? tolong dijawab ya mas.

Agung Santoso mengatakan...

Jika mau dibilang sebenarnya, ada tes yang lebih pas untuk menguji beberapa sample berpasangan yaitu Friedman. SPSS menyediakan metode lain seperti Cochran's Q dan Kendall's W.
Hanya saja memang untuk mencari perbandingan antar pasangan atiek tetap perlu menggunakan uji dua sampel berpasangan seperti wilcoxon. Jadi dalam hal ini tidak masalah sejauh atiek mengendalikan tipe eror I nya dengan mempertimbangkan banyaknya uji yang dilakukan. Misalnya karena tiap kelompok dilakukan paling tidak 3 kali uji, maka patokan signifikasinya perlu diperkecil. Bukan lagi 0.05 misalnya tapi 0.05/3.

Mengenai hasilnya mengapa bisa begitu, saya pikir atiek yang seharusnya lebih tahu. Misalnya secara teoretik permainan mana yang bisa memberikan dampak yang tahan lama, dst. Mungkinkah ada penurunan efek permainan seiring waktu? Apakah kreativitas memiliki sifat yang menetap atau berubah-ubah? dst... Ini tentunya ada di dasar teori yang diacu.

Mengenai mana yang paling efektif, sayang sekali atiek tidak memiliki kelompok kontrol ya. Sehingga kita nggak punya pembanding kelompok yang sama sekali tidak mendapat treatment (atau hanya mendapat placebo). Menurut saya ini kembali ke definisi 'efektif' menurut atiek dalam penelitian ini. Seperti apa treatment yang akan dianggap efektif? Apakah efektif berarti yang penting meningkat dalam waktu cepat, tidak peduli bertahan lama atau tidak (jika ini yang digunakan berarti permainan 2 dan 3 dapat dianggap efektif). Atau efektif berarti tidak meningkatkan kreativitas seketika, tetapi secara bertahap dan memiliki efek menetap (dalam hal ini maka permainan 1 akan dianggap efektif)? definisi ini yang akan menentukan mana dari ketiga treatmen yang dianggap efektif.

Anonim mengatakan...

ALuw mas..aku lg bingung neh.
mw tanya2 boleh kan? aku meneliti pola sebaran hama uret di lahan stroberi, kaitannya dengan hasil panen. nah, data aku ambil secara purposif. kalo data purposif apa bisa buat menentukan pola sebaran data ya mas??

Anonim mengatakan...

trus kan aku pake 2 lahan. jumlah sampel lahan pertama 38, sampel lahan ke-2 ada 90. nah yg bikin ruwet pada lahan pertama ada cuma ada 3 uret. truz lahan ke-2 ada 50 uret. ehm, analisisnya gmn ya mas? apa perlu aku uji normalitas data dulu?? thanx b4

Anonim mengatakan...

Pengambilan sampelnya tiap 2 minggu.
:-)data lahan pertama=
(jumlah tanaman yang dicabut;jumlah uret)
* 4 tanaman;0 uret
* 4 tnman;0 uret
* 6 tnman;2 uret
*8 tnman;1 uret
* 4;0
* 4;0
* 4;0
* 4;0

:-)data lahan kedua:
* 12;4
* 18;11
* 20;8
* 20;11
* 20;16

nah, krn pengambilan data secara purposif, ada yg 4 tnman, ada yg 6, 12, 20..tergantung dari ada tidaknya gejala serangan uret. yg mw aku tanyain analisis datanya ky apa ya mas??? thanx bgt.
kalo bisa tolong kirim ke emailku ya..
yudi_aladin@yahoo.co.id

skali lg thanx bgt ya mas

__niEcoHoLic__ mengatakan...

mas, kl sampel na lebih dari 120 nyari tabel durbin-watson gmn carana?
coz aq udah nyari rata2 tabelna cm smp 100.... misalkan 195 or 196... tknk ambl sampel dg purposive...
hatur nuhun...

__niEcoHoLic__ mengatakan...

mas, kl sampel na lebih dari 120 nyari tabel durbin-watson gmn carana?
coz aq udah nyari rata2 tabelna cm smp 100.... misalkan 195 or 196... tknk ambl sampel dg purposive...
hatur nuhun...

__niEcoHoLic__ mengatakan...

mas, mo tny kl nyari tabel durbin-watson dg jumlah sampel 196 gmn? coz rata2 tabel yg saya temukan cm smp 100... tknk ambil sampel na purposive
thx bantuana...

Agung Santoso mengatakan...

Halo niecoholic,

kamu bisa ngecek di web ini. Sepertinya mereka menyajikan tabel critical value agak banyak :

http://www.stanford.edu/~clint/bench/dwcrit.htm

__niEcoHoLic__ mengatakan...

mo tny lagi hehehe...
aq udah beberapa x nguji normalitas tp ga normal-normal neh...
jumlah variabel independen 5 (QR,TAT, DER, ROA, PER)terhadap harga saham, sampel na 42 periode penelitian 3 thn...
udah nyoba skewness, komolgrov..
yg belum tuh wilcoxon, coz ga ngerti...
sekarang aq pk qq normal plot tp ad 3 titik scaterplot yg extreme jauh dari garis normal..
sebenarnya apakah dalam penelitian harus normal..???
truz kalo hrz transform data carana gmn...???
ma kasih....
ma kasih juga info tabel na kemarin...

__niEcoHoLic__ mengatakan...

o iya...
pengujian yg saya pakai adalah regresi berganda...

Agung Santoso mengatakan...

Halo niEcoHolic

Kenormalan data memang salah satu syarat dari Regresi. Namun demikian ada beberapa orang yang menganggap kenoramalan data ini bukan asumsi yang paling penting. Terlebih lagi karena sifat dari uji F yang robust. Tapi menurut saya ada baiknya untuk tetap dicek pemenuhannya.

Namun demikian ada satu gejala yang menurut saya penting untuk dicermati, yaitu outlier atau titik ekstrim yang niEcoHolic bilang. Titik ini perlu dicermati lebih lanjut dalam arti melihat dampaknya terhadap hasil regresi.

Mengenai transformasi data, SPSS menyediakan fasilitas Transform-Compute. Lalu tinggal dimasukkan operasi hitung apa yang akan digunakan untuk mentransformasi.

Anonim mengatakan...

Mas, mw nanya, penelitian sy membandingkan 2 perlakuan, di kelas eksperimen dan kontrol, nah udah uji normalitas salah satunya ada yg ga normal dan kmudian sy pake uji wilcoxon, yg bikin saya bingung, pas nginput d kotak uji wilcoxon, kan diminta 2 variabel? Nah variabel 1 dan 2 nya itu pretest dg pretest antara 2 kelompok tsb, atau pre test dgn post tes di masing2 kelompok? Mhn dijawab trm kasih

Agung Santoso mengatakan...

Begini, saya agak kesulitan menjawabnya karena saya tidak tahu apa yang akan dianalisis. Wilcoxon biasanya dilakukan sebagai pengganti t-test paired sample. Dalam hal ini berarti kita hendak menguji perbedaan mean dari satu kelompok sebelum dan setelah perlakuan.

Dalam kasus di atas, ini berarti yang perlu dimasukkan adalah pretest dari kelompok eksperimen dan posttest dari kelompok eksperimen. Analisis ini dilakukan untuk mengecek apakah ada pengaruh pemberian treatement pada kelompok eksperimen.

Analisis lain yang dapat dilakukan adalah menguji pretest kelompok kontrol dan posttest kelompok kontrol untuk melihat adakah efek belajar atau maturasi.

Anonim mengatakan...

mas mau tanya. kalau mau uji normalitas data skor tes apa ada sampel minimalnya. maksudnya kalau SAMPELNYA kecil (kelas A=20 dan kelas B=20), apa langsung diasumsikan tidak normal? atau harus di uji dulu

Eileen mengatakan...

terima kasih buat artikelnya..
Saya ingin bertanya pada mas. Saya mengalami kebingungan untuk uji normalitas ini. Saya melakukan uji paired sample t test, dan asumsi datanya mesti normal. Yang saya bigung adalah datanya ada 2, sebelum dan sesudah treatment. Apakah untuk uji normalitas data tersebut diuji masing-masing atau digabung?
Terima kasih dan saya tunggu jawabannya..

Agung Santoso mengatakan...

Untuk anonim,
Hmm.. menurut saya ada baiknya diuji normalitas terlebih dulu. Namun demikian jumlah sampel yang kecil memang beresiko untuk membuat analisis menjadi tidak akurat sekalipun berasal dari populasi yang normal. Oleh karena itu saya menyarankan menggunakan analisis non parametrik untuk perbandingan.

Untuk Eileen,
Jawabannya memang baik sebelum maupun sesudah treatemen harus dicek normalitasnya.

OK, terima kasih atas komentarnya ya.

meyfie mengatakan...

mo nanya niy, untuk uji normalitas klu sampel kecil dan data ordinal kira2 pake uji apa?

Agung Santoso mengatakan...

untuk Meyfie,
Kalau setahu saya sih, jika datanya ordinal biasanya tidak diuji normalitasnya. Karena normalitas sebaran itu berasumsi datanya interval.

Lia mengatakan...

Jk data tdk normal, pd poin ke-2 disebutkan agar membt grafik. Lantas bagaimanakah cr membt grafik tsb?
Terimakasih.

Agung Santoso mengatakan...

Untuk Lia,
Lia bisa melihat postingan lain dalam blog ini. Misalnya di sini:
http://psikologistatistik.blogspot.com/2007/09/uji-asumsi-1-uji-normalitas-dalam-spss.html

yuli mengatakan...

mksh .. jd nambah pngetahuan nieh.kbtulan sy d suruh bca ttg uji normalitas m dosen,,,

cheryl mengatakan...

mau nanya mas.. kalo data tidak normal dan tidak dibuang outliernya. apa tetap bisa menggunakan parametrik..
karena data tersebut sayang kalau dibuang..itu khan hasil sebenarnya yang kita dapat di lapangan..
terima kasih sebelumnya

Anonim mengatakan...

maaf mas agung , saya mau tanya nih. penjelasan diatas bermanfaat bgt buat sumber referensi skripsi saya . kalau boleh tau mas agung dapet referensi drmn yaa ? buku atau apa gt ? soalnya sama dosbing saya gaboleh sumber referensi dari internet .

makasii banyak mas agung :)

Agung Santoso mengatakan...

Untuk Yuli,
terima kasih feedbacknya. semoga berguna untuk yang lain juga.

Untuk Cheryl,
Kalau outlier merupakan data yang sebenarnya, menurut saya data itu justru tidak boleh dibuang. Tapi ada baiknya untuk melakukan analisis 2 kali. Satu dengan outlier, satu tanpa outlier. Lalu hasil analisisnya dibandingkan. Apakah ada perbedaan yang cukup besar dari keduanya. Jika tidak maka keberadaan outlier tidak masalah. Tapi kalau cukup besar, maka interpretasi hasil harus dilakukan hati-hati. Karena hasil analisis bisa tidak berlaku untuk seluruh kondisi data atau hanya berlaku untuk sebagian kecil data.

Agung Santoso mengatakan...

Untuk yang menanyakan referensi,

sebenarnya agak susah menjawabnya karena tulisan ini saya tulis dari hasil pemahaman saya akan banyak bacaan dan kuliah. Buku-buku yang pernah saya baca misalnya Statistical Methods for Psychology dari David C Howell, juga dari buku-bukunya Pedhazur, dkk.

Sebenarnya blog ini sudah dibukukan. Nah apakah blog yang dibukukan diijinkan untuk dikutip juga? (Wah malah promosi nih).

Anonim mengatakan...

pak agung saya mau tanya
judul skripsi saya 'pengaruh kualitas aktiva produktif terhadap rentabilitas'
kalau data yang saya gunakan adalah laporan keuangan sebuah bank selama 10tahun dan saya menggunakan analisis regresi sederhana, apakah perlu dilakukan uji normalitas?

Agung Santoso mengatakan...

Saya pikir pengecekan asumsi tetap perlu dilakukan dalam penelitian manapun. Informasi mengenai pengecekan asumsi ini akan berguna untuk menilai seberapa akurat hasil analisis yang dijalankan. Sehingga memberi informasi seberapa besar kepercayaan terhadap hasil analisis ini.

Anonim mengatakan...

wah.terima kasih banyak atas sharing ilmu dan penjelasnnya Pak

Quraish mengatakan...

Permisi Pak...
Saya Mau Bertanya Masalah Uji Normalitas Data.

Berikut ini adalah contoh data yang ingin saya olah :
254 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255

Dari data tersebut sekilah kalau diperhatikan berbentuk / rata-rata konstan.
Kemudian saya lakukan uji normalitas dengan menggunakan software SPSS v17 (Shapiro Wilk, karena data <50).

Dari hasil analisi significantnya sebesar 0.000. (<0.05-> Tidak Normal, Lakukan Uji Non-Parametrik Test)

Yang ingin saya tanyakan, apakah dari data yang konstan tersebut apakah memerlukan uji normalitas untuk melakukan pengolahan uji ANOVA, karena data yang bersifat konstan sehingga tidak harus dilakukan uji normalitas.

Mohon sarannya, baik dari sumber dan informasinya...

Terima Kasih Banyak...

hau ria mengatakan...

Mau nanya mas.. Boleh tidak hasil regresi linear nilai constant nya minus? Penelitian saya -16.143, artinya apa ya mas? Terimakasih

Agung Santoso mengatakan...

Pengecekan asumsi normalitas data tidak terkait dengan ke-konstan-an data. Tentu saja kalau data konstan sudah bisa dipastikan kalau asumsi normalitas dilanggar.

Selain itu dalam studi sosial, data yang sangat konstan seperti ini menimbulkan kecurigaan karena sangat jarang menemukan data yang sangat konstan. Jadi mungkin perlu dicek lagi skoring instrumennya.
(Kalau boleh tahu skala apa yang digunakan?).

Semoga bisa membantu.

Agung Santoso mengatakan...

Untuk hau ria,

Secara matematis intercept sangat memungkinkan memiliki nilai negatif. Karena secara matematis intercept adalah titik potong antara sumbu y dan garis regresi. (Atau definisi resminya: nilai y ketika semua x dalam regresi adalah 0).

Nah, hanya saja dalam prakteknya seringkali nilai intercept negatif menjadi janggal. Misal kalau meregresi prestasi akademik dengan IQ. Lalu ditemukan intercept negatif, masa prestasi akademik bisa negatif?

Masalahnya, nilai IQ = 0 juga nyaris tidak ada secara riil. Jadi secara matematis dan teoretis tidak masalah sejauh interpretasinya tidak sampai ke area 'non-riil' ini. Beberapa peneliti melakukan centering atau mengurangi semua nilai IQ dengan mean IQ dari data penelitian ini. Ini akan membuat nilai Intercept memiliki makna yang lebih masuk akal.

Lebih jauh, aplikasi garis regresi juga tidak dilakukan di luar angka yang ada dalam penelitian. Maksudnya, jika data IQ hanya berkisar dari 90 - 120, maka sangat riskan untuk menerapkan garis regresi pada nilai di luar range IQ itu. Ini yang dimaksud dengan ekstrapolasi.

gangsar cahyono mengatakan...

Met siang,mas. Q ada problem soal uji asumsi klasik. Pertama hasil uji tdk normal. Kedua pdhal data n=100, kedua dlm K-S asym.sigx 0.000 wah kaget jg neh. Trus gmn mas cara membuat nilai tgah utk dimasukkan dlm tabel regresi dgn data interval sbb :
a. kurang dari rp. 2.000.000
B. 2000.001 -3000.000
c. 3000.001 - 4000.000
d. 4000.001 - 5000.000
e. lebih dari 5000.000
Tks mas sy tggu jwabanx...salam kenal

gangsar cahyono mengatakan...

Bgmn cr memsukan nilai tgh utk dt interval sbb.
a. Kurang dr 2000.000
b. 2000.001 - 3000.000
c. 3000.001 - 4000.000
d. 4000.001 - 5000.000
e. Lebih dr 5000.000
Trus kenapa dl uji KS nilai asym q koq 0.000 waduuhh..tolong dong mas...tks atas batuannya.