Iklan 1

Sabtu, Desember 22, 2007

t-test : The Beginning

Setelah lelah bercerpen ria. Sekarang saya mau istirahat dulu dari menulis cerpen, dan menyajikan materi seperti biasa yang saya sukai, bertutur. Kali ini saya ingin menunjukkan keterkaitan antara Z score dengan Uji-t yang manapun. Dengan melakukan ini saya berharap kita tidak lagi harus menghafal rumus mati-matian atau bolak-balik catetan kalo ujian. Dengan pemahaman ini, saya berharap kita cukup mengingat satu rumus saja dan prinsip dasar serta logikanya sehingga ketika berhadapan dengan tiap situasi, kita bisa menerapkan variasi dari rumus tersebut.

Z score
Sebenarnya ide awal pengujian statistik khususnya t-test berasal dari Z-score… Ya, ya saya bisa dengar suara di ujung sana bertanya,”Ehm ehm maaf, Pak, Z-score itu apa ya?”. Tenang saja, itu makanya saya kasih judul sub bab ini seperti itu karena ini yang mau saya bahas pertama kali (ribet banget nggak sih ngomongnya?).

Z-score adalah skor standard berupa jarak skor seseorang dari mean kelompoknya dalam satuan Standard Deviasi. Z-score memiliki banyak sekali kegunaan, misalnya membandingkan posisi seseorang dengan orang lain dalam kelompok masing-masing. Budi, mendapat nilai 7 sementara Andi 9. Budi berargumen bahwa guru kelasnya itu pelit nilai sementara guru kelas Andi itu baik hati. Nah untuk membuktikan apakah memang Budi mendapat nilai yang sama atau lebih baik dari Andi, kita menggunakan Z-score. Pemikirannya begini, karena semua anak di kelas Andi atau Budi mendapat perlakuan yang sama (tentu saja dengan asumsi tidak ada anak emas, anak perak, dll), kita tinggal membandingkan posisi Budi dan Andi dalam kelas mereka masing-masing. Jika posisi Budi lebih tinggi daripada Andi dalam kelas mereka, kita bisa bilang Budi sebenarnya memiliki nilai lebih baik dari Andi.

Rumus? Mari kita baca definisi Z-score sekali lagi: jarak skor seseorang dari mean kelompoknya ini berarti:



dalam satuan Standard Deviasi, ini berarti jarak tadi dibagi Standard Deviasi. Rumusnya jadi begini:



Kegunaan lain dari Z-score adalah kita bisa menghitung persentase orang-orang yang berada di atas atau di bawah skor tertentu. Nah, biasanya diasumsikan sebaran data yang diacu itu normal. Lagi-lagi saya mendengar suara nun jauh di,”Mengapa?”. Karena bentuk ini yang paling mudah dijadikan acuan. Sebenarnya bentuk lain juga bisa dihitung persentasenya, hanya saja akan sangat banyak variasinya sehingga kita harus menghitung kasus per kasus. Ini akan menyulitkan pembuatan formula yang dapat berlaku umum. Oleh karena itu sebaran data yang normal ini yang dijadikan acuan.

Gambarannya seperti ini:

Dalam gambar ini bisa dikatakan area berwarna biru adalah persentase banyaknya orang-orang yang skornya lebih besar dari -2 SD. Sementara area yang berwarna hijau menggambarkan persentase orang-orang yang skornya lebih kecil dari -2SD atau bisa dibilang juga lebih ekstrim. Nah untuk mendapat angka persisnya bisa kita lihat di tabel. Caranya? Lihat posting sebelumnya mengenai Confidential Interval ya.

Contoh? Oke oke… Misalnya contoh yang kita lihat tadi. Benarkah Andi memiliki kemampuan lebih dibanding Budi? Kita tahu bahwa skor Andi itu 9 sementara Budi itu 7. Nah misalnya saja di kelas Andi rata-rata murid mendapat skor 8, sementara Budi 5. Standard Deviasi di kelas Andi dan Budi misalnya sama-sama 1. Dan kita anggap saja kedua kelas memiliki sebaran data yang normal. Nah mari kita terapkan data ini:

OK, dari perhitungan terlihat bahwa ternyata Andi hanya berada dalam jarak 1 SD dari mean kelompoknya, sementara Budi 2 SD lebih tinggi dari mean kelompok. Dari sini sudah terlihat bahwa Budi sebenarnya memiliki skor yang lebih tinggi. Ini makin terlihat jika kita membandingkan persentase orang-orang yang berada di bawah skor mereka. Andi berada di atas 84.13% murid-murid lain di kelasnya, sementara 97.72% murid-murid di kelas Budi berada di bawah nilai Budi. Ini berarti Budi termasuk murid pintar di kelasnya, karena hanya ada 2.28% (100%-97.72%) murid di kelas Budi yang memperoleh nilai sama seperti Budi atau lebih tinggi.

Kita juga bisa berkata bahwa Budi dan 2.28% murid di kelasnya termasuk murid langka, jarang atau sulit ditemui (kayak pejabat aja ya sulit ditemui). Dengan kata lain, jika kita masuk ke kelas dan memilih secara random, kecil kemungkinan kita akan memilih Budi dan 2.28% temannya. Ini yang kemudian akan jadi dasar penentuan uji hipotesis menggunakan signifikasi.

Central Limit Theorem

Nah ide ini kemudian juga digunakan untuk mencari berapa besar probabilitas kita memilih secara random sebuah kelompok dengan mean tertentu dari populasi dengan mean tertentu. Duh bingungin ya. Misalnya begini: berapa besar probabilitas memperoleh sekelompok mahasiswa dengan rata-rata IP di atas 3.5 dari populasi mahasiswa yang rata-rata IP-nya 2.5 secara random?

Jika kita menganggap rerata sampel sebagai unit analisis seperti Budi dalam kasus di atas, kita bisa menerapkan ide yang sama dengan Z score tadi, lihat gambar berikut:

Lingkaran besar ini menggambarkan kelas Budi dalam kasus di atas. Lingkaran kecil di dalamnya menggambarkan tiap siswa di kelas tersebut termasuk Budi. Anggap saja lingkaran kecil tersebut banyak.

Dalam kasus tersebut Budi dan siswa di kelasnya menjadi unit analisis. Tiap siswa merupakan satu unit analisis. Jika kelas Budi berisi 40 siswa, maka ada 40 unit analisis atau kita sering menyebut dengan n = 40. Kita menghitung mean kelas, SD kelas dari unit-unit analisis ini.

Sekarang kita bandingkan seandainya sampel yang menjadi unit analisisnya.


Nah dalam kasus mahasiswa gambarnya kurang lebih seperti ini. Sama? Ya tentu saja karena saya hanya copy paste hehe… Tapi memang idenya sama. Sekarang, lingkaran besar merupakan populasi, dan lingkaran kecil adalah sampel mahasiswa termasuk sampel yang memiliki rerata 3.5.

Jika kita ingin tahu berapa persen sampel mahasiswa yang reratanya 3.5, kita dapat menggunakan ide yang sama dengan kasus Budi tadi. Benarkah? Baiklah kita coba terapkan rumus Z di atas.


Hm…sepertinya ada yang salah? Ya berapa SD-nya saudara-saudara? Perhitungan di sini sebenarnya sama dengan perhitungan SD dalam kasus Budi. Perbedaannya, dalam kasus Budi kita menghitung SD dari distribusi skor individu, sementara dalam kasus ini kita menghitung SD dari distribusi mean sampel atau mean dari sekelompok individu. Lihat ilustrasi berikut:
Rumusnya? Plêk padha (persis sama dalam bahasa Tegal). Lihat perbandingan berikut ini:

Sama kan?
Hanya saja masalahnya, kita bisa menarik sampel hingga jumlah yang tak terbatas berkali-kali (k=tak terhingga), sehingga menghitung SD dari distribusi mean sampel hampir merupakan pekerjaan mustahil buat kita. Selain itu cara ini mengharuskan kita mengambil sampel sangat banyak dan menghitung meannya padahal ketertarikan kita hanya pada satu sampel dengan mean 3.5. Ini tentunya tidak efisien alias repot!

Untung saja ada Central Limit Theorem (CLT). Salah satu hal yang dinyatakan oleh CLT ini adalah SD dari distribusi mean sampel besarnya akan sama dengan hasil bagi antara SD populasi dengan akar dari besarnya sampel, atau begini:

Yang perlu diingat di sini, sX adalah SD dari populasi bukan SD dari sampel yang kita dapatkan. Tentu saja ini akan menimbulkan masalah baru, tapi untuk sementara anggap saja kita tahu besarnya SD dari populasi.

Jadi mari kita bereskan masalah tadi. Misalnya kita tahu bahwa besarnya sampel mahasiswa dengan rerata IP 3.5 yang kita miliki adalah 9 orang dan SD dari populasi adalah 1.8 Berapa persentase mendapatkan sampel dengan mean IP 3.5 atau lebih besar?

Ini berarti kemungkinan kita memperoleh sampel dengan mean sebesar 3.5 dalam populasi ini sebesar 4.78%. Besarkah atau kecilkah kemungkinannya? Itu tergantung penilaian masing-masing. Beberapa orang menggunakan patokan p lebih kecil dari 0.05 sementara yang lain menggunakan judgment, penilaian sendiri (thanks for Dr Huberty). Penilaian sendiri ini tentunya terkait dengan pertimbangan-pertimbangan tertentu seperti apakah ini penelitian awal atau lanjutan, temuan-temuan dalam penelitian sebelumnya, dsb.

Jadi aplikasinya begini: jika kita mengambil suatu sampel (sebesar 9 orang) secara random dari suatu populasi A, kemudian menghitung mean IP-nya dan mendapatkan angka 3.5, dapat kita simpulkan bahwa sampel kita ini kecil kemungkinannya (jika 4.78% dianggap kecil) berasal dari populasi dengan mean IP 2.5. Kemudian disimpulkan bahwa sampel ini bukan berasal dari populasi dengan IP 2.5. Ini yang kemudian diberi label signifikan: ada perbedaan signifikan antara mean populasi dengan mean sampel. Kesimpulan lanjutannya jadi seperti ini: karena sampel kita kecil kemungkinannya berasal dari populasi dengan mean IP 2.5, ini berarti populasi A (tempat sampel kita berasal) kecil kemungkinannya memiliki mean IP sebesar 2.5.

OK deh. Beres.

Ya ya ya saya tahu. Tadi saya bilang kalo menggunakan standard deviasi populasi (sX) akan menimbulkan masalah tersendiri. Masalahnya, kita seringkali (bahkan hampir selalu) nggak pernah tahu berapa besarnya standard deviasi di populasi. (Saya seakan bisa mendengar,”Hah?! Lalu?”) Ya ya saya bisa paham perasaanmu, seperti tertipu begitu? Tenang, penjelasan tadi memang perlu untuk memahami apa yang akan saya bahas berikutnya dan juga melihat kaitan keduanya.

Distribusi t

Karena kita nggak pernah bisa tahu standard deviasi populasi, kita perlu melakukan estimasi terhadap standard deviasi populasi ini. Estimasinya berasal dari… Yak betul! Dari standard deviasi sampelnya. Jadi kita akan mengganti sX dengan SDX. Di sini muncul masalah baru (duuh masalah mlulu kapan selesainya?). Ternyata dengan mengganti sX dengan SDX distribusi sebaran mean sampel jadi berubah. Bukan lagi mengikuti kurve normal, tetapi mengikuti distribusi baru. Aha! Tepat sekali! Distribusi baru ini adalah distribusi t (t kecil).

Distribusi ini ditemukan oleh seseorang bernama William Gosset dengan nama samaran ‘student’. Oleh karena itu statistik ini disebut ‘student t distribution’. Dia adalah salah satu staf di perkebunan anggur milik Guiness. Hmm… Siapa bilang statistik itu membosankan. Probabilitas ditemukan di meja judi, distribusi t ditemukan di tempat pembuatan bir, F test (yang akan kita pelajari berikutnya) berasal dari jamuan minum teh. Adakah yang lebih menyenangkan dari ini? (Thanks Jon, for the illustration).

Nah sekarang rumusnya akan berubah sedikit menjadi seperti ini:
Ya kita akan menggunakan istilah estimated karena standard deviasi dari distribusi mean sampel ini adalah hasil estimasi dari sampelnya.

ini sering juga disebut estimated standard error atau banyak yang menyebut hanya sebagai standard error. (Saya bisa mendengar beberapa berteriak,”Aha!” memperoleh pencerahan).

Teknik atau rumus ini kemudian disebut sebagai one sample-t test, atau t-test untuk satu sample, digunakan untuk menguji perbedaan antara mean satu sample dengan mean populasi atau suatu acuan lainnya.

Dengan demikian sekarang jadi jelas bukan kaitan antara Z dan t. Semua prosesnya kemudian menjadi sama dengan jika kita menggunakan Z. Perbedaannya terletak pada tabel acuan distribusinya. Jika menggunakan Z kita mengacu ke tabel distribusi normal, di sini kita akan menggunakan acuan tabel distribusi t. Selain itu distribusi t ternyata juga berbeda-beda untuk tiap derajat kebebasan/degrees of freedom (db / df). Jadi untuk tiap db akan ada distribusi t-nya sendiri sehingga sangat penting untuk mengetahui db ini. Makin besar dbnya, distribusi t ini akan menyerupai distribusi normal.

Derajat keBebasan?

Ya derajat kebebasan (db). Db ini bersumber dari pemikiran ini: tiap kali kita mengestimasi parameter (karakteristik populasi), kita akan kehilangan satu derajat kebebasan. Ilustrasinya begini: misalnya ada populasi dengan mean sebesar 10. Jika kita diijinkan untuk mengambil sampel sebesar 10 orang dari populasi ini, berapa banyak orang yang dapat kita ambil dengan bebas? Misalnya kita ambil orang pertama secara bebas, ia memiliki skor 14. Orang kedua masih dengan bebas, ia memiliki skor 8. Kemudian berturut-turut orang selanjutnya: 15, 6, 11, 14, 8, 6, 5 dan orang kesepuluh…. Tidak. Orang kesepuluh tidak dapat diambil secara bebas lagi. Jika sudah ada 9 angka, angka ke sepuluh tidak lagi dapat ditentukan dengan bebas agar mendapat estimasi yang sama (mean = 10). Misalnya jumlah skor-skor tadi adalah 87. Agar estimasi yang kita dapatkan sama, yaitu mean = 10, orang kesepuluh harus ditentukan sebesar 13. Dengan demikian dapat dikatakan kita kehilangan satu derajat kebebasan.Nah db inilah yang kemudian digunakan untuk melihat tabel t.

Dalam perhitungan kita tadi, kita hanya mengestimasi satu parameter yaitu sX, oleh karena itu kita hanya kehilangan satu derajat kebebasan, sehingga db yang kita miliki sekarang adalah N-1, yaitu 49-1 = 48.

Contoh

OK, contohnya begini. seorang peneliti sosial ingin mengetahui apakah desa A itu dapat digolongkan dalam desa miskin atau tidak. Peneliti kemudian mengambil data penghasilan penduduk dari sampel yang diambilnya secara random sejumlah 49 KK. Peneliti kemudian menghitung standard deviasi dan mean dari penghasilan 49 KK ini, ditemukan SX=140000, dan Mean penghasilan= 290000 rupiah perbulan. Misalnya batas kemiskinan itu adalah 250.000 rupiah perbulan. Jadi apakah desa A masih dapat digolongkan sebagai desa miskin? Mari kita buktikan:

Dari perhitungan di atas kita mendapatkan p(t(48))=2.55% (baca: probabilitas munculnya t dengan df=48 sama atau lebih besar dari 2 adalah 2.55%). Karena angka sebesar 2.55% itu termasuk kecil (menurut saya) saya bisa berkata bahwa desa A sudah tidak dapat dianggap sebagai desa miskin lagi, tapi sudah di atas peringkat desa miskin. Berapa peringkat di atasnya? Itu tidak dapat dijawab dalam penelitian lagi, diperlukan penelitian lagi dengan acuan yang berbeda.

Nah sekarang baru beres? Belum. Pertanyaan selanjutnya: bagaimana jika yang saya inginkan adalah membandingkan mean dari dua sampel, mean tiga sampel, mean dari sampel-sampel yang berkaitan? Jika demikian tunggu posting berikutnya ya.

39 komentar:

irhan mengatakan...

Terimakasih atas artikel yang penuh manfaat ini, sekaligus saya mohon ijin untuk copy-paste sebagai bahan belajar.

Agung Santoso mengatakan...

Boleh sekali jika untuk belajar. Kalau saya boleh tahu juga, Irhan ini berasal dari mana ya (asal institusinya)?

endang mengatakan...

maaf pak, saya mau tanya tapi saya tidak menemukan forum tanya jawabnya.. lewat ini boleh kan?
begini, penelitian saya tentang pengajaran. selain menggunakan test instrument, saya juga mengambil data dari nilai rapor siswa. sayang, nilai rapornya berbentuk deskripsi. contohnya nilai berbentuk A, B dan C. agar bisa dianalisa dengan uji t, maka niali tersebut harus di ubah menjadi angka. Nah, bagaimana cara meng-angka-kan data yang berbentuk deskripsi? terus alasanya kenapa?
mohon di jawab. karena jawaban anda sangat berguna bagi saya
terimakasih

Agung Santoso mengatakan...

Halo Endang,

Salah satu asumsi dari t-test adalah variabel dependen yang dianalisis berupa data interval atau rasio. Nah karena nilai raport yang diberikan tidak berupa data interval, maka sepertinya t-test tidak dapat digunakan untuk menganalisis.

Pertanyaan saya begini: bagaimana nilai A, B, C, ini diperoleh siswa? Jika yang dimaksud endang adalah deskriptif dalam arti naratif, maka sepertinya analisis kuantitatif agak sulit untuk diterapkan dalam kasus ini.

Atau mungkin Endang bisa memberi informasi lebih detil lagi?

ayu mengatakan...

saya mau tanya pak...
bisakah z score atau t-test dipergunakan untuk uji visibilitas pada instrument penelitian?
saya menggunakan model likert.
terima kasih sebelumnya.

Agung Santoso mengatakan...

Hai ayu,

Saya belum pernah mendengar tentang uji visibilitas pada instrumen penelitian. Mungkin ayu bisa menjelaskan lebih detil apa yang dimaksud visibilitas?

ayu mengatakan...

saya sendiri jg masih bingung pak... hehehe..
saya sebenarnya cuma pengen menghitung distribusi jawaban pada klasifikasi nilai pada instrumen likert saya, dengan menggunakan z score. Bisa kan pak??

Agung Santoso mengatakan...

Apa yang dimaksud oleh ayu itu validitas?

Tujuan menghitung distribusi itu sendiri untuk apa? Kalau boleh tahu skala yang digunakan ayu itu apa ya?

Sejauh yang saya tahu jika item-item skala mengungkap satu konstruk (variabel), kita bisa menjumlahkan skor subjek dari tiap item berdasarkan respon subjek. Misalnya jika subjek menjawab sangat setuju pada item favorabel, Ia akan memperoleh skor 5, dst. Lalu skor tiap item dijumlahkan untuk tiap subjek menjadi skor subjek untuk skala tersebut.

ayu mengatakan...

instrument tsb akan saya pakai untuk tesis pak...

sedangkan distribusinya,saya ingin memakainya untuk uji normalitas ...

Agung Santoso mengatakan...

maksud saya begini: skala itu mengukur apa ya ayu?

untuk uji normalitas, bukankah seharusnya uji normalitas dilakukan pada skor total subjek bukan skor subjek di satu item.

Bisakah ayu memberikan rincian lebih detil mengenai penelitian yang sedang dilakukan. Karena untuk bisa menjawab pertanyaan ayu lebih baik saya membutuhkan informasi lebih banyak.

Kalau ayu mau, bisa kirim email ke alamat email saya : agungsan@yahoo.com

Anonim mengatakan...

pak saya wiwid 03. saya mau bertanya :saya meneliti tentang perbedaan kepuasaan kerja antara karyawan tetap dan karyawan kontrak. hipotesis keseluruhan yang saya dapat bahwa ada perbedaan kepuasan kerja dengan besar signfikansi 0,039. namun hipotesis yang saya dapat dari tiap aspek kepuasan kerja yang saya teliti (4 aspek) hanya satu yang signifikan dengan nilai 0,014 dan tiga lainnya memperoleh nilai sig di atas 0,05. saya bingung pak, bagaimana penjelasannya??? terimakasih

Agung Santoso mengatakan...

Menurut saya mungkin saja terjadi. Pertama karena anava sendiri merupakan omnibus test, jadi menguji hipotesis yang bersifat global. Jika satu saja perbedaan signifikan maka uji F akan memberi tanda signifikan pada hasil analisisnya.

Kedua, sebenarnya melakukan uji signifikasi pada aspek-aspek itu seperti menguji variabel tersendiri. Jadi bagaimana aspek-aspek itu berhubungan dengan variabel independen itu yang menentukan apakah uji beda nya signifikan atau tidak.
Jadi skor total dari aspek-aspek tentunya punya hubungan yang berbeda dengan variabel independen. Sehingga uji bedanya juga bisa menghasilkan nilai p yang berbeda juga.

Anonim mengatakan...

Pak, saya sedang kesulitan dalam menentukan cara pengolahan data penelitian saya. Saya mengukur motivasi dengan skala likert, hasilnya akan menunjukkan tipe motivasi apakah yang dimiliki seseorang tertentu.. bagaimana cara menghitungnya dengan z-score?
-vie-

Agung Santoso mengatakan...

Halo vie,

Aduh maaf nih, saya masih belum terlalu jelas mengenai pertanyaan vie. Apakah maksudnya bagaimana mengubah dari skor total menjadi z score?
Bisakah diperjelas?

Lucifer mengatakan...

saya fendi pak, skripsi saya mengenai psikologi, yang mau saya tanyakan pake uji statistik apa ya pak kalau saya mau menguji perbedaan x terhadap y. thanks pak.

Lucifer mengatakan...

saya fendi pak, skripsi saya mengenai psikologi, yang mau saya tanyakan pake uji statistik apa ya pak kalau saya mau menguji perbedaan x terhadap y. thanks pak.

Agung Santoso mengatakan...

Halo Fendi,

Hmm... saya agak kurang jelas maksud pertanyaanmu. Bisakah kamu menyebutkan variabelnya?

Apakah yang kamu maksud perbedaan mean variabel y antara kelompok x1 dan kelompok x2?
Jika memang kamu mau mencari perbedaan seperti ini maka kamu dapat menggunakan t-test seperti yang saya tulis di artikel ini.

chatarina mengatakan...

saya chatarina.
terimakasih utk artikelnya pak...
skrg saya br membuat skripsi dg judul efektivitas penggunaan modul. dengan metode eksperimen (control group pre-test – post test). saat sy mengajukan proposal saya menggunakan teknik analisis data dg t-test tetapi sy disarankan dsn pembimb untuk menggunakan z-score. tp saya masih agak bingung dengan z score.sy minta bantuan bpk untuk memberi masukan utk skripsi sy ini terima kasih.

Agung Santoso mengatakan...

Hai catharina,
Terima kasih sudah bertanya ya. Sebelumnya saya ingin tahu apa alasan dosen Catharina menyarankan penggunaan Z-score.

Seperti yang saya tulis di postingan, sebenarnya t-test itu mirip sekali dengan z-score. Hanya saja, t-test digunakan ketika varians populasi tidak diketahui, sementara z-score digunakan ketika varians populasi diketahui.

Nah dalam penelitian Catharina, mungkinkah untuk mengetahui varians populasi? jika bisa, dapat digunakan z-score sementara jika tidak, mungkin t-test merupakan analisis yang lebih tepat.

chatarina mengatakan...

alasan pastinya harus menggunakan z score saya belum menanyakan secara rinci. tapi saat beliau meminta saya mengganti t-test dengan z score, beliau hanya menyampaikan penelitian ini pasnya dengan z score. sedangkan konsep yang saya dapat dari beberapa literatur mengatakan bahwa penelitian eksperimen seperti yang saya buat menggunakan t-test. kemarin saya mengirim email ke bapak, tentang teknik analisis data saya. mungkin dari situ bapak bisa mengoreksi hasil dari pekerjaan saya. terimakasih.

Anonim mengatakan...

apa yang saya cari, terima kasih

Amrina mengatakan...

saya mau tanya,skripsi saya tentang penentuan pasar relevan minimarket intinya ingin mengetahui sapa aja pesaing minimarket mis A,dan disini ada 5 minimarket tapi belum tentu ke5nya adlh pesaingnya.itu bisa dilihat dari karakteristik produk(ada 6 atribut)&karakteristik ritel(ada 8atribut)smua berbentuk skala likert dengan jumlah sampel 100/minimarket jadi total 500sampel.pengolahannya dgn MDS yg perceptual mapnya 2 dimensi yaitu krakteristik produk&ritel jadi tidak dilihat tiap atribut tapi 2dimensi itu. krena data yg sangat banyak jadi tidak bisa diolah ke MDS.ada yg menyarankan dengan mentransformassikan ke Zscore dulu dengan menjumlah skala likert k2 dimensi itu lalu di Zscore kan kemudian ke5 minimarket itu di cross kan(diversuskan untuk input MDS).
saya kurang mengerti knp hrs di Zscore kan dulu?apa hubungannya Zscore dgn MDS?apakah ada dasar teorinya?
mhon bantuannya&dibalas segera..trima kasih

Agung Santoso mengatakan...

Untuk Amrina,

Sebelumnya minta maaf sekali kalau saya belum bisa menjawab pertanyaan Amrina, karena saya belum mempelajari MDS secara khusus. Sehingga belum mengetahui secara detil proses melakukan analisisnya.

Semoga lain kali saya sudah mempelajarinya sehingga bisa menjawab pertanyaan ini.
Salam,

Anonim mengatakan...

Mas Agung Santoso, saya mau tanya klo judul "perbedaan prasangka petugas keamanan di mal dan hotel terhadap penampilan pengunjung dalam penerapan SOP keamanan" seperti ini lebih baiknya menggunakan t-test apa ya? trus apakah judul ini tepat menggunakan t-test atau tidak?


Terima Kasih...

Agung Santoso mengatakan...

Untuk Anonim,
dari judul penelitian yang diberikan, saya asumsikan petugas hotel dan mal adalah orang yang berbeda. Oleh karena itu akan lebih tepat jika anda menggunakan uji beda sampel yang independen, seperti uji t independent sample.

Anonim mengatakan...

pak saya karin, saya mau bertanya kalau judul skripsi saya penyesuaian sosial penghuni pada asrama baiknya menggunakan z score atau apa ya..? saya belum paham betul.. sejauh ini dimetodologi penelitian saya menggunakan kategorisasi saja untuk menghitung seberapa berhasilnya pengesuaian sosial pada penghuni asrama.. sebelumnya terima kasih banyak pak..

Agung Santoso mengatakan...

Terima kasih untuk pertanyaan Karin. Mohon maaf nih lama menjawabnya.

Sebelum saya bisa menjawab pertanyaan Karin, ada pertanyaan yang perlu dijawab: Apa tujuan penelitian ini dan apa saja yang ingin diungkap dalam penelitian ini?

Ini yang akan menentukan apakah diperlukan statistik ini atau itu atau apakah cukup dengan kategorisasi saja.

Analisis statistik yang dibutuhkan tidak harus suatu uji inferensial. Jika tujuan penelitian hanya mengharapkan deskripsi suatu sampel, maka statistik deskriptif saja sudah cukup memadai.

Anonim mengatakan...

maaf Pak saya mau bertanya,, metode statistik apa yang cocok dengan skripsi saya? judul skripsi saya adalah : Perbedaan Attachment pada anak yang memiliki ibu bekerja dan ibu tidak bekerja. tujuan penelitian saya adalah untuk membandingkan attachment antara anak yang memiliki ibu bekerja dengan anak yang memiliki ibu tidak bekerja.
terimakasih :)

Agung Santoso mengatakan...

Hmm...
Mungkin ada baiknya anda membaca lagi blog ini, kemudian melihat mana di antara analisis-analisis yang ada yang paling tepat diaplikasikan dalam penelitian anda.
Sepertinya saya sudah memberikan cukup banyak contoh sehingga anda dapat membacanya sendiri.

Hesti Jayasti mengatakan...

Salam kenal pak Agung, saya Hesty
saya mau bertanya pak,apabila saya memiliki satu yaitu variabel x dan 2 kelompok untuk sampelnya dalam penelitian saya kemudian saya bandingkan 2 kelompok tersebut apakah saya dapat menggunakan uji t?
Menurut bapak bagaimana?

Agung Santoso mengatakan...

Hesti, terima kasih pertanyaannya ya. Menurut saya, jawabannya tergantung beberapa hal:
1. Pertanyaan penelitian dan hipotesisnya seperti apa.
2. Apakah variabel dependennya kontinum
3. Apakah yang mau dibandingkan adalah mean?
4. Apakah asumsi-asumsi seperti distribusi normal dan homogenitas varian terpenuhi oleh datamu.

Kurang lebih itu beberapa pertanyaan yang perlu dijawab oleh Hesti. Sebelum pertanyaan itu dijawab, belum bisa dipastikan apakah memang bisa menggunakan uji t atau tidak.

Semoga cukup jelas ya.

Hesti Jayasti mengatakan...

sebenarnya saya bingung harus pakai analisis apa pak? kalau judul saya "perbandingan motivasi melakukan fitness pada pria dan wanita dewasa awal di pusat kebugaran" menurut bapak saya seharusnya menggunakan alat analisis apa?
Terima kasih pak

Agung Santoso mengatakan...

Hesti, menurut saya mungkin Hesti perlu menjawab dulu empat pertanyaan saya, supaya saya jangan sampai salah memberi saran.
Teknik analisis apa yang akan dipakai sangat tergantung pada hipotesis yang diajukan, jenis data yang terlibat dalam analisis, dll. Termasuk apa yang akan dijadikan 'tanda' bahwa ada perbedaan motivasi? Apakah perbedaan mean cukup memberikan gambaran itu?

Saya juga berharap Hesti menjawab pertanyaan saya untuk tujuan pendidikan, supaya Hesti tahu mengapa menggunakan analisis ini atau itu. Tidak semata-mata karena ada yang bilang begini atau begitu.

Hesti Jayasti mengatakan...

pak, kalau seumpama saya konsultasinya lewat email bapak aja bagaimana pak?

Hesti Jayasti mengatakan...

terima kasih pak, sudah saya kirm lewat email. Mohon bantuannya ya pak

risda wati mengatakan...

saya senang baca artikel d blog bapa, sangat membantu sekali..saya minta bantuan bisakah bapa enjelaskan mengenai uji welch, atas bantuanya sy ucpkan makasih

Agung Santoso mengatakan...

Hai Risda,

Terima kasih untuk komentar dan pertanyaannya. Senang sekali kalau tulisan saya bisa membantu teman-teman.

Untuk Uji Welch, setahu saya, uji ini sebenarnya uji t juga, hanya saja dilakukan ketika asumsi homogenitas varian dilanggar. Jadi dalam uji welch ini, varian tiap kelompok tidak di'rerata' seperti t-test, tetapi diberi bobot sesuai dengan besarnya jumlah subjek.

Di SPSS, output t-test biasanya menyertakan uji welch ini di baris kedua dari hasil analisisnya (pada baris equal variance not assumed).
Mungkin bisa dibaca di sini:
http://psikologistatistik.blogspot.com/search/label/t-test

Demikian risda, jika ada pertanyaan lagi silahkan diposting lagi.

Salam,

ditya aji mengatakan...

Selamat malam pak Agung,
artikel yang menarik pak..
Selanjutnya saya mohon masukannya, sy agak tersendat dengan tesis saya. Salah satu tujuan penelitian saya adalah menganalisis perbedaan pendapatan kelompok A dan kelompok B. Sy menggunakan uji independen t test karena data saya rasio dan treatment yang digunakan adalah with and without. Jumlah sampel pada masing-masing kelompok berbeda. Saya telah melakukan uji normalitas dan uji homogenitas varians dan hasilnya data berdistribusi normal, tetapi varians.nya tdk homogen. (Uji homogenitas menggunakan uji F dan hasilnya 5,5). Sy membaca buku Prof Sugiyono yang menyatakan bahwa utk jumlah sampel yang tidak sama dan varians yg tidak homogen dapat menggunakan rumus t test separated varians. Nah, pertanyaan saya pak:
1. Apa perbedaan mendasar antara rumus polled varians dan separated varians?
2. Apakah hasil uji t test homogen yg tdk varians menggunakan rumus separated varians tsb dapat dipertanggungjawabkan/tdk bias?
3. Sebenarnya kalau membaca artikel bapak dlm blog ini, uji yang paling tepat adalah Uji Welch ya pak? permasalahannya tesis sy sudah masuk ke meja penguji, dan saya tidak yakin dengan hasil sy pak.. Mohon bantuannya..


Terimakasih
-ditya-

Agung Santoso mengatakan...

Hai Ditya,
Terima kasih ya untuk komentar dan pertanyaannya.
1. Untuk pertanyaan pertama: Perbedaan rumusnya terletak pada cara 'memperlakukan' varian tiap kelompok. Untuk separated, varian tiap kelompok dibagi dulu sama n kelompok baru dijumlahkan. Sementara kalau yang pooled, varian kedua kelompok dirata-rata dulu baru kemudian dibagi n.

2. Kalau apakah kalau tidak homogen lalu menggunakan separated variance ya tentu saya itu yang akan memberikan estimasi yang lebih akurat. Nah kalau tidak homogen tetap menggunakan yang pooled, hasil analisisnya jadi tidak akurat apalagi jika n nya tidak sama. Jadi bisa saja sebenarnya tidak signifikan tapi hasil analisis nya seolah signifikan. Atau sebaliknya.

3. Wah ya memang agak terlambat ya. Tapi begini saja, coba Ditya cek hasil analisis uji-t dari SPSS. SPSS biasanya melakukan juga analisis welch (atau separated variance) di baris kedua dari analisis uji t ini. Jadi cek saja hasilnya bagaimana. Jika hasilnya tetap signifikan, maka tidak ada kendala yang berarti. Hanya saja Ditya perlu memperbaiki dalam laporannya nanti. Tapi kalau ternyata tidak signifikan, ya .. ini berarti harus ada perbaikan dari pembahasan sampai kesimpulan.