Jumat, Desember 28, 2007

t-test Reloaded : Independent sample t-test

Masih ingat posting sebelumnya? t-test the beginning? Kasus yang dimunculkan di sana adalah kasus membandingkan mean sampel dengan mean populasi atau acuan tertentu. Bagaimana jika peneliti ingin membandingkan mean dua sampel?Saya sarankan jika belum membacanya, bacalah dulu karena pemikiran yang ditulis disini merupakan kelanjutan pemikiran dalam posting tersebut.

Contoh Kasus

Mungkin ada baiknya jika kita mulai dengan contoh kasus.Seorang peneliti ingin melihat efektivitas pelatihan kewirausahaan yang dibuatnya. Ia mengajukan pertanyaan penelitian : Apakah pelatihan kewirausahaan yang dibuatnya akan meningkatkan motivasi untuk berwirausaha. Ia memilih secara random sekelompok pemuda dari sebuah desa. Kemudian ia melakukan random assignment untuk menentukan siapa yang akan memperoleh pelatihan terlebih dulu, dan siapa yang diberi pelatihan belakangan. Setelah dua kelompok terbentuk, pelatihan kewirausahaan dilakukan untuk kelompok pertama.

Setelah pelatihan pertama selesai, peneliti melakukan pengukuran motivasi berwirausaha dari kelompok pemuda yang telah diberi pelatihan dan yang belum. Ia berhipotesis bahwa kelompok pemuda yang belum menerima pelatihan akan menunjukkan motivasi yang lebih rendah dibandingkan yang telah memperoleh. Jadi bagaimana caranya melihat perbedaan ini?

Distribusi Beda Mean antara Dua Sampel

Kasus ini dapat dilihat dari sudut pandang yang sama seperti membandingkan mean sampel dari mean populasi: ingin mengetahui berapa besar kemungkinan memperoleh sampel dengan mean sebesar A dari sebuah populasi dengan mean sebesar B, yang dapat dirumuskan begini:

Jika kemungkinan memperoleh sampel dengan mean sebesar A dari populasi dengan mean sebesar B itu kecil, kita dapat bilang bahwa sampel dengan mean A tidak berasal dari populasi dengan mean B.

Dalam kasus ini, yang dibandingkan bukan mean dari satu sampel dengan mean populasi melainkan perbedaan mean dari dua sampel dengan perbedaan mean dari dua populasi, yang dirumuskan sebagai berikut:

Jika kita bandingkan rumusan ini dengan sebelumnya akan terlihat sangat mirip, bukan?

Untuk menemukan besarnya kemungkinan, kita perlu mencari dulu nilai standard dari perbedaan ini. Dalam hal ini kita menggunakan distribusi t. Rumus yang digunakan juga memiliki prinsip yang sama dengan rumus mencari nilai t untuk membandingkan mean sampel dari mean populasi; seperti berikut:

Bandingkan dengan t untuk membandingkan mean sampel dari mean populasi :

Perbedaan keduanya hanya terletak pada apa yang dianalisis. Dalam kasus beda mean yang dianalisis adalah beda mean, sehingga kita menggunakan Standard Deviasi untuk distribusi perbedaan mean. Sementara dalam kasus mean sampel, yang dianalisis adalah mean sampel, sehingga kita menggunakan Standard Deviasi untuk distribusi mean sampel.

Ada satu perbedaan lain antara kedua kasus ini. Dalam kasus membandingkan mean sampel dengan mean populasi, mean populasi bisa memiliki nilai berapapun. Sementara dalam kasus membandingkan perbedaan mean 2 sampel dengan perbedaan mean 2 populasi, kita biasanya menetapkan perbedaan mean 2 populasi sama dengan nol. Jadi dalam hal ini :

Biasanya? Ya, sebenarnya kita dapat menetapkan perbedaan mean 2 populasi bukan nol jika kita memiliki dasar yang kuat untuk melakukannya. Dalam hal ini, yang dimaksud dasar yang kuat adalah teori atau penelitian sebelumnya. Beda mean 2 populasi diasumsikan nol, karena kita ingin menguji apakah pelatihan memberi efek atau tidak. Jika memberikan efek maka beda mean 2 populasi tidak akan sama dengan nol, jika tidak memberikan efek, beda mean 2 populasi akan sama dengan nol (tidak ada perbedaan). Nah kita menggunakan tidak memberikan efek sebagai acuan.

Ya ya saya bisa dengar pertanyaanmu,”mengapa tidak menggunakan ‘memberikan efek’ sebagai acuan?” Alasannya, kita tidak tahu berapa angka yang dapat digunakan untuk menjadi acuan ‘memberikan efek’, dua, sepuluh, lima belas? Sementara “tidak memberi efek” hanya memiliki satu angka yaitu nol. Dalam hal ini jauh lebih mudah menggunakan acuan nol daripada bukan nol.

Standard Deviasi Distribusi Beda Mean

Nah masalah berikutnya terkait dengan bagaimana mengukur standard deviasi distribusi beda mean? Kita akan menggunakan prinsip yang sama dengan distribusi mean sampel, yaitu :

Dengan menggunakan prinsip ini dan juga rumus standard deviasi :kita akan menemukan rumus Standard Deviasi Distribusi Beda Mean sebagai berikut:
Jika ditelusuri terus, persamaan ini akan menjadi seperti ini: (proses penelusuran ini saya cantumkan di akhir posting agar kita tetap fokus ke pembahasan ini)

Karena diasumsikan kedua sampel saling independen satu dengan yang lain maka rX1X2 akan sama dengan nol. Ini akan membuat persamaan ini menjadi :

Nah persamaan inilah yang sering kita lihat di buku-buku ketika membahas mengenai t-test. Jadi jika kita gabungkan, rumus t-test untuk sampel yang independen akan seperti ini:

Derajat Kebebasan

Hal berikutnya yang perlu kita cari adalah berapa derajat kebebasan (db) untuk t-test sampel yang independen ini. Masih ingat pembahasan mengenai derajat kebebasan t-test untuk satu sampel? Derajat kebebasan terkait dengan berapa banyak parameter yang kita estimasi. Setiap satu parameter kita estimasi, kita akan kehilangan satu derajat kebebasan.

Jika demikian berapa banyak parameter yang kita estimasi dalam t-test ini? Dua? Ya betul! Ada dua, yaitu varians populasi pertama dan kedua. Keduanya kita estimasi menggunakan varians masing-masing sampel (S2X1 dan S2X2). Nah, karena kita mengestimasi dua parameter, kita akan kehilangan 2 derajat kebebasan, satu untuk tiap sampel. Oleh karena itu db dari t-test sampel yang independen dapat dirumuskan seperti ini:

Kembali ke Contoh

Baiklah, kita kembali ke contoh untuk melihat aplikasi t-test ini. Anggap saja kita mendapatkan perhitungan berikut dari data.


X1 (pelatihan)

X2 (belum)

Mean

89

67

Varians

25

36

n

10

10

Dari data seperti ini dapatkah kita mengatakan bahwa kelompok pemuda yang telah memperoleh pelatihan itu memiliki tingkat motivasi yang lebih tinggi daripada yang belum memperoleh pelatihan? Mari kita terapkan data ke dalam rumus :

Hasil perhitungan menunjukkan bahwa kesempatan untuk mendapatkan perbedaan sebesar itu dari dua populasi yang perbedaannya nol adalah 0.000. Nilai p sebesar ini dianggap sangat kecil, sehingga kita dapat berkata ada perbedaan yang signifikan antara mean kedua kelompok. Ini berarti perbedaan yang terjadi di antara kedua sampel dapat mencerminkan perbedaan di populasinya.

Alternatif Rumus t-test

Selain rumus yang telah disajikan sebelumnya, t-test juga bisa menggunakan rumus lain, seperti berikut:

Ide ini berasal dari pemikiran bahwa varian dari kedua sampel dapat dicari reratanya. Rata-rata dari varians kedua sampel ini yang disebut S2 pooled. Rumus ini hanya berlaku jika varians kedua sampel tidak jauh berbeda. Jika varians kedua sampel jauh berbeda maka rumus ini akan memberikan estimasi yang keliru. Hal ini akan dibahas dalam posting mengenai Asumsi dalam t-test.

Nah demikianlah t-test untuk sampel yang independen berasal. Dan juga bagaimana aplikasinya. Kita masih ada dua pembahasan lagi nih untuk posting berikutnya: mengenai t-test untuk sampel yang berhubungan atau antar waktu, dan asumsi dalam t-test.Besar harapan saya, pembaca bisa menemukan benang merah (atau warna apapun boleh) antara Z, t-test satu sampel dan t-test sampel independen ini.

Penelusuran Rumus Standard Deviasi Beda Mean

Seperti yang saya tulis sebelumnya saya mencantumkan ini di akhir posting agar tidak ‘mengganggu pemandangan’, khususnya bagi yang agak mengalami alergi dengan rumus matematika. Penelusuran ini saya tampilkan untuk ‘pembuktian’ mengenai pemikiran saya tentang kesamaan pemikiran Z, t-test satu sampel, dan t-test sampel independen (dan nanti t-test sampel yang dependen atau antar waktu).

Penulusuran ini berjalan seperti ini (Peringatan saya, memandang pembuktian rumus sekecil ini dapat merusak mata. Oleh karena itu silahkan diklik saja supaya ditampilkan dalam image yang lebih besar) :

6 komentar :

Anonim mengatakan...

Salam kenal pak, saya Danang, mau dapat penjelasan tentang uji statistik
1. Perbandingan antara mean sampel dan mean populasi ( mean teoritis atau mean hipotesa)
2. Pembandingan mean dari dua sampel yang tidak bergantung.

Unknown mengatakan...

Untuk Danang,

1. Sebenarnya mean teoritis dan mean hipotesis itu sama. Keduanya diasumsikan menggambarkan mean populasi. Perbandingan antara mean sampel (atau sering disebut mean empiris dalam buku-buku Pak Azwar) dengan mean hipotetik dapat dilakukand dengan menggunakan one sample t-test. mean hipotetik dianggap sebagai nilai/kriteria pembanding, sementara mean empirik adalah mean yang didapat dari data

2. perbandingan mean dari dua sampel yang tidak bergantung telah di bahas dalam salah satu posting dalam blog ini: uji t independen sampel.

Anonim mengatakan...

siang pak Agung,, saya putri..
saya ingin bertanya,, mengapa dalam sebuah penelitian (skripsi) mean empirik dan mean teoritik perlu dituliskan?
trimakasih sblmnya pak.. :)

Unknown mengatakan...

Untuk Putri,
sebenarnya mean empirik atau teoretik tidak harus dianalisis. Keduanya akan dianalisis tergantung pada tujuan penelitian, apakah akan mendeskripsikan data dengan cara tertentu dan apakah ada manfaat yang dapat diambil dengan melakukan analisis ini.

Anonim mengatakan...

pak agung..
bagaimana cara merubah raw score menjadi z-score?
saya masih bingung..
mohon penjelasannya..
terima kasih

Anonim mengatakan...

pak saya mau tanya tentang persyaratan untuk peneltian korelasional menggunakan uji apa saja ya pak? terima kasih