Selasa, Agustus 16, 2016

Kritis Membaca Riset (Berita tentang suatu Riset):”Religious Kids Are More Selfish Than Non-Religious Kids, Study Says” (bag 2).

Pada bagian 2 ini saya akan membahas sedikit seperti apa riset yang diacu oleh berita di atas.    Baiklah mari kita mulai dengan melalui 3 tahapan mengkritisi berita tentang hasil riset terlebih dulu: 

  1. Apakah ada penelitiannya? Ya. Berita itu didasarkan pada penelitian yang benar-benar ada dan dapat diakses serta dibaca. Terbit di jurnal Current Biology, tahun 2015, dengan no doi sebagai berikut:  http://dx.doi.org/10.1016/j.cub.201...  (DOI: digital object identifier). 
  2. Siapa penerbitnya dan apakah ini peer-reviewed journal? Jurnal ini diterbitkan pertama kali oleh kelompok Current Science pada tahun 1991, kemudian diambil alih oleh Elsevier di tahun 1998 dan menjadi bagian dari Cell Press sejak tahun 2001 (sumber: wikipedia, link:https://en.wikipedia.org/wiki/Curre...). Jurnal ini merupakan jurnal yang peer-reviewed. Impact factor-nya tergolong lumayan besar (9.571 di tahun 2014). Jadi bisa dibilang jurnal ini merupakan terbitan yang lumayan bergengsi. Apakah ini berarti kita bisa percaya sepenuhnya isi dari artikel ini? Tidak juga. Kita perlu baca isinya lebih detil. 
Nah saya sudah membacanya beberapa waktu lalu dan sempat mendiskusikannya dengan beberapa teman. Ada beberapa poin catatan yang saya peroleh dari bacaan ini:
  • Artikel ini masih in press, jadi yang dapat diakses baru bagian hasil penelitian dan diskusi dan kesimpulannya. Oleh karena itu cukup banyak hal yang belum jelas terkait dengan prosedur lengkap dalam penelitian ini. 
  • Metode yang digunakan semi-survey (meskipun dalam artikel dituliskan ada prosedur eksperimen. Namun demikian sebenarnya tidak ada manipulasi VI dan tidak ada random assignment). Rasanya memang tidak memungkinkan riset ini dijalankan dengan metode eksperimen. Oleh karena itu, seharusnya hubungan kausal antara variabel independen (VI) dan variabel dependen (VD) tidak dapat ditegakkan secara meyakinkan.  Namun demikian si penulis agak gegabah menggunakan kata affect atau bahkan influence yang mengindikasikan sebab-akibat. Meskipun tidak sepenuhnya salah, tetapi karena tidak adanya manipulasi VI, pembaca seharusnya diberi peringatan mengenai hal ini: validitas internal penelitian ini tidak terlalu meyakinkan.
  • Definisi dari VI yang menurut saya tidak konsisten: Variabel Independen dalam penelitian ini apakah religion atau religious rearing environment? Ketidak-konsisten-an ini bisa berdampak pada validitas pengukuran-> anak ditanya tentang ia dibesarkan dalam keluarga apa atau apa agamamu? Saya pribadi belum bisa melihat bahwa pembedaan ini akan berdampak besar terhadap hasil penelitian. Tapi ini satu hal yang perlu dicatat juga rasanya. Altruisme juga sepertinya diukur hanya dengan menggunakan perilaku berbagi , yang mungkin akan menimbulkan pertanyaan tentang validitas konstruknya. ‘Meanness’ (semacam sifat kejam) tidak terlalu gamblang dijelaskan pengukuran seperti apa yang dilakukan dan bagaimana skor diperoleh.
  • Peneliti melakukan beberapa analisis dalam penelitian ini. Mari kita lihat satu demi satu. Analisis yang pertama adalah uji-t sampel independen dari mean sharing (altruisme) antara mereka yang dibesarkan dalam lingkungan agama tertentu dengan yang ‘tidak beragama’. Hasil pengujiannya sangat signifikan dengan p lebih kecil dari 0.001. Namun demikian ada dua hal yang perlu dicatat: (1). Selisih mean antara yang religius (3.25) dan non-religius (4.11) sebesar 0.86. Dengan SD sebesar 2.46 (religius) dan 2.48 (non-religius), perbedaan mean sebesar itu dianggap masuk dalam kategori besaran efek yang kecil hingga medium (0.86/2.46=0.35, untuk kategori medium=0.4, kecil = 0.2). (2). Standard deviasinya cenderung besar untuk kedua kelompok. Ini menggambarkan tingkat variasi tergolong besar (Coefficient of Variation (CV)=2.46^2/3.25 = 1.86 untuk religius, jauh lebih besar dari .1 yang dianggap ‘wajar’). Ilustrasi dapat dilihat dalam gambar 1 (overlap antar dua kelompok cenderung besar). Dampak dari kondisi seperti ini (ukuran efek kecil dan besarnya SD) adalah masalah replikasi: pada penelitian replikasi bisa terjadi efek berbalik atau tidak ada efek.
  • Permasalahan lain terkait dengan uji-t ini adalah pengecekan apakah data memenuhi asumsi baik distribusi maupun homogenitas varian. Untuk asumsi kedua, sekilas sepertinya tidak ada masalah karena perbedaan SD yang tidak terlalu besar. Namun demikian informasi mengenai bentuk distribusi ini penting karena jika bentuk distribusi kedua kelompok berkebalikan, maka sangat mungkin hasil yang diperoleh ‘menipu’ (seharusnya tidak signifikan tapi terlaporkan signifikan).
  • Analisis berikutnya adalah regresi dengan model: Sharing = usia+negara asal+SES+religion identification (dummy coded). Sekali lagi religion identification memiliki koefisien yang signifikan (b=-.132 (standardized), p<.001). Dalam hal ini lagi-lagi tidak dicantumkan apakah ada pengecekan asumsi regresi. Ada sedikit masalah teknis dalam pelaporan penelitian ini: nilai b yang dilaporkan adalah standardized, disertai nilai p, padahal nilai b yang standardized belum ada cara untuk menguji-nya (sudah sih tapi belum populer). Nah tidak cukup jelas apakah memang peneliti menggunakan cara yang masih baru ini atau tidak. Jika tidak maka nilai yang dilaporkan keliru.
  • Selain itu, nilai r kuadrat untuk keseluruhan model = 0.184. Ini berarti kemampuan model yang diajukan untuk menjelaskan variasi dari sharing (mengapa anak satu share lebih banyak dari yang lain) tergolong kecil: hanya 18.4% variasi saja yang dapat dijelaskan. Ini berarti religion identification akan memiliki kemampuan yang lebih kecil lagi. Selain itu, dapat dilihat bahwa age memiliki b = 0.39 yang berarti lebih besar daripada religion identification. Ini berarti usia memiliki peran lebih besar dibandingkan identifikasi keagamaan untuk menjelaskan variasi sharing pada anak.
  • Analisis berikutnya adalah korelasi product moment antara altruism dengan frekuensi melakukan praktek religius (r=-0.161), spiritualitas dalam keluarga (r=-0.179), dan religiousness secara umum (r=-0.173). Ketiganya memperoleh nilai p < 0.001. Namun demikian, dapat dilihat juga bahwa angka korelasi antara ketiga variabel ini dengan altruisme tergolong kecil (|r|
  • Analisis berikutnya kurang lebih memiliki masalah yang sama dengan yang sebelumnya: pengecekan asumsi yang kurang dipaparkan apakah telah dilakukan dan effect size yang kecil.

Nah saya sudah membacanya beberapa waktu lalu dan sempat mendiskusikannya dengan beberapa teman. Ada beberapa poin catatan yang saya peroleh dari bacaan ini:
Jadi? Ada beberapa hal yang perlu diperjelas dalam artikel tersebut untuk membuat hasil penelitian ini menjadi lebih meyakinkan. Agak terlalu dini untuk menyatakan penelitian ini salah atau benar. Namun demikian, terlepas dari indecisiveness saya, kiranya ada sikap-sikap yang lebih bijak dalam menyikapi hasil riset ini. Saya pribadi menyukai salah satu komentar dari teman yang menyatakan bahwa kita perlu introspeksi juga terkait hasil ini. Jangan-jangan kita memang mengajarkan / mensosialisasikan agama dengan cara yang keliru sehingga mungkin saja anak-anak kita justru jadi kurang altruis (Terima kasih, Mas David Agus Widarto atas komentarnya).
That’s all guys! Butuh waktu lama untuk berpikir dan menulis segini banyak. Buat saya pribadi, ini berarti memang tidak mudah menyusun argumen yang kokoh yang didasarkan pada temuan ilmiah yang dapat dipertanggungjawabkan. Tapi tentunya mudah sekali bikin argumen yang diramu dengan cucoklogi plus imajinasi nan liar tanpa kaidah logika yang memadai. Semoga tulisan ini bisa membantu negara dalam rangka mencerdaskan kehidupan bangsa... Amin.

Kritis Membaca Riset (Berita tentang suatu Riset):”Religious Kids Are More Selfish Than Non-Religious Kids, Study Says” (bag 1).

Beberapa waktu lalu saya sempat upload link berita mengenai hasil riset di atas. Tujuan saya yang utama adalah ... iseng... mohon maaf ... Saya ingin melihat reaksi teman-teman ketika membaca berita tersebut. Sayangnya memang tidak banyak yang memberikan respon. Entah karena timing nya kurang pas atau memang tidak terlalu menarik atau terlalu ‘menantang’.  Keinginan atau keisengan ini muncul karena cukup sering saya membaca teman-teman share tentang berita mengenai suatu riset begitu saja tanpa mengkritisi-nya dengan baik, termasuk mengevaluasi apakah memang berita mengenai riset tersebut pantas dikonsumsi / dipercayai.  Dan komentar-komentar yang muncul biasanya juga ramai sekali, tetapi nyaris tidak satupun yang didasarkan pada hasil evaluasi memadai dari metode yang digunakan dalam riset itu sendiri. Yang biasa saya temukan, para ‘ahli’ ini berteori ini dan itu, berdebat ini dan itu tanpa pernah sekalipun membaca risetnya itu sendiri. Jadi yang diperdebatkan apa? eng.... tanya sama para ‘ahli’ itu saja ya... 

Nah, dari pengalaman tersebut dan pengalaman mengupload berita ini, saya ingin menyarankan, jika diperkenankan, apa yang sebaiknya dilakukan ketika membaca atau mendengar ‘berita tentang hasil riset mengatakan ...’. 

  • Tanyakan atau cari terlebih dulu artikel asli yang merupakan laporan riset tersebut. Kalau ada orang berkata riset ini menunjukkan ini dan itu, harusnya dia juga baca dong risetnya. Jadi tanya saja, mana risetnya? Apa judulnya? Terbit di mana? Bisa minta copynya nggak? Atau kalau terbit di berita seperti ini, gunakan google scholar untuk mencari artikelnya.
  • Kalau sudah diberikan artikel nya, coba cek dulu artikel ini yang nerbitin siapa atau lembaga apa? Apakah artikel ini terbit di jurnal yang proses publikasinya melalui peer review (artikel direview terlebih dulu oleh sejawat baik secara terbuka atau tertutup sebelum diputuskan untuk diterbitkan)? Mengapa ini penting? Karena review sejawat inilah yang menjadi salah satu kontrol baik isi maupun metode dari penelitian yang dijalankan. Meskipun tidak selalu artikel yang terbit di jurnal yang peer-reviewed pasti baik dan sebaliknya artikel yang terbit di jurnal yang tidak peer-reviewed pasti tidak baik. Namun demikian, dalam hal tingkat kepercayaan subjektif, jurnal dengan peer review memiliki tingkat ‘dapat dipercaya’ yang lebih tinggi daripada yang tanpa peer review.
  • Nah, kalau sudah dicek dan ternyata artikel ini terbit di jurnal yang peer-reviewed, lalu? Ya dibaca. Ada kecenderungan yang saya amati, kalau mahasiswa (akademisi juga mungkin ya? hehe...) membaca jurnal, biasanya baca introduction terus loncat ke discussion atau conclusion, melewatkan bagian paling nyebahi : metode penelitian (apalagi baca bagian analisis statistik... No Way!). Padahal bagian ini merupakan bagian yang sama penting (jika tidak bisa dibilang paling penting) dari suatu laporan penelitian. Bagian ini yang seringkali menjadi dasar untuk menentukan seberapa besar kita bisa mempercayai hasil penelitian. Tanpa membaca bagian ini, kita tidak akan mendapatkan informasi memadai untuk, misalnya, menilai validitas internal dan eksternal penelitian ini, menilai apakah kesimpulan hasil analisisnya dapat dipercaya, termasuk kekuatan dan keterbatasan penelitian ini. Informasi di bagian ini juga-lah yang dapat dijadikan dasar untuk menilai apakah kesimpulan hasil riset dapat dipertanggunjawabkan dan pada akhirnya apakah klaim yang dinyatakan dalam riset ini atau berita yang memuat riset ini dapat dipercaya sebagai ‘benar’.
Saya pikir tiga langkah itu merupakan langkah-langkah minimal yang seharusnya dilakukan sebelum mensharing-kan atau mengomentari suatu artikel hasil penelitian, apalagi hanya beritanya saja.
Karena judul notes nya seperti itu, nanti di bagian kedua akan saya bahas seperti apa riset yang diacu oleh berita yang pernah saya share dulu.

Senin, Agustus 15, 2016

Bermain Kartu Belajar Bayesian

Salah satu kesalah-pahaman terbesar dari para peneliti atau penulis artikel ilmiah adalah menginterpretasi nilai p sebagai probabilitas dari kebenaran / kesalahan suatu hipotesis berdasarkan kondisi data penelitian kita. Nilai p sebenarnya berbicara tentang probabilitas memperoleh hasil penelitian seperti yang kita temukan atau lebih ekstrim jika hipotesis nul benar di populasi, atau dapat diekspresikan sebagai berikut:


                                                                (1)

D dalam ekspresi tersebut adalah data penelitian yang kita peroleh, sementara H0 adalah Hipotesis Nul. Jadi nilai p sebenarnya adalah probabilitas kondisional (Conditional Probability).  Dengan kata lain, nilai p berarti besarnya probabilitas memperoleh hasil penelitian seperti yang kita peroleh atau lebih ekstrim dalam kondisi H0 benar.  Ini berarti H0 merupakan kondisi yang ditetapkan atau diketahui terlebih dulu, baru mencari probabilitas memperoleh D. 


Jadi misalnya dalam sebuah penelitian korelasional, ditemukan nilai korelasi sebesar 0.3 dengan nilai p = 0.025, ini berarti besarnya probabilitas memperoleh koefisien korelasi sebesar 0.3 atau lebih besar jika koefisien korelasi di populasi adalah nol, sebesar 0.025 atau 2.5%. Apakah ini berarti probabilitas koefisien korelasi di populasi sama dengan nol berdasarkan hasil temuan penelitian kita adalah 0.025? Tidak. Probabilitas koefisien korelasi di populasi sama dengan nol jika didasarkan pada hasil penelitian diekspresikan sebagai berikut:



                                                                   (2)

Kita ilustrasikan dengan bermain kartu remi yang berisi 52 kartu dengan 13 angka (As, 2, 3, hingga Raja) dan 4 jenis (Hati, Keriting, Sekop dan Wajik).  Anggaplah jenis kartu adalah hipotesis-hipotesis (H), dengan kartu jenis Hati sebagai H0,  sementara angka kartu adalah Data (D). 

Jika saya mengambil satu kartu dari setumpuk kartu remi yang telah dikocok. Saya menyebutkan bahwa kartu yang saya pegang adalah kartu Hati (H0). Berapa besar probabilitas kartu tersebut memiliki angka 5 (D=5)? Ini berarti pertanyaan saya terkait dengan ekspresi probabilitas yang pertama (1). Dalam kelompok kartu berjenis Hati, probabilitas memperoleh angka sebesar 5 adalah 1/13. 


Ekspresi probabilitas kedua (2) melakukan dengan cara yang terbalik dari yang saya lakukan sebelumnya. Setelah saya mengambil kartu, saya menyebutkan angkanya (D-nya) terlebih dulu, baru bertanya berapa besar probabilitas karti ini berjenis Hati (H0)? Atau dalam kelompok kartu berangka 5 (D=5), besarnya probabilitas memperoleh kartu berjenis Hati (H0) adalah 0.25. 


Dapat kita lihat bahwa besarnya  tidak sama dengan : yang pertama bernilai 1/13 yang kedua 0.25.  Nah, pertanyaannya sekarang jadi begini: jika ketertarikan peneliti sebenarnya adalah no 2 (probabilitas benar/tidak nya H0 berdasarkan data), sementara yang bisa kita peroleh adalah no 1 (probabilitas memperoleh suatu data (D) jika H0 benar), mungkinkah kita memperoleh no 2 dengan menggunakan informasi dari no 1?



Teorema Bayes

Jawabannya: Bisa dengan menggunakan teorema Bayes:

                                              (3)


Mari kita amati persamaan (3). Persamaan (3) dapat kita tulis ulang menjadi

                                              (4)

Dalam contoh kartu remi di atas ini Pr(H0|D) adalah probabilitas memperoleh kartu berjenis hati jika kita mengetahui bahwa kartu tersebut berangka lima, yaitu sebesar 0.25. Pr(D) adalah besarnya probabilitas memperoleh kartu 5 dari keseluruhan kartu remi, yaitu 4 / 52 = 1/13 (4 kartu berangka 5 dari 52 total kartu remi). Jika kita kalikan keduanya, kita memperoleh angka 1/52 (1/4 dikalikan 1/13).  Ternyata besarnya hasil perkalian ini sama dengan hasil perkalian antara Pr(D|H0) dan Pr(H0). Pr(D|H0) adalah probabilitas memperoleh kartu berangka 5 jika kita tahu bahwa kartu tersebut berjenis hati (besarnya 1/13). Sementara Pr(H0) adalah besarnya probabilitas memperoleh kartu berjenis hati dari keseluruhan kartu remi (besarnya = 13 kartu berjenis hati / 52 total kartu remi=1/4). Hasil perkaliannya sama dengan 1/52. 

Baik Pr(H0|D)Pr(D) maupun Pr(D|H0)Pr(H0) menghasilkan nilai yang menggambarkan probabilitas gabungan (Joint Probability), atau dalam contoh kartu remi di atas probabilitas kartu yang saya pegang adalah kartu berjenis Hati dan berangka 5, yaitu sebesar 1/52 (hanya ada satu kartu berjenis Hati dan berangka 5 dibagi 52 kartu remi). Keterkaitan ekspresi probabilitas no 1 dan no 2 inilah yang memungkinkan kita memperoleh Pr(H0|D) dari Pr(D|H0) atau sebaliknya. 


Informasi yang Dibutuhkan

Meskipun kita bisa memperoleh informasi mengenai Pr(H0|D) dari Pr(D|H0) atau nilai p, ada beberapa informasi tambahan yang dibutuhkan yaitu Pr(H0) dan Pr(D). Pr(H0) disebut juga sebagai Probabilitas Prior (Prior Probability atau Prior Distribution).  Tanpa mengetahui Pr(H0) ini, kita tidak dapat memperoleh apa yang kita inginkan. Informasi mengenai Probabilitas Prior ini cukup penting karena informasi keliru mengenai Probabilitas Prior ini bisa berdampak pada kesalahan perhitungan Pr(H0|D). 

Informasi kedua yang dibutuhkan adalah Pr(D). Dalam kondisi tertentu, peneliti dapat berasumsi bahwa Pr(D) bersifat menetap sehingga kita dapat berasumsi  bahwa Pr(H0|D) proporsional terhadap Pr(D|H0)*Pr(H0)


Demikian sekilas mengenai ide awal analisis menggunakan paradigma Bayesian. Dengan pendekatan Bayesian inilah muncul teknik Markov Chain Monte Carlo (MCMC) yang seringkali digunakan untuk memecahkan persamaan yang tidak memiliki closed form.