Senin, Agustus 15, 2016

Bermain Kartu Belajar Bayesian

Salah satu kesalah-pahaman terbesar dari para peneliti atau penulis artikel ilmiah adalah menginterpretasi nilai p sebagai probabilitas dari kebenaran / kesalahan suatu hipotesis berdasarkan kondisi data penelitian kita. Nilai p sebenarnya berbicara tentang probabilitas memperoleh hasil penelitian seperti yang kita temukan atau lebih ekstrim jika hipotesis nul benar di populasi, atau dapat diekspresikan sebagai berikut:


                                                                (1)

D dalam ekspresi tersebut adalah data penelitian yang kita peroleh, sementara H0 adalah Hipotesis Nul. Jadi nilai p sebenarnya adalah probabilitas kondisional (Conditional Probability).  Dengan kata lain, nilai p berarti besarnya probabilitas memperoleh hasil penelitian seperti yang kita peroleh atau lebih ekstrim dalam kondisi H0 benar.  Ini berarti H0 merupakan kondisi yang ditetapkan atau diketahui terlebih dulu, baru mencari probabilitas memperoleh D. 


Jadi misalnya dalam sebuah penelitian korelasional, ditemukan nilai korelasi sebesar 0.3 dengan nilai p = 0.025, ini berarti besarnya probabilitas memperoleh koefisien korelasi sebesar 0.3 atau lebih besar jika koefisien korelasi di populasi adalah nol, sebesar 0.025 atau 2.5%. Apakah ini berarti probabilitas koefisien korelasi di populasi sama dengan nol berdasarkan hasil temuan penelitian kita adalah 0.025? Tidak. Probabilitas koefisien korelasi di populasi sama dengan nol jika didasarkan pada hasil penelitian diekspresikan sebagai berikut:



                                                                   (2)

Kita ilustrasikan dengan bermain kartu remi yang berisi 52 kartu dengan 13 angka (As, 2, 3, hingga Raja) dan 4 jenis (Hati, Keriting, Sekop dan Wajik).  Anggaplah jenis kartu adalah hipotesis-hipotesis (H), dengan kartu jenis Hati sebagai H0,  sementara angka kartu adalah Data (D). 

Jika saya mengambil satu kartu dari setumpuk kartu remi yang telah dikocok. Saya menyebutkan bahwa kartu yang saya pegang adalah kartu Hati (H0). Berapa besar probabilitas kartu tersebut memiliki angka 5 (D=5)? Ini berarti pertanyaan saya terkait dengan ekspresi probabilitas yang pertama (1). Dalam kelompok kartu berjenis Hati, probabilitas memperoleh angka sebesar 5 adalah 1/13. 


Ekspresi probabilitas kedua (2) melakukan dengan cara yang terbalik dari yang saya lakukan sebelumnya. Setelah saya mengambil kartu, saya menyebutkan angkanya (D-nya) terlebih dulu, baru bertanya berapa besar probabilitas karti ini berjenis Hati (H0)? Atau dalam kelompok kartu berangka 5 (D=5), besarnya probabilitas memperoleh kartu berjenis Hati (H0) adalah 0.25. 


Dapat kita lihat bahwa besarnya  tidak sama dengan : yang pertama bernilai 1/13 yang kedua 0.25.  Nah, pertanyaannya sekarang jadi begini: jika ketertarikan peneliti sebenarnya adalah no 2 (probabilitas benar/tidak nya H0 berdasarkan data), sementara yang bisa kita peroleh adalah no 1 (probabilitas memperoleh suatu data (D) jika H0 benar), mungkinkah kita memperoleh no 2 dengan menggunakan informasi dari no 1?



Teorema Bayes

Jawabannya: Bisa dengan menggunakan teorema Bayes:

                                              (3)


Mari kita amati persamaan (3). Persamaan (3) dapat kita tulis ulang menjadi

                                              (4)

Dalam contoh kartu remi di atas ini Pr(H0|D) adalah probabilitas memperoleh kartu berjenis hati jika kita mengetahui bahwa kartu tersebut berangka lima, yaitu sebesar 0.25. Pr(D) adalah besarnya probabilitas memperoleh kartu 5 dari keseluruhan kartu remi, yaitu 4 / 52 = 1/13 (4 kartu berangka 5 dari 52 total kartu remi). Jika kita kalikan keduanya, kita memperoleh angka 1/52 (1/4 dikalikan 1/13).  Ternyata besarnya hasil perkalian ini sama dengan hasil perkalian antara Pr(D|H0) dan Pr(H0). Pr(D|H0) adalah probabilitas memperoleh kartu berangka 5 jika kita tahu bahwa kartu tersebut berjenis hati (besarnya 1/13). Sementara Pr(H0) adalah besarnya probabilitas memperoleh kartu berjenis hati dari keseluruhan kartu remi (besarnya = 13 kartu berjenis hati / 52 total kartu remi=1/4). Hasil perkaliannya sama dengan 1/52. 

Baik Pr(H0|D)Pr(D) maupun Pr(D|H0)Pr(H0) menghasilkan nilai yang menggambarkan probabilitas gabungan (Joint Probability), atau dalam contoh kartu remi di atas probabilitas kartu yang saya pegang adalah kartu berjenis Hati dan berangka 5, yaitu sebesar 1/52 (hanya ada satu kartu berjenis Hati dan berangka 5 dibagi 52 kartu remi). Keterkaitan ekspresi probabilitas no 1 dan no 2 inilah yang memungkinkan kita memperoleh Pr(H0|D) dari Pr(D|H0) atau sebaliknya. 


Informasi yang Dibutuhkan

Meskipun kita bisa memperoleh informasi mengenai Pr(H0|D) dari Pr(D|H0) atau nilai p, ada beberapa informasi tambahan yang dibutuhkan yaitu Pr(H0) dan Pr(D). Pr(H0) disebut juga sebagai Probabilitas Prior (Prior Probability atau Prior Distribution).  Tanpa mengetahui Pr(H0) ini, kita tidak dapat memperoleh apa yang kita inginkan. Informasi mengenai Probabilitas Prior ini cukup penting karena informasi keliru mengenai Probabilitas Prior ini bisa berdampak pada kesalahan perhitungan Pr(H0|D). 

Informasi kedua yang dibutuhkan adalah Pr(D). Dalam kondisi tertentu, peneliti dapat berasumsi bahwa Pr(D) bersifat menetap sehingga kita dapat berasumsi  bahwa Pr(H0|D) proporsional terhadap Pr(D|H0)*Pr(H0)


Demikian sekilas mengenai ide awal analisis menggunakan paradigma Bayesian. Dengan pendekatan Bayesian inilah muncul teknik Markov Chain Monte Carlo (MCMC) yang seringkali digunakan untuk memecahkan persamaan yang tidak memiliki closed form. 

2 komentar :

Unknown mengatakan...

masih berat rasanya nih bayesian :)

Unknown mengatakan...

Terima kasih Andres Purmalino untuk komentarnya,

Benar, memang tidak mudah untuk mempelajari Bayesian karena kita cenderung terbiasa untuk menggunakan cara berpikir 'fruekentis' selama ini. Meskipun dalam banyak analisis yang dilakukan dalam Bayesian memberikan hasil yang mirip dengan frekuentis, dalam analisis-analisis yang sangat kompleks, Bayesian memberikan keunggulan dalam hal kemudahan memecahkan fungsi-fungsi yang tidak 'closed form'.

Salam,
Agung