Melihat COVID-19 vaccine efficacy secara sederhana
Implementasi dasar Bayesian inference
.
.
.
A thread
Di thread kali ini, yuk kita bahas gimana cara mengestimasi efek dari vaksin secara keseluruhan. Nah, ini baru kita bakal mulai pake Bayesian inference. Apa tuh Bayesian inference? Kok bayes ada di mana-mana, sih?
Sebelum memulai thread, disclaimer dlu nih! Data yang kita gunakan itu data yang masih belum lengkap, sehingga kesimpulan dari thread ini bisa jadi belum akurat. Kita bakal fokus ke gimana caranya mengimplementasikan Bayesian inference di kasus vaksin COVID-19 saja, ya!
Jadi, si Bayesian inference ini tuh metode inferensi statistik yang make teorema Bayes buat memperbarui probabilitas hipotesis saat lebih banyak bukti atau informasi tersedia. Nah kenapa sih kita pake Bayesian inference ini? 🤔
Informasi data vaksin COVID-19 itu akan terus bertambah dan berkembang seiring berjalannya waktu. Jadi, pemodelan bakal terus dilakukan berulang kali supaya distribusinya sesuai dengan data yang ada.
Nah, bayes ini bisa bantu kita buat memperbarui probabilitas kalo data yang kita punya makin banyak.
Sebelumnya, pasti udah pada tau teorema bayes, kan? Atau belum? Kalo belum, yuk baca thread kita sebelumnya tentang Bayesian!
Jadi kalau teorema bayes diaplikasikan jadi bayes inference, kurang lebih bakal jadi begini. Pusing? Sama! Yuk kita kupas bareng bareng.
Misalnya kita punya sejumlah orang yang sudah vaksinasi. Dari orang-orang yang telah divaksin itu, ada yang tidak sakit (kebal) dan ada yang tetap sakit karena virus COVID-19.
Nah, kita mau liat estimasi berapa persen sih orang yang kebal virus jika kita terus memberikan vaksin kedepannya?
Kalau dilihat dari kejadian itu, kita punya dua kejadian, nih: vaksin berhasil dan vaksin gagal. kita bakal asumsikan data berbentuk biner dengan 1: vaksin berhasil dan 0: vaksin gagal. Jadi, kejadian vaksin bakal mengikuti distribusi Bernoulli.
Nah untuk menggunakan Bayesian inference untuk memodelkan efek vaksin ini, kita perlu ngerti dulu nih terkait si Bayesian inference itu sendiri.
Bayesian inference ini terdiri dari tiga tahap: menentukan prior model, menentukan likelihood model, dan menentukan posterior model maksimal.
Inti dari prior probability itu kita bakal cari distribusi dari kemungkinan suatu kejadian sebelum kita melihat datanya (X). Kalau kasus kita, berarti prior itu distribusi kemungkinan vaksin tersebut sukses berdasarkan apa yang kita tahu (masih kita tebak, nih).
Untuk fungsi likelihood, sederhananya itu kita bakal memodelkan gimana data real (X) bakal terlihat kalau kejadian yang terjadi adalah vaksin berhasil.
Kebalikan dari prior, posterior model itu distribusi kemungkinan dari suatu kejadian setelah kita melihat data realnya.
Di kasus ini berarti kemungkinan vaksin berhasil setelah kita melihat data vaksinasi. Nanti kemungkinan vaksin berhasil yang kita pilih itu adalah yang punya posterior terbesar.
Nah, biar hidup jadi mudah, kita bakal pake distribusi dari prior probability yang bisa menghasilkan posterior dist berupa conjugate prior.
Waduh, apaan lagi tuh conjugate prior? Si conjugate prior ini tuh posterior yang punya distribusi sama kayak priornya. Kenapa tuh harus begitu?
Sederhananya, kita tuh bakal nyari posterior buat setiap kemungkinan vaksin bakal berhasil, terus liat posterior yang paling maksimum. Buat nyari maksimum posterior, kita harus normalize semua likelihood dan prior distributionnya. Intinya: pusing, euy!
Jadinya, supaya kita ga perlu normal-normalin, kita bakal pake teori yang udah ada bahwa distribusi beta itu merupakan conjugate prior dan Bernoulli likelihood. Jadi, Bayesian inference kita bakal berbentuk begini:
Udah cukup pusing? Kalo udah berarti tandanya kita harus langsung aja ke praktek nih, hehe. Kita bakal gunain data dari blog.fellstat.com.
Terus, kita bakal jelasin model dari prior (dist beta) sama likelihood (dist Bernoulli) dari setiap jenis vaksin, kurang lebih begini:
Nah, setelah itu kita bisa liat plot gabungan dari vaccine efficacy untuk tiap jenis vaksin.
Kalau kita lihat, posterior distribution yang ada di gambar ini itu adalah maksimum posterior distribution (berdistribusi beta). Akhirnya, kita jadi bisa liat vaksin efficacy dari setiap jenis vaksin, deh!
Buat pengingat lagi, data yang kita pake itu masih belum komplit, jadi kesimpulan yang diambil dari posterior distribution yang kita buat ini masih belum bisa merepresentasikan kebenaran dari vaccine efficacy, ya!
Yang penting, sekarang kita udah tau gimana cara ngemodelin Bayesian inference, kan? 😁
Pengen lanjut belajar, tapi bingung dan penasaran apa kegunaan Bayesian di machine learning? Yuk belajar bareng mimin di non degree program Data Scientistnya Pacmann.AI. 😎
Pendaftaran batch 3 udah dibuka loh, langsung aja daftarin diri kalian di bit.ly/PendaftaranNon… 🤩🤩🤩
Oh ya, lagi ada promo potongan 💸 Early Bird 💸 juga loh buat kalian yang daftar sekarang juga hingga Jumat, 2 April 2021! Kalau mau tahu info lebih lanjut tentang Program Non-Degree nya, bisa langsung klik bit.ly/BrosurSingkatP… atau hubungi kami di bit.ly/WASalesPacmann ya😊

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Follow us on instagram: @pacmannai

Follow us on instagram: @pacmannai Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

1 Apr
Being different from the other, is it okay? 🍏🍐🍏
Intro to time series anomaly detection
.
.
.
A thread
Coba kalian perhatikan gambar dibawah ini, coba simak baik baik ya Image
Ada yang bisa nebak ga apa yang aneh dari gambar itu?
Read 40 tweets
30 Mar
Distance Function: Sudut Pandang Baru atas Jarak
.
.
.
A thread
Pastinya kita udah gak asing lagi ya denger-denger kata korelasi, similaritas, klasifikasi, clustering, dan hal-hal lain yang sejenis
Katakanlah kita ingin bikin sebuah clustering pake pendekatan similaritas. Gimana sih caranya kita mengatakan 2 titik/data itu similar? Ya simplenya adalah dengan mengatakan bahwa tipe mereka sama
Read 34 tweets
30 Mar
Critical thinking for Data Scientist, why is it important and how to develop it🧠
.
.
.
A thread
Pernah nggak kamu left grup WA karena bete sama orang yang suka share-share berita hoax yang nggak jelas asalnya dari mana? Nah mungkin, orang itu belum tau soal Critical Thinking 🙂
Critical thinking sebenarnya basic skill yang harus dimiliki oleh semua orang, tapi ada alasan kenapa skill ini jadi penting banget buat seorang Data Scientist, di luar hardskill yang selama ini udah sering kamu dengar.
Read 37 tweets
29 Mar
Akurasi bagus nggak menjamin modelnya pasti bagus juga. Kok bisa?
Confusion Matrix: In a Nutshell
.
.
.
A thread
Suatu hari, seorang data scientist diminta klien dari sebuah rumah sakit untuk membangun sebuah model machine learning yang bisa mendeteksi dini adanya gejala tumor otak pada pasien balita
Lalu singkat cerita, data selesai di preprocessing dan modeling selesai. Pertanyaannya, kira-kira gimana cara si DS bisa mengukur performa modelnya? Cukupkah akurasi yang tinggi bisa membuat dia bilang ke klien kalau modelnya ‘works well’?
Read 42 tweets
29 Mar
Guys mimin dapat pertanyaan bagus dari banyak teman-teman yang mau S2 Machine Learning.

Kalian ada saran S2 ML di manakah yang favorit di luar negeri?

Mimin tahu yang bagus dari publikasinya doang, kurang dari sisi proses belajar.

Mungkin yang alumni mau kasih saran?
Mimin suka sih sama ML CMU
ml.cmu.edu

Tapi gak tahu gimana rasanya sekolah di sana. Mas @ardyadipta mau kasih testimoni, kah?
Yang bagus yang lain, yang fokus ML ya.... bukan program CS tapi ada ML nya.

Edinburgh Msc Artificial Intelligence
ed.ac.uk/studying/postg…

Mas @aliakbars bolehkah minta testimoninya?
Read 4 tweets
28 Mar
#GaliData 4: Web Scraping
.
.
A thread
Coba kalian bayangin gimana cara orang dengan multiple source of income ngetrack pendapatan hariannya dari website yang berbeda? Misal Andrea, seorang youtuber, tapi juga punya saham dan jual lipstik di e-commerce.
Kalau Andrea mau ngetrack berapa sih pendapatannya dalam sehari, dia harus cek di 3 website yang berbeda dong: youtube, sekuritas, dan website e-commerce. Misalkan untuk cek 3 website tersebut dan ngitung berapa pendapatan hariannya butuh 10 menit,
Read 31 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!