Deteksi penyakit pake probabilitas? Gimana tuh caranya?! 😲🤯
Yuk belajar Aturan Bayes biar tau peluangnya!
.
.
A thread
Kalian tau gak kalo sampai saat ini, gaada satu alat tes pun yang punya akurasi 100% untuk mendeteksi COVID-19. Bahkan PCR yang jadi golden standard pun akurasi tertingginya 98%
Artinya, kalo ada 1000 orang dites, ada sekitar 20 orang yang akan mendapat hasil tes yang salah, bisa jadi ada yang terinfeksi tapi terdeteksi negatif (false negative), atau yang gak terinfeksi tapi terdeteksi positif (false positive). Wah terus gimana dong?
Nah mimin mau bahas nih gimana caranya ngitung peluang kesalahan test pake Aturan Bayes. Tapi sebelumnya ada pertanyaan dulu buat kalian.
Oh iya pertanyaannya bakal butuh materi confusion matrix, nah kalo kalian lupa, bisa banget nih cek thread mimin yang ini
Misalkan 20% dari populasi penduduk di suatu daerah terinfeksi penyakit C. Setelah dilakukan tes terhadap 10.0000 penduduk dan pengamatan, hasilnya kayak gini,
Pertanyaannya, misalkan kamu dites dengan alat yang sama dan dapet hasil negatif, berapa sih kemungkinan kamu sebenernya terinfeksi tapi terdeteksi negatif?
[[Poll]]
- 4 / 16
- 4 / 72
- 4 / 76
- 4 / 1000
Sebelum kita bahas jawabannya, yuk kita pelajari dulu konsepnya!
Kita kenalan dulu sama konsep himpunan. Sederhananya himpunan adalah kumpulan objek yang didefinisikan dengan jelas. Ada juga nih yang namanya himpunan semesta, yaitu himpunan yang memuat semua objek atau anggota himpunan yang sedang dibicarakan.
Kalo kita punya lebih dari 1 himpunan, kita bisa liat hubungan dari beberapa himpunan tersebut. Hubungannya bisa berupa irisan, gabungan, atau komplemen.
Irisan himpunan itu himpunan yang anggotanya merupakan anggota persekutuan dari dua himpunan tersebut.
Gabungan himpunan itu himpunan yang anggotanya adalah kumpulan anggota dari himpunan-himpunan yang digabungkan
Komplemen himpunan adalah bagian dari himpunan semesta yang anggotanya bukan anggota himpunan yang dikomplemenkan.
(1) Ruang sampel (S)
Ruang sampel itu himpunan dari semua kemungkinan hasil dari suatu percobaan acak. Contohnya kalo kita lakukan percobaan lempar dadu, ruang sampelnya {1,2,3,4,5,6}. Kalo percobaannya lempar koin, ruang sampelnya {angka,gambar}.
(2) Kejadian
Kalo kejadian adalah himpunan bagian (subset) dari suatu ruang sampel S. Contohnya untuk percobaan lempar dadu, kejadian munculnya mata dadu ganjil itu {1,3,5}.
(3) Peluang kejadian
Kita udah tau kan kalo ruang sampel dan kejadian itu adalah himpunan. Kalo suatu ruang sampel S punya elemen sebanyak n(S) dan suatu kejadian E dalam ruang sampel itu punya elemen sebanyak n(E), maka peluang kejadian E itu P(E) = n(E) / n(S)
Misal kita lempar dadu. Berapa sih peluangnya kita dapet mata dadu kurang dari 4 kalo yang muncul angka ganjil?
Pertama, kita hitung kejadian yang jadi syarat yaitu muncul mata dadu ganjil. Kejadian yang mungkin itu {1,3,5}. Nah sekarang kejadian yang dicari yaitu dapet mata dadu kurang dari 4. Berarti yang memenuhi cuma {1,3}.
Karena kejadian yang memenuhi cuma 2 dari 3 kemungkinan kejadian muncul mata dadu ganjil, maka peluangnya 2/3 atau sekitar 66.7%.
Gimana, udah paham belom nih?
Nah itu tadi kalo kita hitung pake intuisi yaa. Sekarang kita bahas caranya pake persamaan matematis dari peluang bersyarat.
Ruang sampel dari pelemparan dadu itu {1,2,3,4,5,6}.
Kejadian muncul mata dadu ganjil itu {1,3,5}.
Jadi peluang muncul mata dadu ganjil 3/6
Sedangkan kejadian muncul mata dadu kurang dari 4 itu {1,2,3}.
Irisan dari 2 kejadian tadi {1,3}.
Dan peluang irisannya terjadi adalah 2/6
Setelah tau beberapa informasi di atas, tinggal hitung pake rumusnya aja deh.
P(Kurang dari 4 | Ganjil) = P(Kurang dari 4 dan Ganjil) / P(Ganjil) = (2/6) / (3/6) = 2/3
Nah kalo udah paham itu semua, sekarang kita bisa masuk ke Aturan Bayes. Aturan Bayes ini menggambarkan probabilitas suatu peristiwa, berdasarkan pengetahuan sebelumnya tentang kondisi yang mungkin terkait dengan peristiwa tersebut.
Secara matematis, Aturan Bayes itu dituliskan gini
Okee kalo udah paham kita kembali ke masalah awal tadi.
Menurut teorema Bayes, peluang munculnya penyakit dengan hasil tes negatif dapat diperoleh dengan mengalikan peluang terinfeksi penyakit C dan peluang terdeteksi negatif tapi terinfeksi penyakit, kemudian bagi dengan peluang hasil tes negatif.
Pake data yang kita punya di awal tadi, perhitungannya jadi gini dehh
Hasilnya sekitar 5,26%. Artinya, setiap 20 orang yang dapet hasil tes negatif, ada 1 orang yang sebenarnya terinfeksi penyakit tersebut.
Ternyata memang stats itu dekat banget kan sama kehidupan manusia! Hal-hal simpel seperti ini bisa banget diterapkan di kehidupan kita. Dan konsep stats yang lebih keren lagi bisa kamu dapetin di kelas Non-Degree Pacmann lho!
Kebetulan banget juga kita baru aja update versi dari Non-Degree kita jadi lebih terjangkau, faster track, opsi cicilan dengan bunga 0%, dan masih banyak lagi! Liat-liat dulu yuk kelasnya di sini: bit.ly/PacmannioTwitt…
Mimin dulu belajar coding html di notepad berasanya udah keren banget gasih?! 😆😅
Dulu inget banget nih, belajarnya pas pelajaran komputer waktu SMP. Sekelas terseok-seok belajarnya, tapi begitu dijalanin dan bisa, pada teriak-teriak saking kesenengan karena keren 😂🤣
Dan tentunya yang paling jago coding di kelas jadi anak kesayangan guru dan selalu disamperin anak-anak lain buat ditanyain 😂
Building data scientist portfolio to land a job
.
.
.
A thread
Menurut kalian, penting ga sih seorang DS punya portfolio?
Pernah ga kalian liat job opening buat entry level yang requirementnya gak masuk akal? Udah mah fresh graduate tapi minimal punya beberapa tahun experience, misalnya?
Gini loh cara abang kurir nyari jalan tikus🛵🐀
Introduction to Particle Swarm Optimization
.
.
.
A thread
“MISI PAKETTT!!”
Hayoo siapa yang semangat waktu dengar kata itu. Mimin yakin deh, yang awalnya mager dan rebahan pasti langsung semangat. 11-12 lah sama keterima SBMPTN 🤣🤪
Tapi kalian pernah kepikiran gak sih jalan tikus si abang kurir? Coba tebak mereka nemunya dari mana hayoo
Nurunin cost of production dengan scheduling ?!⌛️💸
Kenalan sama job shop problem yuk!
.
.
.
A thread
Dengan begitu banyaknya model baju yang diproduksi oleh 1 brand aja, kadang mimin mikir gimana ya alur produksinya, apalagi mesin yang digunakan buat semua model baju itu sama.
Lebih tepatnya gini, gimana sih cara pabrik ngatur jadwal pemakaian mesin mereka untuk memproduksi berbagai model baju yang berbeda?