Memahami kontribusi features pada model ML.
Intro to Interpretable Machine Learning menggunakan SHAP Values (Part I)
.
.
.
A Thread
Halo guyss, pernah gak sih kalian penasaran, kira-kira seberapa besar yaa kontribusi tiap-tiap features dari model yang kita buat??
Kali ini mimin akan bahas salah satu tools yang digunakan dalam Interpretable Machine Learning: “SHAP Values“. Tapi sebelum masuk kesana, yukk kita pahami dulu apa sih Interpretable ML
Dalam dunia ML, meskipun suatu model udah sering digunakan, tetap aja sebagian besarnya seakan-akan kotak hitam buat kita, gelap dan isinya gak bisa diketahui, kayak isi hati doi 😁️ Nah, disinilah muncul interpretable ML untuk untuk menjelaskan cara kerja model kita.
Studi tentang Interpretable ML ini dapat mengatasi stigma “kotak hitam” (black boxes) terhadap ML, yang di mana bahkan perancangnya nggak bisa menjelaskan kenapa model ML nya bisa sampai pada keputusan tertentu.
Nah, kemudian apa sih itu menginterpretasikan suatu model ML supaya mudah dipahami ? Ada tiga poin utama yang dapat kita jadikan acuan untuk melakukan Interpretasi model ML, yaitu What, Why, dan How. Yuk kita pahami !
Pertama, What, pahami apa yang membuat model bisa memprediksi. Dari sini kita akan mengerti gimana sih interaksi tiap features, sehingga bisa menentukan kira-kira features mana yang akan menjadi penting untuk pengambilan keputusan dari model ML kita.
Hal ini akan memastikan “fairness” dalam model yang kita miliki.
Kedua, Why, kita pahami kenapa model kita memilih untuk mengambil suatu keputusan tertentu. Dengan memahami ini, kita akan bisa memvalidasi apakah features tertentu berpengaruh terhadap pengambilan keputusan, sehingga hal ini akan memastikan model kita dapat dipertanggungjawabkan
Ketiga, How, kita memastikan bagaimana kita bisa memastikan model kita ini dapat digunakan dengan tepat. Poin ini memastikan kita untuk bisa mengevaluasi dan memvalidasi tiap tiap data poin serta bagaimana cara model kita mengambil keputusan terhadapnya.
Nah hal ini akan memastikan transparansi dalam model kita.
Tingkat mudah-sulitnya suatu model machine learning untuk kita pahami “cara pengambilan keputusannya” melalui 3 poin tadi (What, Why, How) dapat disebut sebagai interpretability, atau sebutan lainnya, Human human-interpretable interpretations (HII).
Semakin tinggi tingkat interpretabillitynya, maka akan semakin mudah pula model ML tersebut untuk dijelaskan cara pengambilan keputusannya.
Selanjutnya mungkin kalian bertanya “sesulit itukah min menjelaskan model ML? kenapa harus ribet banget yahh” jawabannya.. tergantung. Kok bisa?
Dalam studi tentang Interpretable ML, terdapat istilah umum “Interpretability and complexity Trade off”. Semakin mudah suatu model untuk dijelaskan, maka model tersebut semakin tidak kompleks.
Tapi sebaliknya jika mimin menggunakan model yang kompleks, maka akan lebih sulit juga model itu untuk dijelaskan. Maka kita harus pilih antara interpretability untuk membuat model lebih mudah dijelaskan atau complexity untuk membuat model lebih akurat.
Masih bingung ?? Okee mimin ambil contoh dari model sederhana ya, yaitu regresi linier berganda. Sebagaimana kita paham regresi linier berganda memiliki model seperti pada gambar berikut. Image
Model tersebut kita gunakan untuk memprediksi apakah seseorang menyukai game komputer, berdasarkan umur (age), jenis kelamin (gender), dan pekerjaan (occupation) orang tersebut. Image
Nah dari sana, kita bisa tau features yang kita masukkan ialah x_Age, x_Gender, dan x_Occupation. Maka untuk menjelaskan seberapa pentingnya tiap features merupakan hal yang mudah, kita hanya perlu melihat seberapa besar koefisien ϕ pada tiap-tiap features.
Sebagai Contoh jika ϕ_Age besar (koefisien pada features Age), akan menandakan bahwa features Age memiliki pengaruh besar terhadap model tersebut. begitu juga akan berlaku sebaliknya jika koefisien tersebut kecil maka pengaruh x_Age tidak signifikan terhadap model.
Nah karena model kita regresi linier, maka ia hanya bisa digunakan untuk data yang memiliki hubungan linier. Pertanyaannya, gimana caranya menentukan features importance jika ternyata pada rentan umur 12-18 seseorang lebih suka bermain game dibanding umur lainnya ??
Yap, jawabannya ‘nggak bisa’ karena data memiliki hubungan non-linier, maka membutuhkan model yang lebih kompleks. Nah, sekarang, gimana cara kita menjelaskan model yang kompleks? Lanjut yaah!
Untuk menginterpretasikan model yang complex, mimin akan ambil model kompleks yang telah mempelajari pola non-linier dalam data lalu kita akan pecah menjadi banyak model linier yang mendeskripsikan titik data individual.
Dengan demikian, jika menggabungkan semua model individual yang sederhana ini, kita akan bisa dapatkan gimana sih model itu berperilaku pada tiap-tiap orang yang akan diprediksi.
Nah tapi, penting untuk dicatat, bahwa koefisien ϕ yang kita gunakan ini bukan lagi hasil dari model ya, melainkan apa mimin gunakan untuk menginterpretasikan model ini.
Sebagai contoh, ada seorang bernama Frank yang bekerja sebagai penguji game dan memiliki usia 50 tahun, dia suka dengan game komputer, Maka, Frank akan memiliki koefisien ϕ_Job yang tinggi, sedangkan koefisien ϕ_Age akan rendah.
Selanjutnya, bagi Bobby yang juga suka dengan game komputer , jika ia 14 tahun dan tidak bekerja, ϕ_Age akan menjadi tinggi karena model melihat bahwa anak 14 tahun cenderung menyukai game komputer.
Sebagai tambahan untuk menyederhanakan model kita. Maka tiap-tiap koefisien akan kita kalikan dengan 1 atau 0 tergantung keberadaaan featuresnya. contoh jika Bobby tidak bekerja, maka ϕ_Occupation akan kita kalikan dengan 0 Image
Hal ini jika kita lakukan untuk tiap data poin lalu kita gabungkan, maka kita akan mendapatkan pemahaman bagaimana cara model kita bekerja secara global. selanjutnya kita tinggal pahami gimana cara menghitung angka koefisien ϕ. Disinilah kita akan menggunakan Shapley Value😎
Shapley Value diambil berdasarkan Cooperative Game Theory. Kita bayangkan ada sekelompok orang bermain game, di akhir permainan tiap orang menerima hadiah sesuai dengan kontribusi masing-masing. Gimana cara membagi hadiahnya ??
Nah sesuai ketentuan Shapley Value, ada aturan-aturan supaya pembagiannya menjadi adil dan sesuai kontribusi. Yuk ikutin terus thread pacmann untuk pembahasan lanjutannya yaah 😁️
Gimana, jadi tau kan interpretable Machine Learning. Kalau kalian mau dalemin lagi gimana sih konsep machine learning dan juga penerapannya, langsung aja belajar bareng di non degree program Data Scienctist Pacmann.AI!
Kalian bisa liat apa aja yang akan dipelajari di non degree program DS di bit.ly/BrosurSingkatP… atauu kalau ada yang mau ditanyaiin bisa chat kami di bit.ly/WASalesPacmann. Buruan daftar, mumpung masih ada THR dari Pacmann, jangan sampai kelewatan yaa! Image

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Follow us on instagram: @pacmannai

Follow us on instagram: @pacmannai Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

27 Apr
Dulu dipakai perang, sekarang dipakai modeling🗡️🛡️
Intro to ROC-AUC

.
.
A thread
Minggu pagi 7 Desember 1941, 420 pesawat pengebom milik Kekaisaran Jepang menyerang pangkalan militer Amerika Serikat di Pearl Harbor, Hawaii. Lebih dari 20 kapal, 323 pesawat, dan 3000 tentara AS menjadi korban dalam 'surprise attack' selama 2 jam tersebut. Image
Peristiwa ini akhirnya menyeret AS untuk bergabung dengan Sekutu dan mengubah peta pertempuran Perang Dunia II setelah esok harinya, 8 Desember 1941, Presiden AS Franklin D. Roosevelt mendeklarasikan perang dengan Jepang. Image
Read 34 tweets
26 Apr
Intip cara netflix rekomendasiin film yuk!📺
Penerapan recommender system (RecSys)
.
.
.
A thread
Pernah ga sih kalian kepikiran pas buka netflix, kok bisa netflix rekomendasiin film atau series yang patut kalian tonton selanjutnya itu cukup relate sama film atau series yg barusan selesai kalian tonton?
Tenang, netflix itu gak memata-matai kalian kok sampe bisa tau genre film apa yang kalian suka. Mereka bisa tau dan sampe bisa merekomendasikan next movies itu dengan menggunakan Recommender System (RecSys)
Read 41 tweets
25 Apr
Memahami kontribusi features pada model ML.
Intro to Interpretable Machine Learning menggunakan SHAP Values (Part II)
.
.
.
A Thread
Haloo guys, masih ingat pembahasan kita tentang Interpretable ML kemarin?
Tenang, bagi kalian yang kemarin ketinggalan threadnya, ga usah cape cape scroll, langsung aja cek yah pembahasannya di sini
Read 33 tweets
25 Apr
Siapa bilang Data Scientist cuma butuh ngasah technical skill?🙇👨‍💼
Jangan tinggalin soft skill dong!
.
.
.
A thread
“Hard Skill--or Technical Skill--make you qualified for the job, but soft skill will make or break your career.” Pernah denger quotes semacam itu?
Kalau kamu search di google, kamu bisa nemuin banyak quotes-quotes tentang softskill dengan kalimat yang beragam. Tapi semua quotes itu punya inti yang sama: pentingnya soft skill dalam karir.
Read 33 tweets
24 Apr
Senangnya bisa bergabung dengan:

Gerakan Separatis Statistikal (meme) Garis Keras untuk Bayesian dan Frequentist
😭😥🤣 Image
🤣🤣🤣🤣🤣🤣🤣🤣🤣🤣🤣 Image
Read 6 tweets
18 Apr
NLP bantu cegah osteoporosis, emang bisa?🦴🧓
.
.
.
A thread
Hayoo, siapa yang udah pernah ke radiologi?
Kita akan memulai thread dari penjelasan mengenai radiologi dulu, biar nanti kedepannya ga bingung hehe.
Read 36 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!