Enam alasan kenapa project DS sering gagal. 🥲🤦
Jangan sampai terjerumus ke 6 penyebab ini!
.
.
.
A thread
Pernah gak sih udah cape-cape begadang berminggu-minggu bikin model tapi kok ga selesai-selesai? Atau mungkin modelnya udah jadi tapi ternyata ga memberikan insight sesuai yang diminta atasan? 🥲🥲🥲
Yaa, kita semua setuju lah ya hal-hal di atas jadi nightmare banget, dan sebisa mungkin kita mau menghindari project menjadi gagal. Nah, makanya di thread kali ini, mimin mau bahas beberapa alasan yang bisa menyebabkan project kita fail. Langsung aja ke alasan yang pertama
(1) Kita ga memahami apa yang diminta oleh user. Sebagai seorang Data Scientist, pasti kita sering nih diminta user untuk mencari insight dari data yang ada, misalnya nyari trend market dan penyebabnya, dll.
Yang sering menjadi masalah adalah kita kadang ga menangkap sebenarnya apa yang sebenarnya user butuhkan. Kadang user bisa menjelaskan dengan efektif apa yang ia mau, tapi case nya kan ga selalu kaya gitu.
Ada saatnya dimana user ga bisa mentranslate apa yang ingin ia kerjakan ke apa yang ia ingin ukur. Untuk mencegah model kita ga sesuai kemauan user dan malah jadinya sia sia, kalian bisa memastikan ‘pemahaman’ kalian dengan 3 pertanyaan ini:
Pertama, tanyakan apakah kamu benar-benar paham apa yang stakeholder butuhkan? Kedua, apakah kamu paham apa yang stakeholder ga katakan tapi sebenarnya mereka membutuhkan hal itu? Ketiga, apakah kamu tau siapa aja yang kira-kira bakal butuh insight ini selain si stakeholder?
Kalau kamu ga bisa menjawab 3 pertanyaan tersebut dengan yakin, ga ada salahnya untuk reach out dan make sure lagi apa yang akan kamu kerjakan nantinya. Toh, mencegah lebih baik kan daripada revisian mulu.
(2) Kurangnya ‘check-in’ selama mengerjakan project. Kesalahan ini sebenarnya masih berkaitan nih sama yang pertama. Biasanya, ketika mengerjakan project, kita cenderung mau kerja sendiri dulu sampai ada hasilnya, baru deh ngasih ke stakeholder.
Padahal, tanpa adanya ‘check-in’ atau pengawasan yang reguler dari stakeholder, bisa aja project yang kamu lakukan malah jadi menyimpang dari tujuan awalnya, dan akhirnya revisian lagi deh.
Iya sih, terkadang melibatkan stakeholder dalam proses itu membuat kita ga begitu nyaman, apalagi kalau kita harus ngasih tau progress padahal semuanya masih mentahan dan belom ke developed.
Belom lagi, kalau ada feedback, berarti kamu harus revisian. Tapi, kalau dipikir-pikir, dengan melibatkan stakeholder buat ngasih masukan di tengah-tengah pekerjaan kamu, kamu jadi bisa menghindari nightmare tadi tuh
Dan pastinya hasil akhir model yang kamu buat juga udah sesuai banget sama kebutuhan stakeholder.
(3) Underfitting atau overfitting. Sekarang kita masuk ke yang lebih tekninkal ya. Kesalahan umum yang terjadi adalah overfitting, yaitu ketika training, modelnya bekerja dengan baik, eh tapi giliran di testing ambyar.
Sebaliknya, kalau underfitting ya model kita emang ga fit aja dari awal, ujung-ujungnya merembet ke masalah lain deh. Yaa, dari sini udah jelas kan kedua masalah ini haru diberesin.
Salah satu cara untuk menyelesaikan hal ini adalah dengan menggunakan dataset yang lebih balance, entah itu dengan cara nge-dropout, ningkatin atau nurunin trainable parameters nya, dan masih banyak lagi.
(4) Kurangnya pemahaman dan riset yang mendalam. Langkah pertama untuk menyelesaikan project yaang kompleks adalah memastikan kalau kamu udah punya resource dan reference terkait topik project tersebut.
Again, research itu merupakan aspek integral dalam Data Science, jadi pastikan kalau kamu udah melakukan riset dan punya pemahaman konseptual, teorretikal, dan praktikal dari project yang lagi kamu kerjakan.
Semakin dalam pemahaman kamu, semakin banyak juga ide yang bisa kamu implementasikan untuk project tersebut. Intinya adalah, jangan meremehkan kekuatan riset deh!
(5) Ga mencoba berbagai algoritma dalam satu project. Mungkin beberapa dari kalian memegang prinsip ‘yang penting selesai dan sesuai tujuan’. Asal projectnya udah jadi dan sesuai dengan tujuan, ya selesai juga tugas kalian.
Walaupun gitu, ga ada salahnya mencoba berbagai algoritma untuk projectmu. Dengan begini, kamu ga hanya mendapatkan pemahaman yang lebih mendalam terkait projectnya, tapi juga bisa menemukan model-model lain yang lebih baik dibandingkan yang dipakai sebelumnya.
Have fun aja dan explore berbagai ide dan model yang bisa kamu buat dalam jangka waktu pengerjaan project. Toh, kalau ada model yang lebih baik, kenapa tidak dipakai? Jadi ga ada salahnya nih untuk coba-coba berbagai algoritma machine learning dalam satu project.
(6) Gak up-tp-date. Bidang data science 11 12 lah sama teknologi, perkembangannya cepet banget, bisa aja apa yang populer sekarang ga lagi dibutuhkan di masa depan. Makanya kalian harus tetap up to date terhadap perkembangan di bidaang ini.
Caranya dengan tetap membaca berbagai penelitian terbaru di bidang Data Science, buku-buku relevan, artikel, youtube video, dll. Kalau kalian nemu sesuatu yang baru, misalnya algoritma baru, coba lah buat mengimplementasikannya secara langsung.
Kebiasaan ini bakal membantu kamu buat paham konsep, dan praktek dari algoritma baru tersebut. Dan yang pastinya, kamu jadi lebih inget lebih lama sama apa yang kamu pelajari.
Selain itu, dengan nyari tau apa aja penemuan terbaru di bidang Data Science, pilihan penggunaan algoritma yang bisa kamu pakai juga lebih banyak, dan siapa tau algoritma terbaru ini lebih cocok digunakan di project kamu dibandingkan algoritma yang sekarang lagi dipakai.
Perlu diingat kalau bidang ini punya alur pembelajaran yang curam dan berkelanjutan, jadi jangan sampai kalian punya mindeset ‘pengetahuan udah cukup kok’, bahaya banget!
Kira-kira itu 6 kesalahan yang sering dilakukan dan beresiko membuat project yang kalian kerjakan jadi fail. Nah, selain solusi yang udah disebutin tadi, sebenarnya mimin masih punya solusi lain nih untuk mencegah project gagal, yaitu pakai MLops!
Kamu bisa nyari tau lebih dalam tentang MLops, apa kegunaannya, dan seluk beluk lainnya di webinar MLops yang bakal diadaiin hari Selasa, 04 Mei 2021 dari jamm 16.30 - 17.30. Info lengkapnya bisa kalian liat di poster ini yaa
Jangan sampai ketinggalan, mumpung webinarnya GRATIS. Jadi segera daftarin diri kamu di bit.ly/PendaftaranPac…, see youu!

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Follow us on instagram: @pacmannai

Follow us on instagram: @pacmannai Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

30 Apr
Mau punya model bagus tapi datanya imbalanced? 😢🤷‍♂️
Catat 3 solusinya!
.
.
.
A thread
Suatu hari, kita diminta klien membangun model machine learning yang bisa mendeteksi tumor ganas pada lambung pasien. Kemudian, dengan memakai dataset berisi kumpulan CT-Scan perut, kita buat model yang memprediksi apakah seorang pasien menderita kanker lambung atau tidak.
Tapi masalahnya, ‘Gastric cancer’ atau kanker lambung ini tergolong sangat jarang temen-temen. Bahkan di Indonesia, resikonya itu cuma sekitar 0.0028%. Itu artinya, kalau kita sampling 100.000 orang, kemungkinannya kita cuma akan peroleh 3 sampel data penderita kanker lambung!
Read 34 tweets
30 Apr
Butuh kedewasaan untuk mengakui pekerjaan kita gak perlu pakai model/tool yang paling canggih.

Butuh kedewasaan untuk mengakui model yang dibutuhkan gak njlimet pakai Deep Learning Transformers, tapi pakai Logistic Regression aja bisa.
Menurut gue ini penyakit semua orang yang baru masuk ke industry ya, terlepas industry nya apa aja.

Gue juga dulu pas kerja pertama jadi DS di 2015, semua model mau gue deeplearning-kan-saja-semua.
Namun ya gue ke sini mikirnya adalah bikin model yang:

1. Mudah
2. Sederhana
3. Cepat
4. Gampang lo debug
5. Gampang di-tuning, yang ini adalah hasil diskusi dengan teman kemarin di suatu kantor berita.
Read 8 tweets
29 Apr
Udah buat program tapi bingung evaluasinya gimana?🧐🤔
Pakai Difference in Difference aja!
.
.
.
A thread
Mimin yakin tempat kerja kalian pasti pernah membuat program baru / keputusan krusial. Setelah membuat program baru ini, tentunya ada outcome yang diharapkan dong, kalau ga ya ngapain repot-repot bikin program?
Yang menjadi pertanyaan adalah, gimana caranya kita tau kalau program ini memiliki dampak yang signifikan?
Read 32 tweets
29 Apr
Katanya mau jadi Data Scientist, tapi masih takut statisik? 🤨😱
Kenalan sama basicnya dulu yuk!
.
.
.
A thread
Hayoo siapa yang disini lagi mau banting setir buat ngerambah dunia perdataan dan jadi Data Scientist?
Kalau kamu udah mau menyelami profesi ini, ada baiknya nih tau dulu kira kira kamu bakal berurusan sama apa sih ketika jadi DS nanti? Biar kebayang, kamu bisa liat diagram venn dibawah ini nih:
Read 8 tweets
28 Apr
Central Limit Theorem: kenyataan pahit yang ga semua orang tahu📊
Introduction to Cauchy Distribution
.
.
.
A thread
Central limit theorem? Hmm.. udah sering banget ga sih denger teorema ini? Tapi kalo Cauchy Distribution, udah pada tau belum, nih?
Central Limit Theorem itu kan bunyinya gini: distribusi dari rata-rata sampel variabel acak yang gak di-generate dari dist Gaussian biasanya akan jadi Gaussian kalo misalnya ukuran sampelnya cukup besar. Image
Read 29 tweets
28 Apr
Mau jadi Data Scientist dengan gaji diatas 2 digit?🤑📈
Nih, ikutin tips nya!
.

.

A Thread
(image credit: unsplash.com/@jpvalery) Image
Coba tebak-tebakan dulu: Berapa sih gaji Data Scientist di Indonesia?
Sebenernya, ketiga opsi itu nggak ada yang salah guys HEHE. Soalnya, penentuan gaji seseorang bakal dipengaruhi oleh banyak hal, meski punya titel sama sebagai ‘Data Scientist’.
Read 34 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!