Sudah 7 tahun kerja sebagai Data Scientist, berikut adalah apa yang gue kerjakan dan kenapa gue hanya mau digaji mahal:
1. Hal pertama yang gue kerjakan sebagai data scientist adalah membuat dokumen bisnis proses.
Kenapa dokumen ini dibuat? karena kalau gak ada dokumen ini, gue gak tahu apa aja yang mesti dimodelkan.
Gue harus interview semua department dan menurunkan business process nya. Kebanyakan di perusahaan, terlebih di perusahaan rintisan, dokumen ini gak ada sama sekali.
Gue harus ngobrol sama tim operation, tim sales, tim marketing, tim HR, dll.
2. Hal kedua yang harus gue buat adalah menurunkan business metrics dari perusahaan.
Emang perusahaan gak punya? Ya punya, tapi paling cuma sales aja. Gue harus turunkan business metrics ini dan backtracking semua metrics yang gue buat.
Kenapa hal ini harus dibuat?
Karena gue butuh measurable metrics kalau sistem/model yang gue buat beneran memperbaiki perusahaan. Kalau gak ada metrics-metrics ini, perusahaan gak akan tahu kalau mereka berkembang atau enggak.
3. Hal ketiga yang gue turunkan adalah membuat list of models yang bisa optimisasi business metrics dan business proses tersebut.
Gue perlu menerka-nerka, diskusi dengan semua department, dan menurunkan servis apa yang diperlukan agar mereka terbantu.
Lo pernah gak mengalami kalau model yang lo buat itu return nya rendah? ROI nya rendah, tapi model jadi prioritas.
Ngapain dibuat? Salah arah? Hal ini bisa dihindari dengan melakukan 3 hal di atas.
4. Hal keempat yang gue lakukan adalah melakukan riset.
Iya model yang gue propose di step sebelumnya itu butuh riset mendalam.
Modelnya apa? cost functionnya apa? Perkembangan modelnya apa? Model apa yang paling mudah dikerjakan dulu? Ada gak di github orang? lol... Modelnya asumsinya apa? Berapa lama gue bisa mengerjakannya? Apa yang gue lakukan kalau modelnya gagal mengoptimisasi business metrics?
5. Hal kelima adalah update knowledge untuk Math, Stats, ML.
Gak akan selesai-selesai bos belajar beginian, sampai lo pensiun. Selalu ada model yang belum dipelajari. Lo harus update pengetahuan lo.
6. Hal keenam yang perlu gue kerjakan adalah mempelajari sistem/library yang biasanya dipakai di industri. Kiblat gue adalah tim DS di Facebook, AirBnB, Spotify, Uber, dll. Tim-tim ini sering banget menjelaskan sistem mereka di conferences. Gue tonton semuanya sampai habis.
7. Hal ketujuh yang gue kerjakan adalah membuat tim, membentuk sistem kerja dan tanggungjawab dari masing-masing tim.
Iya, gue yang hire, ngetes, kasih job desc dan bikin hiring strategy dari ini semua. Gak mungkin dilepas ke tim HR untuk ini.
8. Desain MLOps dengan tim engineer. MLOps karena punya intersection dengan ML dan Engineering pastilah butuh diskusi dengan keduanya.
Butuh diskusi untuk menciptakan sistem yang robust dengan "technical debt" rendah dan maintenance yang mudah.
9. Diskusi dengan tim business untuk deploy ML System.
Ini harus dijelaskan ke mereka tentang cara kerja model, cara pakai, limitasinya. Gak sekali jelasin langsung ngerti, ini perlu berkali-kali dijelaskan.
10. Disuruh bikin "Data Culture" di perusahaan.
Beberapa kali didatangi oleh "atasan" atau CTO untuk diminta mengajarkan cara mengolah data ke orang bisnis. Misal cara penggunaan statistics di perusahaan, cara visualization, cara menggunakan SQL...
Atau dijelaskan masalah orang bisnis dengan data paling bikin runyam....... kenapa mereka gak boleh simpan data di excel, di email mereka, tanpa versioning, dan tanpa updates.....
Susah lagi ini....
Mungkin semua hal yang dijelaskan ini bukan role junior Data Scientist. Lebih mirip ke VP Data atau Head DS. Namun ini lah yang gue kerjakan dan gue gak mau murah digaji untuk mengerjakan semua ini.
Kalau ada perusahaan yang mau hire gue, gue akan jelaskan itu hal-hal yang gue akan kerjakan.
Untuk hal ini gue meminta gaji sekarang nett Rp 80jt++
Kalau di bawah ini sih gue memilih ternak lele.
Kalau pekerjaan kalian ada sebagian dari yang gue kerjakan dan merasa susah, gak semua orang bisa, atau harusnya dikerjakan oleh beberapa orang....
Ya gpp lah kalian minta gaji yang mahal!
• • •
Missing some Tweet in this thread? You can try to
force a refresh
Regresi buat data kategorik?🧐
Introduction to logistic regression
.
.
.
A thread
Ketika kamu mau bikin model ML pake regresi tapi ternyata data kamu berbentuk kategorik, apa yang kamu lakukan?
Yep, pake regresi buat data kategorik! Loh emang bisa? Bisa dong, tapi pastinya bakal beda sama regresi linear biasa, soalnya kita bakal pake yang namanya regresi logistik.
Pengalaman gue jadi Data Scientist 7 tahunan ini, permasalahan paling sulit itu bukan data, atau algoritma, bukan juga model accuracy.
Permasalahan paling sulit adalah membuat orang bisnis paham limitasi dari model, memahami fungsi model dan membuat mereka skeptis dengan sehat atas kemampuan model.
Deployment juga tidak susah. Yang susah adalah perubahan prioritas dari manajemen dalam modeling. Model sering dijadikan gimmick oleh perusahaan menjadi "data driven" atau "AI company".
Racik minuman pakai data checckk!🍻🧑🍳
Pemanfaatan data untuk industri fnb
.
.
.
A thread
Trend makanan minuman berubah-ubah mulu yaaa. Dulu mimin inget banget thai tea booming dan dijual dimana manaa. Eehhh terus ga lama muncul bobba yang trendnya barengan sama kopi gula aren gituu. Favorit kamu yang mana nih?
Anywayy, trend ginian tuhh cenderung berubah terus yaa seiring berjalannya waktuu. Kira kira kedepannya minuman apa nih yang bakal trending?
Ini mimin bahas dari layout aja yahh, buat pembelajaran kita tentang golden ratio kemarin. Dan juga cuma beberapa elemen, engga semua. Minpe yakin lah #SekelasUI engga mungkin bikin kesalahan-kesalahan pemula 😂
Pakai matematika biar ✨aesthetic✨?
Introduction to golden ratio
.
.
.
A Thread
Pernah ga sii kalian kepikiran make matematika buat art kalian biar ✨aesthetic✨?
Di thread kali ini, mimin mau nunjukin betapa matematika bener-bener deket sama kehidupan manusia, bahkan di hal-hal yang kita engga sadari. Ini juga bisa menjadi suatu “bukti” kalo emang matematika engga bakal bisa lepas dari kehidupan manusia
Ngukur performa model mulu, ngukur performa DS nya kapan?🧑💻🧠
Key Indicator Performance untuk Data Scientist!
.
.
.
A thread
Mimin penasaran dehh, buat temen-temen Data Scientist disini kalau habis ngerjaiin project tuhh bakal dieveluasi gitu ga sii? Eeehh-- bukan performa modelnya, itu mah sudah byasaa~.
Maksud miminn ituu kinerja kalian gitu yang dievaluasii, bukan cuma modelnyaa hehehe.
Pengeluaran perusahaan untuk data scientist team itu pasti gak main-main, jadi para stakeholders mau tau dong apakah ‘investasi’ mereka buat hire data scientist itu paid off well atau engga.