Intip keseharian machine learning engineer Airbnb yuk!🧑💻👩💻
PS: ada bonus tips jadi machine learning engineer di Airbnb loh!
.
.
.
A thread
Siapaa disini yang belum pernah denger Airbnb?
Airbnb sendiri merupakan online marketplace yang mempertemukan penyedia jasa homestay dengan customernya. Platform ini bisa diakses melalui website dan juga aplikasi handphone.
Nah, yang namanya menyediakan jasa platform homestay, Airbnb ini mencegah hal-hal yang tidak diinginkan (contohnya sex offenders, trafficking), makanya mereka melakukan background check terhadap penggunanya.
Kalau dilihat dari websitenya, disebutkan bahwa jika mereka memiliki informasi yang cukup tentang user nya, seperti misal nama depan dan belakang serta tanggal lahirnya, Airbnb bisa melalukan pengecekan ke database publik dan catatan kriminal
Termasuk juga dengan melihat apakah pengguna ini masuk ke dalam list ‘sex offender’. Ini berlaku both ways ya, baik yang menjadi host homestay nya atau orang yang mau menginap.
Selain itu, Airbnb juga melakukan pengecekan pada OFAC list, yaitu daftar yang berisi orang-orang atau organisasi yang terlibat dalam penyeludupan narkoba, teroris, dan program-program berbahaya lainnya. Lengkapnya cek disini aja: airbnb.co.id/help/article/1…
Lalu siapa yang bertugas melakukan tugas ini? Yep, sesuai dengan judul thread, hal tadi merupakan jobdesc dari machine learning engineer di Airbnb.
Secara umum, machine learning engineer di Airbnb bertugas untuk membuat infrastruktur machine learning dan modelnya serta memastikan bahwa keduanya tetap bekerja.
Project utama yang mereka lakukan itu yang tadi mimin sebutin. Nah, ternyata mereka ga hanya mengandalkan database pemerintah aja, tapi juga meng-’ekstrak’ informasi dari berita di internet.
Hal ini dilakukan karena database tadi diupdate secara berkala gituu, jadi mereka juga butuh tau kejahatan apa sih yang sekarang lagi terjadi
Traditional background check ga bisa cover 100% profile orang, jadi mendeteksi ‘bad actors’ dari berita bisa membantu Airbnb untuk mendepak bad actors tersebut dari platform.
Sayangnya, project ini menemui kendala. Contohnya gini, sistem bisa dengan mudah mendeteksi ada kejahatan ketika melihat kalimat ‘Madhu melakukan kejahatan di Kota Semarang’.
Tapi beda kasusnya dengan kalimat ‘Madhu terakhir dilihat di Kota Semarang, ia melakukan kejahatan disana’. Nah, sistem ga bisa mendeteksi kata ‘ia’ ini mengacu ke siapa, padahal kan itu mengacu ke ‘Madhu’ yang ada di kalimat sebelum koma.
Dan untuk mencari data tentang masalah ini juga sulit. Maka dari itu, machine learning engineer di Aibnb memakai workflow information retrieval yang dibuat Standford University. Workflow ini menggunakan experti intuition untuk melabel dataset besar.
Pilihan ini jauh lebih oke dibandingkan harus melabeli data artikel dan berita secara manual. Okee, kita lanjut, lalu tools apa aja yang baisa digunakan oleh machine learning engineer di Airbnb?
Awalnya, mereka memakai ruby on rails, nah tapi akhirnya bermigrasi ke JVM based infrastructure. Ketika melakukan training data, biasanya mereka menggunakan Jupyter untuk mengexplore dan memodeling data.
Sedangkan untuk proses labelling data, mereka menggunakan internal tools seperti flask application untuk menganotasikan artikel berita. Terakhir, untuk modelling, pilihan tools jatuh kepada XGBoost.
Sama seperti sequence model yang biasa dipakai e-commerce untuk memantau berbagai aktivitas user, seperti waktu login, waktu pembelian, dll.
Sampai sini, tertarik untuk bekerja sebagai machine learning engineer di Airbnb? Kalau ya, catat tips berikut ya!
Untuk menjadi machine learning engineer di Airbnb, tentunya kamu melewati beberapa proses rekrutment. Nah, nanti proses interviewnya sendiri akan terbagi menjadi beberapa kalii.
Kandidat akan ditanya mengenai pengetahuannya tentang algoritma, machine learning tools yang biasa digunakan dan pastinya kandidat akan benar-benar dicek apakah memang menguasai tools tersebut.
Tidak lupa, kandidat juga diminta untuk menceritakan bagaimana pengalamannya di dunia per-machine-learningan.
Menceritakannya ini ga cuma sekedar ‘dulu gua pernah kerja di perusahaan X, Y, Z sebagai machine learning engineer’, tapi meliputi apa yang bisa diperbaiki dari model yang dulu pernah kamu buat, dan pertanyaan-pertanyaan yang mengulik seberapa menguasai kamu di bidangi ini.
Kandidat juga akan dilihat apakah memiliki kemampuan eksekusi yang baik dengan waktu yang terbatas, dan melihat apakah keputusan yang diambil dapat diimplementasikan dan bekerja dengan baik, tidak hanya sekedar bagus ketika training saja.
Jangan lupa tonjolkan kalau kamu memiliki satu spesialisasi. Loh kok cuma satu? Yaa, bidang machine learning ini kan benar-benar growing dengan sangat cepat. Agak mustahil bagi seseorang kalau dia bisa baik di semua cabang machine learning.
Maka dari itu, kalau kamu udah expert banget dalam 1 hal, ya tunjukkin hal tersebut. Gimana caranya? Lewat project-project yang udah dikerjakan sebelumnya.
Misalnya, kalau expert di NLP, ya buatlah 2 atau 3 project yang ‘wah’ tentang NLP, alih alih membuat project biasa aja di berbagai cabang.
Oh iya, Airbnb sangat menghargai core value yang mereka junjung. Maka dari itu, ada baiknya kandidat mencari tahu bagaimana culture di Airbnb. Culture sangatlah penting sebab hal ini memastikan agar kandidat tidak akan mengacaukan sesuatu bila nanti bekerja.
Sampai sinii udah paham lah ya.. Nah, yang menjadi pertanyaan selanjutnya adalah ‘min sekarang aku jadi Data Scientist, gimana cara switch ke machine learning engineer?’
Data Scientist bisa dibagi jadi 2, yang sehari-hari mengerjakan analytics, dan ada juga yang fokus nya di algoritma. Kalau kamu tipe yang fokus di analytics, perkuat pendalamanmu di algoritma dan belajarlah coding.
Kalau kamu tipe yang satunya, ga ada salahnya buat belajar coding dan membuat production system.
Nah, kalau kamu bingung mau belajar coding atau algoritna darimana, ga ada salahnya nih ngintip kurikulum non degree program Pacmann, cek lengkapnya di sini ya: bit.ly/PacmannioTwitt…
Nah, kalau kamu bingung mau belajar coding atau algoritna darimana, ga ada salahnya nih ngintip kurikulum non degree program Pacmann, cek lengkapnya di sini ya: bit.ly/PacmannioTwitt…
Kira-kira gitu guys apa yang dilakukan oleh seorang machine learning engineer di Airbnb dan beberapa tips untuk melamar di posisi tersebut. Lengkapnya bisa kalian tonton di yaa, see you!
• • •
Missing some Tweet in this thread? You can try to
force a refresh
CNN bisa deteksi psychological disorders pengguna Reddit?! 🤔🤨
.
.
.
A thread
Siapa yang disini sejak pandemi jadi gampang stress??
Kalau lagi stress, sedih, atau lagi badmood, kalian suka ga sih curhat di sosmed atau seengkanya mengungkapkan emosi kalian gitu walaupun ga menjelaskan penyebabnya secara detail?
Jagain kakek nenek pake machine learning, emang bisa?🧓👵
Sistem deteksi untuk lansia jatuh
.
.
.
A thread
Kalian tau ga siii ada lantai yang punya sensor dibawahnya?
Keren banget ya sekarang ada lantai kaya gitu, eh apa mimin yang baru keluar dari goa ya makanya baru tau?🤔🤔 Ya intinnya hari ini mimin mau bahas tentang lantai yang ada sensornya ini. Tapi disclaimer dulu, lantai yang mimin bahas bukan yang kaya gini nih:
10 menit udah bisa buat kamu jadi data scientist yang lebih keren?! 🧑💻⏳
Intip caranya yuk!
.
.
.
A thread
Dalam 10 menit, apa sih yang bisa kita lakukan?
Tiga-tiganya bener, soalnya 3 hal itu emang bisa dilakuin dalam 10 menit. Tapi tau gak, kalo ternyata ada hal yang cuma butuh 10 menit dan bisa bikin kita upgrade diri sebagai Data Scientist?
Mau punya model bagus tapi datanya imbalanced? 😢🤷♂️
Catat 3 solusinya!
.
.
.
A thread
Suatu hari, kita diminta klien membangun model machine learning yang bisa mendeteksi tumor ganas pada lambung pasien. Kemudian, dengan memakai dataset berisi kumpulan CT-Scan perut, kita buat model yang memprediksi apakah seorang pasien menderita kanker lambung atau tidak.
Tapi masalahnya, ‘Gastric cancer’ atau kanker lambung ini tergolong sangat jarang temen-temen. Bahkan di Indonesia, resikonya itu cuma sekitar 0.0028%. Itu artinya, kalau kita sampling 100.000 orang, kemungkinannya kita cuma akan peroleh 3 sampel data penderita kanker lambung!
Enam alasan kenapa project DS sering gagal. 🥲🤦
Jangan sampai terjerumus ke 6 penyebab ini!
.
.
.
A thread
Pernah gak sih udah cape-cape begadang berminggu-minggu bikin model tapi kok ga selesai-selesai? Atau mungkin modelnya udah jadi tapi ternyata ga memberikan insight sesuai yang diminta atasan? 🥲🥲🥲
Yaa, kita semua setuju lah ya hal-hal di atas jadi nightmare banget, dan sebisa mungkin kita mau menghindari project menjadi gagal. Nah, makanya di thread kali ini, mimin mau bahas beberapa alasan yang bisa menyebabkan project kita fail. Langsung aja ke alasan yang pertama