Intip keseharian machine learning engineer Airbnb yuk!🧑‍💻👩‍💻
PS: ada bonus tips jadi machine learning engineer di Airbnb loh!
.
.
.
A thread
Siapaa disini yang belum pernah denger Airbnb?
Airbnb sendiri merupakan online marketplace yang mempertemukan penyedia jasa homestay dengan customernya. Platform ini bisa diakses melalui website dan juga aplikasi handphone.
Nah, yang namanya menyediakan jasa platform homestay, Airbnb ini mencegah hal-hal yang tidak diinginkan (contohnya sex offenders, trafficking), makanya mereka melakukan background check terhadap penggunanya.
Kalau dilihat dari websitenya, disebutkan bahwa jika mereka memiliki informasi yang cukup tentang user nya, seperti misal nama depan dan belakang serta tanggal lahirnya, Airbnb bisa melalukan pengecekan ke database publik dan catatan kriminal
Termasuk juga dengan melihat apakah pengguna ini masuk ke dalam list ‘sex offender’. Ini berlaku both ways ya, baik yang menjadi host homestay nya atau orang yang mau menginap.
Selain itu, Airbnb juga melakukan pengecekan pada OFAC list, yaitu daftar yang berisi orang-orang atau organisasi yang terlibat dalam penyeludupan narkoba, teroris, dan program-program berbahaya lainnya. Lengkapnya cek disini aja: airbnb.co.id/help/article/1…
Lalu siapa yang bertugas melakukan tugas ini? Yep, sesuai dengan judul thread, hal tadi merupakan jobdesc dari machine learning engineer di Airbnb.
Secara umum, machine learning engineer di Airbnb bertugas untuk membuat infrastruktur machine learning dan modelnya serta memastikan bahwa keduanya tetap bekerja.
Project utama yang mereka lakukan itu yang tadi mimin sebutin. Nah, ternyata mereka ga hanya mengandalkan database pemerintah aja, tapi juga meng-’ekstrak’ informasi dari berita di internet.
Hal ini dilakukan karena database tadi diupdate secara berkala gituu, jadi mereka juga butuh tau kejahatan apa sih yang sekarang lagi terjadi
Traditional background check ga bisa cover 100% profile orang, jadi mendeteksi ‘bad actors’ dari berita bisa membantu Airbnb untuk mendepak bad actors tersebut dari platform.
Sayangnya, project ini menemui kendala. Contohnya gini, sistem bisa dengan mudah mendeteksi ada kejahatan ketika melihat kalimat ‘Madhu melakukan kejahatan di Kota Semarang’.
Tapi beda kasusnya dengan kalimat ‘Madhu terakhir dilihat di Kota Semarang, ia melakukan kejahatan disana’. Nah, sistem ga bisa mendeteksi kata ‘ia’ ini mengacu ke siapa, padahal kan itu mengacu ke ‘Madhu’ yang ada di kalimat sebelum koma.
Dan untuk mencari data tentang masalah ini juga sulit. Maka dari itu, machine learning engineer di Aibnb memakai workflow information retrieval yang dibuat Standford University. Workflow ini menggunakan experti intuition untuk melabel dataset besar.
Pilihan ini jauh lebih oke dibandingkan harus melabeli data artikel dan berita secara manual. Okee, kita lanjut, lalu tools apa aja yang baisa digunakan oleh machine learning engineer di Airbnb?
Awalnya, mereka memakai ruby on rails, nah tapi akhirnya bermigrasi ke JVM based infrastructure. Ketika melakukan training data, biasanya mereka menggunakan Jupyter untuk mengexplore dan memodeling data.
Sedangkan untuk proses labelling data, mereka menggunakan internal tools seperti flask application untuk menganotasikan artikel berita. Terakhir, untuk modelling, pilihan tools jatuh kepada XGBoost.
Sama seperti sequence model yang biasa dipakai e-commerce untuk memantau berbagai aktivitas user, seperti waktu login, waktu pembelian, dll.
Sampai sini, tertarik untuk bekerja sebagai machine learning engineer di Airbnb? Kalau ya, catat tips berikut ya!
Untuk menjadi machine learning engineer di Airbnb, tentunya kamu melewati beberapa proses rekrutment. Nah, nanti proses interviewnya sendiri akan terbagi menjadi beberapa kalii.
Kandidat akan ditanya mengenai pengetahuannya tentang algoritma, machine learning tools yang biasa digunakan dan pastinya kandidat akan benar-benar dicek apakah memang menguasai tools tersebut.
Tidak lupa, kandidat juga diminta untuk menceritakan bagaimana pengalamannya di dunia per-machine-learningan.
Menceritakannya ini ga cuma sekedar ‘dulu gua pernah kerja di perusahaan X, Y, Z sebagai machine learning engineer’, tapi meliputi apa yang bisa diperbaiki dari model yang dulu pernah kamu buat, dan pertanyaan-pertanyaan yang mengulik seberapa menguasai kamu di bidangi ini.
Kandidat juga akan dilihat apakah memiliki kemampuan eksekusi yang baik dengan waktu yang terbatas, dan melihat apakah keputusan yang diambil dapat diimplementasikan dan bekerja dengan baik, tidak hanya sekedar bagus ketika training saja.
Jangan lupa tonjolkan kalau kamu memiliki satu spesialisasi. Loh kok cuma satu? Yaa, bidang machine learning ini kan benar-benar growing dengan sangat cepat. Agak mustahil bagi seseorang kalau dia bisa baik di semua cabang machine learning.
Maka dari itu, kalau kamu udah expert banget dalam 1 hal, ya tunjukkin hal tersebut. Gimana caranya? Lewat project-project yang udah dikerjakan sebelumnya.
Misalnya, kalau expert di NLP, ya buatlah 2 atau 3 project yang ‘wah’ tentang NLP, alih alih membuat project biasa aja di berbagai cabang.
Oh iya, Airbnb sangat menghargai core value yang mereka junjung. Maka dari itu, ada baiknya kandidat mencari tahu bagaimana culture di Airbnb. Culture sangatlah penting sebab hal ini memastikan agar kandidat tidak akan mengacaukan sesuatu bila nanti bekerja.
Sampai sinii udah paham lah ya.. Nah, yang menjadi pertanyaan selanjutnya adalah ‘min sekarang aku jadi Data Scientist, gimana cara switch ke machine learning engineer?’
Data Scientist bisa dibagi jadi 2, yang sehari-hari mengerjakan analytics, dan ada juga yang fokus nya di algoritma. Kalau kamu tipe yang fokus di analytics, perkuat pendalamanmu di algoritma dan belajarlah coding.
Kalau kamu tipe yang satunya, ga ada salahnya buat belajar coding dan membuat production system.
Nah, kalau kamu bingung mau belajar coding atau algoritna darimana, ga ada salahnya nih ngintip kurikulum non degree program Pacmann, cek lengkapnya di sini ya: bit.ly/PacmannioTwitt…
Nah, kalau kamu bingung mau belajar coding atau algoritna darimana, ga ada salahnya nih ngintip kurikulum non degree program Pacmann, cek lengkapnya di sini ya: bit.ly/PacmannioTwitt…
Kira-kira gitu guys apa yang dilakukan oleh seorang machine learning engineer di Airbnb dan beberapa tips untuk melamar di posisi tersebut. Lengkapnya bisa kalian tonton di yaa, see you!

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with IG: @pacmannai

IG: @pacmannai Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

7 May
CNN bisa deteksi psychological disorders pengguna Reddit?! 🤔🤨
.
.
.
A thread
Siapa yang disini sejak pandemi jadi gampang stress??
Kalau lagi stress, sedih, atau lagi badmood, kalian suka ga sih curhat di sosmed atau seengkanya mengungkapkan emosi kalian gitu walaupun ga menjelaskan penyebabnya secara detail?
Read 33 tweets
6 May
Jagain kakek nenek pake machine learning, emang bisa?🧓👵
Sistem deteksi untuk lansia jatuh
.
.
.
A thread
Kalian tau ga siii ada lantai yang punya sensor dibawahnya?
Keren banget ya sekarang ada lantai kaya gitu, eh apa mimin yang baru keluar dari goa ya makanya baru tau?🤔🤔 Ya intinnya hari ini mimin mau bahas tentang lantai yang ada sensornya ini. Tapi disclaimer dulu, lantai yang mimin bahas bukan yang kaya gini nih:
Read 41 tweets
6 May
10 menit udah bisa buat kamu jadi data scientist yang lebih keren?! 🧑‍💻⏳
Intip caranya yuk!
.
.
.
A thread
Dalam 10 menit, apa sih yang bisa kita lakukan?
Tiga-tiganya bener, soalnya 3 hal itu emang bisa dilakuin dalam 10 menit. Tapi tau gak, kalo ternyata ada hal yang cuma butuh 10 menit dan bisa bikin kita upgrade diri sebagai Data Scientist?
Read 35 tweets
30 Apr
Mau punya model bagus tapi datanya imbalanced? 😢🤷‍♂️
Catat 3 solusinya!
.
.
.
A thread
Suatu hari, kita diminta klien membangun model machine learning yang bisa mendeteksi tumor ganas pada lambung pasien. Kemudian, dengan memakai dataset berisi kumpulan CT-Scan perut, kita buat model yang memprediksi apakah seorang pasien menderita kanker lambung atau tidak.
Tapi masalahnya, ‘Gastric cancer’ atau kanker lambung ini tergolong sangat jarang temen-temen. Bahkan di Indonesia, resikonya itu cuma sekitar 0.0028%. Itu artinya, kalau kita sampling 100.000 orang, kemungkinannya kita cuma akan peroleh 3 sampel data penderita kanker lambung!
Read 34 tweets
30 Apr
Enam alasan kenapa project DS sering gagal. 🥲🤦
Jangan sampai terjerumus ke 6 penyebab ini!
.
.
.
A thread
Pernah gak sih udah cape-cape begadang berminggu-minggu bikin model tapi kok ga selesai-selesai? Atau mungkin modelnya udah jadi tapi ternyata ga memberikan insight sesuai yang diminta atasan? 🥲🥲🥲
Yaa, kita semua setuju lah ya hal-hal di atas jadi nightmare banget, dan sebisa mungkin kita mau menghindari project menjadi gagal. Nah, makanya di thread kali ini, mimin mau bahas beberapa alasan yang bisa menyebabkan project kita fail. Langsung aja ke alasan yang pertama
Read 31 tweets
30 Apr
Butuh kedewasaan untuk mengakui pekerjaan kita gak perlu pakai model/tool yang paling canggih.

Butuh kedewasaan untuk mengakui model yang dibutuhkan gak njlimet pakai Deep Learning Transformers, tapi pakai Logistic Regression aja bisa.
Menurut gue ini penyakit semua orang yang baru masuk ke industry ya, terlepas industry nya apa aja.

Gue juga dulu pas kerja pertama jadi DS di 2015, semua model mau gue deeplearning-kan-saja-semua.
Namun ya gue ke sini mikirnya adalah bikin model yang:

1. Mudah
2. Sederhana
3. Cepat
4. Gampang lo debug
5. Gampang di-tuning, yang ini adalah hasil diskusi dengan teman kemarin di suatu kantor berita.
Read 8 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!

:(