Mengembangkang produk Machine Learning di dalam perusahaan (Part II): Feature Engineering Principal
.
.
.
A Thread
Haloo guys kali ini kita bakal lanjut nih bahas hal-hal yang dibutuhin buat mengembangkan produk machine learning di perusahaan, yukk ikutin !
Di thread ini mimin akan menjelaskan fase lanjutan setelah kemarin kita bahas Machine Learning Pipeline. Eits bagi yang ketinggalan jangan sedih, bisa langsung cek disini nihh
Sebelum masuk pembahasan, kira-kira siapa nih yang udah pada tau Feature Engineering??
Sebagai ringkasan, dari Fase I kemarin kita udah buat Machine Learning pipeline nih, mulai dari nentuin model yang cocok sampai monitoring performa dari model kita. Sekarang kita masuk Fase II yuk, Feature Engineering!
Feature Engineering merupakan pengetahuan untuk melakukan ekstraksi features pada data. Gambar berikut menunjukkan letak tahap features engineering dalam pembuatan model

Sumber: H2O.ai
Melalui Features Engineering, kita bisa menemukan apa aja sih yang bakal membuat model machine learning kita semakin baik. Loh tapi min, bukannya kemarin kita udah nentuin features dan ada test nya yaah?! Eits lanjut dulu..
Dalam rangka meningkatkan akurasi model kita, nggak mungkin dong selamanya hanya mengandalkan features yang sudah ada. Hal itu menyia-nyiakan kesempatan buat ningkatin kemampuan model machine learning yang udah kita buat
Banyak variasi features baru dari yang dapat dimasukkan kedalam sistem. Fase kedua ini bertujuan untuk mencari sebanyak mungkin features kemudian dikombinasikan lagi secara intuitif untuk menciptakan model.
Dengan demikian, fase ini akan menciptakan atau me-relaunch model-model baru yang didapatkan dengan menambahkan features yang kita riset.
Dalam fase ini akan banyak banget deploy model-model baru dan hal ini kita jadikan kesempatan untuk mencari sebanyak mungkin features, asalkan perhitungan modelnya selalu naik, yauda kita gas ajee hehe 😎️
Berarti kita ga bisa mengandalkan satu model dong min?? Yup. tapi jangan asal meluncurkan model yaa, setidaknya ada tiga alasan utama sebagai acuan dalam meluncurkan model
Alasan pertama, yaitu kalau kita bisa menemukan fitur-fitur baru. Dengan alasan ini kita meluncurkan model yang karena fitur yang kita temukan meningkatkan akurasi model
Alasan selanjutnya, kita bisa meluncurkan model baru jika kita menemukan tuning yang lebih tepat untuk memperlakukan fitur yang udah ada, atau kita kombinasikan fitur lama dengan cara yang berbeda.
Nah yang terakhir, kita luncurkan model baru ketika kita ingin ganti ‘objektif’ yang ingin dicapai oleh model kita. Loh apa hubunganya min?? Ada dong.. Yuk lanjut!
‘Mengganti objektif’ dalam kata lain adalah merubah tujuan model yang udah kita luncurkan. Hal ini sama kaya ketika tujuan kita mau ke Pondok Indah Mall, eh tiba-tiba doi minta jemput di rumah. Akhirnya kita harus menggunakan mobil yang sama untuk tujuan yang berbeda deh
Terlepas dari tiga alasan itu, dalam meluncurkan model baru kita juga harus mempertimbangkan hal yang mempermudah untuk nambah atau hapus model-model yang akan kita luncurkan.
Pertimbangan itu akan membuat kita lebih nyaman dalam menerapkan features engineering dan menerapkan di model yang baru tanpa harus kepikiran pipeline nya bakal rusak 😎️
Nah Selanjutnya, gimana sih cara nemuin fitur baru yang bisa ningkatin model kita? Yuk kita bahas!
Pertama, kita harus mengutamakan fitur-fitur yang kita amati secara langsung, bukan menggunakan fitur yang diciptakan sama model eksternal seperti unsupervised learning, atau justru fitur dari model kita sendiri
Loh bukannya malah bagus yah min?? Bisa jadi, tapi hal ini akan menyebabkan banyak sekali isu yang seharusnya gak terjadi jika kita menggunakan fitur yang diamati secara langsung.
Sebagai contoh, Ketika kita generate fitur baru menggunakan unsupervised learning, sistem eksternal yang kita gunakan bisa jadi tidak memiliki korelasi dengan objektif yang kita inginkan. Sama aja kita kayak kita mau ke bandung tapi naik kereta jurusan surabaya, salah alamat deh
Masalah lainnya juga timbul karena fitur-fitur turunan atau yang dihasilkan dari model deep learning merupakan nonconvex. Berikut gambar yang menunjukkan perbedaan kurva convex dan nonconvex
Nah dari perbedaan tersebut, kita bisa lihat puncak kurva nonconvex yang tidak konsisten, maka setiap iterasi yang dilakukan akan menghasilkan puncak (local minima) yang berbeda, dan nggak ada jaminan untuk melihat apakah solusi kita optimal atau engga.
Dengan demikian, kita tidak bisa nentukan nih, seandainya ada perubahan terhadap model kita, apa itu beneran dari solusi kita, atau karena random aja yah, jadi gabisa dihitung
Hal ini berbeda jika menggunakan fitur yang diamati secara langsung, bukan hasil dari generate. Kita akan mendapatkan performa dasar untuk bisa menghitung seberapa optimal sih solusi yang kita terapin
Nah terakhir, setelah kita menge-explore fitur, kita harus mempertimbangkan nih menghapus fitur yang sekiranya udah nggak kita gunakan dalam model. Dengan tetap fleksibilitas jika nantinya fitur tersebut mau ditambahin lagi
Hal tersebut penting dalam menjaga infrastruktur kita tetap bersih, jadinya fitur-fitur yang lebih bagus bisa kita tes dan terapkan dengan lebih optimal.
Nah kita udah belajar fase II nih, gimanaa, seruu kann😎️ Kita jadi tau kan prinsip-prinsip feature engineering. Bagi yang ingin lihat lebih lengkap bisa langsung kunjungi blog dari google di sini yaa
developers.google.com/machine-learni…
Atauu kalau mau belejar lebih lanjut, yuk langsung praktek ajaa di non-degree program Business Intelligence / Data Scientist Pacmann.AI. Pendaftaran batch 3 udah dibuka loh dan ada potongan hingga 500k untuk 10 pendaftar pertamaa 🤩🤩🤩
Kalau masih bingung apa sih yang akan dipelajarin di non degree program nanti, kalian bisa cek kurikulumnya di bit.ly/brosurpacmannai yaa atau kalau mau langsung daftar, langsung aja klik bit.ly/PendaftaranNon…. See you!

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Follow us on instagram: @pacmannai

Follow us on instagram: @pacmannai Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

28 Mar
Awas terciduk melanggar aturan lalu lintas sama AI 🚨⚠️
Penerapan Genetic Algorithm
.
.
.
A thread Image
Udah pada tau belom nihh kalau sekarang di Indonesia udah nerapin tilang elektronik? Jadi walaupun ga ada polisi lalu lintas, kalian tetap bisa keciduk loh kalau melakukan pelanggaran 😅
Loh, kok ga ada polisi tapi bisa ketilang? Emangnya siapa deh yang ngawasin?
Read 42 tweets
26 Mar
Naikin sales dengan prediksi konsumen yang hamil 🤰
.
.
.
A thread
Mimin yakin kita semua setuju deh kalau bisnis bisa banget naikin sales nya dengan melakukan consumer analytics. Dulu mimin udah pernah bahas nih tentang consumer analytics, kalian bisa cek disini yaa
Kalau kemarin kita bahas gimana sih caranya pakai consumer analytics, sekarang saatnya kita lihat contoh kesuksesan penggunaan consumer analytics ini.
Read 40 tweets
26 Mar
Nggak usah takut sama Matematika kalau mau belajar Data Scientist!
.
.
.
A thread
Kata siapa kalau mau mulai belajar Data Sains harus jago matematika? 🧐
Coba, mimin mau tau hubungan kalian sama matematika gimana sih?
Read 35 tweets
25 Mar
Alasan untuk tidur lebih banyak menurut Pak Bayes
.
.
.
A thread buat kalian kaum rebahan:)
Mimin yakin banget pasti para kaum rebahan langsung pada melek pas baca judul threadnya, iya banget atau iya ajaa? Supaya punya jawaban konkrit kalau ditanya kenapa tidur terus, yuk simak thread mimin ini!😎
Pernah gak sih kamu merasa udah tidur secukupnya, tapi badan tetap berasa lelah besoknya?
Read 36 tweets
25 Mar
Dear followers dan warganet twitter. Kali ini kami mau share info terkait lowongan kerja yang sedang kami buka. Jadi kali ini kami sedang membuka posisi ML Researcher - Course Lecturer (pacmann.io/careers#ml-res…)
Nah, ini deskripsi pekerjaannya:
1. Kami ingin teman-teman untuk melakukan studi literatur dari State of The Art Machine Learning dan Statistics, mengerti cara algoritmanya bekerja dan mengimplementasikan di kasus industri, dan mampu untuk menjelaskan secara detil.
2. Dari hasil studi literatur tadi, kami ingin teman-teman untuk menyampaikan materi tersebut ke peserta kami.
Read 9 tweets
25 Mar
Belajar buat nambah ilmu atau buat ngodein HRD?🧐
.
.
.
A thread
Siapa yang disini masih menuntut ilmu / mau melanjutkan pendidikan ke jenjang yang lebih tinggi? Anyway, entah kalian masih menempuh pendidikan / mau melanjutkannya, mimin penasaran deh, apa sih yang mendorong kalian buat nuntut ilmu?
Pada dasarnya, ada 2 pandangan tentang pendidikan, pertama itu human capital, dan kedua itu signaling. Kalau kalian nuntut ilmu buat nambah pengetahuan, bisa dikatakan kalau kalian memandang pendidikan sebagai human capital
Read 36 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!