Back to basic: supervised or unsupervised learning?🤓🧠
.
.
.
A thread
Mimin yakin, yang namanya belajar machine learning, pasti deh bakalan kenalan sama istilah ‘supervised learning’ atau ‘unsupervised learning’. Thread kali ini bakalan ngulik apa sih perbedaan kedua istilah itu.
Biar kebayang apa sih beda keduanya, anggaplah kamu punya anak dan mau ngajarin jenis - jenis hewan ke anak kamu. Buat ngenalin jenis hewan, kamu pengen anak kamu itu praktek secara langsung, bukan cuma liat poster ini
Nah, ada 2 pilihan nih: (1) Ngenalin satu satu jenis hewan ke anak kamu, atau (2) Biarin anak kamu menjelajahi hutan dan nyari tau sendiri jenis hewan. Oke, mari kita lihat kedua pilihan ini dengan lebih mendalam.
Pilihan pertama: ngenalin satu satu jenis hewan ke anak kamu. Kalau kamu milih opsi ini, anak kamu bisa belajar dengan baik jenis hewan apa yang kamu kenalin, dan dia bisa tau pattern yang kamu ga bisa pahamin, bahkan dia sendiri pun ga bisa mengekspresikan pattern itu apa
Tapi, anak kamu tuh bakal bisa mengenali pengetahuan yang udah dia dapatkan ini di outdoor. Misal nih, kamu ngasih tau dia tentang kucing, apa yang kucing makan, dan intinya semua ciri ciri kucing.
Jadi, ketika nanti dia ngeliat kucing di taman, dia bakal tau ‘oh ini kucing. Tapi, kalo misalkan dia liat singa di taman padahal kamu belom pernah ngajarin apa itu singa, anak kamu tuh gabakalan bisa recognize singa ini.
Anak kamu cuma tau ‘ini hewan yang gapernah diajarin ke aku’, ya kalo dalam contoh ini kucing.
Positifnya dari metode ini adalah, anak kamu bakal tau banget nih segalanya tentang kucing. Tapi negatifnya, dia gak bakalan tau gajah, jerapah, atau kecoa. Intinya dia ga bisa dikasih sesuatu yang belum pernah kamu ajarin sebelumnya.
Jadi kamu hanya bisa nyodorin hewan yang tidak kamu pahamin dan belum pernah kamu ajarin sebelumnya.
Cara mem’transfer’ pengetahuan ini adalah dengan memberikan label kategori. Kalau dalam contoh ini kan belajar hewan ya, kamu bisa jelasin dengan cara memberikan label kategori hewan, misal dari jenis makanannya, warnanya, matanya, dll.
Nanti, anak kamu bakal belajar dari kategori kategori yang udah kamu buat. Terus, setelah dikasih waktu beberapa lama, anak kamu udah bisa ngebedain jenis jenis hewan deh.
Nah, tadi adalah contoh supervised learning. Ketika menggunakan supervised learning, kita ngasih labeled data ke model sehingga model bisa belajar dan melakukan generalisasi berdasarkan label tadi.
Contohnya gini, di supervised learning, kita bisa ngasih model 1000 gambar kucing yang diberi label ‘kucing’ dan 1000 gambar anjing yang diberi label ‘anjing’. Oke, lalu contoh dari supervised learning ini apa?
Salah satu contoh dari penggunaan supervised learning ini adalah linear regression. Oh iya, mimin udah pernah bahas cara interpretasi linear regression nih, cek di link berikut yaa:
Selain itu, ada juga logistic regression, neural networks, dan support vector machines.
Lalu apa sih keunggulan dari supervised machine learning? Tentunya model jadi cepat paham dan bisa langsung diimplementasikan juga.
Namun, kelemahannya adalah kita hanya bisa melakukan supervised learning kalau memang punya labeled data yang udah benar. Bisa aja sih, kalau kita ngelabelin data data yang emang belom punya label, tapi bakalan makan banyak waktu dan biaya juga.
Kita lanjut ke pilihan kedua: biarin anak kamu menjelajahi hutan.
Kalo kamu biarin anak kamu berkeliaran di hutan buat mempelajari dan mengenali berbagai pattern hewan yang ada di sana. Nah, anak kamu ini bakal mengelompokkan apa yang dia liat ke dalam kategori-kategori kecil gitu.
Misal nih, dia bakal naro semua zebra itu ke dalam kategori yang sama, karena semua zebra kan punya karakteristik yang sama, berwarna hitam putih. Tapi, anak kamu nih ga bakal mengenali ‘zebra’ dengan sebutan ‘zebra’.
Jadi intinya adalah dengan biarin anak kamu explore hutan, dia bisa mengenali pola hewan dan mengkategorikan hewan tersebut sesuai dengan polanya. Anak kamu bisa masukin juga tuh hewan baru ke dalam kategori yang udah dia buat, tanpa mengetahui nama hewan tersebut.
Oh iya, perlu diingat kalau dia ga bakal punya pemahaman yang mendalam tentang satu hewan (ga kaya kalau kamu kenalin ‘ini kucing, makanannya ini, dia hidupnya gini’) karna ada banyak banget hewan dengan karakteristik yang berbeda di hutan
Nah, ini adalah analogi dari unsupervised learning, yakni ketika kita memberikan data yang ga memiliki label kepada model, kemudian membiarkannya untuk nyari tau pattern data dan mengroupkan sampel berdasarkan pola
Salah satu contoh dari penggunaan unsupervised learning adalah autoencoders dan k-means clustering. Mimin baru banget bahas nih tentang k-means clustering dengan gaussian mixture model, cek di sini yaa:
Terakhir, unsupervised learning ini juga punya kelemahan, yakni clustering.
Clustering adalah kegiatan mengelompokkan observasi yang kita miliki ke dalam group yang anggotanya itu memiliki kemiripan satu sama lain. Ketika melakukan clustering, model ga tau berapa banyak cluster yang harus dibuat.
Nah, singkatnya gitu guys tentang perbedaan supervised dengan unsupervised machine learning. Kalau kalian masih belum paham gimana cara nerapinnya, ga ada salahnya untuk belajar bareng di Pacmann.AI
Kalian bisa cek informasi non degree program Pacmann, baik yang Data Scientist maupun Business Intelligence di bit.ly/BrosurSingkatP….
Atau kalau kalian masih takut ngoding, bisa banget nih kenalan dengan data science tanpa ngoding di workshop Pacbuburit. Jadwal terdekatnya adalah Data Science with spreadsheet bersama dengan Anisa Cantika, advertising product operation GoJek di sabtu nanti
Dan workshop data visualization dengan google data studio bersama dengan Agita Sesara, Head of Advisory at Data Consultancy Company di hari Minggu nanti. Yuk segera daftarin diri kalian di bit.ly/DaftarPacbubur…

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Follow us on instagram: @pacmannai

Follow us on instagram: @pacmannai Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

17 Apr
Mau ngolah data finansial pakai machine learning?📈📊
Yakin udah menuhin asumsi stasioneritas?
.
.
.
A thread
Mimin yakin kita semua punya satu kesamaan pemahaman: machine learning bisa diterapin di berbagai industri. Nah, ga terkecuali sama industri finansial. Di thread ini, kita akan secara spesifik membahas trading yaa.
Yang namanya mau ngolah data trading, udah pasti banget jenis data nya itu time series. Data time series merupakan data yang dikumpulkan berdasarkan urutan waktu. Satuan waktunya ini bisa macam macam, tahunan, bulanan, hingga per jam dan bahkan per detik.
Read 30 tweets
16 Apr
Data visualization bisa menyelesaikan pandemi?!🤮🥴
.
.
.
A thread
Siapa disini yang belum tau apa itu Data Visualization? 😏
Yang belum tau, boleh cek dulu threadnya Pacmann tentang datavis nih:
Read 33 tweets
15 Apr
Mau clustering data?
Lebih oke gaussian mixture model atau k-means?🧐🤔
.
.
.
A thread
Gaussian pasti bukan kata yang asing lagi buat kita semua, kan? Distribusi Gaussian, yang diperkenalkan oleh Carl Friedrich Gauss, biasanya kita kenal dengan nama lain distribusi normal.
Sebelumnya, yuk kenalan sama gaussian process dulu. Kalian tau gak sih, sebenernya gaussian process ini cuma berguna di ranah statistika, atau bisa diimplementasikan di machine learning juga?
Read 28 tweets
15 Apr
Mau jadi DS tapi masih takut ngoding?🧑‍💻😉
Mulai dari Excel aja dulu!
.
.
.
A thread
Eits, jangan langsung serang mimin setelah baca judulnya. Ya, ya, ya, mimin paham kok reputasi excel masih jauh banget sama Python, R, Java, you name it lah. Tapi, buat pemula yang masih takut ngoding, excel ini bisa jadi alternatif buat kenalan dengan dunia per ds-an.
Lebih baik mencoba dari hal sederhana dulu kan daripada gak sama sekali?
Read 30 tweets
14 Apr
Mau sales meningkat drastis? 📈🤑
Kenalin dulu pola customer lewat association rule!

.
.
A thread
Siapa disini yang suka window shopping? Yang hobinya masukkin barang ke keranjang online tapi engga pernah di checkout haha
Fenomena ini menarik untuk dibahas deh seiring dengan banyaknya event-event dari e-commerce kayak tanggal cantik yang bikin kita tertarik banget buat belanja
Read 36 tweets
13 Apr
Emang ketidakteraturan bisa diukur?🤨🧐
Intro to entropy
.
.
.
A thread
Mungkin sebagian dari kita mengenal entropi sebagai suatu istilah dalam ilmu fisika khususnya topik termodinamika. Ternyata entropi ini gak cuma ada di fisika loh, dia juga ada di dalam statistik. Gimana tuh?
Oke, mari kita mulai dari suatu pembahasan yang sederhana. Misalkan kita punya 3 kotak. Kotak pertama berisi 4 bola merah, kotak kedua berisi 3 bola merah dan 1 bola biru, kotak ketiga berisi 2 bola merah dan 2 bola biru Image
Read 36 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!