Critical thinking for Data Scientist, why is it important and how to develop it🧠
.
.
.
A thread
Pernah nggak kamu left grup WA karena bete sama orang yang suka share-share berita hoax yang nggak jelas asalnya dari mana? Nah mungkin, orang itu belum tau soal Critical Thinking 🙂
Critical thinking sebenarnya basic skill yang harus dimiliki oleh semua orang, tapi ada alasan kenapa skill ini jadi penting banget buat seorang Data Scientist, di luar hardskill yang selama ini udah sering kamu dengar.
Sebelum masuk ke ‘kenapa’, kita masuk ke ‘apa’ dulu. Apa sih critical thinking itu sebenernya?
Definisinya banyak BANGET. Tapi kalau mau dirangkum+disederhanakan, critical thinking adalah proses berpikir yang melibatkan pencarian dasar berpikir yang bisa dipercaya, sehingga menghasilkan pemikiran yang dapat dipercaya juga.
Atau kalau mau lebih jelasnya: Critical Thinking adalah waktu waktu dimana kamu mikirin suatu hal dengan baik sebelum berpendapat atau membuat tindakan. Jadi ini itu proses berpikir yang dilakukan dengan sadar (conscious).
Kebayang nggak nih sampe sini?
Kamu mungkin bertanya-tanya, ‘Emang kenapa sih skill ini harus dimiliki oleh DS sampe Pacmann bikin threadnya?’ Oke, simak ya! Mimin bakal jelasin aplikasi Critical Thinking di kerjaan DS.
Ngaku deh, pasti seneng kan, kalo dapet dataset yang udah yang udah bersih dan siap diotak-atik?
Tapi pernah nggak sih: sebelum kamu langsung bikin visualisasinya, nyari model yang sesuai, kamu diem dulu sebentar dan liat datanya. Terus mikir, ‘ini datanya make sense ga sih?’
Nah, ini dia peranan Critical Thinking pertama. Dengan mencoba memahami apakah datanya logis atau nggak sebelum melakukan yang harus kamu lakukan, kamu bisa menghindari kemungkinan salah yang lebih besar.
Misal nih. Kamu punya data survey kepuasan konsumen dengan rasio responden 80% laki-laki dan 20% perempuan. Padahal, kamu kerja di perusahaan makeup yang punya segmentasi produk buat perempuan.
Turns out ketika kamu tanya ke bagian yang bertanggung jawab buat sumber datanya, label gendernya ketuker. Alias harusnya 80% perempuan dan 20% laki-laki.
Bayangin kalau kamu nggak ngecek dulu datanya mikir ‘ini make sense ga sih’, dan langsung proses bikin analisis buat bahan strategi marketing. Perusahaan bisa rugi karena strateginya jadi salah sasaran.
Dua. Waktu dimana skill critical thinking akan sangat berguna adalah saat kamu melihat statistik.
Pasti sering dong, liat iklan yang kayak ‘7 dari 10 anak Indonesia suka minum ini!’ atau semacamnya? 7 dari 10 alias 70% keliatan gede banget kan. Ternyata ada tulisan kecil di pojok: ‘berdasarkan survey kepada 50 orang’. Hadeuh.
Statistik emang berguna banget buat seorang Data Scientist, dan bakal sering ditemui juga. Tapi bakal bahaya kalau data scientistnya nggak punya skill critical thinking dan langsung terima-terima aja ketika dapet suatu statistik.
Tipsnya: ketika kamu dapet suatu angka statistik, pastiin untuk cek dan kritisi. Samplingnya bener nggak nih? Ada yang dimanipulasi nggak nih buat dapet angka ini?
Yang ketiga, Punya skill critical thinking bisa bantu Data Scientist biar nggak bias.
Kita biasanya punya kecenderungan buat percaya sama hal yang umum terjadi, dan mengabaikan yang kecil kemungkinannya buat terjadi.
Kita juga punya kecenderungan buat menyimpulkan kalau hal yang berkaitan, punya hubungan sebab akibat. Kalau Data Scientist nggak punya kemampuan Critical Thinking dan berpikir kayak barusan, bisa fatal banget.
Contoh : dari data, kita tau makin banyak personil pemadam kebakaran yang bertugas, kebakarannya juga makin parah. Kalo Data Scientist gak punya Critical Thinking terus nyimpulin ‘banyak personil damkar menyebabkan kerusakan lebih parah’, kan bahaya banget.
Jadi sepakat nggak nih, skill ini penting buat Data Scientist?
‘Jadi gimana min, biar bisa ngembangin skill Critical Thinking?’
Nah untungnya, sama seperti skill lainnya, skill ini bisa dikembangin dengan diasah terus. Ngasahnya gimana? Kamu bisa coba cara ini:
(1) Identifikasi. Ketika kamu dihadapkan dengan hal yang baru, entah itu kondisi atau masalah, coba berhenti sejenak dan memahami gambaran apa yang kamu hadapi. Kalau semuanya udah clear, kamu bisa memproses itu dengan lebih baik.
(2) Tanya, tanya, dan tanya. Nerima ‘oh oke’ kemudian mencoba buat nyelesaiin masalah itu begitu aja mungkin terkesan lebih mudah dan cepat, tapi sebenarnya akan lebih sulit.
Menanyakan hal-hal dasar kayak ‘kenapa ya ini terjadi?’ (bukan dalam konteks sambat ya!), ‘apa ya tujuan akhir yang mau dicapai?’ bisa bantu kamu buat memahami inti masalah dan menemukan solusi yang lebih sederhana.
(3) Kenali diri sendiri. Bakal susah buat menjadikan diri kita bias-free, tapi memahami diri bisa bikin keputusan kita lebih objektif. Cari tau: asumsi apa sih yang biasa disimpulkan tanpa sadar? Kenapa ya kita bisa punya asumsi kayak gitu?
(4) Lihat lebih jauh. Critical thinking berkaitan sama decision making. Which means, output dari critical thinking punya dampak, entah gede atau kecil. Nulisin + - dari keputusan kita adalah salah satu proses buat mengasah critical thinking.
(5) Jadi pemikir yang independen. Kadang kita suka lupa. Nyari sumber keputusan dari sana-sini tapi nggak nanya diri sendiri. Ini juga bisa dilatih, pembiasaan untuk membuat keputusan yang emang sesuai sama prinsip dan nilai yang kita pegang.
Udah siap jadi Data Scientist yang punya skill Critical Thinking? 😁
Selain latihan buat develop Critical Thinking sendiri, kamu juga bisa latihan dengan menerapkannya di proses belajar menuju jadi Data Scientist. Pacmann bisa bantu kamu lewat program non-degree yang punya kurikulum komplit A to Z.
Distance Function: Sudut Pandang Baru atas Jarak
.
.
.
A thread
Pastinya kita udah gak asing lagi ya denger-denger kata korelasi, similaritas, klasifikasi, clustering, dan hal-hal lain yang sejenis
Katakanlah kita ingin bikin sebuah clustering pake pendekatan similaritas. Gimana sih caranya kita mengatakan 2 titik/data itu similar? Ya simplenya adalah dengan mengatakan bahwa tipe mereka sama
Akurasi bagus nggak menjamin modelnya pasti bagus juga. Kok bisa?
Confusion Matrix: In a Nutshell
.
.
.
A thread
Suatu hari, seorang data scientist diminta klien dari sebuah rumah sakit untuk membangun sebuah model machine learning yang bisa mendeteksi dini adanya gejala tumor otak pada pasien balita
Lalu singkat cerita, data selesai di preprocessing dan modeling selesai. Pertanyaannya, kira-kira gimana cara si DS bisa mengukur performa modelnya? Cukupkah akurasi yang tinggi bisa membuat dia bilang ke klien kalau modelnya ‘works well’?
Coba kalian bayangin gimana cara orang dengan multiple source of income ngetrack pendapatan hariannya dari website yang berbeda? Misal Andrea, seorang youtuber, tapi juga punya saham dan jual lipstik di e-commerce.
Kalau Andrea mau ngetrack berapa sih pendapatannya dalam sehari, dia harus cek di 3 website yang berbeda dong: youtube, sekuritas, dan website e-commerce. Misalkan untuk cek 3 website tersebut dan ngitung berapa pendapatan hariannya butuh 10 menit,
Awas terciduk melanggar aturan lalu lintas sama AI 🚨⚠️
Penerapan Genetic Algorithm
.
.
.
A thread
Udah pada tau belom nihh kalau sekarang di Indonesia udah nerapin tilang elektronik? Jadi walaupun ga ada polisi lalu lintas, kalian tetap bisa keciduk loh kalau melakukan pelanggaran 😅
Loh, kok ga ada polisi tapi bisa ketilang? Emangnya siapa deh yang ngawasin?
Mengembangkang produk Machine Learning di dalam perusahaan (Part II): Feature Engineering Principal
.
.
.
A Thread
Haloo guys kali ini kita bakal lanjut nih bahas hal-hal yang dibutuhin buat mengembangkan produk machine learning di perusahaan, yukk ikutin !
Di thread ini mimin akan menjelaskan fase lanjutan setelah kemarin kita bahas Machine Learning Pipeline. Eits bagi yang ketinggalan jangan sedih, bisa langsung cek disini nihh