Difference between Statistics and Machine Learning?
A Thread.
Halo everyone, selamat berjumpa kembali Bersama admin NA di thread pacmann. Nah, di thread kali ini kita bakal bahas-bahas sedikit tentang modeling nih.
Pemodelan ini biasanya kita bisa milih yaitu statistics atau machine learning.
Sebenernya, antara statistics dan machine learning ini bedanya ga jauh karena keduanya bisa digunakan pada analisis data yang ingin kita eksplorasi lebih jauh. Tapi banyak scientist yang bingung, harus pake yang mana dan apa bedanya sih antara keduanya?
Yuk kita bahasss.. Tapi, siang-siang gini enaknya sambil makan kali yaa?
Dalam menganalisis data, ada goal yang harus dipenuhi, yaitu inference dan prediction, sehingga akan mendapatkan informasi yang berguna.
Inference itu kegiatan yang dilakukan untuk mencapai suatu kesimpulan berdasarkan suatu pemikiran atau data, sedangkan prediction itu untuk hasil dari input data yg akan datang.
Perbedaan pertama terletak disana. Statistics itu punya kefokusan yang lebih pada inference. Jadi dia bisa tau sebenernya data ini bisa menjelaskan dan memberikan kesimpulan seperti apa. Tapi statistics juga bisa memprediksi kok, cuma fokusnya aja yang lebih ke inference.
Beda halnya sama machine learning, dia lebih konsen sama prediksi menggunakan algoritma pembelajaran yang bisa dapet pola-pola tertentu.
Perbedaan kedua terletak pada dimensi data. Machine learning lebih pada dimensi data yang lebih kompleks, seperti struktur gene, dibandingkan statistics. Karena si machine learning ini bisa memahami pola-pola dari struktur data kompleks itu.
Berhubungan dengan dimensi data, juga berhubungan dengan komputasinya. Machine learning punya komputasi yang lebih tinggi dibandingkan statistics. Itu perbedaan ketiga ya..
Perbedaan keempat itu di asumsinya. Statistics itu lebih banyak asumsi yang digunakan karena dia mengkoneksikan ke populasi, namun machine learning meminimalkan asumsi, dia mencoba mendapatkan pola-pola dari data yang ada.
Dari asumsi itu, dapat lagi perbedaan kelima pada validasi modelnya. Untuk statistics, mengarah ke interpretasi parameter, bisa juga pake goodness of fit, dll. Untuk machine learning, mengarah ke hasil prediksi, misal akurasi.
Jadi dari penjelasan itu, sebenernya bingung juga kalo harus milih mau pake model statistics atau machine learning. Tapi dari semuanya, kita bisa belajar satu hal, model aja ada plus minusnya apalagi hidup eeaa, kok jadi filsafat
Tapi, dibalik perbedaan keduanya, untuk menjadi seorang data scientist perlu memahami keduanya, baik itu statistics ataupun machine learning.
Data science itu terbagi secara umum bisa dilihat dari bagan ini. Dari itu bisa dilihat statistics dan machine learning merupakan kunci juga buat jadi seorang data scientist.
Jadi meskipun bingung mau pake model machine learning atau statistics tetep belajar keduanya yaa, ataaauuuuu
Bisa belajar bersama di kelas Pacmann Ai!!~ kalo kalian mau tau apa aja yang akan dipelajari bareng kita, cek cek sini yuk! Bit.ly/brosurpacmannai
Nah, kebetulan banget nih! Pacmann.AI akan membuka Hands On Learning Experience lewat Workshop Series seputaran Data Science dan Machine Learning loh!
Untuk info lebih lengkapnya bisa dibawah sini ya!!!
Gimana? Menarik banget kan? Tunggu apalagi!! Yuk segera daftarkan diri kamu lewat bit.ly/PendaftaranPac… sekarang juga karena ada promo imlek dengan input kode voucher “IMLEKMANN2021” !!!
Terakhir, jangan cepat nyerah dan terus hauslah akan ilmu pengetahuan! Semoga paham yaaa! kalo gapaham ikutan aja kelasnya PACMANN AI, boleh tanya2 dan hubungin kita di bit.ly/WASalesPacmann
Menurut gue kebanyakan Data Scientist terlalu mikirin curve fitting dan optimisasi metrics berlebihan tanpa mikirin modeling. Makannya sering kurang berguna di perusahaan.
Gue berikan contoh kasus ya.
Kebanyakan hanya memikirkan: 1. Modelnya supervised atau unsup (meh..) 2. Metrics nya apa (meh...)
Lalu dilakukan development dalam 6 bulan, kemudian modelnya tidak bisa menjawab pertanyaan bisnis.
IMO curve fitting itu hal termudah yang dilakukan oleh DS dan biasanya hanya 5% dari pekerjaan. Pekerjaan utamanya adalah membuat modeling.
Bedakan modeling dengan fitting-fitting pakai sklearn/keras/pytorch.
PERTUMBUHAN EKONOMI BISA DIHITUNG MENGGUNAKAN CAHAYA?!
.
.
.
A Thread
Produk Domestik Bruto atau yang biasa disingkat dengan ‘PDB’ merupakan nilai pasar seluruh barang dan jasa yang diproduksi oleh suatu negara pada periode tertentu. Nilai ini juga menunjukkan jumlah pendapatan nasional sebuah negara.
Dari definisinya aja, bisa dilihat kalau PDB ini menunjukkan nilai yang penting bagi suatu negara. Maka dari itu, wajar aja kalau pertumbuhan PDB mencerminkan pertumbuhan ekonomi dan sering dijadikan sebagai salah satu bahan pertimbangan pembuatan kebijakan sosial-ekonomi.
Halo sedulur-sedulur kalian mimin mau nanya nih siapa kira2 disini yang tertarik untuk Investasi di Saham / Pasar Modal?
Nah Pacmann mau launching Produk/Jasa baru nih untuk membantu literasi Keuangan dan pemahaman Investasi Pasar Modal kawan-kawan semua disiniii
Seperti misi Pacmann di sekolah data, supaya kawan-kawan disini juga bisa belajar investasi secara mendalam dan mandiri, jadi ga cuman ikut-ikutan invest tapi kurang paham dasarnya.
Siang ini mimin mau bikin topik thread yg sedikit berbeda, namun sangat penting untuk dikuasai. Kenapa? Karena salah satu kunci kesuksesan seorang data scientist itu adalah giat mencari resources sebanyak-banyaknya dari jurnal paper.
Baca research paper pun ada ilmunya guys, yang pastinya ga akan ribetin kamu (malah bikin bantu banget) kalau kamu tau cara yang baik dan benar untuk membaca research paper