Buat apa bisa regresi tapi ga bisa intepretasiin hasilnya?🙄🤯
Yuk belajar interpretasi hasil regresi!
.
.
.
A thread
Misalkan kalian kerja di produk pulpen, terus bos kalian minta buat sales bulan depan harus ningkat sekian persen atau kalian bakal dipecat. Berarti, kalian harus tau dulu dong faktor faktor apa yang mempengaruhi sales pulpen.
Dengan kemajuan ilmu yang kita punya sekarang, udah ga perlu lagi nganalisa data secara manual. Kalian bisa pakai regresi, metode buat nyari hubungan antara variabel yang punya hubungan dengan topik yang mau diteliti.
Kalau bahasa kerennya sih, buat ngeliat hubungan antara variabel dependen dengan variabel independen. Kalau diartikan, ‘dependent’ itu artinya ‘bergantung’, jadi variabel dependen merupakan variabel yang bergantung / dipengaruhi sama variabel lain, yaitu variabel independen.
Sebaliknya, ‘independen’ artinya ‘mandiri’ ya maksudnya variabel independent ini ga dipengaruhi sama variabel lain dan dia lah yang mempengaruhi variabel dependen ini.
Kalau dalam kasus kita, variabel dependen nya ya sales pulpen, dan variabel independennya bisa dari sales buku, sales note digital, dll. Biar memudahkan, kita hanya pakai sales buku dan sales note digital aja ya.
Oke, setelah tau faktor faktor apa aja yang mungkin mempengaruhi sales pulpen, sekarang tugas kalian adalah nyari data sales buku dan sales note digital. Nah, kalau udah ketemu, kalian bisa buat model dan lakukan regresi.
Sederhananya, model yang kalian buat akan seperti ini:
Anggaplah setelah kalian melakukan regresi, hasilnya keluar seperti ini, artinya apa?
Mari kita mulai dari angka ‘100’ dulu, artinya adalah tanpa dipengaruhi oleh apapun, sales pulpen kalian itu 100 buah. Lalu, angka ‘20’ ini artinya peningkatan sales buku sejumlah 1 buah akan meningkatkan sales pulpen sebesar 20 buah.
Dan terakhir, angka ‘10’ ini maksudnya adalah peningkatan sales digital note sebesar 1 buah akan mengurangi sales pulpen sejumlah 10 buah. Yaa wajar aja hubungan sales pulpen sama digital note negatif, soalnya kalau udah punya digital note, ga nyatet pake pulpen lagi.
Setelah tau kalau ternyata sales buku ningkatin sales pulpen, kalian bisa ngambil kebijakan, misal dengan ngediskon buku yang kalian jual, atau kebijakan lainnya.
Oke, masih sederhana ya sampe sini? Iya, karena ini masih regresi antar level, alias regresi linear-linear. Coba kalau misalkan kita ubah variabel dependent / independent / bahkan keduanya berbentuk logaritmik, gimana cara menginterpretasikannya?
Sebelum kita masuk ke interpretasi model yang ada log nya, kita harus tau dulu kapan ada model regresi yang pakai log. Jadi, ketika kita melakukan regresi, ada asumsi yang harus kita pegang, sebelumnya mimin pernah bahas nih di tweet ini:
Salah satu asumsi yang kita pegang adalah adanya hubungan yang linear antara variabel dependen dengan variabel independen. Nah, kalau asumsi ini dilanggar, alias ada hubungan TIDAK LINEAR antara keduanya, maka inilah saatnya kita mengubah variabel ke dalam bentuk log.
Jadi, ada beberapa jenis regresi yang menggunakan log, kita ulik satu persatu dan cara mengintepretasikannya yaa!
(1) Double log
Kalau kita perhatikan, pada double log ini, baik variabel dependen maupun independennya diubah dalam bentuk log. Nah, kalau diinterpretasikan jadinya ‘Bila X1 meningkat sejumlah 1%, maka Y akan meningkat sebesar beta1 %’. Biar kebayang kita coba pake angka ya
Misalkan kita punya hasil regresi double log seperti ini. Artinya adalah setiap peningkatan sales buku sebesar 1%, maka sales pulpen akan meningkat sebesar 0.087%. Dan sebaliknya, setiap peningkatan sales digital note sebesar 1%, maka sales pulpen akan berkurang sebesar 0.05%.
(2) Linear-log model
Beda sama double log, sekarang cuma variabel independen nya aja yang diubah ke log. Artinya adalah ‘Bila X1 meningkat sebesar 1%, maka Y akan meningkat sebesar beta1 /100 unit’. Kita contohin pake angka lagi yaa
Hasil regresi semi log ini bisa diinterpretasikan seperti ini “Bila sales buku meningkat sebesar 1%, maka sales pulpen akan meningkat sebesar 3.3/100 atau 0.033 buah”
(3) Log-linear model
Kebalikannya, sekarang dependen variabelnya yang diubah ke log. Artinya gini ‘Bila X1 meningkat sebesar 1 unit, maka Y akan meningkat sebesar beta1 * 100%. Kita contohin lagi yaa
Kalau dari gambar dibawah ini, kita bisa intepretasikan sebagai ‘Setiap peningkatan sales buku sejumlah 1 buah, maka sales pulpen akan meningkat sebesar 2%’’ atau ‘Setiap peningkatan sales digital note sebesar 1 buah, maka sales pulpen akan menurun sebesar 5%’.
Nah kira kira gitu guys cara menginterpretasikan hasil regresi kalian. Oh iya, perlu diingat, hasil regresi ini menentukan korelasi bukan hubungan kausalitas (sebab akibat).
Maksudnya gini, misal kalian masukin faktor hujan sebagai variabel independen dalam kasus ini dan ternyata korelasinya positif, berarti setiap hujan, sales pulpen bakal meningkat.
Tapi kan ga masuk akal hujan bisa ningkatin sales pulpen, kecuali kalian jualan jas hujan bukan pulpen, baru deh hujan bisa ningkatin sales.
Atau misalkan gini, kalian mau nyari faktor apa aja yang mempengaruhi kemiskinan di Indonesia dan masukkan jumlah kerikil sebagai variabel independennya, terus korelasinya positif. Ya, emang masuk akal kalau semakin banyak kerikil maka angka kemiskinan makin tinggi?
Intinya adalah jangan asal pilih variabel independen, landasin pakai teori yang mendukung.
Oh iya, kalian tau ga si di kelas non degree program Data Scientist Pacmann.AI, kalian bakal lebih belajar lebih mendalam tentang hasil interpretasi regresi.
Ga hanya itu aja, masih banyak materi lain yang bisa membuat kalian lebih paham sama data yang dipake dan gimana cara interpretasi hasil analisisnya. Kepoiin kurikulum lengkapnya di bit.ly/brosurpacmannai yaa!
Mumpung pendaftaran non degree programnya udah dibuka, langsung aja daftarin diri kalian di bit.ly/PendaftaranNon… atau kalau ada yang pengen ditanyaiin, Pacmann siap menjawab, hubungi di sini yaa bit.ly/WASalesPacmann. Mimin tunggu di kelas nantii, see you!
Emang Bidang Sosial Butuh Data Scientist? 🤨🤔
.
.
.
A thread
Mimin mau survey dulu. Ada berapa banyak sih followers Pacmann yang backgroundnya bukan IPA? Atau, yang backgroundnya IPA tapi sebenernya kepaksa dan ga suka suka banget?
Kali ini mimin mau bahas soal peranan Data Science di bidang Social Science. Jadi seperti yang kita tau, ilmu DS emang bisa dipake dimana-mana karena basicnya adalah data. Yang artinya, selama ada data, data science bisa berperan disana.
Harga ojol tiba-tiba naik drastis? Gara gara dynamic pricing sih!🚕💸
Bagaimana machine learning membantu menyeimbangkan pasar.
.
.
.
A thread
Malem minggu gini, siapa yang keluar rumah naik ojol? Kalo diliat-liat, harganya pasti lebih mahal ya daripada weekdays?
Ga cuma pas malem minggu aja, ada waktu-waktu tertentu harga transportasi online lebih mahal daripada biasanya. Misal nih, jam berangkat sama pulang kerja, pas lagi cuaca buruk kaya hujan deres, dan pas ada acara-acara tertentu kaya tahun baruan
Lo pikir kebijakan yang lo buat bakal berdampak, yakin? 🤔🤨
Kenalan dulu sama theory of change!
.
.
.
A thread
Semua orang pasti punya tujuan, mau itu jangka panjang atau jangka pendek. Tentunya, buat mencapai tujuan-tujuan itu, ada tindakan yang harus dilakukan. Tapi, belum tentu semua tindakan itu bakal berhasil dan bisa mencapai tujuan akhir. Kan wajar hidup ada gagalnya, ya gak?~
Konsep ‘punya tujuan → lakukan tindakan → mencapai tujuan / tidak mencapai tujuan’ ini sebenarnya bisa diterapkan dalam pengambilan keputusan. Ada teori bernama ‘theory of change’ yang bisa kalian terapin, entah itu buat tujuan pribadi, bisnis, atau bahkan negara
Dadah insomnia, halo tidur nyenyak 💤😴
Intro to monte carlo simulation
.
.
.
A thread
Halo semua! Pernah denger nama Monte Carlo gak, nih? Yang kalian tau, monte carlo itu apa, sih?
Buat yang jawab Monte carlo itu kota casino di Monaco, kalian bener banget! Tapi bukan berarti yang jawab algoritma itu salah, loh. Monte carlo yang bakal kita obrolin itu ditemuin sama Stanslaw Ulam yang lagi ngerjain “Manhattan Project”.
Data Scientist Tapi Manipulasi Statistik? Haram, Boss!🤷🤦♀️
Manipulasi Statistik: Kesalahan Fatal yang Dilakukan Data Scientist.
.
.
A thread
Seperti yang kita semua tau, data itu penting buat dijadikan acuan untuk mengambil keputusan. Tapi sebelum kita bisa membuat kesimpulan dari data yang dimiliki, ada proses panjang yang harus dilewati nih, dan tentu aja proses tersebut juga rawan dari kesalahan.
Sebagai seorang Business Intelligence dan Data Scientist, kita harus menghindari kesalahan - kesalahan yang fatal yang berujung membuat data dan kesimpulan yang dibuat jadi misleading alias menyesatkan.