Mau hasil estimasi OLS gak bias? Yuk patuhin asumsinya!
.
.
.
A thread
Siapa yang sebelumnya udah pernah pakai OLS? Cungg!
Oke, kalau baru pernah denger apa itu regresi OLS, mari kita mulai dari pengertiannya dulu yaa
Regresi OLS ini merupakan metode regresi yang biasanya digunakan untuk melihat / menjelaskan bagaimana hubungan antara independent variable (predictors) dengan dependent variable (target)
OLS bisa menjelaskan hubungan tersebut dengan cara meminimumkan jumlah kuadrat residual, dimana residual sendiri merupakan perbedaan antara nilai yang kita observasi dengan nilai yang diprediksi.
Nah, ketika menggunakan metode OLS, ada asumsi-asumsi yang harus kita penuhi biar hasil estimasinya BLUE (best linear unbiased estimator). Kita masuk ke asumsi yang pertama.
(1) Terdapat hubungan linear antara variabel independen dengan variabel dependen
Biar ga bingung, kita coba perhatikan model OLS di bawah ini. Y itu menunjukkan variabel dependen, Beta 0 menunjukkan intercept (nilai variabel dependen ketika variabel independen = 0),
Beta 1 menunjukkan pengaruh variabel independen ke variabel dependen ketika nilai variabel independen = 1, dan terakhir, u menunjukkan error term (hal-hal di luar model yang dapat mempengaruhi variabel dependen).
Untuk memenuhi asumsi pertama, berarti kita harus punya model dimana hubungan variabel dependen dengan independen nya itu linear kan. Oke, coba perhatikan 2 model di bawah ini duluu.
Ada yang bisa tebak mana model yang linear?
Yep, hubungan variabel dependen dengan variabel independen kedua model di atas sama sama linear. Loh tapi kan variabel X2 di model kedua itu kuadrat min?
Nah, hubungan antara variabel dependen dengan variabel independen itu kan digambarkan melalui parameter, makanya yang kita tekankan di asumsi pertama ini adalah parameter yang linear. Jadi ga masalah kalau variabelnya ga linear.
Kalau misalkan kita ga menuhin asumsi pertama ini, model yang kita buat jadi bias dan bakal membuat estimasi yang buruk. Jadi, pastikan model OLS kalian memenuhi asumsi pertama ini yaa!
(2) Zero conditional mean
Di asumsi kedua ini, error term pada setiap variabel independen = 0. Atau dalam kata lain, unexpected value dari unobserved ga boleh memiliki hubungan dengan variabel independen
(3) Residual harus bersifat homoscedasticity.
Maksudnya adalah varian error dari setiap level variabel independen kita itu konstant / tetap. Untuk memenuhi asumsi ini, kita harus menghindari yang namanya heteroscedasticity.
Heteroscedasticity terjadi ketika varian error dari setiap variabel independen kita berbeda. Kalau kita perhatikan gambar di bawah ini, semakin lama, varian error heteroscedasticity semakin bervariasi, beda sama homoscedasticity yang konstan
Bila asumsi homoscedasticity dilanggar, maka hasil estimasi kita gabisa lagi disebut BLUE karena pelanggaran pada homoscedasticity ini membuat estimasi tidak lagi ‘best’. Untuk menghindari hal ini, kita bisa melakukan uji homoscedasticity.
(4) Tidak ada multikolinearitas.
Multikolinearitas adalah keadaan dimana terdapat korelasi yang kuat antara variabel independen. Kita misalkan variabel independen yang digunakan adalah X1, X2 dan X3, dimana X3 itu merupakan X1 + X2.
Karena X3 ini dibentuk dari X1 dan X2, bisa dikatakan kalau X3 ini punya korelasi yang kuat sama X1 dan X2 alias ada multikolinearitas. Nah, multikolinearitas ini gak baik buat model kita karena susah untuk melihat parameter di model kita.
Maka dari itu, untuk menghindari multikolinearitas, ada uji yang dapat kita lakukan beberapa uji, seperti dengan melihat korelasi antar variabel independen yang kita gunakan atau menjalankan VIF test.
(5) Tidak ada autokorelasi.
Kalau tadi multikolinearitas itu menunjukkan adanya korelasi antar 2 atau lebih variabel independen, nah autokorelasi ini menunjukkan adanya korelasi antar observasi di variabel yang sama.
Contohnya gini, temperatur udara di hari pertama setiap bulan akan lebih mirip dengan temperatur udara di hari kedua dibandingkan dengan hari ke 31.
Kalau kita melanggar asumsi ini, nantinya varians kita bakal underestimate dan mempengaruhi hipotesis testing kita. Nah, itu tadi adalah 5 asumsi OLS agar hasil estimasi kita bisa BLUE.
OLS ini merupakan salah satu materi dasar ekonometrik yang familiar di kalangan Data Scientist. Nah, non degree program Data Scientist Pacmann.AI juga memberikan materi ekonometrik lohh, cek kurikulum lengkapnya di bit.ly/brosurpacmannai yaa
Atau kalau kalian bisa langsung daftarin diri kalian di bit.ly/PendaftaranNon…,, mumpung masih ada Promo Early Bird dari Pacmann. Yuk, buruan daftar, promonya hanya berlaku hingga Selasa besok lohh! See you! 😊👋🏼

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Follow us on instagram: @pacmannai

Follow us on instagram: @pacmannai Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

5 Apr
Normalization vs Standardization: Apa, Kenapa, dan Gimana?
A Simple Guide to Feature Scaling
.
.
.
A thread
Kalau dipikir-pikir, sebenernya jadi DS sama jadi chef itu sama aja. Sama-sama preprocessing ‘ingredients’ nya. Sama-sama modeling dan tuning ‘resep’ nya. Sama-sama deploy ke customer nya. Dan kalau customer bilang “Mas, kok kurang enak?”, sama-sama update resepnya.
Atau ketika seorang chef membuat strawberry-banana smoothie misalnya, nggak semudah mencampur satu pisang utuh dan satu stroberi aja kan? Karena tentu nanti yang terasa cuma pisang nya aja. Atau dengan kata lain, smoothie nya akan ‘bias’ ke pisang. Image
Read 34 tweets
4 Apr
Bintang - bintang di penelitian, apa artinya?⭐️⭐️⭐️
.
.
.
A thread
Hayo siapa yang udah familiar sama maksud ‘***’ atau ‘**’ atau bahkan ‘*’ di paper / penelitian yang kalian bacaa?
Jadi gini guys, tanda bintang yang biasa kalian liat di paper / penelitian itu menandakan p-value dari variabel yang digunakan.
Read 33 tweets
3 Apr
Data visualization bisa nurunin criminal rate, gimana caranya?🤔
.
.
.
A thread
Kalau minggu lalu kita bahas pelanggaran lalu lintas, minggu ini kita bahas tentang tindak kejahatan lain. Nih, kalau belum baca thread gimana AI bisa membantu polisi melihat siapa aja yang ngelanggar aturan lalu lintas, cek disini yaa:
Kejahatan memang menjadi masalah di seluruh penjuru dunia. Ga hanya mempengaruhi kualitas hidup korbannya, tingkat kejahatan juga berpengaruh ke pertumbuhan ekonomi dan reputasi dari sebuah negara. Makanya ga heran kalau berbagai negara mencoba buat nurunin angka kejahatannya
Read 40 tweets
2 Apr
Peninggalan Pabrik Gula Belanda di Jawa yang Masih Terasa di Abad 21🍭
.
.
.
A thread
*pict: Collectie Stichting Nationaal Museum van Wereldculturen Image
Ingat tweet ini? Nah, hari ini mimin mau ngulik nih tentang paper yang memadukan aspek ekonomi dan sejarah era kolonial, menarik banget nih perpaduannya!
Oh iya sebelum kita mulai, disclaimer dulu nih: paper ini bertujuan untuk memaparkan dampak kolonialisme di Indonesia dalam jangka panjang dan tidak membenarkan kolonialisme Belanda terhadap Indonesia jaman dulu yaaa. Oke tanpa mengulur lebih lama lagi, ayo kita mulai threadnya!
Read 40 tweets
2 Apr
Data Scientist di Industri Pengiriman Barang: Ngapain Aja?
(image credit: @ajplus) Image
Kamu pasti familiar dengan foto di atas, yang akhir-akhir ini berseliweran di sosial media kita. Atau mungkin meme ini:
Kapal Ever Given yang stuck dari minggu lalu di Terusan Suez ini akhirnya ‘bebas’ pada hari senin kemarin. Tapi di selang seminggu itu, kejadian ini menghasilkan puluhan meme dan juga kerugian sebesar miliaran dolar bagi berbagai pihak.
Read 30 tweets
1 Apr
Kenapa bot bisa main catur
.
.
.
A thread
Hola semuanya! Pasti kalian udah denger dong tentang partai catur yang sangat fenomenal minggu lalu yang memecahkan rekor penonton catur tertinggi di dunia!
Sekarang mimin mau bahas tentang bot catur yang kemarin sempat jadi perbincangan nih, tapi disini mimin engga ngejudge yahh 🤣
Read 44 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!