Mau jadi DS tapi masih takut ngoding?πŸ§‘β€πŸ’»πŸ˜‰
Mulai dari Excel aja dulu!
.
.
.
A thread
Eits, jangan langsung serang mimin setelah baca judulnya. Ya, ya, ya, mimin paham kok reputasi excel masih jauh banget sama Python, R, Java, you name it lah. Tapi, buat pemula yang masih takut ngoding, excel ini bisa jadi alternatif buat kenalan dengan dunia per ds-an.
Lebih baik mencoba dari hal sederhana dulu kan daripada gak sama sekali?
Oke, siapa sih yang ga kenal excel? Mimin yakin pasti pas masih sekolah setidaknya kalian udah pernah nyentuh excel ini, dan mungkin pertama kalinya kalian ngolah data secara sederhana juga mulainya dari excel.
Walaupun belajar excel doang ga cukup mengantarkan kalian jadi Data Scientist setengah dewa, tapi ga ada salahnya loh belajar excel ketika baru mau terjun ke dunia per ds-an ini. Nih, mimin punya beberapa argumen nya:
(1) Skala excel kecil
Kalo misalkan kalian masih pemula dan hanya memegang data yang ga begitu banyak, excel cocok untuk kalian gunakan. Excel ini bisa reduce technical loads dari kapabilitas software.
Yes, excel memang kurang baik untuk mengelola data dengan jumlah banyak, tapi untuk data yang sedikit dan ga begitu membutuhkan deep learning, kalian bisa melakukan simplifikasi dengan menggunakan excel.
Asalkan data kalian ini bisa dimuat dalam 1,048,576 baris dan 16,384 kolom, excel bisa kalian jadikan pilihan untuk mengolah data data tersebut.
Ngomongin tentang limit nya excel, kalian juga harus perhatiin nih ketika mau ngubah format lain ke format excel, jangan sampai mengulang kesalahan lembaga kesehatan masyarakat Inggris (PHE) yang salah ngimpor file excel dan menyebabkan hilangnya 16.000 data kasus covid-19.
Jadi awalnya gini, PHE ini kan melakukan swab test, tracing, dll. Datanya itu kemudian mereka simpan dalam format CSV. Format ini tuh bisa nampung berapa banyak data gitu.
Data ini selanjutnya pengen di taro di pusat sistem gitu yang bisa diakses sama team testing, tracing sama pemerintah. Masalahnya adalah, PHE ini memilih mengimpor CSV ke format excel tahun 1997 - 2003, alias pakai format XLS.
Ini kan format lama ya, jadinya excelnya cuma bisa nampung 65,536 row aja. Karena datanya lebih dari kapasitas XLS, jadilah data yang ada di row bawah ke cut dan ga muncul di file XLS itu.
Akibatnya jadi banyak orang orang yang ga ke tracing, dan bebas berkeliaran tanpa tau kalau mereka itu orang dalam pengawasan gituu. Nah, jadi jangan ngulangin kesalahan yang sama ya guys, fatal!
(2) Excel bisa melakukan basic statistics
Bisa dikatakan kalau excel ini editor yang baik kalau kita ngomongin data 2 dimensi alias tabel. Yep, excel already in the game since 1987. Tabel yang ada di excel mudah banget untuk kita edit, format, diwarnai, dan tentunya di share.
Ga hanya itu aja, kalian juga bisa melakukan statistik sederhana menggunakan excel lohh! Kalian bisa mulai dari nyari average, joining menggunakan VLookup, pivoting, data cleaning dasar menggunakan TRIM, VALUE, hingga mencari korelasi dan melakukan regresi
(3) Menghemat waktu visualisasi
Excel juga dilengkapi dengan fitur untuk memvisualisasikan data. Nah, fitur visualisasi di excel bisa jadi alternatif kalau kalian mau menganalisa data secara sederhana dan cepat sebelum masuk ke proses ngolah data selanjutnya.
Ngecoding suatu program yang complicated hanya untuk melakukan visualisasi mungkin ga jadi pilihan yang baik mengingat kalau mengerjakan project kan juga ada deadlinenya. Jadi kalian bisa masukin data ke excel dan mempersingkat waktu buat visualisasi deh!
(4) Excel itu non technical
Kalau misalkan nih kalian bekerja di sebuah perusahaan sebagai data scientist, sukur sukur kalau atasan kalian atau orang-orang yang akan membaca report kalian itu paham tentang dunia per-ds-an.
Tapi kan pada nyatanya, tidak semua orang belajar Python, R, dan bisa mahamin data yang kalian sajikan. Nah, excel ini bisa jadi alternatif kalian buat ngasih tau data apa sih yang kalian pegang dari departemen ke departemen lain.
Ga hanya itu aja, sekarang kan udah ada yang namanya google spreadsheet. Spreadsheet ini memungkinkan kita buat ngedit excel dengan orang lain secara berbarengan gitu kan.
Jadi spreadsheet bisa banget jadi pilihan ketika kita harus kerja dengan orang yang ga belajar bahasa pemrograman. Melalui spreadsheet ini, kalian juga bisa ngetrack siapa merubah apa, alias ada historynya. Jadi bakal memudahkan banget sihh spreadsheet ini.
Ngomong ngomong tentang spreadsheet, Pacmann bakal ngadaiin workshop series nih buat kalian yang mau terjun ke dunia Data Scientist tapi masih takut buat ngoding. Workshop ini bakal bantu kalian untuk paham gimana sih cara memanfaatkan spreadsheet untuk Data Science
Yuk, nambah wawasan selagi ngabuburit bersama Annisa Cantika, Advertising Product Operation GoJek. Segera daftarkan diri kalian di bit.ly/DaftarPacbubur… yaa!
(5) Bisa dikombinasikan dengan programming language lain
Tenang aja, menggunakan excel bukan berarti kalian ga bisa combine pakai programming language lain. Intinya kan kalian mau mencari cara untuk menyelesaikan pekerjaan kalian dengan baik, jadi tidak ada salahnya untuk mengcombine excel dengan berbagai programming language lain

β€’ β€’ β€’

Missing some Tweet in this thread? You can try to force a refresh
γ€€

Keep Current with Follow us on instagram: @pacmannai

Follow us on instagram: @pacmannai Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

15 Apr
Mau clustering data?
Lebih oke gaussian mixture model atau k-means?πŸ§πŸ€”
.
.
.
A thread
Gaussian pasti bukan kata yang asing lagi buat kita semua, kan? Distribusi Gaussian, yang diperkenalkan oleh Carl Friedrich Gauss, biasanya kita kenal dengan nama lain distribusi normal.
Sebelumnya, yuk kenalan sama gaussian process dulu. Kalian tau gak sih, sebenernya gaussian process ini cuma berguna di ranah statistika, atau bisa diimplementasikan di machine learning juga?
Read 28 tweets
14 Apr
Mau sales meningkat drastis? πŸ“ˆπŸ€‘
Kenalin dulu pola customer lewat association rule!

.
.
A thread
Siapa disini yang suka window shopping? Yang hobinya masukkin barang ke keranjang online tapi engga pernah di checkout haha
Fenomena ini menarik untuk dibahas deh seiring dengan banyaknya event-event dari e-commerce kayak tanggal cantik yang bikin kita tertarik banget buat belanja
Read 36 tweets
13 Apr
Emang ketidakteraturan bisa diukur?🀨🧐
Intro to entropy
.
.
.
A thread
Mungkin sebagian dari kita mengenal entropi sebagai suatu istilah dalam ilmu fisika khususnya topik termodinamika. Ternyata entropi ini gak cuma ada di fisika loh, dia juga ada di dalam statistik. Gimana tuh?
Oke, mari kita mulai dari suatu pembahasan yang sederhana. Misalkan kita punya 3 kotak. Kotak pertama berisi 4 bola merah, kotak kedua berisi 3 bola merah dan 1 bola biru, kotak ketiga berisi 2 bola merah dan 2 bola biru Image
Read 36 tweets
13 Apr
Ambis jadi Data Scientist bikin burnout? πŸ§‘β€πŸ’»πŸ€―
Yuk recharge dulu!
.
.
.
A thread
Pernah nggak kamu ngerasa muak banget sama kerjaan, ketika deadline kamu numpuk semua hari ini tapi kamu udah ngerasa capek begitu bangun tidur?
Well, lookout guys. Mungkin kamu lagi ngerasa apa yang disebut β€˜burn out’.
Read 34 tweets
12 Apr
Ketika model too good to be true: pas training bagus, giliran dipakai klien anjlok?πŸ§πŸ€”
Intro to data leakage
.
.
.
A thread
Pak Saryono adalah seorang guru matematika di SMA Tunas Bangsa. Suatu hari, ia kepikiran buat ngasih murid-muridnya sebuah set soal latihan beserta pembahasannya sebagai bahan persiapan menjelang pelaksanaan ujian akhir semester.
Guru mana sih yang nggak pengen nilai muridnya bagus-bagus? Nah, tanpa ada satupun yang tahu, Pak Saryono ini sengaja memasukkan soal-soal ujian akhir semester -- yang harusnya baru dilaksanakan minggu depan -- ke dalam set soal latihan!
Read 38 tweets
11 Apr
Mau terbebas dari panasnya neraka duniawi? Ini yang bisa machine learning lakukan!πŸ₯΅πŸ”₯
Tackling climate change with machine learning.
.
.
.
A thread
Ngerasa gak sih, dari tahun ke tahun tuh rasanya tiap musim kemarau makin panas?
Ya wajar aja kalau ngerasa semakin panas. Sejak tahun 1981, temperatur bumi naik 0.18 derajat Celcius per dekadenya. Akibatnya tuh ga cuma sekedar β€˜oh cuaca jadi makin panas’ aja guys, tapi lebih dari itu.
Read 33 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!