“Bikin visualisasi data itu tinggal bikin grafik doang kan?”

Jangan salah!

Nyatanya gak semudah itu.
Coba kalian liat contoh di bawah ini,

Menurut kalian, apa yang salah dari grafik ini? Image
Jawaban: tinggi bar chartnya ga merepresesentasikan nilai yang seharusnya.

Kalau bar chart sebelumnya kita coba benerin, maka tampilan seharusnya mestinya begini: kang emil cuma keliatan lehernya aja :( Image
Bikin visualisasi itu memang susah-susah gampang.

Biar visualisasi yang kamu buat gak seperti contoh sebelumnya,

Malam ini kita akan coba bahas beberapa do’s and don'ts ketika bikin visualisasi data yang wajib kamu tau!
Buat yang lagi nyusun portofolio ke kumpeni idaman, wajib save thread ini!

Disclaimer: penjelasan dos & don’tsnya kali ini sebatas gimana kamu memilih tipe chart dan milih tipe warna ya!
STEP PERTAMA:
Tentuin tipe chart yang sesuai dengan tujuan/informasi yang ingin kamu tampilkan dan tipe data input yang akan kamu visualisasikan
Tujuan visualisasi umumnya bisa dibagi jadi 3 tipe:
- comparison & composition
- relationship
- distribution
COMPARISON: menunjukkan perbandingan data dari 2 kelompok, minimal butuh input 1 tipe data numerik + 1 tipe data kategorik.

Tipe chart yang paling umum dipakai adalah bar chart.
contoh: visualisasinya dari @JabarDigitalService yang membandingkan luas kawasan hutan antar kabupaten

(source: opendata.jabarprov.go.id/id/visualisasi… ) Image
BIG NO ketika kamu nunjukin informasi yang bersifat comparison: pakai pie/doughnut/treemaps chart.

3 tipe chart ini gak bisa ngasih informasi dengan efektif dan efisien.
Contoh: visualisasi Anggaran Belanja dan Pendapatan Daerah Provinsi DKI Jakarta 2017

(source: Open Data Jakarta data.jakarta.go.id/visualisasi/de…) ImageImageImage
“Biar bagus, boleh dijadiin 3D chart ga?”

Nah, penggunaan 3D chart HARUS DIHINDARI karena bisa menimbulkan persepsi yang salah. Image
Ngomong-ngomong tentang persepsi, ini juga menjawab pertanyaan Pacmin di awal.

Persepsi audiens ketika melihat grafik tersebut seolah-olah perbandingan 1 kandidat dengan yang lainnya gak jauh beda.

Padahal, tinggi pada masing-masing bar grafik tersebut gak konsisten.
Lanjut lagi ke tujuan visualisasi yang kedua!
RELATIONSHIP: menunjukkan adanya HUBUNGAN antara 2 variabel atau lebih dengan tipe data numerik.

Tipe chart yang biasa dipakai: scatterplot, line plot.
Contoh: hanya dengan scatterplot aja @OurWorldInData bisa ngejelasin bahwa Child Mortality Rate punya hubungan terbalik dengan GDP per capita loh:
DISTRIBUTION: nunjukin PERSEBARAN data dengan tipe data numerik.

Tipe chart yang biasa dipakai: histogram, kde-plot, boxplot, violinplot dan scatterplot.
Contoh: histogram persebaran penghasilan per rumah tangga Jakarta vs Jogja.

(source: nmonarizqa.medium.com/gaji-jakarta-t…, by @nmonarizqa ) Image
Nah kalau kamu sudah bisa nentuin tipe chart berdasarkan highlight informasi yang ingin kamu tampilkan,

Kita bisa lanjut ke STEP KEDUA: tentuin WARNA yang mau kamu pakai!
Kedengerannya sepele kali ya, perkara cuma milih warna. Padahal, milih warna itu ada aturannya loh, gabisa cuma karna keliatan estetik atau mood-moodan kamu aja xixixi.

Sebelum kita bahas, coba kamu cek dulu contoh grafik ini. Image
(source grafik tadi: medium.com/fm-stories/how… )
Pusing ga buat baca grafiknya?
Biar ga kayak chart di atas, untuk itu kamu perlu mengerti dulu soal COLOR HUE!

Color hue bisa diartikan sebagai “BASE” warna. Contoh warna dengan hue yang berbeda: kuning, merah, biru.
Karena kuning, merah dan biru ini sangat kontras, maka kita bisa bilang merah-kuning-biru itu punya hue yang beda (contoh kiri).

Contoh warna dengan hue yang sama: merah kecoklatan, merah bata, merah maroon, merah muda, pink (semua merah, cuma intensitasnya aja yang beda). Image
Pemakaian warna/color hue yang kontras akan ngasih persepsi bahwa apapun yang direpresentasikan dengan warna yang beda maka akan masuk ke kelompok data yang berbeda.
Dan sebaliknya, kalau ada data yang direpresentasikan dengan warna dasar sejenis maka data tersebut masuk ke kelompok yang sama.
Akibatnya, pemilihan color map ini biasanya berkaitan dengan tipe data variabel input yang kita visualisasikan.

Berdasarkan tipe data, colormap dibagi jadi 3 tipe:
- QUALITATIVE COLORMAP
- SEQUENTIAL COLORMAP
- DIVERGING COLORMAP
QUALITATIVE COLORMAP

Bayangin ketika kamu lagi nunjukin 2, 3 atau lebih kelompok data,

Nah supaya kamu bisa nge-point out bahwa kelompok yang satu sangat berbeda dengan yang lain, maka kamu butuh warna yang hue nya beda juga dongs xixixi.
Contoh: kalau kamu perhatiin chart dari @worldindata tadi, selain nunjukin hubungan antara variabel numerik Child Mortality Rate vs GDP per capita.
Mereka juga ngasih informasi soal kelompok geografi dari masing-masing negara lewat warna (ungu: afrika, hijau: asia, merah: amerika, dan abu: europe)

Nih Pacmin highlight pengelompokan warnanya biar kamu bisa langsung ngeh: Image
SEQUENTIAL & SEQUENTIAL DIVERGING COLOR MAP

Lanjut case lain, misal kamu mau nunjukin informasi dengan input data numerik.

Jenis colormap apa yang harus kamu pilih?

Gampang!

Kamu tinggal cek range numerical data kamu.
Sebelum itu, beda sequential dan sequential diverging colormap tuh gimana sih?

Sequential itu cuma terdiri dari SATU jenis hue warna aja tapi intensitas warnanya bervariasi dari terang ke gelap.
Kalau sequential diverging terdiri dari DUA jenis hue warna dengan intensitas yang juga bisa bervariasi (source: blog.datawrapper.de/which-color-sc…) Image
Sequential colormap dipakai ketika input data numerik kamu HANYA bernilai positif saja atau negatif saja (1 polar nilai)

Sequential diverging colormap dipakai ketika input data numerik kamu ada pada range positif dan negatif (2 polar nilai)

(source: web.natur.cuni.cz/~langhamr/lect…) Image
Ralat untuk tweet ini, pake gambar yang ini.

Pantesan kok gak pada nge-vote xixixi
Image
Nah, seharusnya itu kayak gini,

Karena kita tau range data temperaturnya ada di range negatif dan positif (2 kutub), maka kita bisa pake 2 color hue aja!

Nih chart barusan kalo diganti pake sequential diverging tampilannya jadi: Image
Nah segitu aja penjelasan soal dos and don'ts visualisasi.

Kalau dibahas semua rule of thumb visualisasi lewat thread bisa2 jari Pacmin ketuker antara telunjuk dan kelingking.
Buat kamu-kamu yang masih struggle untuk bikin portofolio dan pingin belajar lebih jauh soal visualisasi kamu bisa banget nih ikutan program belajar di Pacmann!

Psst.. di Pacmann bahkan ga cuman belajar visualisasi lewat kelas aja loh!
Semua student Pacmann dikasih bimbingan untuk konsul portofolio juga.

Menarik khan?

Nih sneak peak soal konsul porto di Pacmann, dikasih feedback yang mendetail untuk porto kamu: Konsul Portofolio Pacmann
Bisa tebak, siapa yang memberikan saran bagi portofolio student? Portofolio student consulta...
Bagi Pacpeers yang pengen dapet diskon sampe 700ribu, bisa langsung aja klik link ini
bit.ly/pacreferral_th…
Atau masuk ke website pacmann.io kemudian daftar dan masukin aja kode promo ini: Image
#SeekMastery at Pacmann

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Probably Approximately Campus

Probably Approximately Campus Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

Nov 15
Banyak banget yang setuju dan berpendapat bahwa portfolio itu penting banget untuk masuk role data.

Alasan terbesarnya karena menunjukan keahlian kita dalam mengolah data yang bakal jadi bahan interview juga.

⬇️
Oke, mimin itu belajar jadi Data Scientist sekitar 1 tahun setelah artikel "Data Scientist is the sexiest job of 21st century" keluar.

Jadi, dia udah belajar sebelum ada bootcamp DS.

Sebelum booming role data ini....
Read 16 tweets
Nov 11
Belajar hal baru memang struggling banget, apalagi tanpa basic.

Dari mulai manajemen waktu, banyak pikiran sampai masalah mental bisa banget terjadi.

Malam ini kita sharing mengenai ini ya! Image
Ini berdasarkan keresahan kalo misalnya ikut bootcamp yang lulus cuma sedikit, bahkan ada yang putus asa.

Ini menjadi concern Pacmann sebagai lembaga edukasi yang ingin sekali untuk membentuk talenta data & bisnis yang berkualitas.
Alasan orang berhenti belajar itu banyak banget, dari gak bisa adaptasi, manajemen waktu yang buruk, burnout ketika belajar bahkan sampe putus asa dan merasa "ini bukan bidang gue".
Read 23 tweets
Nov 10
Data Scientist tanpa pemahaman bisnis?

🚩🚩🚩🚩🚩🚩🚩🚩🚩🚩🚩🚩🚩

Kita bahas di utas ini! Image
Utas ini dibuat berdasarkan diskusi tadi pagi, ternyata masih banyak DS yang belum memiliki business understanding.

Langsung aja bikin model tanpa riset mendalam mengenai model bisnis, apa permasalahannya dan masih banyak lagi.
Jadi DS bukannya butuh fundamental skills berupa Math, Stats, Software Engineering aja min?

Gak gitu dong, DS itu direkrut untuk optimize bisnis dan melakukan analisis untuk decision making, jadi kalo gak paham bisnisnya apa yang mau diselesaikan?
Read 30 tweets
Oct 11
Guide Singkat buat kamu yang ingin tahu tentang SQL Window Functions!

Calon Data Analyst, Data Engineer dan Data Scientist wajib tahu!

Mari kita bahas....
Kemampuan untuk mengolah data merupakan skill yang sangat penting dan wajib dimiliki oleh Pacpeers yang tertarik ingin menjadi data analyst atau data scientist yang handal.

Salah satu skill wajib tersebut adalah penguasaan SQL.
Untuk bisa menggunakan SQL, Pacpeers juga perlu mengetahui berbagai macam fungsi turunan dari SQL, yang salah satunya akan Pacmin bahas dalam thread hari ini yaitu: Window Functions.

Sebelumnya, kita kenalan dulu dengan apa itu SQL!
Read 24 tweets
Oct 10
Social Network Analysis, beberapa tahun terakhir dikenal oleh warga twitter dari Pak @ismailfahmi

Emang manfaatnya apa sih?

Berburu Buzzer? 👀

Nih, Pacmin bahas! Image
Kalo ngomongin social network analysis,

Pacmin inget Six Degree of Separation yang menjelaskan bahwa semua orang itu hanya terpisah tidak lebih dari runtutan 5 orang yang ternyata saling mengenal, dan kita serasa hidup dalam dunia yang sempit. Image
Teori tersebut di-propose oleh Milgram, seorang socio-psychologist.

Ada lagi teori dari seorang mathematician bernama Paul Erdos yang menemukan Graph Theory!

Pak Erdos Pak Milgram ImageImage
Read 20 tweets
Aug 8
Data analytics masih menjadi in-demand skills di masa depan,

Tapi masih banyak yang bingung belajar dari mana?

Pacmin share nih, tips belajar data analytics dari level beginner!
Berdasarkan Future of Jobs Survey 2020, yang dilakukan oleh World Economic Forum, diperkirakan data analyst dan data scientist merupakan pekerjaan yang memiliki permintaan tinggi di Indonesia.
Data Analyst merupakan suatu posisi yang memiliki tugas untuk mengumpulkan, mengolah, menganalisis dan menafsirkan data untuk memecahkan masalah tertentu.

www3.weforum.org/docs/WEF_Futur…
Read 23 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(