Get to Know Data Engineering Role👨‍💻👩‍💻
Extract, Transform, and Load
.
.
.
A thread🧵
Kita udah sering banget bahas peran Data Scientist maupun Business Intelligence. Tapi jangan salah, masih ada loh pekerjaan lain di industri data yang ga kalah pentingnya, yaitu ✨Data Engineer✨!
Udah pada familiar belum dengan role yang satu ini?
Kita bahas dari awal dlu ya apa yang dikerjakan oleh Data Engineering, baru nanti membahas tentang Extract, Transform, and Load (ETL).
Dalam kesehariannya, Data Engineering bertugas untuk mendesain dan membangun sistem untuk mengumpulkan, menyimpan dan menganalisa data dalam skala besar.
Singkatnya, Data Engineer ini bertugas untuk membuat platform data yang memungkinkan Data Scientist untuk melakukan pekerjaannya.
Kalau kita ibaratkan Data Scientist sebagai pembalap mobil profesional yang ingin memenangkan lomba balapan, maka Data Engineer adalah orang yang menyediakan mobil terbaik untuk dipakai Data Scientist bertanding
Intinya adalah, tujuan akhir Data Engineer adalah agar data dapat diakses oleh perusahaan dan digunakan untuk mengevaluasi dan mengoptimasi bisnis mereka.
Nah, kita tau kan kalau Data Engineer ini penting. Tapi, kalau di Indonesia sendiri, demand nya gimana sih?
Setelah iseng searching Data Engineer di LinkedIn, ternyata memang role ini dicari oleh berbagai perusahaan, termasuk para top company. ImageImage
Kalau untuk kisaran gajinya sendiri, berdasarkan Id.indeed.com, ada di angka Rp 11.641.780 rata rata per bulannya. Mungkin temen2 Data Engineer disini mau sharing kisarannya hehehehe
Nah, mimin yakin pasti netizen ada yang tergiur ya kan dengan range gaji segitu per bulannya. Lalu, skill apa yang harus dikuasai agar bisa jadi Data Engineer?
Ini guys listnya

(Mohon dimaklumi karena miminnya lagi demam hometown cha cha cha, kalau kata @inho_oppa mah sedang ter seonho seonho🤪) Image
Okeyy, sudah tau kan kalau salah satu skill yang dibutuhkan adalah Extract, Transform, and Load (ETL). ETL sendiri merupakan proses pengintegrasian data dari satu / lebih sumber ke dalam 1 tempat penyimpanan yang bisa kita sebut sebagai data warehouse.
Lalu bagaimana cara ETL ini bekerja?

Seperti namanya, ada 3 proses yang akan kita lalui.
(1) Extract

Pada tahap ini, kita mengambil data dari sumber yang kita butuhkan yang nanti akan kita transformasikan di staging area.
Nah, data yang diambil ini bisa bermacam macam ya, dari relational database yang terdiri dari baris dan kolom seperti spreadsheet, sampai non relational database yang tidak memiliki skema / relasi di setiap tabelnya.
(2) Transform

Setelah sudah punya datanya, kita akan mentransformasikan data sesuai dengan kebutuhan analisa di staging area hingga siap untuk digunakan.
Ada beberapa tahapan transformasi yang dilakukan, mulai dari

- Memfilter, membersihkan, menghilangkan duplikasi, memvalidasi, dan mengautentikasi data.
- Melakukan perhitungan, terjemahan, atau ringkasan berdasarkan data mentah. Oh iya, ini juga bisa termasuk mengubah baris ke kolom / sebaliknya, mengubah suatu mata uang ke mata uang lainnya, mengubah data string, dan masih banyak lagi.
- Melakukan audit untuk memastikan kualitas data.

- Menghilangkan, mengenkripsi, dan melindungi data yang diatur oleh pemerintah atau industri.

- Mengubah format data agar sesuai dengan skema data yang ada di data warehouse.
(3) Load

Setelah ditransformasikan, data akan dipindahkan ke data warehouse yang ditargetkan. Kalau baru pertama kali, maka tahapannya adalah memasukan semua data ke data warehouse
Tapi kalau sudah pernah melakukannya, ya berarti tahapan load ini mencakup memuat data secara berkala agar tetap up to date, menghapus dan mengganti data yang ada di data warehouse.
Okey, itu dia tahapan ETL. Kalau dulu sih, untuk melakukan ETL, perusahaan membuat code sendiri. Tapi sekarang, udah banyak open source / commercial ETL tools, dan bahkan cloud service yang bisa kalian gunakan.
Nah, untuk mempelajari ETL dan per Data Engineeran ini, kalian bisa enroll free course di Coursera karena ada banyak bangett yang gratis dan cocok untuk pemula.
Contohnya nih ada yang dikeluarkan oleh IBM, dari yang beginner hingga level intermediate nya.
coursera.org/courses?query=… Image
Mungkin itu singkatnya mengenai Data Engineer dan ETL. Kalian bisa gali lebih dalam tentang role ini ke Bagoes Suryo Nugroho, Data Engineer di Lion Parcel pada Webinar hari Jumat nantii. Daftar di goers.co/pacwebinar24sep Image

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with IG: @pacmannai

IG: @pacmannai Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @pacmannai

25 Sep
Data Analyst 101📈🔍
Job desc, Skill, and Benefits
.
.
.
A thread🧵
Mimin yakin kalian udah pernah denger pekerjaan yang satu ini. Tapi, apakah kalian udah tau apa yang dilakukan oleh Data Analyst dan membedakannya dari pekerjaan lainnya di industri data?
Jujuly, mimin juga baru paham jobdesc Data Analyst pas bikin thread ini juga sih heehhehe. Yasuda mari kita kupas tuntas jobdesc, gaji, demand di Indo, sampai skill yang dibutuhkan untuk jadi Data Analyst~
Read 30 tweets
25 Sep
Sebenarnya kalau ada bootcamp jelek dan lulusannya gak ngerti apa-apa, baiknya disebut aja merk bootcamp nya apa...

Jangan sebut cuma bootcamp atau generalisasi semua bootcamp jelek/gak ada gunanya...
Kami di Pacmann beneran niat kok bikin courses yang berkualitas. Bisa ditanya ke temen-temen yang belajar di kami.

Kami juga mau dikritik kalau ada lulusan kami yang jelek atau gak sesuai ekspektasi. Boleh bilang ke kami langsung...
Tapi jika hal itu terjadi juga jangan langsung bilang tempat belajar kamu jelek.

Kalian gak akan bilang UI atau ITB jelek kalau salah satu lululusannya jelek.......

Kami mengevaluasi setiap lulusan kami, setiap matakuliah ada nilainya. Bisa dilihat dia nilainya berapa
Read 10 tweets
12 Aug
Data Science Internship 101
.
.
.
A thread
Di thread thread sebelumnya, mimin selalu menyebutkan kalau mencantumkan project yang pernah dikerjakan di CV itu penting agar recruiter tau kalau kalian ga cuma sekedar paham teori aja.
Tapii, selain project, ada unsur yang ga kalah penting loh untuk dicantumkan di CV, yaitu internship! Dengan adanya pengalaman internship alias magang, recruiter juga lebih yakin kalau kalian pernah mengolah real data di industri.
Read 37 tweets
10 Aug
Data kamu ada multikolinearitas?🥴😱
Jangan panik, pakai ridge regression aja!
.
.
.
A Thread
Halo guys! Masih inget bahasan multikolinearitas kita kemarin? Mimin udah janji nih mau bahas cara mengatasi multikolinearitas! Siapa yang tahu kenapa perlu mengatasi multikolinearitas?
Mimin ulas sedikit, ya. Jadi, ketika mau menggunakan regresi linear tetapi ternyata terdapat korelasi yang tinggi antar variabel independennya, itu artinya ada multikolinearitas.
Read 31 tweets
8 Aug
Cari data pakai survei💬🔍
Yakin pertanyaan yang dibuat sudah benar?
.
.
.
A thread
Hayoo, pernah ga sihh lagi mau nonton Youtube, ehh tiba tiba dikasih ads survei kecil-kecilan kaya gini? Image
Kalau kalian dapet, biasanya bakal ngisi atau enggaa?
Read 29 tweets
14 Jul
Beli followers biar jadi selebgram?!
Awas, bisa diciduk Support Vector Machine loh!
.
.
.
A Thread
Mimin mau tanya nih, siapa disini yang hobi mantengin sosial media. Kalian pernah ga liat story influencer sampe titik-titik? Tapi pas dibuka isinya endorse semua 😔💔 Hmmm, kalian jadi males buka ga?
Sampai sekarang, sudah banyak loh kasus teman teman small business owner yang malah rugi karena endorse di orang yang salah, misalnya kaya yang satu ini nih🤧

Read 39 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!

:(