Talal Almutairi Profile picture
Dec 5, 2022 17 tweets 5 min read Read on X
مفاهيم إدارة وحوكمة البيانات كثيرة ومتداخلة. في هذه التغريدات بنتعرف على بعض نقاط إدارة البيانات Data Management و حوكمة البيانات Data Governance والفرق بينهم.

#علم_البيانات Image
الهدف الأساسي من الاهتمام بالبيانات هو تحويلها إلى أصل ذو قيمة value
مثلاً إدارة وتحليل البيانات الصحية لشعب معين قد يساعد في بناء خطط وقاية تساهم في خفض تكاليف العلاج. هنا لها قيمة مادية تعادل ملايين.
نبدأ بتعريف إدارة البيانات حسب Data Management Association (DAMA)
إدارة البيانات هي تطوير وتنفيذ والإشراف على الخطط والسياسات والبرامج والممارسات التي تقدم وتتحكم وتحمي وتعزز قيمة أصول البيانات والمعلومات طوال دورة حياتها. Image
حوكمة البيانات هي الإطار التنظيمي لوضع الإستراتيجية والأهداف والسياسة لإدارة البيانات بشكل فعال
وتتألف من العمليات processes والسياسات policies والتنظيم organization والتقنيات technologies اللازمة لإدارة وضمان توافر البيانات وإمكانية استخدامها وسلامتها واتساقها وقابليتها للتدقيق Image
نحتاج نفهم هذه المصطلحات من منظور إدارة وحوكمة البيانات
⁃Principles
⁃Standards
⁃Policies
⁃Processes/Procedures
⁃Role and responsibilities Image
الترتيب قد يكون له أهمية لكن في حالات ما يكون مهم. حيث يكون للجهة مبادئ عامة للاهتمام بالبيانات مثلاً أنها أصل قيم
من هذه المبادئ تكتب عدة سياسات ثم تجهز مجموعة من المعايير كقواعد لقياس مدى تحقيق السياسات
يتم بعدها تحدد العمليات والاجراءات التي تمكن من تنفيذ هذه السياسات والمبادئ
ال principles
قواعد أو اهتمامات يجب أن يلتزم بها. تكون غالباً بشكل عام. مثلاً تأخير المهام غير مقبول في هذه المنظمة.
أيضا البيانات يجب أن تكون عالية الجودة.
وهناك سياسات مختلفة لتحقيق كل مبدأ.
في إدارة البيانات هي مجموعة من المبادئ تكون بخطوط عريضة خاصة بالشركة مثلا
إن البيانات هي أصل ذو خصائص فريدة
Data is an asset with unique properties.
أيضأ إدارة البيانات تعني إدارة جودة البيانات
Managing data means managing the quality of data
ال Policy
هي مجموعة guidelines تتبناها لتحقيق مبدأ معين.
هناك عدة سياسات تحددها لتجنب تأخير المهام

ال Data Quality Policy
نركز هنا على مجموعة من الخصائص أو الأبعاد dimensions التي تحقق جودة البيانات
في الصورة نذكر مثلاً دقة البيانات Accuracy أن البيانات لابد أن تكون دقيقة الخ. Image
ال Processes or Procedures
هي الخطوات والعمليات التي من خلالها ننفذ ال Policy وهي عبارة عن مهمة خطوة بخطوة لتحقيق سياسة معينة
عندنا مجموعة من العمليات للدقة مثل

Data Profiling
Data cleansing
وغيرها كثير ممكن تشوف الروابط

sciencedirect.com/topics/compute…
أيضا

dataladder.com/data-quality-p…
في الصورة مثال على ال Data Profiling حيث توجد أدوات توضح لك توزيع البيانات والقيم الفارغة والمتوسطات الخ

وتنظيف البيانات يشمل خطوات كثيرة مثلاً حذف البيانات المتكررة أو القيم الشاذة وغيرها Image
ال Standards
هي القواعد التي نتأكد منها لتحقيق السياسات. مثلا في جودة البيانات حددنا أن البيانات لابد أن تكون دقيقة Policy. يتم في Standards تحدد مجموعة من القواعد rules ليتم التحقق منها وقياس مدى تحقيق ال Policy
وعلى أساسها تكتب و تحدد العمليات والخطوات
مثلاً اسم العميل لابد أن يكون ثلاثي ويخزن بشكل منفصل على هيئة الاسم الأول، الاسم الثاني، الاسم الأخير.
رقم الجوال لابد أن يكون بصيغة محددة
العنوان يكون على شكل تقسيمات معينة الخ
ال Roles and Responsibilities
هنا تحديد الأدوار والمسؤوليات لأشخاص أو فرق حسب المهام المختلفة وهذا مفهوم واضح.
أخيراً نتحدث عن الفرق بين إدارة البيانات وحوكمة البيانات
إدارة البيانات هي مظلة تضم مجموعة من knowledge areas من ضمنها حوكمة البيانات.
كما في الصورة ImageImage
حوكمة البيانات تضع مجموعة من المبادئ principles والسياسات policies و المقاييس standards
وتتداخل حوكمة البيانات مع كل knowledge areas
بمعنى مسؤولة عن المراقبة وليس التنفيذ.
وإدارة البيانات مسؤولة عن تنفيذ هذه المبادئ والسياسات ضمن دورة حياة البيانات من إنشائها حتى التخلص منها Image
في الأخير إدارة وحوكمة البيانات أعمق من النبذه التي ذكرتها بالأعلى. ممكن تتوسع بالقراءة عنها من خلال هذا الكتاب Image

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Talal Almutairi

Talal Almutairi Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @TALALSQL

Mar 24, 2023
تقسيم البيانات إلى بيانات تدريب training وتحقق validation و اختبار testing
تعتبر من المفاهيم الأساسية في تعلم الآلة. لكن عدة مرات يتكرر علي هذا السؤال ويذكر بعضهم أنه تكرر عليه في كذا مقابلة.
في هذه التغريدات سأحاول توضيح لماذا نستخدمها والفروق بينهم. Image
بعد التعريفات هناك بعض الأسئلة التي سأحاول الإجابة عليها

ماهي النسبة الأفضل لتقسيم البيانات ٨٠٪ تدريب و ٢٠٪ إختبار. أو ٣٠:٧٠ أو ١٠:٩٠؟

ماهي طرق تقسيم البيانات أو كيف يتم التقسيم؟

إذا كان لدينا عدم موازنة في الكلاسات كيف نحلها؟

متى أستخدم التقسيم العادي أو cross validation؟
في البداية بناء نموذج تعلم آلي ليست عملية واحدة حتى نصل لنتيجة مُرضية. نحتاج أن نجرب عدة خوارزميات وعدة إعدادات لكل خوارزمية حتى نصل لأفضل نموذج Final Model
هذه العملية تسمى Model Selection. وفيها بعض التفاصيل والاستراتجيات المختلفة لكن نركز على حالتين:
Read 18 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(