Talal Almutairi Profile picture
ماجستير في #علم_البيانات. مهتم بـ #Database, #MachineLearning

Dec 5, 2022, 17 tweets

مفاهيم إدارة وحوكمة البيانات كثيرة ومتداخلة. في هذه التغريدات بنتعرف على بعض نقاط إدارة البيانات Data Management و حوكمة البيانات Data Governance والفرق بينهم.

#علم_البيانات

الهدف الأساسي من الاهتمام بالبيانات هو تحويلها إلى أصل ذو قيمة value
مثلاً إدارة وتحليل البيانات الصحية لشعب معين قد يساعد في بناء خطط وقاية تساهم في خفض تكاليف العلاج. هنا لها قيمة مادية تعادل ملايين.

نبدأ بتعريف إدارة البيانات حسب Data Management Association (DAMA)
إدارة البيانات هي تطوير وتنفيذ والإشراف على الخطط والسياسات والبرامج والممارسات التي تقدم وتتحكم وتحمي وتعزز قيمة أصول البيانات والمعلومات طوال دورة حياتها.

حوكمة البيانات هي الإطار التنظيمي لوضع الإستراتيجية والأهداف والسياسة لإدارة البيانات بشكل فعال
وتتألف من العمليات processes والسياسات policies والتنظيم organization والتقنيات technologies اللازمة لإدارة وضمان توافر البيانات وإمكانية استخدامها وسلامتها واتساقها وقابليتها للتدقيق

نحتاج نفهم هذه المصطلحات من منظور إدارة وحوكمة البيانات
⁃Principles
⁃Standards
⁃Policies
⁃Processes/Procedures
⁃Role and responsibilities

الترتيب قد يكون له أهمية لكن في حالات ما يكون مهم. حيث يكون للجهة مبادئ عامة للاهتمام بالبيانات مثلاً أنها أصل قيم
من هذه المبادئ تكتب عدة سياسات ثم تجهز مجموعة من المعايير كقواعد لقياس مدى تحقيق السياسات
يتم بعدها تحدد العمليات والاجراءات التي تمكن من تنفيذ هذه السياسات والمبادئ

ال principles
قواعد أو اهتمامات يجب أن يلتزم بها. تكون غالباً بشكل عام. مثلاً تأخير المهام غير مقبول في هذه المنظمة.
أيضا البيانات يجب أن تكون عالية الجودة.
وهناك سياسات مختلفة لتحقيق كل مبدأ.

في إدارة البيانات هي مجموعة من المبادئ تكون بخطوط عريضة خاصة بالشركة مثلا
إن البيانات هي أصل ذو خصائص فريدة
Data is an asset with unique properties.
أيضأ إدارة البيانات تعني إدارة جودة البيانات
Managing data means managing the quality of data

ال Policy
هي مجموعة guidelines تتبناها لتحقيق مبدأ معين.
هناك عدة سياسات تحددها لتجنب تأخير المهام

ال Data Quality Policy
نركز هنا على مجموعة من الخصائص أو الأبعاد dimensions التي تحقق جودة البيانات
في الصورة نذكر مثلاً دقة البيانات Accuracy أن البيانات لابد أن تكون دقيقة الخ.

ال Processes or Procedures
هي الخطوات والعمليات التي من خلالها ننفذ ال Policy وهي عبارة عن مهمة خطوة بخطوة لتحقيق سياسة معينة
عندنا مجموعة من العمليات للدقة مثل

Data Profiling
Data cleansing
وغيرها كثير ممكن تشوف الروابط

sciencedirect.com/topics/compute…
أيضا

dataladder.com/data-quality-p…

في الصورة مثال على ال Data Profiling حيث توجد أدوات توضح لك توزيع البيانات والقيم الفارغة والمتوسطات الخ

وتنظيف البيانات يشمل خطوات كثيرة مثلاً حذف البيانات المتكررة أو القيم الشاذة وغيرها

ال Standards
هي القواعد التي نتأكد منها لتحقيق السياسات. مثلا في جودة البيانات حددنا أن البيانات لابد أن تكون دقيقة Policy. يتم في Standards تحدد مجموعة من القواعد rules ليتم التحقق منها وقياس مدى تحقيق ال Policy
وعلى أساسها تكتب و تحدد العمليات والخطوات

مثلاً اسم العميل لابد أن يكون ثلاثي ويخزن بشكل منفصل على هيئة الاسم الأول، الاسم الثاني، الاسم الأخير.
رقم الجوال لابد أن يكون بصيغة محددة
العنوان يكون على شكل تقسيمات معينة الخ

ال Roles and Responsibilities
هنا تحديد الأدوار والمسؤوليات لأشخاص أو فرق حسب المهام المختلفة وهذا مفهوم واضح.

أخيراً نتحدث عن الفرق بين إدارة البيانات وحوكمة البيانات
إدارة البيانات هي مظلة تضم مجموعة من knowledge areas من ضمنها حوكمة البيانات.
كما في الصورة

حوكمة البيانات تضع مجموعة من المبادئ principles والسياسات policies و المقاييس standards
وتتداخل حوكمة البيانات مع كل knowledge areas
بمعنى مسؤولة عن المراقبة وليس التنفيذ.
وإدارة البيانات مسؤولة عن تنفيذ هذه المبادئ والسياسات ضمن دورة حياة البيانات من إنشائها حتى التخلص منها

في الأخير إدارة وحوكمة البيانات أعمق من النبذه التي ذكرتها بالأعلى. ممكن تتوسع بالقراءة عنها من خلال هذا الكتاب

Share this Scrolly Tale with your friends.

A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.

Keep scrolling