Discover and read the best of Twitter Threads about #علم_البيانات

Most recents (12)

مفاهيم إدارة وحوكمة البيانات كثيرة ومتداخلة. في هذه التغريدات بنتعرف على بعض نقاط إدارة البيانات Data Management و حوكمة البيانات Data Governance والفرق بينهم.

#علم_البيانات Image
الهدف الأساسي من الاهتمام بالبيانات هو تحويلها إلى أصل ذو قيمة value
مثلاً إدارة وتحليل البيانات الصحية لشعب معين قد يساعد في بناء خطط وقاية تساهم في خفض تكاليف العلاج. هنا لها قيمة مادية تعادل ملايين.
نبدأ بتعريف إدارة البيانات حسب Data Management Association (DAMA)
إدارة البيانات هي تطوير وتنفيذ والإشراف على الخطط والسياسات والبرامج والممارسات التي تقدم وتتحكم وتحمي وتعزز قيمة أصول البيانات والمعلومات طوال دورة حياتها. Image
Read 17 tweets
الموازنة بين سهولة الاستخدام والحماية من المسلمات التي يعرفها التقنيين ومطوري البرمجيات، اعتقد ان البنوك بالغت مؤخراً في تسهيل العمليات دون بذل جهد إضافي للحماية، عمليات الاحتيال العديدة مثل ماهي محنة إلا أن بداخلها منحة، سأتكلم باختصار عن هذا الموضوع
#علم_البيانات
#تعلم_الآلة Image
عمليات الاحتيال تحمل بين طياتها سلوكيات المحتالين وأساليبهم، والتي يكررونها وينوعونها بين وقت وآخر، البلاغات التي ترد البنوك عن هذه العمليات ماهي إلا عملية (labelling) لكل عملية (transaction) بمعنى ان العمليات يتم تصنيفها مع الوقت إلى عمليات (آمنة) وأخرى (غير آمنة)
أحد استخدامات خوارزميات #تعلم_الآلة هي Anomaly Detection ويُقصد بها اكتشاف السلوكيات الغريبة (أو الشاذة)، بمعنى أن هناك سلوك طبيعي وسلوك غير طبيعي، عمليات الاحتيال تصنف على أنها سلوك غير طبيعي والتحدي الذي تحاول تعالجه هذه الخوارزميات كيف يتم الحكم على العملية (طبيعية أو شاذة)
Read 8 tweets
كيف نتخذ قراراتنا؟
من أهم استخدامات #علم_البيانات إن لم يكن أهمها على الإطلاق #دعم_القرارات ، أسفل هذه التغريدة سأتكلم عن تطور عملية إتخاذ القرار ، ولماذا نحتاج اليوم أن ننتقل من قرارات تقودها البيانات إلى قرارات يقودها #الذكاء_الاصطناعي ؟
المصدر:
hbr.org/2019/07/what-a…
تكيفت العديد من الشركات مع نهج "Data-Driven" لاتخاذ القرارات التشغيلية. يمكن للبيانات تحسين القرارات ، لكنها تتطلب "المعالج" المناسب لتحقيق أقصى استفادة منها ، يفترض الكثير من الناس أن المعالج لهذه البيانات هو (الإنسان)
للاستفادة الكاملة من القيمة الكامنة في البيانات يجب أن تُدخل الشركات تقنيات #الذكاء_الاصطناعي في إجراءات العمل اليومية ، بمعنى إخراج (الإنسان) من عملية اتخاذ القرار كلما كان ذلك ممكناً
Read 14 tweets
هل يمكن للآلة ان تكتسب صفة الذكاء؟ هل يمكن أن تتعلم؟
#الذكاء_الاصطناعي و #تعلم_الآلة من أهم المجالات الحديثة التي دخلت في حياتنا اليومية ، هناك الكثير من التطبيقات والأمثلة ، في هذه السلسلة سنتحدث عن تعلم الآلة (Machine Learning)
#علم_البيانات
#العطاء_الرقمي
#تعلم_الآلة أحد فروع الذكاء الاصطناعي ، يعنى بتمكين الحواسيب والآلات من التعلم واتخاذ القرارات وتنفيذ المهام دون أن يتم برمجتها مسبقًا، من خلال خوارزميات تمكنها من التعلم الذاتي وتحليل البيانات المدخلة، وتنفيذ الأوامر وتحديد ما يجب إنجازه دون مساعدة بشرية
تعمل الخوارزميات كعقل مدبر للآلة، فتتألف من سلسلةٍ من الأوامر والإرشادات لتوجيه الآلة للكيفية التي يجب بها تنفيذ المهام، وتقوم الآلة بتخزين وتجميع ومعالجة كم هائل من البيانات بتكلفة مادية قليلة مقارنة بتكلفة الأيدي العاملة، واختيار القرار الأمثل بسرعة ودقة
Read 10 tweets
يعجبك العمل مع البيانات وتفكر في الدخول في هذا المجال ، ولكن تعتقد أن القطار فاتك كونك موظف على رأس العمل ويصعب عليك الدراسة من جديد .. إذاً ما الحل؟ 🤔🙄

أسفل هذه التغريدة سأتكلم عن المسار المناسب لتحقيق حلم الدخول في عالم #علم_البيانات (Data Science)
علم البيانات مجال مفتوح على نطاق واسع ويدخل في كل المجالات تقريباً ، أينما وجدت بيانات سنحتاج إلى مختصين للتعامل معها ، الكثير مما نقرأه يشير إلى درجات الماجستير والدكتوراه كمتطلب للدخول في هذا المجال ، ولكن الحقيقة أن معظم الشركات لا تحتاج إلى هذا المستوى العالي من الشهادات
علماء البيانات يسدون فجوة أساسية تتمثل في الحاجة لمعالجة #البيانات_الضخمة (Big Data) من قبل الشركات والقطاعات الحكومية ، يقوم عالم البيانات بتنفيذ المبادرات المرتبطة بالبيانات ، ولكن إذا بحثنا عن المسمى الوظيفي في الغالب لانجده تحت أسم "عالم بيانات" ربما بمسميات أخرى
Read 14 tweets
أزمة #كورونا تعلمنا 4 دروس في #علم_البيانات :
📌أهمية جودة البيانات والشفافية
📌أهمية عرض البيانات بطريقة غيرمتحيزة
📌إنشاء نتائج تحليلية لاتخاذ قرارات حكيمة
📌فهم واستيعاب تكلفة الخطأ الإيجابي والخطأ السلبي (False Positive/Negative)
التفصيل أسفل التغريدة
linkedin.com/pulse/data-sci…
لا يمكن اتخاذ قرارات سليمة بدون بيانات موثوقة وعالية الجودة ، الثقة والشفافية في مصدر البيانات مهمة ، مثلاً لحساب معدل الوفيات نقسم "عدد الوفيات" على "عدد المصابين" ، الأول رقم موثوق به ولكن الأخير (عدد المصابين) هو تخمين لأن معظم البلدان لم تبدأ في إجراء الاختبار على نطاق واسع
يجب تقديم البيانات بطريقة محايدة وبمنظور غير متحيز حتى يساعد صناع القرار على اتخاذ قرارات فعالة، مثلاً الرسم المرفق يمثل حالات #كورونا في كوريا الجنوبية ، اليسار حالات مجمعة تعطي انطباع ان العدد في تصاعد بينما اليمين يوضح عدد الحالات اليومية ويشير ربما إلى تجاوز كوريا الذروة
Read 5 tweets
اشتهرت قناة الاخبار الأمريكية فوكس نيوز (Fox News) باستخدام الرسوم البيانية (Data Visualization) بطريقة غير صحيحة جهلاً أو تضليلاً، بغض النظر عن الهدف تعالوا نستعرض أشهر الرسومات البيانية التي عرضتها القناة ونوضح كيف حدث التضليل؟ وماهو الخطأ في تمثيلهم للبيانات؟
#علم_البيانات
في السباق الرئاسي عام 2012م قامت القناة بتمثيل السباق بين ثلاث مرشحين بصيغة Pie Chart، هذا التمثيل يستخدم في الغالب لتوضيح الجزء من الكل بطريقة مئوية، أي كأنه كعكه يتم تقسيمها، المجموع في هذا التمثيل يجب أن يكون مائة، النسب الذي تم تمثيلها وصل مجموعها 193%!!
رسم يوضح أن الأثرياء في أمريكا سيشهدون زيادة كبيرة في سعر الفائدة إذا انتهت صلاحية تخفيضات بوش، الرسم يوحي بأن الزيادة كبيرة، بينما واقعياً 5% فقط
الخدعة التي أُستخدمت في هذا الرسم هي عدم البدء من صفر، وكأنهم عملوا zoom in لتقريب العمودين مما جعل الزيادة تبدو وكأنها كبيرة!
Read 11 tweets
شاب صغير ومتحمس قابلني في أحد الممرات، و أمطرني بوابل من الاسئلة في #علم_البيانات ، فقلت له: على رسلك! أعتقد أن الوقفة القصيرة لن تشبع شغفك ولا فضولك تعال نجلس ونكمل الحوار، رتب اسئلتك و لنأخذها واحداً تلو الآخر .. فقال: على بركة الله .. وبدأ الحوار ...
بدأ وقال: حدثني عن علم البيانات؟ كيف بدأ؟ وماهو تاريخه؟
فقلت: علم البيانات ليس مجال جديد، الإحصائيون كانوا يقومون بهذه المهمة حتى قبل اختراع الحاسب، ولكن تطور إمكانيات الحاسب من جهة، وانفجار البيانات من جهة أخرى أدى إلى ظهور مايسمى بـ "اكتشاف المعرفة" و "استخراج الأنماط"
في آواخر الثمانينات ظهر نظام إدارة قواعد البيانات العلائقية (DBMS)، في عام 1997م تم نشر مصطلح "البيانات الضخمة" في مكتبة ACM الرقمية بعد أن لاحظت صناعة قواعد البيانات انفجار بيانات الأعمال، في أواخر التسعينات خرج مصطلح علم البيانات
Read 15 tweets
تمثل البيانات المحرك الرئيس للاقتصاد الرقمي (Digital economy)، هذا الاقتصاد الذي بدأ يشكل ملامح قادة المستقبل، ولكن الصناعة اليوم تُغيرت بوصلتها لتنتقل من التركيز على معالجة كفاءة عمليات الأعمال إلى إشتقاق القيم التحليلية من البيانات (Data Analytics).. التفاصيل 👇
#علم_البيانات
في عام 2006م أطلق رائد الأعمال البريطاني كلايف همبي عبارة "البيانات هي النفط الجديد"، عبارة اشتهرت لاحقاً ولاقت أصداء كبيرة وتم تكرارها في أكثر من مؤتمر ومحفل للبيانات، عبارة عميقة، ترى ما الذي يجعل البيانات كالنفط؟ هنا مقالي في تفصيل هذه العبارة
hmoodaldossari.blogspot.com/2018/07/blog-p…
حينما يتم تمثيل باخرات النفط في البحر بشركات التقنية فهذا ليس مبالغة، قيمة تلك الشركات اليوم تتجاوز ميزانيات دول، ويلاحظ أن الشركات الأمريكية تتسيد الأكثر قيمة في العالم لعام 2018م ممثلة بـ (أمازون، أبل، جوجل، فيسبوك، مايكروسوفت)
aitnews.com/2018/12/10/%D8…
Read 7 tweets
البيانات أصول (Data is an Asset)
ولكن ما الذي يجعلها مختلفة عن الأصول الأخرى؟
بالأسفل سلسلة تغريدات مأخوذة من مقال كريس برادلي الخبير 35 سنة في إدارة البيانات، لمقارنة البيانات مع 7 أصول أخرى، باستخدام 5 خصائص
المصدر: tdan.com/is-the-data-as…
#علم_البيانات
الأصول التي تم اختيارها للمقارنة:
( النفط، المال، الدم، البشر، العقار، المواد، الأفكار)
وستتم مقارنتها من خلال الإجابة على الأسئلة التالية:
هل هي قابلة للنسخ؟
هل استخدامها يؤدي إلى نفاذها؟
هل يتم ربطها بقيمة نقدية ؟
هل هي ملموسة أو مجردة؟
هل يجب معالجة الأصل للحصول على القيمة؟
النفط غير قابل للنسخ، وبالتأكيد يعتبر سلعة استهلاكية (بمعنى أن استخدامه يؤدي إلى نفاذه)، وربط النفط بقيمة نقدية معينة ممارسة معتادة (مثل 50 دولار للبرميل)، والنفط حقيقي ومحسوس وليس مجرد، وأخيراً يجب معالجته ليتم تشغيله والحصول على شيء مفيد ذا قيمة مثل البنزين والديزل أو البلاستيك
Read 13 tweets
ما الحاجة لدراسة خوارزميات #تعلم_الآلة (Machine Learning) في ظل تفوق خوارزميات #التعلم_العميق (Deep Learning)؟
تساؤل طرحه عالم بيانات مبتديء بعد ملاحظة تفوق التعلم العميق في مسابقات Kaggle ، مقال يناقش هذه الفرضية بشكل جميل، أُلخصه بالأسفل
#علم_البيانات
datasciencecentral.com/profiles/blogs…
#التعلم_العميق أحد الأدوات المهمة لعالم البيانات ، و يُصنف على أنه أحد فروع #تعلم_الآلة التي تُركز على بناء شبكات عصبية مشابهة لخلايا الدماغ البشري ، وما يجعله مختلف عن الشبكات العصبية هو كونه يحتوي على أكثر من طبقة مخفية (عميقة) بعكس ANNs والتي تحتوي على طبقة مخفية واحدة
يُطلق مصطلح ML على أي خوارزمية تُمكن الآلة من التعلم باستخدام مجموعة من البيانات للعثور على معارف وأنماط ، ويشمل ML جميع أنواع الخوارزميات سواءً الموجهة (Supervised)أو الغير موجهة (Unsupervised) لاستخدامها في التصنيف (Classification)او التجميع (Clustering)او الانحدار (Regression)
Read 15 tweets
البعض يخلط بين:
🔘 حوكمة البيانات - Data Governance
🔵 إدارة البيانات - Data Management
تُرى ما لفرق بينهما؟
أسفل هذه التغريدة سأشرح الفرق بين (حوكمة البيانات) و (إدارة البيانات)
#علم_البيانات
يجب التأكيد في البداية على أن "حوكمة البيانات" و "جودة البيانات" ليست مترادفات ، لكنهما يرتبطان ارتباطًا وثيقًا ، جودة البيانات تهتم بقياس دقة البيانات واكتمالها وتوافرها وفعاليتها ، وتطبيق الحوكمة يؤدي إلى رفع جودة البيانات
حوكمة البيانات: تُعرف العلاقة بين المستخدمين في منظمة ما والبيانات من ناحية من (Who) الذي يُسمح له بالوصول للبيانات ولماذا (Why)
إدارة البيانات: معنية بتعامل المستخدمين الفعلي مع البيانات من ناحية أين (Where) يصل المستخدم للبيانات وكيف (How) يتعامل معهاويعالجها أثناء تنفيذ المهام
Read 7 tweets

Related hashtags

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3.00/month or $30.00/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!