هل يمكن للآلة ان تكتسب صفة الذكاء؟ هل يمكن أن تتعلم؟ #الذكاء_الاصطناعي و #تعلم_الآلة من أهم المجالات الحديثة التي دخلت في حياتنا اليومية ، هناك الكثير من التطبيقات والأمثلة ، في هذه السلسلة سنتحدث عن تعلم الآلة (Machine Learning) #علم_البيانات #العطاء_الرقمي
#تعلم_الآلة أحد فروع الذكاء الاصطناعي ، يعنى بتمكين الحواسيب والآلات من التعلم واتخاذ القرارات وتنفيذ المهام دون أن يتم برمجتها مسبقًا، من خلال خوارزميات تمكنها من التعلم الذاتي وتحليل البيانات المدخلة، وتنفيذ الأوامر وتحديد ما يجب إنجازه دون مساعدة بشرية
تعمل الخوارزميات كعقل مدبر للآلة، فتتألف من سلسلةٍ من الأوامر والإرشادات لتوجيه الآلة للكيفية التي يجب بها تنفيذ المهام، وتقوم الآلة بتخزين وتجميع ومعالجة كم هائل من البيانات بتكلفة مادية قليلة مقارنة بتكلفة الأيدي العاملة، واختيار القرار الأمثل بسرعة ودقة
لخوارزميات التعلم أقسام عديدة منها: " التعلم المراقب" Supervised Learning وهو إعطاء أمثلة المدخلات والمخرجات المرغوبة للآلة من قبل الإنسان، فتتعلم الآلة قاعدة عامة تربط المدخلات بالمخرجات، وأحد أنواعه (التصنيف)، من أمثلته تصنيف البريد الإلكتروني إلى عادي أو مزعج (spam)
النوع الآخر هو (الإنحدار) Linear Regression ويقوم على التنبوء Prediction بقيم مستمرة بدلًا من أصناف منفصلة، كالتنبؤ بأسعار البورصة، أو بدرجة الحرارة داخل مبنى، اعتمادًا على بيانات الطقس والوقت والحساسات
القسم الثاني من خوارزميات #تعلم_الآلة هو "التعلم غير المراقب" Unsupervised Learning ويتفرع هذا القسم إلى أنواع أبرزها (التجميع) clustering ، بحيث يتم فرز البيانات المدخلة إلى مجموعات غير معروفة مسبقًا، لاكتشاف أنماط خفية، من أمثلته نظم التوصية التي تقسم العملاء إلى مجموعات
النوع الآخر من التعلم الغير مراقب قواعد الأرتباط Association Rules وتهدف إلى استخراج زاكتشاف العلاقات بين مجموعة خصائص وإظهارها على شكل قواعد، وأبرز أمثلتها تحليل سلة المشتريات Basket Analysis
هناك عدة تطبيقات وأمثلة لاستخدام #تعلم_الآلة في حياتنا اليومية، منها التعرف على الأشخاص من خلال قزحية العين أو الوجوه، والتعرف على الكلام ثم تحوله إلى نص، وتستخدم في عدة مجالات من بنوك وشركات ومستشفيات حتى في التنقيب عن النفط والغاز
الآلة تتعلم وتصبح ذكية من #البيانات ، لذلك يجب أن نهتم كثيراً بـ #جودة_البيانات التي تتدرب عليها الآلة لتصبح ذكية ، إن كانت البيانات رديئة ستكون القرارات مضللة وخاطئة ، والعكس صحيح جودة البيانات تعني بناء تطبيقات وبرامج تساعد في إتخاذ قرارات دقيقة
أخيراً ياليت تشاركونا بأبرز معلومة لفتت انتباهكم واستفدتوا منها من هذا الثريد على هاشتاق #العطاء_الرقمي ، علماً انه سيتم السحب لاختيار فائز من ضمن المشاركين في الهاشتاق وتسليمه جائزة من مبادرة العطاء الرقمي @Attaa_SA
• • •
Missing some Tweet in this thread? You can try to
force a refresh
يعجبك العمل مع البيانات وتفكر في الدخول في هذا المجال ، ولكن تعتقد أن القطار فاتك كونك موظف على رأس العمل ويصعب عليك الدراسة من جديد .. إذاً ما الحل؟ 🤔🙄
أسفل هذه التغريدة سأتكلم عن المسار المناسب لتحقيق حلم الدخول في عالم #علم_البيانات (Data Science)
علم البيانات مجال مفتوح على نطاق واسع ويدخل في كل المجالات تقريباً ، أينما وجدت بيانات سنحتاج إلى مختصين للتعامل معها ، الكثير مما نقرأه يشير إلى درجات الماجستير والدكتوراه كمتطلب للدخول في هذا المجال ، ولكن الحقيقة أن معظم الشركات لا تحتاج إلى هذا المستوى العالي من الشهادات
علماء البيانات يسدون فجوة أساسية تتمثل في الحاجة لمعالجة #البيانات_الضخمة (Big Data) من قبل الشركات والقطاعات الحكومية ، يقوم عالم البيانات بتنفيذ المبادرات المرتبطة بالبيانات ، ولكن إذا بحثنا عن المسمى الوظيفي في الغالب لانجده تحت أسم "عالم بيانات" ربما بمسميات أخرى
أزمة #كورونا تعلمنا 4 دروس في #علم_البيانات :
📌أهمية جودة البيانات والشفافية
📌أهمية عرض البيانات بطريقة غيرمتحيزة
📌إنشاء نتائج تحليلية لاتخاذ قرارات حكيمة
📌فهم واستيعاب تكلفة الخطأ الإيجابي والخطأ السلبي (False Positive/Negative)
التفصيل أسفل التغريدة linkedin.com/pulse/data-sci…
لا يمكن اتخاذ قرارات سليمة بدون بيانات موثوقة وعالية الجودة ، الثقة والشفافية في مصدر البيانات مهمة ، مثلاً لحساب معدل الوفيات نقسم "عدد الوفيات" على "عدد المصابين" ، الأول رقم موثوق به ولكن الأخير (عدد المصابين) هو تخمين لأن معظم البلدان لم تبدأ في إجراء الاختبار على نطاق واسع
يجب تقديم البيانات بطريقة محايدة وبمنظور غير متحيز حتى يساعد صناع القرار على اتخاذ قرارات فعالة، مثلاً الرسم المرفق يمثل حالات #كورونا في كوريا الجنوبية ، اليسار حالات مجمعة تعطي انطباع ان العدد في تصاعد بينما اليمين يوضح عدد الحالات اليومية ويشير ربما إلى تجاوز كوريا الذروة
اشتهرت قناة الاخبار الأمريكية فوكس نيوز (Fox News) باستخدام الرسوم البيانية (Data Visualization) بطريقة غير صحيحة جهلاً أو تضليلاً، بغض النظر عن الهدف تعالوا نستعرض أشهر الرسومات البيانية التي عرضتها القناة ونوضح كيف حدث التضليل؟ وماهو الخطأ في تمثيلهم للبيانات؟ #علم_البيانات
في السباق الرئاسي عام 2012م قامت القناة بتمثيل السباق بين ثلاث مرشحين بصيغة Pie Chart، هذا التمثيل يستخدم في الغالب لتوضيح الجزء من الكل بطريقة مئوية، أي كأنه كعكه يتم تقسيمها، المجموع في هذا التمثيل يجب أن يكون مائة، النسب الذي تم تمثيلها وصل مجموعها 193%!!
رسم يوضح أن الأثرياء في أمريكا سيشهدون زيادة كبيرة في سعر الفائدة إذا انتهت صلاحية تخفيضات بوش، الرسم يوحي بأن الزيادة كبيرة، بينما واقعياً 5% فقط
الخدعة التي أُستخدمت في هذا الرسم هي عدم البدء من صفر، وكأنهم عملوا zoom in لتقريب العمودين مما جعل الزيادة تبدو وكأنها كبيرة!
شاب صغير ومتحمس قابلني في أحد الممرات، و أمطرني بوابل من الاسئلة في #علم_البيانات ، فقلت له: على رسلك! أعتقد أن الوقفة القصيرة لن تشبع شغفك ولا فضولك تعال نجلس ونكمل الحوار، رتب اسئلتك و لنأخذها واحداً تلو الآخر .. فقال: على بركة الله .. وبدأ الحوار ...
بدأ وقال: حدثني عن علم البيانات؟ كيف بدأ؟ وماهو تاريخه؟
فقلت: علم البيانات ليس مجال جديد، الإحصائيون كانوا يقومون بهذه المهمة حتى قبل اختراع الحاسب، ولكن تطور إمكانيات الحاسب من جهة، وانفجار البيانات من جهة أخرى أدى إلى ظهور مايسمى بـ "اكتشاف المعرفة" و "استخراج الأنماط"
في آواخر الثمانينات ظهر نظام إدارة قواعد البيانات العلائقية (DBMS)، في عام 1997م تم نشر مصطلح "البيانات الضخمة" في مكتبة ACM الرقمية بعد أن لاحظت صناعة قواعد البيانات انفجار بيانات الأعمال، في أواخر التسعينات خرج مصطلح علم البيانات
تمثل البيانات المحرك الرئيس للاقتصاد الرقمي (Digital economy)، هذا الاقتصاد الذي بدأ يشكل ملامح قادة المستقبل، ولكن الصناعة اليوم تُغيرت بوصلتها لتنتقل من التركيز على معالجة كفاءة عمليات الأعمال إلى إشتقاق القيم التحليلية من البيانات (Data Analytics).. التفاصيل 👇 #علم_البيانات
في عام 2006م أطلق رائد الأعمال البريطاني كلايف همبي عبارة "البيانات هي النفط الجديد"، عبارة اشتهرت لاحقاً ولاقت أصداء كبيرة وتم تكرارها في أكثر من مؤتمر ومحفل للبيانات، عبارة عميقة، ترى ما الذي يجعل البيانات كالنفط؟ هنا مقالي في تفصيل هذه العبارة hmoodaldossari.blogspot.com/2018/07/blog-p…
حينما يتم تمثيل باخرات النفط في البحر بشركات التقنية فهذا ليس مبالغة، قيمة تلك الشركات اليوم تتجاوز ميزانيات دول، ويلاحظ أن الشركات الأمريكية تتسيد الأكثر قيمة في العالم لعام 2018م ممثلة بـ (أمازون، أبل، جوجل، فيسبوك، مايكروسوفت) aitnews.com/2018/12/10/%D8…
البيانات أصول (Data is an Asset)
ولكن ما الذي يجعلها مختلفة عن الأصول الأخرى؟
بالأسفل سلسلة تغريدات مأخوذة من مقال كريس برادلي الخبير 35 سنة في إدارة البيانات، لمقارنة البيانات مع 7 أصول أخرى، باستخدام 5 خصائص
المصدر: tdan.com/is-the-data-as… #علم_البيانات
الأصول التي تم اختيارها للمقارنة:
( النفط، المال، الدم، البشر، العقار، المواد، الأفكار)
وستتم مقارنتها من خلال الإجابة على الأسئلة التالية:
هل هي قابلة للنسخ؟
هل استخدامها يؤدي إلى نفاذها؟
هل يتم ربطها بقيمة نقدية ؟
هل هي ملموسة أو مجردة؟
هل يجب معالجة الأصل للحصول على القيمة؟
النفط غير قابل للنسخ، وبالتأكيد يعتبر سلعة استهلاكية (بمعنى أن استخدامه يؤدي إلى نفاذه)، وربط النفط بقيمة نقدية معينة ممارسة معتادة (مثل 50 دولار للبرميل)، والنفط حقيقي ومحسوس وليس مجرد، وأخيراً يجب معالجته ليتم تشغيله والحصول على شيء مفيد ذا قيمة مثل البنزين والديزل أو البلاستيك