شاب صغير ومتحمس قابلني في أحد الممرات، و أمطرني بوابل من الاسئلة في #علم_البيانات ، فقلت له: على رسلك! أعتقد أن الوقفة القصيرة لن تشبع شغفك ولا فضولك تعال نجلس ونكمل الحوار، رتب اسئلتك و لنأخذها واحداً تلو الآخر .. فقال: على بركة الله .. وبدأ الحوار ... https://t.co/TNHnuwRa5m
بدأ وقال: حدثني عن علم البيانات؟ كيف بدأ؟ وماهو تاريخه؟
فقلت: علم البيانات ليس مجال جديد، الإحصائيون كانوا يقومون بهذه المهمة حتى قبل اختراع الحاسب، ولكن تطور إمكانيات الحاسب من جهة، وانفجار البيانات من جهة أخرى أدى إلى ظهور مايسمى بـ "اكتشاف المعرفة" و "استخراج الأنماط"
في آواخر الثمانينات ظهر نظام إدارة قواعد البيانات العلائقية (DBMS)، في عام 1997م تم نشر مصطلح "البيانات الضخمة" في مكتبة ACM الرقمية بعد أن لاحظت صناعة قواعد البيانات انفجار بيانات الأعمال، في أواخر التسعينات خرج مصطلح علم البيانات
سألني: كيف أبدأ في هذا العلم؟
فقلت: تعلم المصطلحات الأساسية، قال: حاولت ولكنها كثيرة ومتداخلة ، البيانات الضخمة، علم البيانات، تحليل البيانات، التنقيب في البيانات، تعلم الآلة، كلما حاولت أن ابدأ أشعر بالصداع وأخرج كما دخلت! ، الوضع مزعج ومعقد?!!، فقلت: لنأخذها واحدة واحدة
قال: اذاً ما الفرق بين البيانات الضخمة وتعلم الآلة والتنقيب في البيانات
فقلت: تعمل خوارزميات #تعلمالآلة (Machine Learning) كأداة لاكتشاف واستخراج الأنماط الغير معروفة من #البياناتالضخمة (Big Data)، وتسمى عملية وإجراءات الاستخراج بـ #التنقيبفيالبيانات (Data Mining)