بالنسبة للمستثمرين، أصبح عائد الاستثمار يعتمد بشكل متزايد على الرؤى المستخلصة من البيانات الضخمة.
يختلف واقعنا اليوم بالنسبة لجمع البيانات المتطورة والتحليلات كل الاختلاف عن الماضي حينما قال مارك توين وآخرون في أوائل القرن الماضي: "هناك ثلاثة أنواع من الأكاذيب - الأكاذيب والأكاذيب اللعينة والإحصاءات".
ونلمس صحة هذا على نحو متزايد خاصة في قطاع الاستثمار، حيث يسود حالياً النهج القائم على علوم البيانات. فالمستثمرون الذين يضخون الأموال في المشاريع والشركات دون الاستعانة بالرؤى المستخلصة من البيانات الضخمة لتوجيه قراراتهم، ربما لن يروا عائداً كبيراً على استثماراتهم.
ومن المرجح أن تستخدم الشركات العامة علوم البيانات أكثر من نظيراتها الخاصة، والتي لا تزال تعتمد بصورة كبيرة على أدوات الاستثمار وأساليبه القديمة مع الاستخدام المحدود لخوارزميات التعلّم الآلي وتقنيات جمع البيانات.
ما هو علم البيانات؟
يشمل علم البيانات مزيجاً من الخبرات في مجالات البرمجة، إلى جانب فهم متعمّق للإحصاء والرياضيات لاستخراج رؤى ذات مغزى من البيانات. يتوجّب على علماء البيانات الحصول على درجة الماجستير في العديد من المجالات، ومنها الحوسبة والتحليل الإحصائي والتعلم الآلي والتعلم المتعمّق وتصور البيانات والرياضيات والبرمجة.
هل لعلم البيانات مستقبل؟
الجواب هو نعم بالتأكيد. فأساليب جمع البيانات وقدراته مستمرة في التطور، ما يسهم في تحقيق كميات متزايدة من البيانات. وبالإضافة إلى ذلك، تؤدي القدرة المتزايدة على أتمتة تحليل البيانات إلى اعتماد علم البيانات على نطاق واسع كمقياس رئيسي للأداء ضمن الشركات.
وتشير التقديرات إلى أن حجم سوق علوم البيانات العالمية بلغ 95.30 مليار دولار في عام 2021، ومن المقدر أن يصل إلى 322.90 مليار دولار في عام 2026، بمعدل نمو سنوي مركب قدره 27.7% خلال فترة التوقعات، ما يمثل زيادة بنسبة 300% تقريباً في غضون ست سنوات فقط.
وتشمل العوامل الإضافية التي تدفع نمو السوق، الاعتماد المتزايد على الحلول القائمة على السحابة، والتطبيق المتزايد لعلوم البيانات في مختلف القطاعات، والحاجة لاستخراج رؤى متعمّقة من البيانات الضخمة للحصول على ميزة تجارية تنافسية.
موثوقية علم البيانات
إن استخدام علوم البيانات يشبه إلى حد ما استخدام جوجل عند البحث عن شيء ما. يقوم جوجل بتوفير إجابات، ولكن ليس هناك ما يضمن أن تكون هذه الإجابات دقيقة وكافية، ما يؤدي إلى طرح السؤال، "من يقرر ما إذا كانت إجابة معينة هي الإجابة الصحيحة؟".
نظراً لأن علم البيانات هو حالياً موضوعي للغاية، يعيد الناس التفكير في تقييم الإجابات التي تنتجها مناهج علم البيانات، وصقل طرق متعددة لصياغة الحلول بهدف تحقيق أفضل النتائج. ومع ذلك، فإن معظم هذه الأساليب تتعامل مع الصحة الحسابية للنماذج. من ناحية أخرى، يمكن أن تكون الإجابة الصحيحة حسابياً بلا معنى على الإطلاق.
لنفترض، إذا كان x=5، وy=2، يمكن الاستنتاج بأن x/y = 2.5، ولكن إذا كان x يمثل عدد البرتقال وy يشير إلى درجة الحرارة، فإن الرقم 2.5 لا معنى له على الإطلاق. وعلى نفس المنوال، فإن العديد من الإجابات التي يوفرها جوجل لا معنى له أيضاً. لذا، كيف يمكننا تخطي هذه التحديات؟
الحس السليم أحد أهم العناصر في علم البيانات
حتى وعندما يوفر البحث عدة نتائج، يمكننا في كثير من الأحيان، ومن خلال استخدام الحس السليم، تجاهل بعض الإجابات من خلال تفحّص النتائج القليلة الأولى. ولا يعود ذلك إلى درايتنا بالإجابة، بل إلى أننا نعرف الإجابة التي لا يمكن أن تكون صحيحة.
كيف نتخذ قرارات استثمارية أفضل باستخدام علم البيانات؟
يتمثّل الجواب عن هذا السؤال في نهج ثلاثي المحاور: نماذج أفضل وبيانات أفضل وذكاء اصطناعي قابل للتفسير. تشير قابلية التفسير إلى كيفية فهم قرارات أنظمة التعلم الآلي وكيفية تصميم الأنظمة التي يسهل فهم قراراتها أو تفسيرها.
أولاً، يجب بناء نماذج أكثر تركيزاً على غرض تحليلي معين. التكنولوجيا الحيوية هي مثال جيد على ذلك، إذ يتم من خلالها بناء العديد من الحلول في مجال علوم البيانات من الصفر، وتحديداً لمعالجة مشكلة معينة. ويساعد ذلك على تجنّب مشكلة قابلية التفسير التي تظهر عندما يتم تعديل نموذج تم بناؤه لتحليل مجموعة معينة من البيانات، واستخدامه لتحليل مجموعة أخرى، وبالتالي غالباً ما نرى عيوباً غير متوقعة.
ثانياً، يستغرق بناء نماذج مخصصة وقتاً طويلاً والكثير من البيانات. على سبيل المثال، تعاني المؤسسات المالية عموماً من شح البيانات وضيق الوقت. للتغلب على هذه المشاكل، يجب على المرء إدراك أن البيانات الأولية ليست هي البيانات الوحيدة، ولا توجد طريقة يمكن لنظم البيانات من خلالها التقدم دون البحوث المتعمّقة.
لا تمتلك العديد من المؤسسات المالية أقساماً مخصصة للبحوث والتطوير بهدف المساعدة في حل مشاكل محددة. لذلك، عندما يتعلق الأمر بالبيانات -خاصة في حالة الشركات الخاصة- فإن البيانات البديلة تعد ذات قيمة. غالباً ما يكون الحصول عليها أسهل بكثير مقارنة بالبيانات الأولية. ومن خلال الوسائل الصحيحة، يمكن تحويل البيانات البديلة بشكل فعّال واستخدامها لإلقاء الضوء على مجالات مختلفة من أداء الشركة الحالي والمستقبلي.
ثالثاً، من الضروري توظيف الذكاء الاصطناعي القابل للتفسير. غالباً ما يتم استخدام النماذج المتطورة بصورة متزايدة دون فهم جيد لكيفية عمل هذه النماذج.
في حين أن العبارات الشائعة مثل "التعلّم العميق" و"الذكاء الاصطناعي" مثيرة للاهتمام عند عرض مجموعة من النماذج على المستثمرين، فإن ذلك لا يعني بالضرورة أن جميع هذه النماذج تتفوق على النماذج الكلاسيكية. علاوةً على ذلك، من المهم إدراك أن أكثر من 3% من الدقة ليست دائماً سبباً كافياً للتخلي عن نموذج قابل للتفسير، ولكنه أقل دقة.
الاتجاهات الرئيسية في علم البيانات بحلول عام 2025
يشهد علم البيانات تغيرات يومية تقريباً. من إدارة البيانات إلى التكنولوجيا العميقة. من المقرر أن يواجه القطاع تغييرات كبيرة، ومن المهم مواكبة الاتجاهات لضمان أصالة وأخلاقية ودقة علم البيانات. تتضمن بعض اتجاهات علوم البيانات الأسرع نمواً ما يلي:
- ارتفاع ضخم في مجال الفيديو والصوت المزيّف، والذي يُستخدم عادةً لتسهيل عمليات الاحتيال.
- المزيد من التطبيقات التي تم إنشاؤها باستخدام بايثون (Python)، وتشمل التطبيقات التي تهدف إلى تطوير تطبيقات تقنية بلوكتشين.
- زيادة الطلب على حلول الذكاء الاصطناعي الشاملة لمساعدة العملاء من المؤسسات على تنظيف مجموعات البيانات الضخمة الخاصة بهم، وبناء نماذج التعلم الآلي.
- الشركات التي توظف المزيد من محللي البيانات لتحليل الكم المتزايد من البيانات المتاحة.
- انضمام المزيد من علماء البيانات إلى كاغل (Kaggle) والتي تعد أكبر مجتمع لعلوم البيانات في العالم مع أكثر من ثمانية ملايين مستخدم في 194 دولة.
- زيادة الاهتمام بحماية بيانات المستهلكين وخصوصيتهم، خاصة في أعقاب فضيحة كامبريدج أناليتكس.
- مكافحة التعلم الآلي العدائي من قبل مطوري الذكاء الاصطناعي، إذ يقوم المهاجم بإدخال البيانات في نموذج التعلم الآلي بهدف التسبب في أخطاء.
علوم البيانات ذات صلة مع العديد من القطاعات
بالإضافة إلى دوره المهم في قطاع الاستثمار، يشكل علم البيانات أيضاً عنصراً أساسياً لاتخاذ قرارات مهمة عبر مجموعة متنوعة من القطاعات، ومنها التمويل والزراعة والتكنولوجيا الحيوية والتسويق والموارد البشرية والرعاية الصحية والبرامج الحكومية وغيرها.
وقد أسهم علم البيانات في حل المشاكل المعقدة ضمن العديد من المجالات، مثل التنبؤ بالتنمية الزراعية ونجاح المحاصيل وتحديد السموم الناتجة عن الأدوية وتحديد الميزانيات وتخصيص رؤوس الأموال.
كيف يتم جمع البيانات في علم البيانات؟
يتم استخدام العديد من التقنيات، يشمل بعضها تتبع المعاملات ومراقبة وسائل التواصل الاجتماعي وإجراء الدراسات الاستقصائية والمقابلات ومجموعات التركيز والملاحظة والاستنتاج والتتبع عبر الإنترنت والنماذج الأخرى.
على سبيل المثال، يمثّل الذكاء الاصطناعي في مجموعة المعرفة المتعمّقة المحرك الأساسي وراء صياغة استراتيجيتنا وتنفيذها. نلعب اليوم دور شركة التكنولوجيا الحسابية العميقة، ما يضمن إعطاء الأولوية للوظائف التحليلية وعلوم البيانات والذكاء الاصطناعي ضمن عملياتنا من خلال الاستثمار المستمر في هذه الموارد.
على مدى السنوات التسع الماضية، قمنا بإنشاء 10 شركات فرعية تحليلية تختص بقطاعات مختلفة، تعمل كمراكز قوة تحليلية لدراسة وفهم القطاعات ذات الصلة، وتمكين أصحاب المصلحة من اتخاذ خطوات استراتيجية مستنيرة ضمن هذه القطاعات.