الشروق:

البيانات الضخمة.. القوة المستقبلية للدول والمجتمعات

03 July 2024


تُعرَّف البيانات الضخمة فى العديد من المصادر بأنها كمية هائلة من البيانات التى يصعب تخزينها ومعالجتها بواسطة البرامج التقليدية بسبب تعقيدها. لكن هذا التعريف لا يعكس على نحو صحيح جوهر البيانات الضخمة. فحجم البيانات ليس هو العامل الوحيد الذى يجعلها «ضخمة»، فمنذ القدم، كان البشر يجمعون البيانات، لكنها لم تكن «ضخمة» بمعنى الكلمة إلا مع بزوغ عصر الرقمنة فى مطلع القرن الحالى.

ومع انتشار الإنترنت ومواقع التواصل الاجتماعى وأجهزة الاستشعار، أصبحنا ننتج كميات هائلة من البيانات بشكل يومى. هذه البيانات متنوعة جدا، وتتراوح بين النصوص إلى الصور ومقاطع الفيديو، وتأتى من مصادر متعددة، مثل: مواقع التواصل الاجتماعى، المستشعرات، وحتى أجهزة إنترنت الأشياء.

ما يجعل هذه البيانات «ضخمة» هو قيمتها، وما يمكن أن يولد خلالها من معرفة. فهى ليست مجرد بيانات كمية أو وصفية، بل هى نافذة على العالم من حولنا. فإلى جانب التدفق الهائل يأتى تنوع المصادر وتكاملها؛ مما يشكل صورة واضحة حال تحليلها تساعد على صناعة قرارات مستنيرة، تمكن من فهم سلوك البشر، وتحسين الخدمات، وتطوير تقنيات جديدة.

أما الحجم فهو أحد خصائص البيانات الضخمة لكنه ليس السمة الوحيدة؛ إذ هناك ما يعرف بـ The 7 V’s of Big Data وهى السمات السبع للبيانات الضخمة، وهي: الحجم (Volume)، سرعة التدفق (Velocity)، التنوع (Variety)، الصدق (Veracity)، القيمة (Value)، التغير (Variability)، التمثيل البصرى (Visualization).

مع بداية القرن الحادى والعشرين، شهد العالم ثورة رقمية حقيقية؛ إذ انتشر الإنترنت بشكل واسع أدى إلى وصوله لأغلب سكان الكوكب، تبعه ظهور مواقع التواصل الاجتماعى التى أصبحت منصات رئيسية لتبادل المعلومات؛ إذ أسهمت فى تمكين المواطنين فى شتى بقاع العالم من توثيق ونشر يومياتهم؛ مما عزز توليد تيارات هائلة من البيانات غير المنظمة، تتنوع ما بين نصوص وصور ومقاطع فيديو، بالتوازى مع تدفق هذا الكم الهائل من البيانات بحرية وسهولة أخذت المستشعرات، أو ما يعرف بإنترنت الأشياء (IOT) فى الانتشار فى مجالات عديدة مثل: الصحة والتعليم والأمن وغيرها؛ لتضيف على هذا الكم من البيانات تدفقا آخر؛ وقد أدى ذلك إلى توليد كميات هائلة من البيانات تميزت بتنوعها وثرائها، فجاءت عبر قطاعات عدة وبتنسيقات عدة.

أدت هذه التطورات إلى زيادة هائلة فى كميات البيانات التى يتم إنشاؤها؛ مما أدى إلى ظهور مصطلح البيانات الضخمة.

وقد عزز نهج التحول الرقمى الذى انتهجته الكثير من المؤسسات والحكومات حول العالم؛ تحويل البيانات من النسخ الورقية إلى نسخ رقمية يمكن تخزينها ومعالجتها وربطها ببعضها عبر قواعد بيانات منظمة ومتشابكة للحصول على صورة متكاملة؛ ومن ثم قرارات مستنيرة.

وتنقسم طرق التحليل إلى أربع فئات رئيسية حسب درجة التعقيد: التحليل الوصفى والتحليل التشخيصى والتنبؤى والتوجيهى، وكلما انتقلت من الأبسط إلى الأكثر تعقيدا، تزداد الصعوبة والموارد المطلوبة، وكذلك مستوى المعطيات الناتجة عن عملية التحليل.

• التحليل الوصفى: هو الخطوة الأولى والأكثر شيوعا والأبسط فى إجراء أية عملية تحليل إحصائى، والغرض منه هو الإجابة عن سؤال، ماذا حدث؟ بمعنى آخر، فإنه يعطى وصفا لما حدث فى الماضي، ويتم ذلك عن طريق تلخيص البيانات السابقة وبناء وتفسير البيانات الأولية من مصادر مختلفة لتحويلها إلى رؤى قيمة.

• التحليل التشخيصى: الذى يشار إليه غالبا باسم تحليل السبب الجذرى، فهو نوع متقدم من التحليل يتقدم خطوة أخرى إلى البيانات أو المحتوى للإجابة عن سؤال لماذا حدث هذا؟ فيما يتميز التحليل التشخيصى بأساليب مثل: التنقيب عن البيانات والارتباط، ويلقى نظرة أعمق على البيانات لفهم أسباب الأحداث والسلوكيات؛ مما يسمح بفهم المعلومات بسرعة أكبر.

• التحليل التنبؤى: فهو يحدد النتائج المحتملة من خلال تحديد الميول فى التحليلات التشخيصية والوصفية. ويأخذ البيانات السابقة ويغذيها فى نموذج التعلم الآلى الذى يأخذ فى الاعتبار الأنماط الرئيسية. ثم يتم تطبيق النموذج على البيانات الحالية للتنبؤ بما سيحدث؛ ما يسمح باتخاذ إجراءات وقائية.

• التحليل التوجيهى: يُعد بمثابة عملية تحليل للبيانات إلى جانب تقديم نصائح فورية حول كيفية تحسين ممارسات العمل لتناسب العديد من النتائج المتوقعة فى الواقع، فهو «يأخذ ما نعرفه البيانات، ويفهم البيانات للتنبؤ بما يحدث، ويقترح أفضل الخطوات التطلعية بناءً على المحاكاة الواعية، ويحدد العواقب المحتملة لكل منها». والغرض من التحليل التوجيهى هو اقتراح طريقة عملية لتجنب المشكلات المستقبلية أو لتحقيق أقصى استفادة من عملية واعدة.

إلى ذلك، يمكن للحكومات والمؤسسات الاستفادة من البيانات الضخمة بشكل كبير؛ لتحسين الخدمات العامة وصنع السياسات الفعالة.

أدت البيانات الضخمة دورا محوريا فى تطور الذكاء الاصطناعى. فقد أصبحت البيانات الوفيرة والمتنوعة غذاءً للنماذج التى تعتمد عليها تقنيات الذكاء الاصطناعى، مثل التعلم العميق، وتعتمد هذه النماذج على تحليل كميات هائلة من البيانات لاكتشاف الأنماط واستخراج المعرفة؛ مما يؤدى إلى تحسين أداء الأنظمة الذكية فى مختلف المجالات.

البيانات الوفيرة والمتنوعة تُعد غذاءً للنماذج التى يعتمد عليها الذكاء الاصطناعى. على سبيل المثال، تُستخدم بيانات النصوص والصور والفيديوهات لتدريب نماذج التعلم العميق؛ مما يمكنها من التعرف على الأشياء، وفهم اللغة الطبيعية، واتخاذ القرارات المعقدة. فمن دون هذه البيانات، سيكون من الصعب تحقيق التقدم الذى نشهده اليوم فى مجالات مثل: التعرف على الصوت والصورة، والترجمة الآلية، وتحليل البيانات.

علاوة على ذلك، فإن البيانات الضخمة تمكن الذكاء الاصطناعى من التكيف مع التغيرات المستمرة فى البيئة والتعلم منها. ففى مجالات مثل الرعاية الصحية، يمكن استخدام البيانات الضخمة لتحليل السجلات الطبية وتحديد الأنماط التى تساعد على تشخيص الأمراض وتطوير خطط علاجية مخصصة، وفى الصناعة، تُمكِّن البيانات الضخمة من تحسين عمليات الإنتاج من خلال تحليل بيانات الأداء واكتشاف الفرص لتحسين الكفاءة والجودة.

ولكن مع كل هذه الفوائد، تأتى تحديات كبيرة؛ إذ يتطلب التعامل مع كميات ضخمة من البيانات بنية تحتية قوية للتخزين والمعالجة، بالإضافة إلى تقنيات متقدمة للحفاظ على أمن البيانات وخصوصيتها. كما أن جودة البيانات تؤدى دورا حاسما فى فعالية نماذج الذكاء الاصطناعى؛ إذ إن البيانات غير النظيفة أو المتحيزة يمكن أن تؤدى إلى نتائج غير دقيقة أو مضللة.

تواجه صناعة البيانات الضخمة العديد من التحديات والمخاطر؛ إذ يُعد أمن وخصوصية البيانات أحد أهم هذه التحديات. فمع زيادة حجم البيانات وتنوعها، يصعب حفظها وحمايتها من الاختراقات والاستخدامات غير المصرح بها؛ مما يهدد خصوصية المستخدمين ويضعهم فى موقف معرض للخطر. لذلك، يجب تطوير سياسات وأنظمة أمنية متقدمة لحماية البيانات الضخمة وضمان سلامتها من الاختراقات والاستغلال غير المشروع.

• التحديات الأمنية:

تُعد مراكز البيانات التى تخزن البيانات الضخمة هدفا رئيسيا للهجمات الإلكترونية، ويمكن أن يؤدى اختراق هذه المراكز إلى سرقة البيانات أو تعطيل الخدمات، بالإضافة إلى ذلك، يمكن للقراصنة استهداف أنظمة تخزين البيانات وسرقة المعلومات الحساسة مثل: البيانات الشخصية أو المالية. تهديد آخر يأتى من الداخل؛ إذ قد يكون الموظفون أو المتعاقدون مصدرا للتهديدات الأمنية؛ إذا تمكنوا من الوصول إلى البيانات الحساسة بشكل غير قانونى.

• تحديات الخصوصية:

من ناحية الخصوصية، يُعد استخدام البيانات دون موافقة صاحبها تحديا كبيرا. فقد يتم بيع البيانات الشخصية إلى شركات تسويق أو استخدامها لأغراض غير قانونية. بالإضافة إلى ذلك، قد تُستخدم البيانات الضخمة لتعقب الأفراد أو مراقبة سلوكهم دون علمهم؛ مما يشكل انتهاكا للخصوصية.

لمواجهة هذه التحديات، يمكن اتخاذ عدة إجراءات، ويُعد التشفير من أهم الوسائل لحماية البيانات الضخمة؛ إذ يتم تحويل البيانات إلى شكل غير قابل للقراءة إلا بواسطة الأشخاص المصرح لهم. كذلك، يجب مراقبة الوصول إلى البيانات بدقة، بحيث يتم منح الوصول فقط للأشخاص المصرح لهم. يتطلب الأمر أيضا استخدام تقنيات أمنية متطورة لحماية البيانات من الهجمات الإلكترونية، مثل: جدران الحماية ونظم الكشف عن الاختراقات. وتُعد التوعية بأهمية الأمن والخصوصية ضرورية؛ إذ يجب تعليم الموظفين والمستخدمين كيفية حماية البيانات من المخاطر.

فى النهاية، باتت البيانات الضخمة بمثابة «نفط القرن» باعتبارها تمثل كنزًا كبيرًا لكل من يمتلكها ولديه القدرة على تحليلها والاستفادة منها، فى عصر باتت فيه البيانات أكثر أهمية من السلاح؛ لأنها قد تتوقف عليها مصائر دول.

*عمرو العراقي

*خبير في علوم البيانات

*لينك المقال في الشروق*