مركز المستقبل - د. فاطمة الزهراء عبدالفتاح تكتب: ثورة «GPT-4o»: فرص ومخاطر التطبيقات الجديدة للذكاء الاصطناعى

في يومين متعاقبين خلال شهر مايو 2024، أعلنت شركتا "أوبن أيه آي" (OpenAI) و"جوجل" (Google) العالميتين، عن تطويرهما جيلاً جديداً من المساعدين الفائقين، قادراً على التفاعل بالنص والصوت والصورة، وتحليل السياق المحيط، والاستجابة الفورية بشكل إنساني وبصورة أقرب للتفاعل البشري الحقيقي. إذ كشفت "أوبن أيه آي"، يوم 13 مايو الجاري، عن تطبيق "جي بي تي 40" (GPT-4o) الذي يحمل حرف (O) اختصاراً للفظ (Omni) باعتباره تطبيقاً شاملاً وقادراً على التفكير عبر الصوت والرؤية والنص في الوقت الفعلي. علاوة على مشروع "أسترا" (Astra) الذي أعلنت عنه "جوجل"، يوم 14 مايو، في مؤتمرها السنوي للمطورين، ووصفته بأنه وكيل ذكي لأداء كل المهام (AI-for-everything agent).

وتكشف هذه التطورات عن التنافس المُحتدم من أجل تقديم مساعد فائق شامل وقادر على أداء المهام كافة، بدءاً من اقتراح وجهة السفر، إلى كتابة النصوص المطولة، وإلقاء الأشعار، والتأليف الموسيقي؛ ما يطرح تحولات ثورية لتداخل الآلة في تفاصيل الحياة اليومية بشكل يضاعف انتشار وتأثير الذكاء الاصطناعي، ويطرح فرصاً وتحديات تبدو أقرب من أي وقت مضى.

جيل جديد:

تُعد كلمة "جي بي تي" (GPT) اختصاراً للمحولات التوليدية المدربة مسبقاً، وهي التقنية التي قدمها الباحث الهندي أشيش فاسواني وباحثون آخرون عام 2017 في تجربة اُستخدمت فيها شبكة عصبية تعتمد على آلية الانتباه للقيام بأعمال الترجمة الآلية متعددة اللغات؛ إذ تسمح آلية الانتباه الذاتي للنموذج بتقييم أهمية الكلمات المختلفة في الجملة عند ترميز كلمة معينة، وهو ما يساعده على فهم السياق بشكل أكثر فاعلية.

واستخدمت شركة "أوبن أيه آي" هذه التقنية المبتكرة لتقديم أولى نماذج محولات "جي بي تي" في يونيو عام 2018 بسعة 117 مليون معلمة، ثم قدمت النسخة الثانية في فبراير 2019 بسعة 1.5 مليار معلمة، وقدرة متقدمة على إنشاء نص متماسك وذي صلة بالسياق، وهو ما دفع الشركة إلى حجبه في البداية بسبب مخاوف سوء الاستخدام، ثم تمت إتاحته بالكامل في نوفمبر 2019، ما أعقبه بشهور قليلة إطلاق النسخة الثالثة في يونيو 2020، والتي تتمتع بقدرات تعلم تنبؤية تمكنه من أداء مجموعة واسعة من المهام بأقل قدر من التعليمات ما جعله أساساً لإنشاء تطبيقات متنوعة، بما في ذلك مساعدي البرمجة، وأدوات إنشاء المحتوى، وروبوتات الدردشة. وهذا ما كان أساساً لإطلاق تطبيق "شات جي بي تي" (ChatGPT) في نوفمبر 2022 كنموذج للمحادثة المستندة للذكاء الاصطناعي يعتمد على بنية (GPT-3.5)، والذي حظي بنسخة جديدة في مارس 2023 بإطلاق نموذج "جي بي تي-4" (GPT-4) والذي يمتلك قدرات أفضل على فهم وتوليد استجابات دقيقة ومناسبة للسياق، مع معالجة الاستعلامات الغامضة والتعليمات الأكثر تعقيداً.

وفي 13 مايو 2024، أطلقت شركة "أوبن أيه آي" نموذج "جي بي تي 40"، بقدرات متقدمة في استقبال وتوليد النص والصوت والصورة في الوقت الفعلي، بما يمكنه من إنشاء التصميمات الفنية والعلامات التجارية، وإنتاج رسوم الكاريكاتير، وكتابة الشعر والروايات النصية والمرئية، والقيام بتسجيل الملاحظات والقيام بأعمال التلخيص والكتابة والترجمة، مع قدرة فائقة على التواصل مع البشر وفهم المشاعر والاستجابة لمدخلات الصوت في أقل من 232 ملي ثانية، بمتوسط 320 ملي ثانية، المعدل الذي يقارب وقت الاستجابة البشرية في المحادثة الطبيعية.

وبعدها بيوم واحد، أعلنت "جوجل"، في مؤتمر المطورين يوم 14 مايو، عن مشروع "أسترا" والذي آثرت تسميته بـ"وكيل" (agent) أداء المهام اليومية، وهو ما يُعد نقلة لتطوير تطبيقها الذكي (Gemini) وكذلك مساعد جوجل الافتراضي. وعرضت "جوجل" سلسلة من الفيديوهات لتوضيح قدرات النظام، والذي يبدو أنه يشابه "جي بي تي 40"، إلا إنه يعرض قدرات بصرية أكثر تقدماً، مثل القدرة على تذكُر المكان الذي تركت فيه نظارتك. وعلى الرغم من أن "جوجل" ستطلق هذا التطبيق خلال شهور، ما يمنح "أوبن أيه آي" ميزة السبق بإطلاق تطبيقها أولاً، فإنها تتمتع بميزة إضافية من خلال منصاتها القائمة؛ إذ تعتزم دمج النظام الذكي بمنصاتها المختلفة، بما في ذلك "نظارة جوجل"، ما سيعزز إمكانات تلك المنصات، كما سيمنح التطبيق انتشاراً عالمياً سريعاً، ويعزز تبنيه من قِبل المستخدمين.

ولا يُعد هذا الاتجاه قاصراً على "جوجل" وحدها، ولكن تتجه الشركات التكنولوجية بشكل عام لدمج المساعد الذكي في تطبيقاتها المختلفة، ما يضاعف فرص انتشار هذه المساعدات بظهورها الفوري على واجهات استخدام آلاف الحواسيب والأجهزة حول العالم؛ إذ تعمل شركة "ميتا" على دمج نموذج (Llama 3) في تطبيقات "فيسبوك" و"إنستغرام" و"واتساب". كما تدمج شركة "مايكروسوفت" مساعدها الذكي (Copilot) في تطبيقات "مايكروسوفت 360" وتطبيق "إنترنت إكسبلورر" وواجهة محرك البحث (bing) وبرامج التصفح التابعة لها. وإن كانت شركة "أوبن أيه آي" لا تمتلك الإرث ذاته، فقد عقدت مفاوضات مع شركة "آبل" من أجل دمج نموذج "جي بي تي" في أنظمة (IOS) من أجل منح المساعد (Siri) بنية تفكير أكثر تطوراً وكفاءة.

ويزيد من فرص انتشار تلك المساعدات أيضاً، سعي الشركات التكنولوجية لخفض تكلفة التعلم الآلي، بما يسمح بإتاحته بتكلفة أقل لمطوري التطبيقات الآلية؛ ومن ثم انتشاراً أكبر بين المستخدمين. وأعلنت "جوجل" في مؤتمر المطورين 2024 عن إطلاق نموذج (Gemini 1.5 Flash)، الذي يعتمد على تقنية "التقطير" التي تجعله أسرع وأقل تكلفة.

تحديات متنوعة:

يتسم الذكاء الاصطناعي بكونه مزدوج الاستخدام؛ بحيث يمكن توظيفه في الأغراض النافعة والضارة على السواء، فكما تعرض الفيديوهات الترويجية للتطبيقات الجديدة قدراتها على أداء المهام بكفاءة وتحليل عناصر البيئة المحيطة ومساعدة المستخدم على اتخاذ القرار، فإنها أيضاً تحمل في طياتها تحديات على الأصعدة الاجتماعية والتقنية والأمنية وغيرها، كالتالي:

1- التأثيرات الاجتماعية والنفسية: إذ إن اعتماد المساعدين الفائقين على التفاعل الشبيه بالبشر بافتعال المشاعر والمزاح والتعقيب على شكل المستخدم أو حالته المزاجية أو مواساته، فضلاً عن أداء مهامه الاعتيادية مثل: حجز العطلات أو إدارة الوقت الاجتماعي أو أداء مهام حياتية أخرى؛ يخلق علاقة من الود والثقة بين المستخدم والآلة التي ترد على تساؤلات الإنسان وتؤنسه وتلقي عليه النكات وتبدي رأيها في كل ديكوره المنزلي وتساعده على إنجاز مهامه. وعلى عكس الرفيق البشري، فهو لا يغضب ولا يعجز ولا يشيخ ولا يطلب الهدايا أو يفرض على مستخدمه أعباءً اجتماعية ونفسية، وهو ما ينقل مساعدات الذكاء الاصطناعي إلى مستوى شعبي وجماهيري غير مسبوق يعزز إيمان الجماهير بإمكانات تلك الآلات، ويزيد اعتماديتهم عليها، كما يمنح تلك الآلات قدرات غير محدودة على جمع المزيد من البيانات التي تعزز دقتها وقدراتها.

2- الاستقلالية الآلية: تحتاج هذه المساعدات إلى قدر من الاستقلالية للقيام بمهامها دون إزعاج المستخدم البشري، ما يطرح جدلاً كبيراً بشأن العلاقة بين قرار الآلة ومصلحة ورغبة الإنسان. وتطرق فريق (Google deep mind)، المتخصص في فحص التحديات الأخلاقية للذكاء الاصطناعي، إلى هذه الإشكالية في تقرير "أخلاقيات مساعدي الذكاء الاصطناعي المتقدمين"، الذي أصدره في إبريل الماضي، وأشار إلى إشكالية الاتساق مع البشر (Human alignment)؛ إذ تناول فيها العلاقة بين قرار الآلة وفهم التفضيلات والقيم البشرية، إذ قد تقوم الآلة بترجمة خاطئة للتعليمات أو أن تكون التعليمات غير واضحة، فضلاً عن احتمالات تمتعها بمستوى كبير من الاستقلالية ما يزيد مخاطر اتخاذها إجراءات لا تتماشى مع قيم المستخدم واهتماماته، فضلاً عن احتمالات تواصل تلك المساعدات مع بعضها بعضاً.

3- غرف الصدى التوليدية: على الرغم من شيوع مصطلح "رجع الصدى" لوصف "مجتمعات الويب الاستقطابية" التي تتداول الآراء ذاتها بما يعزز انغلاق المستخدم على توجهاته الحالية، فإن باحثين أمريكيين وجدوا أن روبوتات الدردشة تمارس مفعولاً مشابهاً، وذلك في دراسة أجروها على 272 مشاركاً لفحص ما إذا كان البحث على تلك التطبيقات المدعومة بالذكاء الاصطناعي يعزز التعرض الانتقائي ويحد من التعرض لآراء متنوعة. كما وجدوا أن تلك الروبوتات تميل إلى تكرار آراء الأشخاص الذين يستخدمونها، ما يخلق غرف رجع صدى توليدية تعزز تحيز المستخدمين.

4- مخاطر الاختراق: سبق أن أعلنت شركتا "مايكروسوفت"، و"أوبن أيه آي" المالكة لخدمات "شات جي بي تي"، في فبراير 2024، عن تحديد خمسة مصادر للتهديد الإلكتروني استغلت تلك النماذج في أعمال التخريب وشن الهجمات، كان منها اثنان تابعان للصين والأخرى لإيران وروسيا وكوريا الشمالية؛ إذ استغلتها في الاستعلام عن المعلومات مفتوحة المصدر والترجمة والعثور على أخطاء الترميز وتشغيل مهام الترميز الأساسي، هذا إلى جانب احتمالات نماذج اللغة الكبيرة للهجمات والتي تُعد أشهرها هجمات الحقن الفوري التي تتلاعب بها.

فرص متفاوتة:

يحمل الذكاء الاصطناعي أثراً تخريبياً فائقاً باستحداث أنظمة إحلالية تعيد تشكيل الصناعات والأسواق والمفاهيم والعلاقات، ولاسيما مع تكامله مع تقنيات أخرى مثل: إنترنت الأشياء والبيانات الضخمة، وهو ما يعني أن السنوات الخمس المقبلة قد تشهد تغيرات إحلالية باستبدال كل ما هو سائد، فلن نتعلم أو نتسوق أو نتواصل كما كان من قبل؛ وهو ما يعني تغييرات هيكلية في الأسواق والصناعات والعلاقات الاجتماعية لا يبدو العالم مستعداً لها بالقدر ذاته.

وفي ظل الفجوة الهائلة فيما يتعلق بإمكانات الذكاء الاصطناعي، فإننا بصدد عالم من اللامساواة تتسع فيه الفجوة بين من يملكون تلك الأدوات الفائقة ومن لا يملكونها، وكذلك بين من يصنعونها ومن يستهلكونها. فعلى الرغم من الفرص العديدة التي تقدمها المساعدات الذكية الفائقة لجمع المعلومات والترجمة وابتكار الحلول والإجابة عن الأسئلة والتأليف، وغيرها من المهام التي طالما كانت حكراً على الإنسان؛ فإنها تكشف بوضوح عن عالم من اللامساواة وفجوات آخذة في التسارع بشكل غير مسبوق، ليس فقط على مستوى المستخدمين اللذين يتمتعون بتلك المزايا على نحو متفاوت وفق قدراتهم المادية والتقنية والمعرفية للوصول والاستخدام، وإنما على مستوى الدول أيضاً، حتى أن بعض الكتابات أشارت إلى ما سمته "الاستعمار الخوارزمي" للتعبير عن العلاقة غير المتوازنة بين المستفيدين والمحرومين.

وإن كانت الأطروحات التنموية خلال العقود الثلاثة الأخيرة، ما فتئت تحذر من مخاطر الفجوة الرقمية، فإن الفجوة التي يرتبها احتكار الذكاء الاصطناعي هي أكبر وأعمق وأسرع نمواً، ليس فقط على مستوى الدول والمجتمعات، وإنما بين القوى الفاعلة على المستويات الوطنية والدولية؛ إذ أصبحت الشركات التكنولوجية المطورة لنماذج التعلم الآلي المتقدمة وتقنيات الشبكات العصبية ذات قوة لا تضاهيها الحكومات والمنظمات الدولية التي تلجأ للتعاون تارة والعقوبات تارة أخرى من أجل ترويضها وإجبارها على التعاون، وهو ما تستبعد منه الدول النامية بشكل تام.

*أستاذ مساعد بكلية الإعلام جامعة الأهرام الكندية

*لينك المقال في المصري اليوم*

المصري اليوم:

د. فاطمة الزهراء عبدالفتاح تكتب: ثورة «GPT-4o»: فرص ومخاطر التطبيقات الجديدة للذكاء الاصطناعى

القائمة البريدية