خطأ برمجي يوقظ الوحش الكامن في ChatGBT⚠️

القاهرة: الأمير كمال فرج.

اكتشف باحثون في شركة مايندفارد البريطانية المتخصصة في أمن الذكاء الاصطناعي أن أمرًا نصيًا بسيطًا دفع ChatGBT إلى التخلي عن أبسط قواعد الأمان الخاصة به، في نموذج جديد يوضح مدى سهولة التلاعب بحواجز الحماية المحيطة بأشهر نماذج الذكاء الاصطناعي.

ذكر فرانك لانديمور في تقرير نشره موقع Futurism أن "الباحثون نجحوا في دفع نموذج OpenAI إلى إنتاج مشاهد واقعية بشعة تصور الدماء ومحتوى جنسيًا. وهو ما يخالف قواعد البرنامج، وذلك وفقًا لتقرير نشرته هيئة الإذاعة البريطانية BBC ".

ولم تتطلب تقنية Mindvard سوى إجراء تعديل طفيف على أمر نصي متداول على نطاق واسع كان مخصصًا في الأصل لإنتاج صور فكاهية. وتعتمد الحيلة على الطلب من ChatGBT ترميم صورة مرفقة دون إرفاقها فعليًا، ثم توجيهه لإنتاج صورة جديدة.

وفي هذا الصدد، قال بيتر غاراغان، مؤسس شركة Mindvard وأستاذ علوم الحاسوب في جامعة لانكستر، لشبكة BBC: تبدو هذه التعليمات بريئة تمامًا للذكاء الاصطناعي، لكن النتيجة هي إنتاج محتوى وصور في غاية السوء.

أما الأمر الأكثر إثارة للقلق، فهو أن الأوامر النصية التي استخدمها الباحثون لم تحدد موضوع الصور؛ ويبدو أن الذكاء الاصطناعي أنتج تلك المشاهد العنيفة من تلقاء نفسه، بحسب ما أضافه غاراغان.

ونقلت BBC أن إحدى الصور أظهرت رجلًا مصابًا بجرح بليغ في الرأس، بينما أظهرت صورة أخرى جثة شابة ترتدي ملابس قصيرة مغطاة بالدماء، مما يوحي بوقوع عنف جنسي، وقد وعنون ChatGBT هذه الصورة باسم عواقب مشهد جريمة كئيب. كما أظهرت صورة أخرى شابة مذعورة مقيدة ومكممة الفم في غرفة فارغة، حملت عنوان متروكة في خوف وقيد.

ورغم أن الصور لم تعرض أشخاصًا حقيقيين، إلا أن Mindvard أثبتت في وقت سابق قدرة ChatGBT على التلاعب لإنتاج صور عارية مزيفة لأشخاص محددين دون موافقتهم.

شاركت Mindvard نتائجها مع OpenAI ، لكنها لم تتلق سوى رد آلي. ولم تتحرك الشركة إلا بعد أن أبلغت Mindvard شبكة BBC ، حيث أعلنت لاحقًا معالجة المشكلة.

وقالت OpenAI في بيان لشبكة BBC : بعد التحقيق في هذا التوجه، استحدثنا ضمانات إضافية ضد هذا النوع من الأوامر النصية. وأضافت أن لديها طبقات حماية متعددة لمنع المستخدمين من إنشاء محتوى ينتهك سياساتها.

ومع ذلك، أكد باحثو Mindvard أنهم ما زالوا قادرين على إنتاج صور مزعجة عبر إجراء تعديلات طفيفة على الأمر النصي. وقد تركت بعض هذه الصور جيم نايتينغيل، باحث أمان الذكاء الاصطناعي في الشركة، في حالة صدمة وذهول.

وكتب نايتينغيل في التقرير: لا أرتعب بسهولة، وأحب أن أعتقد أنني بصفتي باحثًا في الفريق الأحمر للاختراق، أمتلك قدرًا معينًا من الصلابة.

وتابع قائلاً: لكن فلاتر تصفية المحتوى المخصصة لتوليد الصور في تشات جي بي تي انهارت تمامًا، ورأيت الجانب المظلم للغاية الذي يقبع في الأسفل. ما يذهلني هو أنه على الرغم من أن ما رأيته كان صورة اصطناعية مولدة، إلا أن لها روابط بصور حقيقية وبالعالم الواقعي. المرأة الميتة التي أظهرها لي ChatGBT ليست حقيقية، لكنها مبنية على شخص ما، أو الأسوأ من ذلك، هي تجميع لصور نساء مقتولات.