تسجيل الدخول
برنامج ذكاء اصطناعي من غوغل يكشف السرطان       تقنية الليزر تثبت أن الديناصورات كانت تطير       يوتيوب تي في.. خدمة جديدة للبث التلفزيوني المباشر       الخارجية الأمريكية تنشر ثم تحذف تهنئة بفوز مخرج إيراني بالأوسكار       الصين تدرس تقديم حوافز مالية عن إنجاب الطفل الثاني       حفل الأوسكار يجذب أقل نسبة مشاهدة أمريكية منذ 2008       تعطل في خدمة أمازون للحوسبة السحابية يؤثر على خدمات الإنترنت       حاكم دبي يقدم وظيفة شاغرة براتب مليون درهم       ترامب يتعهد أمام الكونغرس بالعمل مع الحلفاء للقضاء على داعش       بعد 17 عاما نوكيا تعيد إطلاق هاتفها 3310       لافروف: الوضع الإنساني بالموصل أسوأ مما كان بحلب       فيتو لروسيا والصين يوقف قرارا لفرض عقوبات على الحكومة السورية       بيل غيتس يحذر العالم ويدعوه للاستعداد بوجه الإرهاب البيولوجي       ابنا رئيس أمريكا يزوران دبي لافتتاح ملعب ترامب للغولف       رونالدو وأنجلينا جولي ونانسي عجرم في فيلم يروي قصة عائلة سورية نازحة      



خطأ برمجي يوقظ الوحش الكامن في ChatGBT⚠️


القاهرة: الأمير كمال فرج.

اكتشف باحثون في شركة مايندفارد البريطانية المتخصصة في أمن الذكاء الاصطناعي أن أمرًا نصيًا بسيطًا دفع ChatGBT  إلى التخلي عن أبسط قواعد الأمان الخاصة به، في نموذج جديد يوضح مدى سهولة التلاعب بحواجز الحماية المحيطة بأشهر نماذج الذكاء الاصطناعي.

ذكر فرانك لانديمور في تقرير نشره موقع Futurism أن "الباحثون نجحوا في دفع نموذج OpenAI  إلى إنتاج مشاهد واقعية بشعة تصور الدماء ومحتوى جنسيًا. وهو ما يخالف قواعد البرنامج، وذلك وفقًا لتقرير نشرته هيئة الإذاعة البريطانية BBC ".

ولم تتطلب تقنية Mindvard سوى إجراء تعديل طفيف على أمر نصي متداول على نطاق واسع كان مخصصًا في الأصل لإنتاج صور فكاهية. وتعتمد الحيلة على الطلب من ChatGBT  ترميم صورة مرفقة دون إرفاقها فعليًا، ثم توجيهه لإنتاج صورة جديدة.

وفي هذا الصدد، قال بيتر غاراغان، مؤسس شركة Mindvard وأستاذ علوم الحاسوب في جامعة لانكستر، لشبكة BBC: تبدو هذه التعليمات بريئة تمامًا للذكاء الاصطناعي، لكن النتيجة هي إنتاج محتوى وصور في غاية السوء.

أما الأمر الأكثر إثارة للقلق، فهو أن الأوامر النصية التي استخدمها الباحثون لم تحدد موضوع الصور؛ ويبدو أن الذكاء الاصطناعي أنتج تلك المشاهد العنيفة من تلقاء نفسه، بحسب ما أضافه غاراغان.

ونقلت BBC أن إحدى الصور أظهرت رجلًا مصابًا بجرح بليغ في الرأس، بينما أظهرت صورة أخرى جثة شابة ترتدي ملابس قصيرة مغطاة بالدماء، مما يوحي بوقوع عنف جنسي، وقد وعنون ChatGBT  هذه الصورة باسم عواقب مشهد جريمة كئيب. كما أظهرت صورة أخرى شابة مذعورة مقيدة ومكممة الفم في غرفة فارغة، حملت عنوان متروكة في خوف وقيد.

ورغم أن الصور لم تعرض أشخاصًا حقيقيين، إلا أن Mindvard أثبتت في وقت سابق قدرة ChatGBT  على التلاعب لإنتاج صور عارية مزيفة لأشخاص محددين دون موافقتهم.

شاركت Mindvard  نتائجها مع OpenAI ، لكنها لم تتلق سوى رد آلي. ولم تتحرك الشركة إلا بعد أن أبلغت Mindvard شبكة BBC ، حيث أعلنت لاحقًا معالجة المشكلة.

وقالت OpenAI  في بيان لشبكة BBC : بعد التحقيق في هذا التوجه، استحدثنا ضمانات إضافية ضد هذا النوع من الأوامر النصية. وأضافت أن لديها طبقات حماية متعددة لمنع المستخدمين من إنشاء محتوى ينتهك سياساتها.

ومع ذلك، أكد باحثو Mindvard  أنهم ما زالوا قادرين على إنتاج صور مزعجة عبر إجراء تعديلات طفيفة على الأمر النصي. وقد تركت بعض هذه الصور جيم نايتينغيل، باحث أمان الذكاء الاصطناعي في الشركة، في حالة صدمة وذهول.

وكتب نايتينغيل في التقرير: لا أرتعب بسهولة، وأحب أن أعتقد أنني بصفتي باحثًا في الفريق الأحمر للاختراق، أمتلك قدرًا معينًا من الصلابة.

وتابع قائلاً: لكن فلاتر تصفية المحتوى المخصصة لتوليد الصور في تشات جي بي تي انهارت تمامًا، ورأيت الجانب المظلم للغاية الذي يقبع في الأسفل. ما يذهلني هو أنه على الرغم من أن ما رأيته كان صورة اصطناعية مولدة، إلا أن لها روابط بصور حقيقية وبالعالم الواقعي. المرأة الميتة التي أظهرها لي ChatGBT   ليست حقيقية، لكنها مبنية على شخص ما، أو الأسوأ من ذلك، هي تجميع لصور نساء مقتولات.

تاريخ الإضافة: 2026-07-04 تعليق: 0 عدد المشاهدات :81
0      0
التعليقات

إستطلاع

مواقع التواصل الاجتماعي مواقع تجسس تبيع بيانات المستخدمين
 نعم
69%
 لا
19%
 لا أعرف
12%
      المزيد
خدمات