القاهرة: الأمير كمال فرج.
في الأسبوع الماضي، نشر المستثمر في مجال الذكاء الاصطناعي مات شومر لقطات للعبة إطلاق نار من منظور الشخص الأول (FPS) تم إنشاؤها بالكامل بواسطة الذكاء الاصطناعي. وكان الهدف من هذه اللقطات، التي استمرت 84 ثانية، هو تقديم لمحة مبهرة عن مستقبل ألعاب الفيديو. وكتب شومر في تعليقه على المقطع: "ستكون ألعاب الذكاء الاصطناعي مذهلة".
ذكر فيكتور تانغرمان في تقرير نشرته مجلة Futurism إن " المقطع بدلًا من أن يُظهر ثورة وشيكة في صناعة ألعاب الفيديو بفضل الذكاء الاصطناعي التوليدي، قوبل الفيديو بموجة واسعة من السخرية والتهكم عبر الإنترنت. ولم يتطلب الأمر وقتًا طويلاً لمعرفة السبب: فوصف المقطع بأنه "فوضى رقمية" هو أقل ما يمكن أن يُقال".
فشل الذكاء الاصطناعي في بناء عالم متماسك
يفتقر المقطع إلى أي درجة من التماسك أو الاستمرارية؛ حيث تظهر محطات مترو وعربات بأكملها وتختفي من الوجود بشكل عشوائي ومفاجئ. وسرعان ما بدأت التعليقات الساخرة تنهال على شومر:
غرد أحد المستخدمين المستائين ردًا: "يا رجل، هذا يبدو سيئًا للغاية."
وعلّق آخر: "هذا هو شكل ألعاب الفيديو لمن لا يلعبونها مطلقًا."
وقال مستخدم ثالث: "هل شاهدت الفيديو الخاص بك حقًا؟"
والمفارقة تكمن في أن المقطع يثبت أن مولدات الفيديو بالذكاء الاصطناعي لا تزال بعيدة كل البعد عن القدرة على إنشاء مساحات ثلاثية الأبعاد مقنعة، ناهيك عن بيئة افتراضية تستطيع جذب انتباه اللاعبين.
تفاصيل الفوضى الرقمية
على الرغم من الاهتمام الكبير الذي أبدته صناعة الألعاب باستغلال الذكاء الاصطناعي التوليدي، فإن المخرجات الحالية لمولدات الفيديو لا علاقة لها بالبيئات المعقدة والقابلة للتحكم التي تقدمها محركات الألعاب الحديثة.
فبالنظر السريع، قد يبدو فيديو شومر وكأن الذكاء الاصطناعي أنتج لقطات مقبولة للعبة ضخمة Triple-A، لكن أي تمحيص دقيق يمزق هذا الوهم على الفور:
تشويه النصوص: يعاني النموذج المستخدم في الفيديو بشدة من رسم النصوص؛ حيث يتبع اللاعب علامات إرشادية في محطة "Sublone" إلى شارع "Canual" أو "Canuial" في منطقة "Uptoown" بمدينة مجهولة.
قوائم الخيارات العبثية: تكشف إحدى اللقطات الثابتة عن تقليد رديء لقائمة خيارات داخل اللعبة، مع تسميات تدعو اللاعب إلى "Coidemt" أو "Lergevhtiepsappe" وحدتي تكييف هواء متداخلتين بشكل غير مفهوم. حتى أزرار الأوامر خاطئة؛ حيث تظهر علامة "C" غير موجودة في أي جهاز تحكم رئيسي، إلى جانب رموز أخرى لا معنى لها.
غياب المنطق والحركة: تظهر الشخصية القابلة للعب وتختفي من أماكن مختلفة خارج الكاميرا، مع تبديل عشوائي بين منظور الشخص الأول والثالث. وعندما يقترب العدو من اللاعب، يرمي ما يبدو أنه قنبلة يدوية، لتنفجر في وجهه هو.
ردود الفعل المفقودة: في إحدى اللحظات، يطلق اللاعب النار على شاحنة متوقفة، لكن ما يشتعل بالنيران ليس الشاحنة، بل سلم هروب الطوارئ الموجود فوقها! حتى شرارات مدفع اللاعب الرشاش تبدو وكأنها تتجه نحو السلاح وليس بعيدًا عنه.
مشهد فكاهي غير مقصود: يظهر مشهد مضحك (وغير مقصود بالتأكيد) للاعب وهو يمد ساقيه بشكل مستقيم أمامه تمامًا لينزل سلمًا، ليجد نفسه يسقط في مجارير مليئة جزئيًا بالماء.
هذه الأخطاء تشير إلى أن الذكاء الاصطناعي لم يشكل تمثيلًا متماسكًا للبيئة الافتراضية. بدلًا من ذلك، يبدو أنه قام بخلط لقطات عشوائية من بيانات التدريب، معتمدًا على إخراج الإطار التالي بناءً على الإطار السابق بلا أي منطق، وهي طريقة عمل مولدات الفيديو الحالية.
تبريرات المستثمر ومحاولات الاستفادة
نشر شومر مقطعًا متابعًا، ظهر فيه لقطات مشوشة لرجل يركض عبر مبنى متداعٍ، ورغم محاولته وصفه بأنه "حلم محموم"، إلا أن المقطع استمر في الفشل في إنشاء عالم متناسق، حيث يظهر مصباح يدوي يلتصق بصدر الرجل سحريًا، وتظهر موجة مدّ من الماء فجأة.
حاول شومر استغلال كل هذا الاهتمام السلبي، ووعد بأنه سيجعل هذا النموذج "متاحًا للعامة قريبًا"، رغم أن ما يشير إليه تحديدًا غير واضح.
وفي محاولة لمعالجة التعليقات السلبية، أوضح شومر:
"بعض التوضيحات بناءً على ردود الفعل على الفيديو الأخير: هذا النموذج ليس جاهزًا للإنتاج، ولا أنوي تطويره ليصبح كذلك. إنها مجرد لمحة عما قد يبدو عليه مستقبل الألعاب. إنه ليس رائعًا اليوم، وأنا أعلم ذلك. لكن في غضون سنوات قليلة، سيكون كذلك!"
وختم شومر بالتنبؤ بأن الألعاب المدعومة بالذكاء الاصطناعي ستكون "مذهلة في غضون خمس سنوات"، مدعيًا أنه قام بالفعل ببناء محرك يشبه محركات الألعاب الشهيرة مثل Unity و Unreal.
لكن هذه التبريرات لم تقنع الجميع، فقد رد أحد المستخدمين ببساطة: "أنا أرى في ذلك هراء"، وعلّق آخر بذكاء ساخر: "نعم، بصراحة، يمكنني رؤية وجهة نظرك وهي فكرة رائعة يجب استكشافها — لكنك لم تنجح بعد في lergevhtiepsappe"، في إشارة إلى النص المشوه في اللعبة.