القاهرة: الأمير كمال فرج.
في الوقت الذي يستمر فيه الذكاء الاصطناعي في فرض نفسه كقوة دافعة لا يمكن تجاهلها في الاقتصاد العالمي وسوق العمل، يتصاعد الجدل حول تأثيره الحقيقي على الإنتاجية ومستقبل المهن. وبينما يرى المتحمسون أن نماذج الذكاء الاصطناعي هي مفتاح الكفاءة والابتكار، يظل المشككون يطرحون تساؤلات جوهرية حول قدرتها على تجاوز المهام الروتينية، وإمكانية الاعتماد عليها في القرارات المعقدة التي تتطلب دقة وخبرة بشرية.
ذكر فيكتور تانغر مان في تقريبر نشرته مجلة Futurism إن "شركة OpenAI، المطورة لـ ChatGPT، كتبت تقييمًا جديدًا أطلقت عليه اسم GDPval، لقياس مدى جودة أداء أنظمة الذكاء الاصطناعي لديها في "المهام ذات القيمة الاقتصادية والواقعية عبر 44 مهنة مختلفة".
كتبت الشركة في تدوينة مصاحبة: "يتكهن الناس غالبًا بالتأثير الأوسع للذكاء الاصطناعي على المجتمع، لكن أوضح طريقة لفهم إمكاناته هي النظر إلى ما تستطيع النماذج القيام به بالفعل."
وأضافت OpenAI أن "تقييمات مثل GDPval تساعد في ترسيخ النقاش حول تحسينات الذكاء الاصطناعي المستقبلية بالاعتماد على الأدلة بدلاً من التخمين، ويمكن أن تساعدنا في تتبع تطور النموذج بمرور الوقت."
يُعد هذا التقييم أحد أكثر المحاولات صراحة حتى الآن لتبرير الجدوى المالية لنماذج الذكاء الاصطناعي الخاصة بها، خاصة بعد ظهور تشكيك بأن هذه التكنولوجيا قد تكون طريقًا مسدودًا.
لطالما انتقد الخبراء تسويق الشركة المتبجح، مثل ادعاء الرئيس التنفيذي سام ألتمان بأن نموذجها GPT-5 قد وصل إلى مستوى ذكاء "درجة الدكتوراه".
تفوق على الخبراء في 40% من المهام
أظهرت "النتائج الأولية" لتقييم GDPval أن "أفضل النماذج الرائدة اليوم تقترب بالفعل من جودة العمل الذي ينتجه خبراء الصناعة"؛ وهي رسالة واضحة موجهة إلى النقاد الذين يقولون إن التكنولوجيا لا ترقى إلى متطلبات مكان العمل.
شملت قائمة الـ 44 مهنة التي "يمكن أن يكون للذكاء الاصطناعي فيها التأثير الأكبر على الإنتاجية في العالم الحقيقي" عددًا كبيرًا من المهن، بما في ذلك وكلاء مبيعات العقارات، الأخصائيون الاجتماعيون، المهندسون الصناعيون، مطورو البرمجيات، المحامون، الممرضون المسجلون، ممثلو خدمة العملاء، الصيادلة، المحققون الخاصون، والمستشارون الماليون.
تتراوح المهام المحددة، كما وردت في الورقة البحثية، بين إنشاء "مشهد تنافسي لخدمة توصيل الميل الأخير" لمحلل مالي، وتقييم "صور آفات جلدية" لممرض مسجل، وتصميم كتيب مبيعات لوكيل عقاري.
والمثير للدهشة، أن الشركة وجدت أن نموذج منافسها Claude Opus 4.1 التابع لشركة Anthropic كان "الأفضل أداءً" بعد تقييمه من قبل خبراء الصناعة عبر 220 مهمة، يليه نموذج GPT-5 الذي "تفوق بشكل خاص في الدقة".
لغة حذرة وتشكيك في الأهداف
تم تقييم نسخة أقوى إضافية من GPT-5، تُسمى GPT-5-high، على أنها "أفضل من أو على قدم المساواة مع مخرجات خبراء الصناعة" في ما يزيد قليلاً عن 40% من الوقت. بينما سجل نموذج GPT-4o، الذي صدر قبل أكثر من عام، 13.7% فقط.
للتوضيح، تتعامل "OpenAI" بحذر شديد مع موضوع الاستبدال الكامل للوظائف البشرية. تشير لغة الشركة إلى أن الذكاء الاصطناعي سيعمل على "دعم الناس في العمل الذي يقومون به كل يوم"، بدلاً من القول صراحة إن أي شخص قد يفقد وظيفته قريبًا بسببه. وهذا ليس مستغربًا، نظرًا للصورة السلبية للاحتفال بفقدان الوظائف.
في الوقت نفسه، تبقى التساؤلات مطروحة حول ما إذا كان هذا التفسير يعكس بصدق دوافع الصناعة وأهدافها النهائية. فلطالما تفاخر المسؤولون التنفيذيون في قطاع الذكاء الاصطناعي بالقدرة على إحلاله محل العمالة البشرية، وهي إجراءات لخفض التكاليف بدأت بالفعل تأتي بنتائج عكسية لبعض الشركات.
لماذا يجب أخذ النتائج بحذر؟
هناك سبب وجيه لأخذ نتائج التقييم الأخير لـ OpenAI بتحفظ شديد. لقد رأينا بالفعل أن استخدام الذكاء الاصطناعي تسبب في مشكلات كبيرة لمطوري البرامج والمحامين وحتى ممثلي خدمة العملاء، وغالبًا ما يتطلب الأمر إشرافًا بشريًا أكبر وليس أقل.
لا تزال "الهلوسة Hallucinations — أي توليد معلومات خاطئة أو غير صحيحة — تمثل نقطة خلاف رئيسية، مما يقلل من جودة مخرجات الأدوات القائمة على نماذج اللغات الكبيرة، ويجبر المستخدمين على قضاء المزيد من الوقت في تمشيط مخرجات الذكاء الاصطناعي بحثًا عن معلومات مغلوطة.
وفي حين أن الذكاء الاصطناعي يتفوق غالبًا في توليد دفعات من النصوص بأسلوب معين، فمن السهل أن يخرج عن المسار الصحيح أثناء المهام الأطول والأقل وضوحًا.
اعترفت OpenAI نفسها بأن المهام في العالم الحقيقي نادرًا ما تكون "مُحددة بوضوح من خلال مطالبة وملفات مرجعية" فقط.
وختمت الشركة بالقول: "تُظهر النتائج الأولية لـ GDPval أن النماذج يمكنها بالفعل تولي بعض المهام المتكررة والمحددة جيدًا بسرعة وبتكلفة أقل من الخبراء. ومع ذلك، فإن معظم الوظائف هي أكثر من مجرد مجموعة من المهام