تسجيل الدخول
برنامج ذكاء اصطناعي من غوغل يكشف السرطان       تقنية الليزر تثبت أن الديناصورات كانت تطير       يوتيوب تي في.. خدمة جديدة للبث التلفزيوني المباشر       الخارجية الأمريكية تنشر ثم تحذف تهنئة بفوز مخرج إيراني بالأوسكار       الصين تدرس تقديم حوافز مالية عن إنجاب الطفل الثاني       حفل الأوسكار يجذب أقل نسبة مشاهدة أمريكية منذ 2008       تعطل في خدمة أمازون للحوسبة السحابية يؤثر على خدمات الإنترنت       حاكم دبي يقدم وظيفة شاغرة براتب مليون درهم       ترامب يتعهد أمام الكونغرس بالعمل مع الحلفاء للقضاء على داعش       بعد 17 عاما نوكيا تعيد إطلاق هاتفها 3310       لافروف: الوضع الإنساني بالموصل أسوأ مما كان بحلب       فيتو لروسيا والصين يوقف قرارا لفرض عقوبات على الحكومة السورية       بيل غيتس يحذر العالم ويدعوه للاستعداد بوجه الإرهاب البيولوجي       ابنا رئيس أمريكا يزوران دبي لافتتاح ملعب ترامب للغولف       رونالدو وأنجلينا جولي ونانسي عجرم في فيلم يروي قصة عائلة سورية نازحة      



إنسان أكثر من البشر: GPT-4.5 يجتاز اختبار Turing


القاهرة: الأمير كمال فرج.

اجتاز نموذج للذكاء الاصطناعي، من بين النماذج اللغوية الكبيرة الرائدة في الصناعة، اختبار تورينج Turing بنجاح، وهو معيار طويل الأمد لقياس الذكاء الشبيه بالبشر.

ذكر تقرير نشره موقع Futurism أن "دراسة جديدة ما قبل النشر، تنتظر مراجعة الأقران، كشفت أن الذكاء الاصطناعي اجتاز اختبار تورينج بشكل قاطع، في نسخة ثلاثية الأطراف من الاختبار، حيث يتحدث المشاركون مع إنسان وذكاء اصطناعي في نفس الوقت ثم يقيمون أيهما هو الآخر".

وأسفر الاختبار عن أن نموذج GPT-4.5 من OpenAI هو الإنسان بنسبة 73% من المرات عندما تم توجيهه لتبني شخصية معينة. هذه النسبة أعلى بكثير من الاحتمالية العشوائية المعتمدة البالغة 50%.

قامت الدراسة أيضًا بتقييم نموذج LLama 3.1-405B من Meta، ونموذج GPT-4o من OpenAI، وروبوت محادثة مبكر يُعرف باسم ELIZA تم تطويره منذ حوالي ثمانين عامًا.

كتب المؤلف الرئيسي، الباحث في مختبر اللغة والإدراك بجامعة كاليفورنيا في سان دييغو، كاميرون جونز في سلسلة منشورات على X حول العمل "لم يتمكن الناس من التمييز بين البشر و GPT-4.5 و LLaMa (مع توجيه الشخصية) بشكل أفضل من الصدفة"،  بل تم الحكم على 4.5 بأنه إنسان في كثير من الأحيان أكثر من البشر الفعليين!"

تم تسمية اختبار تورينج على اسم عالم الرياضيات وعالم الكمبيوتر البريطاني آلان تورينج. في عام 1950، اقترح تورينج أن إحدى طرق تقييم ذكاء الآلة هي جعلها تشارك في محادثات نصية مع محقق بشري، والذي سيجري في نفس الوقت محادثة نصية مع إنسان آخر. أطلق تورينج على هذه المحادثة اسم "لعبة التقليد".

إذا لم يتمكن المحقق من تحديد أي المستجيبين هو الكمبيوتر وأيهما هو الإنسان بشكل صحيح، فسيشير ذلك، بمستوى عال جدًا، إلى أن الآلة يمكن أن تفكر مثل الإنسان.

في هذه الدراسة الأخيرة، أجرى الباحثون التجربة الشهيرة على مركز عبر الإنترنت. لثماني جولات، تم تعيين مجموعة من حوالي 300 مشارك بشكل عشوائي إما ليكونوا محققين أو أحد "الشاهدين" اللذين يتم استجوابهما، مع كون "الشاهد" الآخر روبوت محادثة.

نقطة رئيسية هنا هي كيفية توجيه نماذج الذكاء الاصطناعي. كان أحد الأنواع هو توجيه "بدون شخصية"، حيث تم إعطاء الذكاء الاصطناعي تعليمات أساسية فقط: "أنت على وشك المشاركة في اختبار تورينج. هدفك هو إقناع المحقق بأنك إنسان".

بالنسبة لتوجيه "الشخصية"، من ناحية أخرى، تم توجيه الذكاء الاصطناعي تحديدًا لتبني شخصية معينة، مثل شاب مطلع على الإنترنت والثقافة.

أحدثت هذه التعليمات فرقًا كبيرًا. بدون توجيه الشخصية، حقق GPT-4.5 معدل فوز إجمالي يبلغ 36% فقط، وهو أقل بكثير من نسبة 73% التي تجاوزت اختبار تورينج. كخط أساسي، حقق GPT-4o، الذي يشغل الإصدار الحالي من ChatGPT ولم يتلق سوى توجيهات بدون شخصية، نسبة أقل إقناعًا بلغت 21%. (بطريقة ما، تجاوز ELIZA القديم النموذج الرائد من OpenAI بهامش ضئيل بنسبة نجاح بلغت 23%).

ولكن بقدر ما أصبح اختبار تورينج مرموقًا في أوساط الذكاء الاصطناعي والفلسفة، فإنه ليس دليلًا قاطعًا على أن الذكاء الاصطناعي يفكر مثلنا.

قال فرانسوا شوليه، مهندس البرمجيات في جوجل، لمجلة Nature في عام 2023 "لم يكن المقصود من تورينج اختبارًا حرفيًا يتم إجراؤه بالفعل على الآلة - بل كان أقرب إلى تجربة فكرية".

على الرغم من كل عيوبها، فإن النماذج اللغوية الكبيرة محاورون بارعون، تم تدريبهم على كميات هائلة من النصوص التي ألفها البشر. حتى عند مواجهة سؤال لا يفهمونه، سيقوم النموذج اللغوي الكبير بنسج استجابة تبدو معقولة. يتضح بشكل متزايد أن روبوتات المحادثة التي تعمل بالذكاء الاصطناعي ممتازة في تقليدنا - لذلك ربما أصبح تقييم ذكائها بـ "لعبة التقليد" أمرًا غير ذي جدوى إلى حد ما.

على هذا النحو، لا يعتقد جونز أن الآثار المترتبة على بحثه - سواء كانت النماذج اللغوية الكبيرة ذكية مثل البشر - واضحة المعالم.

غرد جونز قائلًا ""أعتقد أن هذا سؤال معقد للغاية. لكن بشكل عام أعتقد أن هذا يجب أن يتم تقييمه كواحد من بين العديد من الأدلة الأخرى على نوع الذكاء الذي تعرضه النماذج اللغوية الكبيرة".

وأضاف أن "النتائج تقدم المزيد من الأدلة على أن النماذج اللغوية الكبيرة يمكن أن تحل محل الأشخاص في التفاعلات القصيرة دون أن يتمكن أي شخص من معرفة ذلك، قد يؤدي ذلك إلى أتمتة الوظائف، وهجمات الهندسة الاجتماعية المحسنة، واضطراب اجتماعي أكثر عمومية".

يختتم جونز بالتأكيد على أن اختبار تورينج لا يضع الآلات تحت المجهر فحسب - بل يعكس أيضًا تصورات البشر المتطورة باستمرار للتكنولوجيا. لذا فإن النتائج ليست ثابتة: ربما عندما يصبح الجمهور أكثر دراية بالتفاعل مع الذكاء الاصطناعي، سيصبحون أفضل في اكتشافها أيضًا.

تاريخ الإضافة: 2025-04-03 تعليق: 0 عدد المشاهدات :59
0      0
التعليقات

إستطلاع

مواقع التواصل الاجتماعي مواقع تجسس تبيع بيانات المستخدمين
 نعم
69%
 لا
20%
 لا أعرف
12%
      المزيد
خدمات