القاهرة: الأمير كمال فرج.
شهدت الساحة الأكاديمية كارثة علمية، فمع تزايد اعتماد الباحثين على أدوات الذكاء الاصطناعي في صياغة أوراقهم العلمية. ما بدأ كأداة مساعدة تطور الآن إلى ظاهرة واسعة النطاق تثير قلق العلماء حول مصداقية الإنتاج المعرفي.
كشف الأبحاث الحديثة، أن عددًا هائلًا من الدراسات المنشورة قد يكون قد كُتب كليًا أو جزئيًا بمساعدة نماذج اللغة الكبيرة، مما يطرح تساؤلات جدية حول مستقبل البحث العلمي ونزاهته.
على غرار أي كاتب بشري مبتدئ، تميل روبوتات الدردشة المدعومة بالذكاء الاصطناعي إلى الإفراط في استخدام كلمات محددة، ويستخدم العلماء الآن هذه الخاصية للكشف عن زملائهم الذين يلجأون إلى هذه الأدوات سرًا في عملهم.
كما ذكرت صحيفة New York Times، أن "العلماء يقدرون بناءً على تحليل هذه المصطلحات المفرطة الاستخدام، أن مئات الآلاف من الأوراق الأكاديمية قد كُتبت بالفعل بمساعدة الذكاء الاصطناعي".
في دراسة جديدة نُشرت في مجلة Science Advances، حدد باحثون من جامعة توبنغن الألمانية حوالي 454 كلمة تستخدمها نماذج اللغة الكبيرة (LLMs) بشكل متكرر - مثل مصطلحات "حصد garnered"، و"شامل encompassing"، و"آخذ في التوسع burgeoning - ووجدوا أن ما بين 13.5 إلى 40 % من ملخصات المقالات الطبية الحيوية كُتبت بالكامل أو بمساعدة الذكاء الاصطناعي.
مع وجود ما يقرب من 1.5 مليون ورقة بحثية مفهرسة سنويًا في قاعدة بيانات المجلات الأكاديمية PubMed، يعني هذا أن ما لا يقل عن 200 ألف من هذه الأوراق قد كُتبت بمساعدة نماذج اللغة الكبيرة. قد يكون هذا الرقم الهائل، كما أشارت صحيفة New York Times، متحفظًا عند الأخذ في الاعتبار أي تعديلات متعمدة للنصوص المولّدة بواسطة الذكاء الاصطناعي.
تحديات الكشف وتكتيكات الإخفاء
في حين يبذل بعض كتاب المجلات المخادعين جهودًا لإخفاء استخدامهم للذكاء الاصطناعي، إلا أن آخرين لم يبدوا اهتمامًا بمن سيعرف. ففي مثال نشره عالم الحاسوب سوباراو كامبهامباتي من جامعة ولاية أريزونا على منصة X، ترك "كُتّاب" مجلة أشعة ذات جودة متدنية إقرارًا بأنها كُتبت بواسطة روبوت محادثة.
جاء في الاقتباس من الورقة: "أنا آسف جدًا، ولكن ليس لدي وصول إلى معلومات في الوقت الفعلي أو بيانات خاصة بالمريض لأنني نموذج لغة ذكاء اصطناعي."
لن تكون جميع الأخطاء واضحة بهذا القدر. فما لم تكن ملمًا بمصطلح "تجديد الاستجابة" regenerate response - وهو خيار في ChatGPT يجبر روبوت الدردشة على إعادة صياغة إجابة رديئة - يمكنك بسهولة تفويت وجوده متناثرًا في المجلات المرموقة، وهو ما اكتشفته مدونة Retraction Watch في عام 2013.
كشفت المدونة ذاتها أيضًا عن ورطة محبطة تتعلق بورقة بحثية عن "الدويبات الألفية millipedes تحتوي على مراجع مختلقة تمامًا، والتي تم سحبها في البداية من خادم ما قبل الطباعة، لتظهر لاحقًا على قاعدة بيانات أكاديمية مختلفة بنفس المصادر الوهمية.
ولا ننسى المجلة التي اضطرت إلى سحب ورقة بعد أن لاحظ المراقبون أنها مليئة بالهراء، بما في ذلك صورة مولّدة بالذكاء الاصطناعي لفأر بأعضاء تناسلية ضخمة بشكل هزلي.
تأثير غير مسبوق وتحذيرات العلماء
لزيادة تعقيد الأمور، يبذل الأكاديميون جهودًا لإخفاء استخدامهم للذكاء الاصطناعي. فكما صرح كامبهامباتي للصحيفة، بدأ الأكاديميون في تغيير طريقة كتابتهم حتى لا يتم الخلط بين عملهم وبين الذكاء الاصطناعي، بإزالة مصطلحات مثل "الغوص في delve" التي تفرط نماذج اللغة الكبيرة في استخدامها.
في ورقة Science Advances، يقترح باحثو توبنغن أن كل هذا الاستخدام للذكاء الاصطناعي في المجلات الأكاديمية، إذا تم تأكيده، يمكن أن يكون له "تأثير غير مسبوق على الكتابة العلمية في الأبحاث الطبية الحيوية، متجاوزًا تأثير الأحداث العالمية الكبرى مثل جائحة COVID 19"
ومع ذلك، يرى المؤلف المشارك ديمتري كوباك أن الأمر برمته يبدو غير منطقي، فقد صرح لـ New York Times: "أعتقد أنه بالنسبة لشيء مهم مثل كتابة ملخص لورقتك البحثية، لن تفعل ذلك."