القاهرة: الأمير كمال فرج.
قامت شركة Anthropic بفرم وتقطيع ملايين الكتب الورقية لتدريب نموذجها للذكاء الاصطناعي Claude، وتكشف وثائق جديدة أن الشركة كانت تدرك تماماً مدى بشاعة الصورة التي ستظهر بها أمام الرأي العام إذا ما انكشف أمرها.
ذكر فرانك لانديمور في تقرير نشرته مجلة Futurism إن "هذه المبادرة السرية، التي أُطلق عليها اسم "مشروع بنما"، تم الكشف عنها الصيف الماضي خلال دعوى قضائية رفعها مجموعة من المؤلفين ضد الشركة، وهي القضية التي وافقت Anthropic في نهاية المطاف على تسويتها مقابل 1.5 مليار دولار في أغسطس الماضي".
ومنذ ذلك الحين، بدأت تتكشف تفاصيل إضافية حول ما كان يحدث خلف الكواليس، بعد أن أمر قاضٍ اتحادي بفك السرية عن المزيد من وثائق القضية، وفقاً لما نشرته صحيفة Washington Post.
وتكشف الوثائق أن قيادة الشركة كانت تعتبر الكتب "عنصراً جوهرياً" لتدريب نماذجها؛ حيث صرح أحد المؤسسين المشاركين بأن الكتب ستعلم الروبوتات "كيفية الكتابة بشكل جيد" بدلاً من محاكاة "لغة الإنترنت الركيكة".
كان شراء الكتب المستعملة، ثم مسحها ضوئياً، ومن ثم تدميرها، هو الوسيلة لتحقيق ذلك، مع ميزة إضافية تتمثل في كونها وسيلة رخيصة وقانونية (إلى حد ما). استغلت هذه الممارسة التدميرية مفهوماً قانونياً يُعرف باسم "عقيدة البيع الأول"، والتي تسمح للمشترين بالتصرف في مشترياتهم كما يشاؤون دون تدخل صاحب حقوق الطبع والنشر.
ومن خلال تحويل الملفات من ورقية إلى رقمية، وجد القاضي في أغسطس أن هذا ساهم في جعل استخدام الشركة للنصوص الأصلية استخداماً "تحويلياً"، مما اعتبره القضاء "استخداماً عادلاً"، وبذلك تجنبت الشركة دفع أي مبالغ للمؤلفين مقابل أعمالهم.
وتصف وثائق الدعوى القضائية كيف حولت الشركة عملية "تمزيق الكتب" إلى فن قائم بذاته؛ حيث استخدمت "آلة قطع هيدروليكية" لقص ملايين الكتب بدقة، ثم مسح الصفحات ضوئياً باستخدام "ماسحات ضوئية عالية السرعة والجودة". بعد ذلك، يتم تحديد موعد مع شركة إعادة تدوير لاستلام المجلدات التي تم إفراغ محتواها، وذلك "حتى لا تهدر الموارد" كما يبدو!
وإذا بدا لك هذا الأمر مشكوكاً فيه من الناحية الأخلاقية، فلست وحدك؛ إذ كانت Anthropic نفسها تشعر بالقلق تجاه مظهر هذه الممارسات التدميرية، والتي تبدو رمزاً صارخاً لكيفية تدمير صناعة التكنولوجيا للفنون. وجاء في وثيقة تخطيط داخلية من عام 2024: "نحن لا نريد لأحد أن يعرف أننا نعمل على هذا المشروع".
وقبل اللجوء للكتب الورقية، اعتمدت الشركة على الكتب الرقمية. ففي عام 2021، قام المؤسس المشارك "بن مان" بتحميل ملايين الكتب من LibGen، وهي مكتبة مقرصنة على الإنترنت. وفي العام التالي، أثنى "مان" على موقع جديد يسمى Pirate Library Mirror الذي ينتهك قوانين حقوق النشر عمداً، ووصف انطلاقه بأنه جاء "في الوقت المناسب تماماً".
ورغم نفي الشركة استخدام هذه الكتب المقرصنة في نماذجها التجارية، إلا أن هذا المسار أدى في النهاية لتسوية المليار ونصف دولار.
ولم تكن Anthropic الوحيدة في هذا المضمار؛ إذ كشفت وثائق في دعوى قضائية أخرى أن شركة Meta المملوكة لمارك زوكربيرج قد استولت أيضاً على ملايين الكتب من مكتبات الظل مثل LibGen.
وعلق أحد مهندسي Meta في عام 2023 بفكاهة: "التحميل بصيغة (تورنت) من حاسوب الشركة لا يبدو أمراً صواباً". بينما حذر موظف آخر في قسم العلاقات العامة من العواقب إذا تسرب الخبر، قائلاً: "إذا أشارت التغطية الإعلامية إلى استخدامنا لبيانات نعرف أنها مقرصنة، فقد يضعف ذلك موقفنا التفاوضي مع الجهات التنظيمية".