القاهرة: الأمير كمال فرج.
لطالما كانت أدوات الذكاء الاصطناعي لتوليد الفيديو مصدرًا للجدل الواسع، حيث تثير مخاوف أخلاقية وقانونية عميقة بسبب تدريبها على مواد محمية بحقوق الطبع والنشر. لكن شركة ناشئة تدعى Moonvalley تقدم نموذجًا جديدًا يتحدى هذا الواقع، مدعيةً أن نموذجها تم تدريبه بالكامل على أفلام من الملكية العامة، مما يعني "لا بكسلات مسروقة، ولا جمع بيانات من الإنترنت".
تفاصيل النموذج الجديد: Marey من Moonvalley
تعتبر خوارزميات الذكاء الاصطناعي المعقدة، التي تجمع ملايين نقاط البيانات لتشكيل ثوانٍ من الفيديو، سيئة السمعة لتدريبها على مواد مملوكة للغير. وقد جادل عمالقة التكنولوجيا بأن هذا ضروري لتطوير الذكاء الاصطناعي، حيث يتطلب تغذيته بالكتب والموسيقى ومقاطع الفيديو المحمية بحقوق الطبع والنشر.
لكن Moonvalley، وهي شركة ناشئة في مجال الذكاء الاصطناعي مقرها لوس أنجلوس، تسعى لدحض هذه الحجة. تقدم الشركة نموذجًا لتوليد الفيديو "ثلاثي الأبعاد" يُدعى Marey، والذي تؤكد أنه تم تدريبه بنسبة 100% على أفلام من الملكية العامة.
بعد إطلاق محدود في مارس، أصبح Marey الآن متاحًا للجمهور، وفقًا لتقرير TechCrunch، ويعمل بنظام قائم على الرصيد، وهو أمر شائع في معظم برامج فيديو الذكاء الاصطناعي.
جذب انتباه عمالقة صناعة الأفلام
يجذب هذا النهج اهتمام أسماء كبيرة في عالم السينما، مثل إد أولبريش، فنان المؤثرات البصرية والمنتج الذي عمل على أفلام شهيرة مثل "تيتانيك"، و"بنجامين بتون"، و"توب جن: مافريك". وظفت Moonvalley أولبريش في يونيو ليكون حلقة وصل مع استوديوهات الأفلام، وقد انجذب إلى هذا الدور بفضل ما أسماه "النموذج النظيف" للشركة.
كان أولبريش في السابق معارضًا لتقنيات الذكاء الاصطناعي التوليدي، لكنه يقول إن نهج Moonvalley ساعد في تغيير رأيه.
في مقابلة مع موقع Deadline، قال أولبريش: "أعتقد أن الأمر الأساسي بالنسبة لي والذي غيّر قواعد اللعبة وجعلني مضطرًا للانضمام هو أن الفكرة الأساسية لنموذج Moonvalley النظيف هي شيء شرعي ومناسب، تم الحصول عليه وتدريبه أخلاقيًا. لا بكسلات مسروقة، ولا جمع بيانات من الإنترنت. لقد تم ذلك بطريقة رائعة. ومن المهم جدًا أن يحدث ذلك."
سوابق مماثلة في مجالات أخرى
تم إطلاق مشاريع مماثلة في وسائط أخرى. ففي يونيو، قام فريق يضم أكثر من عشرين باحثًا في الذكاء الاصطناعي بتدريب نموذج لغة كبير (LLM) على بيانات مرخصة بشكل مفتوح أو من الملكية العامة، مما أثبت أنه لا يتطلب الأمر ملايين الكتب المسروقة لبناء روبوت محادثة يعمل بالذكاء الاصطناعي.
كان هذا العمل يتطلب جهدًا هائلاً، حيث قام الفريق بتمشيط أكثر من ثمانية تيرابايت من البيانات – أي ما يعادل تقريبًا 1,685,461 إنجيلًا – مرة واحدة لتنسيق كل شيء، ثم مرة أخرى للتحقق المزدوج من حالة حقوق الطبع والنشر لجميع المواد.
وكانت النتيجة نموذج لغة كبير يضاهي إلى حد كبير نموذجي Llama 1 و Llama 2 7B من ميتا، واللذان يعتبران قديمين بعض الشيء في هذه المرحلة، لكن الإنجاز لا يزال مثيرًا للإعجاب.
في حين أنه لا يزال يتعين معرفة ما إذا كانت بيانات Moonvalley مرخصة بشكل عام حقًا، كما تدعي، فإن هذا التطور يمكن أن يقدم ردًا قويًا على سرد شركات التكنولوجيا الكبرى حول نقص البيانات وضرورة "النهب". هل يمكن أن يفتح هذا النموذج الجديد الباب أمام مستقبل أكثر أخلاقية لتطوير الذكاء الاصطناعي التوليدي؟