أطلقت شركة Shengshu الصينية الناشئة في مجال الذكاء الاصطناعي أداة لتحويل الصورة إلى فيديو، لتنافس Sora
في الصورة هنا مقطع تم إنشاؤه بواسطة الذكاء الاصطناعي من موقع Vidu الإلكتروني. يمكن للأداة إنشاء مقاطع فيديو من مطالبات نصية أو صورية.
إيفلين تشينج | سي ان بي سي
بكين – قالت شركة Shengshu Technology ومقرها بكين يوم الأربعاء إن أداة تحويل النص إلى الفيديو التي تعمل بالذكاء الاصطناعي Vidu ستكون الآن قادرة على إنشاء مقاطع فيديو من خلال الجمع بين الصور.
يتيح Vidu بالفعل للمستخدمين في جميع أنحاء العالم إنشاء مقاطع مدتها 8 ثوانٍ بناءً على مطالبات مكتوبة. وفي حين كشفت شركة OpenAI – الشركة المصنعة لـ ChatGPT – في فبراير أن نموذج الذكاء الاصطناعي الخاص بها Sora يمكنه إنشاء مقاطع فيديو مدتها دقيقة واحدة من النص، إلا أنها لم تنشر ذلك علنًا بعد.
وقال Shengshu إن ميزة الذكاء الاصطناعي الجديدة من Vidu يمكنها دمج ثلاث صور – مثل قميص وشخص ودراجة نارية – في مقطع فيديو للشخص الذي يرتدي القميص ويقود الدراجة عبر المشهد.
تزعم منصات أخرى أنها تستطيع تحويل النصوص أو الصور إلى مقاطع فيديو باستخدام الذكاء الاصطناعي، لكن جودة الإخراج تختلف. الإنجاز الذي يدعي Shengshu هو القدرة على التقاط ثلاث صور فريدة ودمجها مع الاتساق البصري في مقطع فيديو تم إنشاؤه بواسطة الذكاء الاصطناعي.
“لقد حددنا ذلك في وقت مبكر جدًا [visual consistency] وقال فان باو، كبير مسؤولي التكنولوجيا في شركة Shengshu، باللغة الماندرين، التي ترجمتها CNBC: “المشكلة، وأراد حلها جيدًا”.
تم إطلاق Vidu في أبريل، وانتشرت قدرته على تحويل صورتين للملف الشخصي إلى مقاطع فيديو واقعية لأشخاص يتعانقون على TikTok.
قال جيايو تانغ، المؤسس المشارك والرئيس التنفيذي لشركة Shengshu، باللغة الماندرين، إن مولد الفيديو القائم على الذكاء الاصطناعي يجني الأموال بالفعل من المعلنين ورسامي الرسوم المتحركة والشركات الأخرى، وفقًا لترجمة CNBC. وقال إن معدلات الاستخدام الشهرية لكل عميل يمكن أن تتراوح من 100 ألف يوان إلى مليون يوان (13871 دولارًا إلى 138711 دولارًا).
ولمعالجة قضايا حقوق الطبع والنشر، قال تانغ إن إحدى الشركات قد توقع صفقة مع فنان تسمح للذكاء الاصطناعي بتقليد أسلوب الفنان في الرسم للإعلان. وقال إنه لم ير قضايا قانونية مهمة حول استخدام المستهلكين للصور.
وأضاف تانغ أن Vidu لا يسمح للجمهور بإنشاء محتوى باستخدام صور المشاهير أو الأفراد “الحساسين”. وقال إن أداة الذكاء الاصطناعي تحظر أيضًا الصور العارية والصور العنيفة. أما بالنسبة للصور الشخصية، فقال تانغ إن Vidu يقوم بتدمير البيانات وفقًا للوائح العامة لحماية البيانات – وهو معيار عالمي.
تأسست شركة Shengshu العام الماضي مع داعمين من بينهم Baidu Ventures، وAnt Group التابعة لشركة Alibaba، والشركة الصينية الناشئة Zhipu AI، وQiming Venture Partners، ومدينة بكين، وفقًا لشركة PitchBook.
وقال تانغ إن الذكاء الاصطناعي الخاص بـ Vidu يعمل على تشغيل خوادم سحابية مستأجرة في الصين وخارجها.
اكتشاف المزيد من نهج
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.