كشفت تينسنت، اللاعب الرائد في ساحة التكنولوجيا الصينية، مؤخرًا عن إصدار محدث من نموذجها لتوليد الفيديو بالذكاء الاصطناعي المفتوح المصدر، DynamiCrafter، يؤكد هذا الإعلان على الجهود المتزايدة بين الشركات التكنولوجية الصينية الكبرى لتحويل النصوص والصور إلى فيديوهات بطريقة ثورية.
استخدام الذكاء الاصطناعي لتوليد الفيديو:
العملاق الإنترنت الصيني، المعروف بإمبراطوريته في مجال ألعاب الفيديو وتطبيق المراسلة الشهير WeChat، يستخدم تقنيات الانتشار في DynamiCrafter لتحويل الشرح والصور الثابتة إلى مقاطع فيديو قصيرة، تمثل هذه الطريقة، المستوحاة من ظاهرة الانتشار الطبيعي في الفيزياء، نهجًا متطورًا لتوليد بيانات معقدة وواقعية من مدخلات أبسط.
التقدم التكنولوجي:
يمكن لأحدث إصدار من نموذج DynamiCrafter التابع لتينسنت أن ينتج فيديوهات بدقة 640×1024 بكسل، مما يمثل تحسنًا كبيرًا مقارنة بفيديوهات الإصدار السابق التي كانت بدقة 320×512 بكسل، يسلط ورقة أكاديمية نشرها فريق تينسنت الضوء على كيفية تميز تكنولوجيا DynamiCrafter عن المنافسين من خلال تعزيز تطبيق تقنيات الصور المتحركة على المحتوى البصري العام.
نهج فريد:
يكمن الفكر الأساسي وراء DynamiCrafter في استغلال الحركة السابقة في نماذج الانتشار التي تحول النص إلى فيديو، مدمجة الصورة كتوجيه في العملية التوليدية، على عكس التقنيات التقليدية التي تركز على تحريك المشاهد الطبيعية بديناميكيات عشوائية أو حركات محددة مثل شعر أو أفعال جسم الإنسان، ينتج نموذج تينسنت نتائج حية تبرز في عروض المقارنة بين DynamiCrafter ونماذج أخرى مثل Stable Video Diffusion وPika Labs.
مستقبل الفيديوهات المولدة بالذكاء الاصطناعي:
تحمل الفيديوهات المولدة بالذكاء الاصطناعي وعدًا كبيرًا كالجبهة التالية في سباق الذكاء الاصطناعي، بعد الطفرة في تقنيات توليد النص والصورة، مع استثمار الشركات الناشئة والعمالقة على حد سواء الموارد في هذا المجال، لا تشكل الصين استثناءً، حيث أطلقت شركات مثل ByteDance وBaidu وAlibaba أيضًا نماذجها لتوليد الفيديو بالذكاء الاصطناعي، مع قيام Alibaba بجعل نموذجها VGen مفتوح المصدر، معكسة نهج تينسنت.
تكتسب استراتيجية فتح مصدر نماذج توليد الفيديو بالذكاء الاصطناعي شعبية بين الشركات التكنولوجية الصينية، بهدف جذب مجتمع المطورين العالميين، لا يمثل أحدث إصدار من DynamiCrafter لتينسنت هذا الاتجاه فحسب، بل يضع أيضًا معيارًا جديدًا في المشهد المتطور لإنشاء الفيديو بدافع الذكاء الاصطناعي، مقدمًا لمحة عن مستقبل توليد المحتوى المتعدد الوسائط.