بالفيديو | الموناليزا تغني الراب... ولكن كيف ذلك؟

كتبها ندى ماهر عبدربه بتاريخ 2024/04/25

طقس العرب - طوّر فريق من العلماء في Microsoft Research Asia نموذجًا جديدًا للذكاء الاصطناعي يُسمى VASA-1، والذي يحوّل صور وجوه الأشخاص ومقاطع الصوت إلى فيديوهات متزامنة مع حركات الشفاه وتعابير الوجه وحركات الرأس بشكل دقيق وواقعي.

وفي ورقة بحثية، صرّح الفريق بأنهم قدموا إطار عمل VASA، الذي يتيح إنشاء وجوه ناطقة نابضة بالحياة مع مهارات عاطفية بصرية جذابة من خلال صورة واحدة ومقطع صوتي للكلام يتميز النموذج الأول، VASA-1، بقدرته على توليد حركات الشفاه بشكل رائع ومتزامن مع الصوت، بالإضافة إلى التقاط مجموعة واسعة من الفروق الدقيقة في تعابير الوجه وحركات الرأس الطبيعية التي تُسهم في إضفاء الأصالة والحيوية على الفيديو.

ويُدعي الفريق أن طريقتهم لا تُقدم فقط جودة عالية للفيديو مع ديناميكيات واقعية للوجه والرأس، ولكنها تدعم أيضًا إنشاء مقاطع فيديو بحجم 512 × 512 عبر الإنترنت بسرعة تصل إلى 40 إطارًا في الثانية مع زمن انتقال يكاد لا يُذكر.

 

بالفيديو | موظف طيران سعودي يتحول الى ترند... ما القصة؟

 

 

 

غناء الموناليزا ومخاوف من انتحال الشخصية

VASA، أو Visual Affective Skills Animator، هو الاسم الذي يعني "الرسوم المتحركة للمهارات البصرية العاطفية"، وهو قادر على خلق فيديوهات واقعية تحاكي سلوكيات المحادثة البشرية بدقة وواقعية.

يمكن لنموذج VASA إنشاء فيديوهات تبدو حقيقية تمامًا، حيث تعكس "الوجوه الناطقة الواقعية" سلوكيات المحادثة من خلال إيماءات الوجه وحركة العين والرأس بشكل طبيعي، وكل ذلك يبدأ من صورة ثابتة واحدة للرأس.

استخدم الفريق مجموعة بيانات VoxCeleb2 التي تتضمن مقاطع فيديو لآلاف المشاهير الواقعيين لتدريب نموذجهم.

وتميّز نموذجهم بقدرته على التعامل مع المدخلات المتنوعة خارج مجال التدريب، مثل الصور الفنية والكلام بغير الإنجليزية.

وبينما تثير قدرات النموذج مخاوف انتحال الشخصية، يؤكد العلماء أن هدفهم من الأداة هو تطوير المهارات العاطفية البصرية للشخصيات الافتراضية، وليس انتحال شخصية أي شخص في العالم الحقيقي.

تؤكد Microsoft أنه لا توجد خطط حاليًا لإصدار الكود الذي يدعم النموذج، وتهدف إلى استخدام التقنية بشكل مسؤول ووفقًا للوائح المناسبة في المستقبل.

 

 

اقرأ أيضا:

الصين تغرق في التراب... كيف ذلك؟

في اليوم العالمي للأرض أسئلة شائعة عنها...

 


المصادر:

Interesting Engineering



تصفح على الموقع الرسمي



المقلاة الهوائية قد تتجسس عليك.. ما القصة؟كيفية قياس درجة حرارة الطقس من خلال ساعة سامسونج الذكيةتحــــديث: ضباب الآن في مطار الملكة علياء و المناطق المُحيطة و تدني لمدى الرؤية الأفقية إلى 200 مترالأردن | بداية مستقرة لأربعينية الشتاء وأجواء باردة في مختلف المناطق مع ظهور السحب المتفرقةالأردن - تحديث جوي | سحب ممطرة تؤثر على بعض المناطق الجنوبية يصاحبها تشكل للضبابرياح نشطة وباردة خاصة على الشرقية تترافق بانخفاض درجات الحرارة الأيام القادمةالأردن - تحديث جوي | تجدد هطول الأمطار على أجزاء من شمال ووسط المملكة وضباب كثيف فوق المرتفعات الجبليةجدة | طقس غائم جزئي إلى غائم مع هطول أمطار متفرقة على بعض المناطقتحديث جوي | انسياب رياح قارسة البرودة في طبقات الجو السفلى في الساعات القادمة وزخات أمطار متجمدة متوقعة