بالفيديو | الموناليزا تغني الراب... ولكن كيف ذلك؟

كتبها ندى ماهر عبدربه بتاريخ 2024/04/25

طقس العرب - طوّر فريق من العلماء في Microsoft Research Asia نموذجًا جديدًا للذكاء الاصطناعي يُسمى VASA-1، والذي يحوّل صور وجوه الأشخاص ومقاطع الصوت إلى فيديوهات متزامنة مع حركات الشفاه وتعابير الوجه وحركات الرأس بشكل دقيق وواقعي.

وفي ورقة بحثية، صرّح الفريق بأنهم قدموا إطار عمل VASA، الذي يتيح إنشاء وجوه ناطقة نابضة بالحياة مع مهارات عاطفية بصرية جذابة من خلال صورة واحدة ومقطع صوتي للكلام يتميز النموذج الأول، VASA-1، بقدرته على توليد حركات الشفاه بشكل رائع ومتزامن مع الصوت، بالإضافة إلى التقاط مجموعة واسعة من الفروق الدقيقة في تعابير الوجه وحركات الرأس الطبيعية التي تُسهم في إضفاء الأصالة والحيوية على الفيديو.

ويُدعي الفريق أن طريقتهم لا تُقدم فقط جودة عالية للفيديو مع ديناميكيات واقعية للوجه والرأس، ولكنها تدعم أيضًا إنشاء مقاطع فيديو بحجم 512 × 512 عبر الإنترنت بسرعة تصل إلى 40 إطارًا في الثانية مع زمن انتقال يكاد لا يُذكر.

 

بالفيديو | موظف طيران سعودي يتحول الى ترند... ما القصة؟

 

 

 

غناء الموناليزا ومخاوف من انتحال الشخصية

VASA، أو Visual Affective Skills Animator، هو الاسم الذي يعني "الرسوم المتحركة للمهارات البصرية العاطفية"، وهو قادر على خلق فيديوهات واقعية تحاكي سلوكيات المحادثة البشرية بدقة وواقعية.

يمكن لنموذج VASA إنشاء فيديوهات تبدو حقيقية تمامًا، حيث تعكس "الوجوه الناطقة الواقعية" سلوكيات المحادثة من خلال إيماءات الوجه وحركة العين والرأس بشكل طبيعي، وكل ذلك يبدأ من صورة ثابتة واحدة للرأس.

استخدم الفريق مجموعة بيانات VoxCeleb2 التي تتضمن مقاطع فيديو لآلاف المشاهير الواقعيين لتدريب نموذجهم.

وتميّز نموذجهم بقدرته على التعامل مع المدخلات المتنوعة خارج مجال التدريب، مثل الصور الفنية والكلام بغير الإنجليزية.

وبينما تثير قدرات النموذج مخاوف انتحال الشخصية، يؤكد العلماء أن هدفهم من الأداة هو تطوير المهارات العاطفية البصرية للشخصيات الافتراضية، وليس انتحال شخصية أي شخص في العالم الحقيقي.

تؤكد Microsoft أنه لا توجد خطط حاليًا لإصدار الكود الذي يدعم النموذج، وتهدف إلى استخدام التقنية بشكل مسؤول ووفقًا للوائح المناسبة في المستقبل.

 

 

اقرأ أيضا:

الصين تغرق في التراب... كيف ذلك؟

في اليوم العالمي للأرض أسئلة شائعة عنها...

 


المصادر:

Interesting Engineering



تصفح على الموقع الرسمي



المقلاة الهوائية قد تتجسس عليك.. ما القصة؟كيفية قياس درجة حرارة الطقس من خلال ساعة سامسونج الذكيةالأردن - تحديث الساعة 12:40 ظهراً | الانتباه من الإنزلاقات… زخات متفرقة من الأمطار تشمل أجزاء من العاصمة عمان في هذه الأثناءالأردن | 200 دينار سنويًا .. توجه أردني لتحديد سقف قيمة الشراء إلكترونياًموعد مباراة العراق وعمان في تصفيات كأس العالم 2026 والقنوات الناقلة وحالة الطقس المتوقعةسمكة يوم القيامة تظهر للمرة الثانية بأحد شواطئ أمريكا.. ما دلالة ظهورها؟الأردن - تحديث جوي | اقتراب سُحب ماطرة من شمال المملكة وفرص الأمطار تمتد تدريجيًا لبعض المناطق الوسطى خلال الساعات القادمةغـ.زة | سُحب ممطرة تقترب من القطاع فجر اليوم وتزايد فُرص الأمطار خلال الساعة القادمةالأردن - تحديث جوي | بداية تأثر المملكة بامتداد منخفض جوي بعيد وزخات من الأمطار على محافظة إربد