مولد الفيديو باستخدام الذكاء الاصطناعي Google Veo 3: مزامنة الصوت والفيديو مع واقعية مبهرة

في يوم الثلاثاء، كشفت شركة جوجل عن نماذج Veo 3، وهو نموذج جديد للتوليف بالفيديو باستخدام الذكاء الاصطناعي قادر على تحقيق شيء لم تتمكن من تحقيقه أي مولد فيديو رئيسي بالذكاء الاصطناعي من قبل: إنتاج مسار صوتي متزامن مع الفيديو. بين عامي 2022 و2024، كانت مقاطع الفيديو التي يتم إنشاؤها باستخدام الذكاء الاصطناعي في بدايتها صامتة وعادةً كانت قصيرة جدًا. الآن، يقدم Veo 3 مقاطع عالية الجودة مدتها ثماني ثوانٍ مصحوبة بأصوات وحوارات وتأثيرات صوتية. بعد إطلاق النموذج، طرح الناس على الفور السؤال المعياري الواضح: ما مدى قدرة Veo 3 على تقليد الممثل الفائز بجائزة الأوسكار ويل سميث وهو يأكل السباغيتي؟ في ملخص سريع: بدأ معيار "السباغيتي" في فيديوهات الذكاء الاصطناعي في مارس 2023 من خلال فيديو مبكر ومزعج إلى حد ما تم إنشاؤه باستخدام نموذج توليف مفتوح المصدر يسمى ModelScope. أصبح هذا المثال من السباغيتي معروفًا جدًا لدرجة أن سميث سخر منه حوالي سنة كاملة لاحقًا، في فبراير 2024. وإليك تذكيرًا بنظرة على الفيديو الذي حقق انتشارًا واسعًا: ما غالبًا ما يُنسى هو أنه في ذلك الوقت، لم يُنتج تقليد سميث باستخدام أفضل مولد فيديو بالذكاء الاصطناعي متاح—نموذج يُدعى Gen-2 من شركة Runway كان قد قدم نتائج ذات جودة أعلى، على الرغم من أنه لم يكن متاحًا للجمهور بعد. ومع ذلك، كانت نسخة ModelScope غريبة بما يكفي وملفتة بحيث أصبحت مرجعًا لمحدوديات الفيديو المبكرة بالذكاء الاصطناعي مع تطور التقنية. في بداية هذا الأسبوع، رد مطور تطبيقات الذكاء الاصطناعي جافي لوبيز على المعجبين المتحمسين لإعادة اختبار السباغيتي باستخدام Veo 3، وشارك نتائجه على منصة X. ولكن عند مشاهدة النتائج، بدا أن الموسيقى التصويرية غير عادية: بدا أن سميث المزيف كان يمضغ السباغيتي ويصنع صوتًا مقرمشًا. هذه المشكلة ناتجة عن قدرة Veo 3 التجريبية على إضافة التأثيرات الصوتية، ربما لأنها تدربت على العديد من الأمثلة التي تتضمن مضغ الطعام مع أصوات قرقشة. تعمل نماذج الذكاء الاصطناعي التوليدي كنظم تنبؤ تطابق الأنماط، وتعتمد على وجود كمية كافية من بيانات التدريب عبر أنواع الوسائط المختلفة لإنتاج نتائج مقنعة.
عندما يكون مفهوم معين مكررًا بكثرة أو نادرًا في تلك البيانات، يؤدي ذلك إلى ظهور عيوب غريبة في الإنتاج، مثل هذا. كما أجرينا تجربتنا الخاصة باستخدام النموذج على Veo 3، لكن "ويل سميث" تم حظره بواسطة فلاتر المحتوى من جوجل. ومع ذلك، عند استخدام عبارة "رجل أسود يأكل السباغيتي"، أنتجت تأثير قرقشة مماثل (ربما كان لوبيز يمتلك وصولًا مبكرًا بدون فلاتر، أو جرب تكرارات لعبارات نجحت في التسلل). Veo 3 يثير الإعجاب بقدرته على توليد حوارات متماسكة وموسيقى، وهو ما ألهم العديد من الأمثلة المذهلة على منصة X. ولمجرد أننا لا نرغب في الاكتفاء بمقطع فيديو لرجل يأكل نودلز مطبوخة جدًا، اختبرنا ما إذا كان بالإمكان أن يغني ويأكل في نفس الوقت عبر عبارة: "رجل يغني أوبرا كوميدية باللغة الإنجليزية عن السباغيتي على طاولة المطبخ وهو يأكلها". لقد حققنا تقدمًا ملحوظًا منذ عام 2023، وسوف تستمر أدوات توليد الفيديو بالذكاء الاصطناعي في تحسين مستوى الواقعية والوظائف. لو لم يكن هناك فلتر المشاهير الحالي في Veo 3، لكنا قادرين بسهولة على صنع فيديوهات لسميث وهو يغني—أو يفعل أي شيء تقريبًا—وهو ما يسلط الضوء على المخاوف المحتملة من تكنولوجيا فيديوهات الذكاء الاصطناعي. الاقتراب من نقطة التحول الثقافي يسير بسرعة. وفي هذا الصدد، أجرينا مؤخرًا سلسلة موسعة من اختبارات توليد الفيديو باستخدام Veo 3 وسنشارك نتائجنا قريبًا في مقال خاص. حتى ذلك الحين، اعتبروا هذا تحديثًا موجزًا عن "ذا برنس الجديد" في زمن المعكرونة. بون أبيتيت!
Brief news summary
قدمت شركة جوجل نموذج Veo 3، وهو نموذج متقدم لمحاكاة الفيديو باستخدام الذكاء الاصطناعي قادر على توليد مقاطع فيديو عالية الدقة مدتها ثماني ثوانٍ منسقة مع الصوت، الحوار والمؤثرات الصوتية، متجاوزًا الأدوات السابقة التي كانت تقتصر على مقاطع صامتة أو قصيرة جدًا. في الاختبارات، تمكن Veo 3 من إعادة إنشاء سيناريو معياري من خلال محاكاة الممثل الحائز على جائزة الأوسكار ويل سميث وهو يأكل السباغيتي من فيديو منخفض الجودة لعام 2023. على الرغم من أن النموذج نجح في تنسيق الفيديو والصوت بشكل فعال، إلا أنه أظهر صوتًا غير معتاد يشبه طحن الأسناخ خلال مشهد السباغيتي، ويُرجح أن السبب يعود إلى انحيازات في بيانات التدريب التي تركز بشكل كبير على أصوات المضغ. تمنع فلتر المحتوى الطلبات المباشرة بـ "ويل سميث"، لكن إدخالات مماثلة لا تزال تتسبب في حدوث أخطاء صوتية. على الرغم من هذه التحديات، يتميز Veo 3 في إنتاج حوارات متماسكة وموسيقى، مما يلهم مشاريع إبداعية مثل أوبرا الكوميدية عن السباغيتي. يمثل هذا التقدم خطوة مهمة نحو واقعية الوسائط المتعددة التي يُنشئها الذكاء الاصطناعي، رغم أن القيود على التشابه مع المشاهير تظل عقبة مستمرة. إطلاق Veo 3 أثار نقاشات ثقافية حول مدى واقعية فيديوهات الذكاء الاصطناعي، وأضاف لمسة جديدة على قصة "الأمير الطازج" حول السباغيتي في ظل استمرار الاختبارات.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

سريع سباق الذكاء الاصطناعي مع إعلانات كبرى للشركا…
شهدت صناعة الذكاء الاصطناعي الأسبوع الماضي طفرة مذهلة في التطورات الكبرى، مما يبرز سرعة الابتكار وتنافسية شرسة بين الشركات التقنية الرائدة.

هل لا تزال جوجل تهيمن على عمليات البحث في عصر روب…
في مؤتمر المطورين لعام 2025 الذي أُقيمت في جوجل، كشفت الشركة عن إعادة هيكلة رئيسية لوظائف البحث الأساسية، مع التأكيد على الدور الحاسم الذي ستلعبه الذكاء الاصطناعي في مستقبلها.

واشنطن تتجه نحو العملات الرقمية: مشروعات قوانين ا…
في حلقة هذا الأسبوع من برنامج "رؤية بحجم bite" على منصة دي سنترالايزد مع كوينتيليغراف، نستعرض تطورًا مهمًا في تشريعات العملات الرقمية في الولايات المتحدة.

مقدمة عن الأصول الرقمية: لماذا يتم تحويل أسواق ال…
مر أكثر من 15 عامًا منذ إنشاء أول بيتكوين، وأصبحت العملات الرقمية الآن تحقق بعض وعودها المبكرة من خلال تحويل الأنظمة المالية القديمة.

إليكم أبرز ستة استنتاجات من مؤتمر Google I/O، حيث…
في مؤتمر Google I/O لهذا الأسبوع، أطلقت الشركة العملاقة حوالي 100 إعلان، مما يُظهر طموحها للسيطرة على الذكاء الاصطناعي عبر مجالات متعددة، من تجديد محرك البحث إلى تحديث نماذج الذكاء الاصطناعي وتقنيات الأجهزة القابلة للارتداء.

قفزت بيتكوين فوق ١١١،٠٠٠ دولار: التعدين السحابي ل…
يعيد البيتكوين جذب الانتباه العالمي من جديد بعد أن تجاوز مستوى 111,000 دولار لأول مرة، متأثراً بالمستثمرين المؤسسيين، وتغير الديناميات المالية والجيوسياسية، وانتعاش موجة العملات الرقمية.

ما هو رأي الذكاء الاصطناعي في ما ستسفر عنه قضايا …
ترامب ضد CASA في بوتقة الذكاء الاصطناعي: محاكاة آراء المحكمة العليا في الأسبوع الماضي، استمعت المحكمة العليا إلى قضية ترامب ضد CASA، والتي فحصت استخدام "الأوامر القضائية الشاملة" فيما يخص الأمر التنفيذي للرئيس ترامب بتحديد حق المواطنة عند الولادة