lang icon En
May 24, 2025, 6:48 a.m.
3082

تولیدکننده ویدیوی هوش مصنوعی Google Veo 3: هم‌نمونه‌سازی صدای همراه و تصویر با واقع‌نمایی چشمگیر

Brief news summary

گوگل ویو ۳، یک مدل پیشرفته تولید ویدئو با هوش مصنوعی، را معرفی کرده است که قادر به ساخت ویدئوهای اچ‌دی هشت‌ثانیه‌ای هم‌زمان با صدا، دیالوگ و افکت‌های صوتی است—و این از ابزارهای قبلی که محدود به کلیپ‌های بی‌صدا یا بسیار کوتاه بودند، فراتر رفته است. در آزمایش‌ها، ویو ۳ موفق شد سناریوی معیار را بازسازی کند؛ نمونه‌ای از آن، تکرار کردن صحنه‌ای بود که در آن ویلیام سمیث، بازیگر برنده اسکار، در حال خوردن اسپاگتی در ویدئویی با کیفیت پایین از سال ۲۰۲۳ است. گرچه این مدل در هماهنگ کردن ویدئو و صدا موثر عمل کرد، اما در صحنه اسپاگتی صدای عجیبی شبیه «قرچقرچ» تولید کرد که احتمالاً ناشی از تعصبات در داده‌های آموزشی و تمرکز بر صدای جویدن است. فیلترهای محتوای مستقیم درخواست‌های «ویلیام سمیث» را مسدود کردند، اما ورودی‌های مشابه هنوز باعث خطاهای صوتی می‌شوند. با وجود این چالش‌ها، ویو ۳ در تولید دیالوگ و موسیقی منسجم بسیار موفق است و پروژه‌های خلاقانه‌ای مانند اپرای کمدی اسپاگتی را الهام می‌بخشد. این پیشرفت گامی مهم در راه تولید چندرسانه‌ای واقع‌گرایانه با هوش مصنوعی است، هرچند محدودیت در کپی‌برداری از چهره‌های مشهور همچنان جزو چالش‌ها باقی می‌ماند. عرضه ویو ۳ بحث‌های فرهنگی درباره واقع‌گرایی ویدئوهای هوش مصنوعی را برانگیخته و در حین آزمایش‌های مداوم، داستان «شاهزاده تازه‌وارد» و اسپاگتی را با چرخش جدیدی روبه‌رو کرده است.

در سه‌شنبه، گوگل مدل جدیدی از تولید ویدیوی مبتنی بر هوش مصنوعی به نام Veo 3 را رونمایی کرد؛ مدلی که قادر است دستاوردی را برآورده کند که هیچ ژنراتور ویدیوی هوش مصنوعی بزرگی تا کنون نتوانسته بود: تولید یک صدای هم‌زمان با ویدیو. در فاصله سال‌های ۲۰۲۲ تا ۲۰۲۴، ویدیوهای اولیه تولیدشده توسط هوش مصنوعی بی‌صدا بودند و اغلب بسیار کوتاه. حالا، Veo 3 کلیپ‌های هشت‌ثانیه با وضوح بالا ارائه می‌دهد که همراه با صدا، دیالوگ و افکت‌های صوتی هستند. پس از عرضه، مردم فوراً پرسیدند که چقدر Veo 3 می‌تواند تظاهر کند که بازیگر برنده اسکار، ویلیام سمیث، در حال خوردن اسپاگتی است. مروری کوتاه بر موضوع: «معیار اسپاگتی» در ویدیوی هوش مصنوعی آغاز شد در مارس ۲۰۲۳ با یک ویدیوی اولیه و نسبتاً ناراحت‌کننده که با استفاده از مدلی متن‌باز به نام ModelScope ساخته شده بود. آن مثال از اسپاگتی آن‌قدر معروف شد که سمیث تقریباً یک سال بعد، در فوریه ۲۰۲۴، آن را مسخره کرد. در اینجا تکراری از شکل ویدیوی ویروسی اولیه آورده شده است: آنچه اغلب فراموش می‌شود این است که در آن زمان، پارودی سمیث با بهترین ژنراتور ویدیوی هوش مصنوعی موجود ساخته نشده بود — مدلی به نام Gen-2 از رن‌وی که نتایج باکیفیت‌تری ارائه داده بود، هرچند هنوز در دسترس عمومی نبود. با این حال، نسخه ModelScope آن قدر عجیب و خاطره‌انگیز بود که به عنوان مرجعی برای محدودیت‌های اولیه ویدیوهای هوش مصنوعی در پیشرفت فناوری عمل کرد. اوایل این هفته، توسعه‌دهنده برنامه‌های هوش مصنوعی، خاور Lopez، در پاسخ به طرفداران مشتاق بازبینی آزمایش اسپاگتی با Veo 3، یافته‌های خود را در X به اشتراک گذاشت. اما هنگام تماشا نتایج، صدای پس‌زمینه عجیب به نظر می‌رسید: صدای ساختگی سمیث مانند این بود که او در حال گاز زدن اسپاگتی است. این اشکال ناشی از ظرفیت آزمایشی Veo 3 برای افزودن افکت‌های صوتی است، احتمالاً به این دلیل که داده‌های آموزشی آن شامل نمونه‌های متعددی از جویدن همراه با صداهای شکستنی بودند. مدل‌های تولیدکننده هوش مصنوعی عملکردشان بر پایه تطابق الگو و پیش‌بینی استوار است، و برای تولید نتایج قانع‌کننده نیازمند داده‌های آموزشی کافی در انواع مختلف رسانه‌ها هستند.

زمانی که مفاهیمی در آن داده‌ها بیش از حد یا کم‌تر از حد نمایان می‌شوند، منجر به مصنوعات عجیب و غریبی در تولید مانند این می‌شود. ما خودمان هم این درخواست را در Veo 3 اجرا کردیم، اما «ویل اسمیت» توسط فیلترهای محتوای گوگل مسدود شد. با این حال، استفاده از درخواست «یک مرد سیاه‌پوست در حال خوردن اسپاگتی»، صدای خردکننده مشابهی تولید کرد (احتمالاً Lopez به نسخه‌ای بدون فیلتر اولیه دسترسی داشته یا با تغییرات در پرس‌شده‌ها که از فیلتر عبور کرده بودند، آزمایش کرده است). Veo 3 با توانایی تولید دیالوگ و موسیقی منسجم، تحت تأثیر قرار می‌دهد و در حال حاضر نمونه‌های قابل‌توجهی در X ایجاد کرده است. نمی‌خواستیم فقط یک ویدیو از مردی که نودل‌های بسیار آلدنته می‌خورد باشد، بلکه آزمایش کردیم که آیا می‌تواند همزمان آواز بخواند و غذا بخورد؛ با پرسش: «مردی در حال آواز خواندن در اپرای کمدی انگلیسی درباره اسپاگتی در کنار میز آشپزخانه و همزمان خوردن آن. » ما از سال ۲۰۲۳ پیشرفت قابل توجهی داشته‌ایم، و تولیدکنندگان ویدیو با هوش مصنوعی در واقعیت و عملکرد بهبود خواهند یافت. اگر فیلتر فعلی سلبریتی در Veo 3 نبود، به راحتی می‌توانستیم ویدیوهایی از سمیث بسازیم که در حال آواز خواندن است — یا تقریباً انجام هر چیز دیگری — که این موضوع به نگرانی‌های احتمالی درباره فناوری ویدیوهای هوش مصنوعی اشاره دارد. در حال حاضر، ایده‌ی تکینگی فرهنگی به سرعت در حال نزدیک شدن است. در این راستا، اخیراً مجموعه‌ای گسترده از آزمایش‌های تولید ویدیو با Veo 3 انجام دادیم و به زودی نتایج آن را در گزارشی اختصاصی منتشر خواهیم کرد. فعلاً این را به عنوان یک بروزرسانی کوتاه درباره «پرنس جدید نودل‌خور» در نظر بگیرید. نوش جان!


Watch video about

تولیدکننده ویدیوی هوش مصنوعی Google Veo 3: هم‌نمونه‌سازی صدای همراه و تصویر با واقع‌نمایی چشمگیر

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 12, 2025, 1:42 p.m.

دیزنی به گوگل درباره استفاده از محتوای هوش مصنوعی…

شرکت والت دیزنی اقدام حقوقی قابل توجهی علیه گوگل آغاز کرده است و با صدور نامه توقف و جلوگیری، این غول فناوری را متهم به نقض حقوق کپی‌رایت دیزنی در حین آموزش و توسعه مدل‌های هوش مصنوعی مولد (AI) بدون ارائه جبران می‌کند.

Dec. 12, 2025, 1:35 p.m.

هوش مصنوعی و آینده بهینه‌سازی موتور جستجو

با پیشرفت هوش مصنوعی (AI) و ادغام هر چه بیشتر آن در بازاریابی دیجیتال، تأثیر آن بر بهینه‌سازی موتورهای جستجو (SEO) روز به روز بیشتر می‌شود.

Dec. 12, 2025, 1:33 p.m.

هوش مصنوعی: برنامه MiniMax و Zhipu AI برای عرضه د…

مینی‌ماکس و ژیپوجی آی‌آی، دو شرکت پیشرو در حوزه هوش مصنوعی، در گزارش‌ها در حال آماده‌سازی برای عرضه اولیه سهام در بورس هنگ‌کنگ در اوایل ژانویه سال آینده هستند.

Dec. 12, 2025, 1:31 p.m.

OpenAI مدیرعامل Slack، دنیس دِسِر، را به عنوان رئیس…

دنیس درسر، مدیرعامل اسلک، قرار است از سمت خود کناره‌گیری کرده و به عنوان مدیر ارشد درآمد شرکت اوپن‌ای‌آی، شرکت پشت چت‌جی‌پی‌تی، فعالیت کند.

Dec. 12, 2025, 1:30 p.m.

تکنیک‌های سنتز ویدیوی هوش مصنوعی بهره‌وری تولید ف…

صنعت فیلم در حال تجربه تغییرات اساسی است؛ چرا که استودیوها به طور فزاینده‌ای از تکنیک‌های سنتزی ویدئویی مبتنی بر هوش مصنوعی (AI) برای بهبود فرآیندهای پس‌تولید استفاده می‌کنند.

Dec. 12, 2025, 1:24 p.m.

۱۹ ابزار برتر هوش مصنوعی در رسانه‌های اجتماعی برا…

هوش مصنوعی در حال انقلاب در بازاریابی شبکه‌های اجتماعی است و ابزارهایی را ارائه می‌دهد که تعامل با مخاطبین را ساده‌تر و بهبود می‌بخشد.

Dec. 12, 2025, 9:42 a.m.

تاثیرگذاران هوشمند مصنوعی در شبکه‌های اجتماعی: فر…

ظهور تأثیرگذاران ساخته شده با هوش مصنوعی در رسانه‌های اجتماعی نشان‌دهنده تغییر عمده‌ای در محیط دیجیتال است که منجر به بحث‌های گسترده‌ای درباره اصالت تعاملات آنلاین و مسائل اخلاقی مرتبط با این شخصیت‌های مجازی شده است.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today