در سهشنبه، گوگل مدل جدیدی از تولید ویدیوی مبتنی بر هوش مصنوعی به نام Veo 3 را رونمایی کرد؛ مدلی که قادر است دستاوردی را برآورده کند که هیچ ژنراتور ویدیوی هوش مصنوعی بزرگی تا کنون نتوانسته بود: تولید یک صدای همزمان با ویدیو. در فاصله سالهای ۲۰۲۲ تا ۲۰۲۴، ویدیوهای اولیه تولیدشده توسط هوش مصنوعی بیصدا بودند و اغلب بسیار کوتاه. حالا، Veo 3 کلیپهای هشتثانیه با وضوح بالا ارائه میدهد که همراه با صدا، دیالوگ و افکتهای صوتی هستند. پس از عرضه، مردم فوراً پرسیدند که چقدر Veo 3 میتواند تظاهر کند که بازیگر برنده اسکار، ویلیام سمیث، در حال خوردن اسپاگتی است. مروری کوتاه بر موضوع: «معیار اسپاگتی» در ویدیوی هوش مصنوعی آغاز شد در مارس ۲۰۲۳ با یک ویدیوی اولیه و نسبتاً ناراحتکننده که با استفاده از مدلی متنباز به نام ModelScope ساخته شده بود. آن مثال از اسپاگتی آنقدر معروف شد که سمیث تقریباً یک سال بعد، در فوریه ۲۰۲۴، آن را مسخره کرد. در اینجا تکراری از شکل ویدیوی ویروسی اولیه آورده شده است: آنچه اغلب فراموش میشود این است که در آن زمان، پارودی سمیث با بهترین ژنراتور ویدیوی هوش مصنوعی موجود ساخته نشده بود — مدلی به نام Gen-2 از رنوی که نتایج باکیفیتتری ارائه داده بود، هرچند هنوز در دسترس عمومی نبود. با این حال، نسخه ModelScope آن قدر عجیب و خاطرهانگیز بود که به عنوان مرجعی برای محدودیتهای اولیه ویدیوهای هوش مصنوعی در پیشرفت فناوری عمل کرد. اوایل این هفته، توسعهدهنده برنامههای هوش مصنوعی، خاور Lopez، در پاسخ به طرفداران مشتاق بازبینی آزمایش اسپاگتی با Veo 3، یافتههای خود را در X به اشتراک گذاشت. اما هنگام تماشا نتایج، صدای پسزمینه عجیب به نظر میرسید: صدای ساختگی سمیث مانند این بود که او در حال گاز زدن اسپاگتی است. این اشکال ناشی از ظرفیت آزمایشی Veo 3 برای افزودن افکتهای صوتی است، احتمالاً به این دلیل که دادههای آموزشی آن شامل نمونههای متعددی از جویدن همراه با صداهای شکستنی بودند. مدلهای تولیدکننده هوش مصنوعی عملکردشان بر پایه تطابق الگو و پیشبینی استوار است، و برای تولید نتایج قانعکننده نیازمند دادههای آموزشی کافی در انواع مختلف رسانهها هستند.
زمانی که مفاهیمی در آن دادهها بیش از حد یا کمتر از حد نمایان میشوند، منجر به مصنوعات عجیب و غریبی در تولید مانند این میشود. ما خودمان هم این درخواست را در Veo 3 اجرا کردیم، اما «ویل اسمیت» توسط فیلترهای محتوای گوگل مسدود شد. با این حال، استفاده از درخواست «یک مرد سیاهپوست در حال خوردن اسپاگتی»، صدای خردکننده مشابهی تولید کرد (احتمالاً Lopez به نسخهای بدون فیلتر اولیه دسترسی داشته یا با تغییرات در پرسشدهها که از فیلتر عبور کرده بودند، آزمایش کرده است). Veo 3 با توانایی تولید دیالوگ و موسیقی منسجم، تحت تأثیر قرار میدهد و در حال حاضر نمونههای قابلتوجهی در X ایجاد کرده است. نمیخواستیم فقط یک ویدیو از مردی که نودلهای بسیار آلدنته میخورد باشد، بلکه آزمایش کردیم که آیا میتواند همزمان آواز بخواند و غذا بخورد؛ با پرسش: «مردی در حال آواز خواندن در اپرای کمدی انگلیسی درباره اسپاگتی در کنار میز آشپزخانه و همزمان خوردن آن. » ما از سال ۲۰۲۳ پیشرفت قابل توجهی داشتهایم، و تولیدکنندگان ویدیو با هوش مصنوعی در واقعیت و عملکرد بهبود خواهند یافت. اگر فیلتر فعلی سلبریتی در Veo 3 نبود، به راحتی میتوانستیم ویدیوهایی از سمیث بسازیم که در حال آواز خواندن است — یا تقریباً انجام هر چیز دیگری — که این موضوع به نگرانیهای احتمالی درباره فناوری ویدیوهای هوش مصنوعی اشاره دارد. در حال حاضر، ایدهی تکینگی فرهنگی به سرعت در حال نزدیک شدن است. در این راستا، اخیراً مجموعهای گسترده از آزمایشهای تولید ویدیو با Veo 3 انجام دادیم و به زودی نتایج آن را در گزارشی اختصاصی منتشر خواهیم کرد. فعلاً این را به عنوان یک بروزرسانی کوتاه درباره «پرنس جدید نودلخور» در نظر بگیرید. نوش جان!
تولیدکننده ویدیوی هوش مصنوعی Google Veo 3: همنمونهسازی صدای همراه و تصویر با واقعنمایی چشمگیر
شرکت والت دیزنی اقدام حقوقی قابل توجهی علیه گوگل آغاز کرده است و با صدور نامه توقف و جلوگیری، این غول فناوری را متهم به نقض حقوق کپیرایت دیزنی در حین آموزش و توسعه مدلهای هوش مصنوعی مولد (AI) بدون ارائه جبران میکند.
با پیشرفت هوش مصنوعی (AI) و ادغام هر چه بیشتر آن در بازاریابی دیجیتال، تأثیر آن بر بهینهسازی موتورهای جستجو (SEO) روز به روز بیشتر میشود.
مینیماکس و ژیپوجی آیآی، دو شرکت پیشرو در حوزه هوش مصنوعی، در گزارشها در حال آمادهسازی برای عرضه اولیه سهام در بورس هنگکنگ در اوایل ژانویه سال آینده هستند.
دنیس درسر، مدیرعامل اسلک، قرار است از سمت خود کنارهگیری کرده و به عنوان مدیر ارشد درآمد شرکت اوپنایآی، شرکت پشت چتجیپیتی، فعالیت کند.
صنعت فیلم در حال تجربه تغییرات اساسی است؛ چرا که استودیوها به طور فزایندهای از تکنیکهای سنتزی ویدئویی مبتنی بر هوش مصنوعی (AI) برای بهبود فرآیندهای پستولید استفاده میکنند.
هوش مصنوعی در حال انقلاب در بازاریابی شبکههای اجتماعی است و ابزارهایی را ارائه میدهد که تعامل با مخاطبین را سادهتر و بهبود میبخشد.
ظهور تأثیرگذاران ساخته شده با هوش مصنوعی در رسانههای اجتماعی نشاندهنده تغییر عمدهای در محیط دیجیتال است که منجر به بحثهای گستردهای درباره اصالت تعاملات آنلاین و مسائل اخلاقی مرتبط با این شخصیتهای مجازی شده است.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today