lang icon Ukrainian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 24, 2025, 6:48 a.m.
92

Гугл Вео 3 AI Відео Генератор: синхронізація аудіо та відео з вражаючою реалістичністю

Увівторок, Google презентував Veo 3 — нову модель штучного інтелекту для синтезу відео, здатну досягти того, що жоден великий генератор AI відео раніше не вміг зробити: створювати синхронізований аудіотрек разом із відео. У період з 2022 по 2024 рік ранні відео, створені за допомогою AI, були мовчазними і зазвичай дуже короткими. Тепер Veo 3 надає восьмисекундні високоякісні кліпи з голосами, діалогами і звуковими ефектами. Після запуску люди одразу поставили очевидне питання щодо критеріїв оцінки: наскільки добре Veo 3 може підробити Оскара для актора Вілу Сміта, який їсть спагеті? Короткий огляд: «спагетті-бенчмарк» у AI відео почався у березні 2023 року з раннього, досить тривожного відео, створеного за допомогою відкритої моделі синтезу під назвою ModelScope. Цей приклад з спагеті став настільки відомим, що Сміт з пародією повторив його майже через рік, у лютому 2024. Ось нагадування, як виглядав оригінальний вірусний ролик: Зазвичай забувають, що тоді пародія на Сміта не була створена найкращим доступним AI-генератором — модель під назвою Gen-2 від Runway вже давала більш високоякісні результати, хоча вона ще не була публічно доступною. Втім, версія від ModelScope була досить дивною та впізнаваною, щоб стати орієнтиром для перших обмежень AI відео у процесі розвитку технології. Раніше цього тижня розробник AI-додатків Хаві Лопес відповів фанатам, які прагнули повторити тест із спагетті за допомогою Veo 3, поділившись своїми висновками у X. Однак, дивлячись на результати, звуковий супровід видавався незвичним: фальшивий Сміт звучав так, ніби хрумав спагетті. Ця помилка виникла через експериментальні можливості Veo 3 додавати звукові ефекти, ймовірно, тому, що його навчальні дані містили багато прикладів жування з хрускотом. Генеративні моделі AI працюють як системи прогнозування, що шукають шаблони, опираючись на достатню кількість навчальних даних з різних медіа, щоб створювати переконливий контент.

Коли певні концепції пере— або недооцініюються в цих даних, це може спричинити дивні артефакти у згенерованому відео. Ми також самі протестували цей запит на Veo 3, але «Will Smith» був заблокований фільтрами Google. Проте запит «чорний чоловік, який їсть спагетті» дав подібний хрумкій звуковий ефект (можливо, Лопес мав ранній доступ без фільтрів або експериментував із варіаціями запитів, що пройшли через фільтри). Veo 3 вражає своєю здатністю створювати логічний діалог і музику, вже надихаючи багато вражаючих прикладів у X. Не зупиняючись лише на відео чоловіка, що їсть дуже аль денте спагетті, ми перевірили, чи може ця фігура співати і їсти одночасно, запропонувавши: «Чоловік співає англійською комедичну оперу про спагетті за кухонним столом під час їжі». З 2023 року ми зробили значний прогрес, і генератори відео AI продовжать удосконалюватися у реалістичності й функціональності. Якби не поточний фільтр знаменитостей Veo 3, ми могли б легко створювати відео із співом Сміта — або щось ще, що ще більше підкреслює потенційні занепокоєння щодо технологій AI відео. Культурна сингулярність швидко наближається. З цієї нагоди ми нещодавно провели власну масштабну серію тестів з генерації відео за допомогою Veo 3 і скоро поділимося результатами в спеціальній публікації. А поки що — коротке оновлення про «Свежого принца» у танці з локшиною. Смачного!



Brief news summary

Google представила Veo 3 — сучасну модель штучного інтелекту для синтезу відео, здатну створювати синхронізовані HD-відео довжиною восьть секунд із аудіо, діалогами та звуковими ефектами — перевищуючи попередні інструменти, обмежені беззвучними або дуже короткими кліпами. У тестах Veo 3 успішно відтворила еталонний сценарій, імітуючи їжу спагетті з низької якості відео 2023 року за участю нагородженого Оскар акторa Віла Сміта. Хоча модель ефективно синхронізувала відео та аудіо, вона створювала незвичний звук «хрускоту» під час сцени з спагетті, ймовірно, через упередження у тренувальних даних, що наголошували на голосах жування. Фільтри контенту блокують прямі запити «Вілл Сміт», але подібні введення все ж викликають збої у звуці. Попри ці труднощі, Veo 3 добре справляється з створенням зрозумілих діалогів і музики, надихаючи творчі проєкти, наприклад, комічну оперу з спагетті. Цей прорив є важливим кроком у розвитку реалістичного мультимедійного контенту, створеного штучним інтелектом, хоча й обмеження щодо зображень знаменитостей залишаються перешкодами. Випуск Veo 3 викликав культурні дискусії щодо реалістичності відео ШІ і додає новий сюжет у історію з «Фріш Прінц», пов'язану із спагетті, під час тривалих тестувань.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

June 14, 2025, 10:21 a.m.

Конгрес США схвалює законопроект про розвиток бло…

У середу Палата представників США зробила значущий крок уперед, проголосувавши 279-136 за схвалення Закону про фінансові інновації та технології для 21-го століття (FIT21).

June 14, 2025, 10:16 a.m.

Google має намір розірвати зв'язки з Scale AI на …

Google планує припинити співпрацю з Scale AI, провідним стартапом у сфері маркування даних, після недавнього придбання Meta 49% акцій компанії.

June 14, 2025, 6:37 a.m.

Роджений USDC від Circle запустився в мережі найв…

У середу, 11 червня, компанія оголосила про офіційний запуск USDC від Circle та оновленого протоколу міжланцюгових передач (CCTP V2) на World Chain.

June 14, 2025, 6:16 a.m.

Режим штучного інтелекту Google для пошуку: транс…

Google оголосив про запуск інноваційного режиму AI в своєму пошуковику, який має змінити спосіб взаємодії користувачів з інформацією в Інтернеті.

June 13, 2025, 2:25 p.m.

Il Foglio інтегрує штучний інтелект у журналістик…

Il Foglio, провідна італійська газета, розпочала новаторський експеримент із впровадження штучного інтелекту у журналістику під керівництвом редактора Клавдіо Чераса.

June 13, 2025, 2:08 p.m.

Криптовалютна компанія OneBalance залучила 20 міл…

© 2025 Fortune Media IP Limited.

June 13, 2025, 10:31 a.m.

Інвестиція Meta у розмірі 14,3 мільярди доларів у…

Meta оголосила про велике інвестування в сферу штучного інтелекту, викупивши 49% акцій у компанії Scale за 14,3 мільярда доларів.

All news