lang icon Bulgarian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 24, 2025, 6:48 a.m.
1

Google Veo 3 AI генератор за видео: синхронизиране на аудио и видео с впечатляващ реализъм

Във вторник Google представи Veo 3 — нов модел за изкуствен интелект за видеосинтезиране, способен да постигне нещо, което досега нито един голям генератор за AI видеа не е успявал: създаване на синхронизиран аудио път със самото видео. Между 2022 и 2024 година първоначалните AI-генерирани видеа бяха без звук и обикновено много кратки. Сега Veo 3 предлага осемсекундни висококачествени клипове, пълни с гласове, диалози и звукови ефекти. След старта хората веднага зададоха очевидния въпрос: До каква степен Veo 3 може да фалшифицира носителя на Оскар, Уил Смит, който яде спагети? Кратко напомняне: „стандартът за спагети“ в AI видеата започна през март 2023 г. с ранно, донякъде тревожно AI-генерирано видео, създадено с отворен модел за синтез, наречен ModelScope. Този пример с спагетите стана толкова известен, че Смит го spoof-ва почти година по-късно, през февруари 2024 г. Ето как изглеждаше оригиналната вирусна видео: Често забравяме, че по онова време пародиата с Смит не беше създадена с най-добрия AI видеогенератор. Моделът Gen-2 от Runway вече беше постигнал по-високо качество, макар и да не беше още достъпен за широка публика. Въпреки това, версията от ModelScope беше достатъчно странна и запомняща се, за да стане ориентир за ранните ограничения на AI видеата с напредването на технологиите. Ран тази седмица разработчикът на AI приложения Хави Лопес отговори на фенове, които искат да повторят теста с спагети, използвайки Veo 3, споделяйки откритията си в X. Обаче при прегледа на резултатите, звуковата част изглеждаше необичайна: фалшивият Смит звучеше сякаш хруска спагетите. Този бъг произлиза от експерименталната способност на Veo 3 да добавя звукови ефекти, вероятно защото обучаващите данни включваха многобройни примери за дъвчене с хрускащи звуци. Генеративните AI модели функционират като системи за предсказване чрез разпознаване на шаблони, като разчитат на достатъчно обучителни данни от различни видове медии, за да произвеждат убедителни резултати.

Когато определени концепции са прекалено много или твърде малко представени в тези данни, това води до странни генеративни артефакти като този. Също така ние ourselves проведохме опит с промпт към Veo 3, но „Уил Смит“ беше блокиран от филтрите на Google. Използването на промпта „Чернокож мъж яде спагети“ обаче доведе до подобен ефект на хрускащи звуци (вероятно Лопес е имал ранен достъп без филтри или е експериментирал с вариации на промпта, които са преминали филтрите). Veo 3 впечатлява с умението си да създава смислени диалози и музика, вече вдъхновявайки множество впечатляващи примери в X. Не искайки да спираме само на видеа с мъж, който яде много твърда паста, направихме тест дали моделът може да пее и да яде едновременно, като зададохме: „Мъж, който пее английска комедийна опера за спагети на кухненската маса, докато ги яде. “ От 2023 г. сме постигнали значителен напредък, а генераторите за AI видеа ще продължат да се подобряват по реализм и функционалност. Ако не беше текущата филтърна система за известни личности във Veo 3, лесно можехме да създадем видеа с пеенето на Смит или почти всичко друго, което подчертава потенциалните притеснения около технологията за AI видеа. Културната сингулярност се приближава бързо. По тази причина наскоро направихме собствена обстойна серия от тестове за генериране на видеа с Veo 3 и скоро ще споделим резултатите в отделна публикация. Засега това е кратка новина за „Fresh Prince of Noodletime“. Добър апетит!



Brief news summary

Google представи Veo 3 – усъвършенстван модел за създаване на видеа с изкуствен интелект, който може да генерира синхронизирани осемсекундни HD видеа с аудио, диалог и звукови ефекти – надхвърляйки предишните инструменти, ограничени до беззвучни или много кратки клипове. В тестове Veo 3 успешно пресъздаде стандартен сценарий, като възпроизведе актьора носител на Оскар Уил Смит, ядещ спагети, от нискокачествено видео от 2023 г. Въпреки че моделът ефективно синхронизираше видеото и аудиото, той произведе необичаен звук на хрускане по време на сцената с спагетите, вероятно поради пристрастия в обучаващите данни към шумове от дъвчене. Контент филтрите блокират директни заявки с „Уил Смит“, но подобни въведения все пак причиняват аудио гличове. Въпреки тези предизвикателства, Veo 3 се отличава с умението си да генерира последователен диалог и музика, вдъхновявайки творчески проекти като комична опера за спагети. Този напредък представлява важна стъпка към реализъм в мултимедията, създадена от изкуствен интелект, макар че ограниченията върху подобията на знаменитости остават постоянен проблем. Пускането на Veo 3 доведе до културни дискусии за реализъм в AI видеата и добави нов обрат към историята за спагетите на „Енергичния принц“, докато продължават тестовете.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 24, 2025, 9:57 a.m.

Гонката за изкуствен интелект се ускорява с голем…

Индустрията на изкуствения интелект преживя забележителен подем през миналата седмица, подчертавайки бързата иновация и ожесточената конкуренция сред водещите технологични компании.

May 24, 2025, 8:23 a.m.

Може ли Google все още да доминира в търсенето пр…

На конференцията за разработчици на Google през 2025 г.

May 24, 2025, 7:36 a.m.

Вашингтон напредва по въпроса за криптовалутите: …

В епизода на Byte-Sized Insight на Decentralize с Cointelegraph тази седмица разглеждаме важна новина в американското крипто законодателство.

May 24, 2025, 5:55 a.m.

Първоначално въведение в цифровите активи: защо п…

От над 15 години от създаването на първия биткойн насам, криптовалутите вече изпълняват някои от своите първоначални обещания, като трансформират дългогодишните финансови системи.

May 24, 2025, 5:11 a.m.

Ето 6-те най-големи изводи от Google I/O, където …

На тазгодишната конференция Google I/O технологичният гигант направи около 100 обявления, което показва амбициите му за доминация в областта на изкуствения интелект в различни сфери – от обновяване на търсенето до актуализиране на AI модели и технологията за носими устройства.

May 24, 2025, 4:18 a.m.

Биткойн надмина $111 000: Блокчейн облачно майнин…

Биткойн отново привлича глобално внимание след като надхвърли 111 000 долара за първи път, стимулиран от институционални инвеститори, променящата се геополитическа парична динамика и възраждането на крипто бурята.

May 24, 2025, 3:31 a.m.

Какво според ИИ се очаква да се случи в делата за…

Тръмп срещу CASA в AI тест при гореща точка: симулация на становища на Върховния съд Миналата седмица Върховният съд разгледа делото Trump срещу CASA, Inc

All news