lang icon Lithuanian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 24, 2025, 6:48 a.m.
3

Google Veo 3 AI Vaizdo Generatorius: Sinchronizuojant Garso ir Vaizdo Kūrybiškai ir Įtikinamai

Antradienį „Google“ pristatė Veo 3 – naują dirbtinio intelekto vaizdo sintezės modelį, galintį pasiekti kažką, ką iki šiol sukurti didieji AI vaizdo generatoriai nebuvo sugebėję: sukurti sinchronizuotą garso takelį kartu su vaizdu. Nuo 2022 iki 2024 metų ankstyvieji AI generuoti vaizdo įrašai būdavo tylūs ir dažniausiai labai trumpi. Dabar Veo 3 pateikia aštuonių sekundžių aukštos raiškos klipus su balsais, dialogais ir garso efektais. Po pristatymo žmonės nedelsdami iškėlė akivaizdų klausimą: kaip gerai Veo 3 gali sukurti suklastotą Oscarą laimėjusio aktoriaus Willo Smitho vaizdą, valgantį spagečius? Greita apžvalga: „spagečių benchmark’as“ AI vaizdo srityje prasidėjo 2023 metų kovą su ankstyvu, gana nerimą keliančiu AI sugeneruotu vaizdo įrašu, sukurtu naudojant atvirojo kodo sintezės modelį, pavadintą ModelScope. Tas spagečių pavyzdys tapo toks gerai žinomas, kad Smithas jį perdarė beveik po metų, 2024 metų vasarį. Štai priminimas, kaip atrodė tas virusinis vaizdo įrašas: Dažnai pamirštama, kad tuo metu Smitho parodija nebuvo sukurta naudojant geriausią turimą AI vaizdo generatorių – modelis „Gen-2“ iš „Runway“ jau teikė aukštesnės kokybės rezultatus, nors jis dar nebuvo plačiai prieinamas. Visgi ModelScope versija buvo pakankamai keista ir įsimintina, kad tapo pirmųjų AI vaizdo technologijų ribotumų atspindžiu, kai technologija toliau tobulėjo. Šį savaitgalį dirbtinio inteleko programėlių kūrėjas Javi Lopez atsakė į gerbėjų norą vėl išbandyti spagečių testą su Veo 3 ir pasidalijo savo pastebėjimais X platformoje. Tačiau žiūrint į rezultatus, garso takelis pasirodė keistas – netikras Smithas skambėjo lyg įkandantis spagečius. Ši klaida kyla dėl Veo 3 eksperimentinio gebėjimo pridėti garso efektų, tikriausiai todėl, kad jo mokymo duomenyse buvo daugybė pavyzdžių, kaip kramtyti ir traškėti. Generatyvūs AI modeliai veikia kaip modelių atitikimo prognozės sistemos, priklausomai nuo pakankamų mokymo duomenų įvairioms medijų rūšims, kad galėtų kurti įtikinamus rezultatus.

Kai tam tikri konceptai yra per dažnai arba per retai reprezentuoti duomenyse, susidaro keisti generacijos pėdsakai, kaip šis. Patys pabandėme įvesti tą patį užklausą į Veo 3, tačiau Google filtrai „Will Smith“ vardą blokuoja. Naudojant užklausą „Juodaodis vyras valgo spagečius“, rezultatas buvo panašus ir į traškantį garsą (tikriausiai Lopez’as turėjo ankstyvą prieigą be filtrų arba bandė variacijas užklausose, kurios praslydo). Veo 3 stebina savo gebėjimu generuoti nuoseklų dialogą ir muziką, jau įkvėpęs daugybę įspūdingų pavyzdžių „X“ platformoje. Nenorėdami apsiriboti tik vaizdu, kaip vyras valgo labai al dente makaronus, patikrino, ar galima juos dainuoti ir valgyti vienu metu, užklausa: „Vyras dainuoja anglų kalba komedijos operą apie spagečius ant virtuvės stalo, tuo pačiu juos valgydamas. “ Nuo 2023 metų padarėme reikšmingą pažangą, ir AI vaizdo generatoriai toliau tobulės, gerindami realizmą ir funkcionalumą. Jei ne Veo 3 dabartinis žvaigždžių filtras, galbūt lengvai galėtume sukurti vaizdų, kaip Smithas dainuoja – ar dar ko nors kita, – kas atskleidžia galimus rūpesčius dėl AI vaizdo technologijos. Kultūrinė singularumas artėja greitai. Su šia mintimi neseniai atlikome pačius išsamiausius savo vaizdo generavimo testus su Veo 3 ir netrukus pasidalinsime jų rezultatais specialiame leidinyje. O šiuo metu tegul tai būna trumpas atnaujinimas apie „Noodles’ų jauniklį“. Skanaus!



Brief news summary

Google pristatė Veo 3 – pažangų dirbtinio intelekto vaizdo sintezės modelį, galintį generuoti suderintus aštuonių sekundžių HD vaizdo įrašus su garsais, dialogais ir garso efektais – viršijantį ankstesnius įrankius, kurie buvo riboti iki tyliai arba labai trumpų klipų. Testuose Veo 3 sėkmingai atkūrė standartinį scenarijų, kopijuodamas Oskarais apdovanoto aktoriaus Willo Smitho sceną valgant spagečius iš žemos kokybės 2023 metų vaizdo įrašo. Nors modelis efektyviai suderino vaizdą ir garsą, metuose spagečių scena skambėjo neįprastai – traškėjimo garsas, greičiausiai, atsirado dėl treniruočių duomenų šališkumo, pabrėžiančio kramtymo garsus. Turinys filtrai blokuoja tiesioginius „Will Smith“ užklausų įvedimus, tačiau panašios įvestys vis tiek sukelia garso sutrikimus. Nepaisant šių iššūkių, Veo 3 puikiai generuoja darnų dialogą ir muziką, įkvėpdama kūrybinius projektus, pavyzdžiui, komišką spagečių operą. Šis pasiekimas žymi reikšmingą žingsnį link realistiško dirbtinio intelekto sukurtos medijos, nors ir kyla iššūkių dėl žvaigždžių atvaizdo ribojimų. Veo 3 leidimo sukėlė kultūrines diskusijas apie dirbtinio intelekto vaizdo tikroviškumą ir įneša naują posūkį į „Fresh Prince“ spagečių istoriją, toliau testuojant šį technologijos etapą.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 24, 2025, 9:57 a.m.

Dirbtinio intelekto lenktynės spartėja su pagrind…

Praeities AI industrijoje praėjusią savaitę buvo matomas ryškus didžiųjų pasiekimų proveržis, pabrėžiantis sparčias inovacijas ir intensyvią konkurenciją tarp pirmaujančių technikos įmonių.

May 24, 2025, 8:23 a.m.

Ar Google vis dar gali dominuoti paieškoje AI pok…

„Google“ 2025 m.

May 24, 2025, 7:36 a.m.

Vašingtonas juda į priekį su kriptovaliutomis: St…

Šios savaitės „Byte-Sized Insight on Decentralize with Cointelegraph“ epizode nagrinėjame svarbų pokytį JAV kriptovaliutų įstatymų srityje.

May 24, 2025, 5:55 a.m.

Skaitmeninių turto vadovas: kodėl akcijų rinkos y…

Prieš daugiau nei 15 metų buvo sukurta pirmoji bitkoino, o kriptovaliuta dabar iš dalies įgyvendina ankstyvuosius pažadus – transformuoti ilgus metus egzistavusias finansines sistemas.

May 24, 2025, 5:11 a.m.

Štai šeši didžiausi išmokimai iš Google I/O, kuri…

Šių metų Google I/O konferencijoje technologijų gigantė padarė apie 100 skelbimų, parodydama savo ambicijas dominuoti dirbtinio intelekto srityje įvairiose srityse – nuo paieškos atnaujinimo iki dirbtinio intelekto modelių ir išmaniosios technologijos su nešiojamais įrenginiais.

May 24, 2025, 4:18 a.m.

Bitcoin kylama virš 111 000 USD: Blockchain debes…

Bitcoin vėl pritraukia pasaulinį dėmesį po to, kai pirmą kartą šoktelėjo virš 111 000 USD, tai paskatino institutų investuotojai, besikeičiantys geopolitiniai pinigų srautai ir atgaivintas kriptovaliutų bumas.

May 24, 2025, 3:31 a.m.

Ką dirbtinis intelektas mano, kad įvyks balsų tei…

Trump versus CASA AI kūgnyje: Aukščiausiojo Teismo nuomonių simuliacija Praėjusią savaitę Aukščiausiasis Teismas nagrinėjo bylą Trump v

All news