Google Veo 3 AI -videoiden luontityökalu: äänen ja videon synkronointi vaikuttavalla realismilla

Tiistaina Google esitteli Veo 3:n, uuden tekoälyvideon synteesimallin, joka pystyy saavuttamaan jotain, mihin mikään suurista tekoälyvideogeneraattoreista ei ole aiemmin kyennyt: synnyttämään synkronoitua ääniraitaa videon kanssa. Vuoden 2022 ja 2024 välillä varhaiset tekoälyn luomat videot olivat hiljaisia ja yleensä hyvin lyhyitä. Nyt Veo 3 tuottaa kahdeksan sekunnin kristallinkimpiarvioita, joissa on ääniä, vuoropuhelua ja ääniefektejä. Julkaisun jälkeen ihmiset esittivät heti ilmiselvän vertailupisteen kysymyksen: Kuinka hyvin Veo 3 pystyy väärennöksessä Oscar-voittajasta näyttelijä Will Smithistä, joka syö spagettia? Pikakatsaus: "Spagetti-vertailu" tekoälyvideoissa alkoi maaliskuussa 2023 varhaisesta, melko epämiellyttävästä tekoälyn luomasta videosta, jonka oli tehnyt avoimen lähdekoodin synteesimalli nimeltä ModelScope. Tämä spagettiesimerkki tuli niin tunnetuksi, että Smith teki siihen pilan lähes vuosi myöhemmin, helmikuussa 2024. Tässä muistutus siitä, miltä alkuperäinen viraalinen video näytti: Usein unohtuu, että tuolloin Smithin pilaa ei ollut tehty parhaalla saatavilla olevalla tekoälyvideogeneraattorilla—aikaisemmin korkealaatuisempia tuloksia oli jo tuottanut Runwayn Gen-2-malli, vaikka se ei ollut vielä julkisesti käytettävissä. Silti ModelScope-versio oli niin outo ja mieleenpainuva, että siitä tuli viitekohta tekoälyvideoiden alkuvaiheen rajoituksille teknologian kehittyessä. Tämän viikon alussa tekoälysovellusten kehittäjä Javi Lopez reagoi faneihin, jotka halusivat palata spagettitestiin Veo 3:n kanssa, ja jakoi löytönsä X-sivustolla. Katsoessaan tuloksia ääni oli kuitenkin epätavallinen: väärennetty Smith kuulosti kuin hän olisi pureskellut spagettia. Tämä häiriö johtuu Veo 3:n kokeellisesta kyvystä lisätä ääniefektejä, luultavasti koska sen koulutusdata sisälsi runsaasti esimerkkejä pureskelusta ja ruskutuksesta. Generatiiviset tekoälymallit toimivat mallintamassa toistuvia ennusteita, jotka perustuvat riittävään opiskelutietoon eri medioista saavuttaakseen uskottavia tuloksia.
Kun tietyt käsitteet ovat liioitellusti tai liian vähän edustettuina datassa, syntyy outoja artiikoita, kuten tämä. Testasimme myös itse kehotteen Veo 3:lla, mutta "Will Smith" oli estetty Googlen sisällönsuodatuksen kautta. Sen sijaan kehotteella "Musta mies syö spagettia" tuloksena saatiin samanlainen ruskutuksen kuuloinen efektin (Lopezilla saattoi olla aikainen, suodattamaton pääsy tai hän saattoi kokeilla kehotusvaihtoehtoja, jotka menivät läpi). Veo 3 yllättää kykynsä kanssa luoda johdonmukaista vuoropuhelua ja musiikkia, mikä on jo inspiroinut useita vaikuttavia esimerkkejä X-sivustolla. Etsimättä vain videota miehestä, joka syö erittäin al dente -pastaa, testasimme, voisiko hahmo myös laulamalla ja syöden samaan aikaan, kehotteella: "Mies laulaa englanninkielistä komediaoopperaa spagetista keittiöpöydän ääressä samalla syöden sitä. " Olemme edistyneet merkittävästi vuodesta 2023 lähtien, ja tekoälyvideogeneraattorit kehittyvät entistä realistisemmiksi ja toimivammiksi. Jollei Veo 3:n nykyinen julkkisrajoitinesto olisi, voisimme helposti luoda videoita Smithistä laulamassa—tai tekevänpä mitä tahansa muuta—mikä korostaa tekoälyvideoteknologian mahdollisia huolia. Kulttuurinen singulariteetti lähestyy vauhdilla. Sitä varten olemme äskettäin tehneet oman laajan sarjan videotuotestauksia Veo 3:lla, ja jaamme nämä tulokset pian omassa erillisessä artikkelissa. Toistaiseksi tämä oli pieni päivitys Nooding Prince -ajasta. Hyvää ruokahalua!
Brief news summary
Google on ottanut käyttöön Veo 3:n, edistyneen tekoälyvideogenisaatiomallin, joka kykenee tuottamaan synkronoituja kahdeksan sekunnin HD-videoita audioiden, dialogien ja ääniefekteiden kanssa—ylittäen aiemmat työkalut, jotka rajoittuivat hiljaiseen tai erittäin lyhyeen clipin sisältöön. Testeissä Veo 3 onnistui luomaan vertailukohdan ottamalla kopion Oscar-palkitusta näyttelijä Will Smithistä syömässä spagettia alhaalta laadultaan heikosta vuodelta 2023 peräisin olevasta videosta. Vaikka malli synkronoi videon ja äänen tehokkaasti, se tuotti kummallisen "pureskelun" äänen spagettikohtauksessa, mikä todennäköisesti johtui koulutusdatan vinoumasta, joka korosti pureskelun ääniä. Sisältörajoitukset estävät suorat "Will Smith" -pyynnöt, mutta vastaavat syötteet voivat silti aiheuttaa äänihaavoja. Näistä haasteista huolimatta Veo 3 menestyy yhtenäisen dialogin ja musiikin tuottamisessa, ja se inspiroi luovia projekteja, kuten komediapohjainen spagetti-opaera. Tämä edistysaskel merkitsee merkittävää askelta kohti realistisempaa tekoälyn tuottamaa multimediaa, vaikka julkkisten kasvonpiirteiden rajoitukset muodostavat edelleen haasteita. Veo 3:n julkaisun ansiosta on käyty kulttuurikeskusteluja tekoälyn videorealistisuudesta, ja se lisää uusia käänteitä "Fresh Prince" -spagettitarinaan edelleen testien jatkuessa.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Tekoälykilpailu kiihtyy suurten teknologiayrityst…
Tekoälyteollisuus koki viime viikolla merkittävän kehityksenpuuskia, mikä korostaa nopeaa innovaatiota ja kovaa kilpailua johtavien teknologiayritysten välillä.

Voiko Google edelleen hallita hakualaa tekoälykes…
Google:n vuoden 2025 kehittäjäkonferenssissa yritys esitteli suuren uudistuksen peruskohdansa hakutoimintoon, korostaen tekoälyn keskeistä roolia tulevaisuudessa.

Washington etenee kryptojen saralla: Stablecoin- …
Tämän viikon Byte-Sized Insight -osiossa Decentralize-sarjassa Cointelegraphin kanssa tutkimme merkittävää kehitystä Yhdysvaltain kryptolainsäädännössä.

Digitaalisten omaisuuksien perusteet: Miksi osake…
On kulunut yli 15 vuotta siitä, kun ensimmäinen bitcoin luotiin, ja kryptovaluutta täyttää nyt osan varhaisista lupauksistaan muuttaen perinteisiä rahoitusjärjestelmiä.

Tässä kuusi suurinta oivallusta Google I/O -tapah…
Tämän viikon Google I/O -konferenssissa teknologian jättiläinen teki noin 100 ilmoitusta, mikä viestii sen tavoitteesta hallita tekoälyä eri osa-alueilla – palaten hakukoneiden uudistamiseen, päivittäen tekoälymalleja ja wearables-teknologiaa.

Bitcoin nousee yli 111 000 dollarin: Blockchain C…
Bitcoin herättää jälleen maailmanlaajuista huomiota ylittäessään ensimmäisen kerran 111 000 dollaria, kiitos institutionaalisten sijoittajien, muuttuvien geopoliittisten rahatalouden dynamiikkojen ja uudelleen syttyneen kryptojen nousun.

Mitä tekoäly uskoo tapahtuvan syntyperäoikeusstat…
Trump vs.