Google Veo 3 AI myndbandsgjafi: Samstilling hljóðs og myndbands með slagverki og athyglisverðri raunsæi

Á þriðjudaginn kynnti Google Veo 3, nýtt gervigreintíð myndbandsgerðarmódel sem getur náð eitthvað sem ekkert stórt gervigreintíð myndbandagerðarvél hefur náð áður: framleiða samstæðu hljóðrás með myndbandi. Milli 2022 og 2024 voru fyrstu gervigreindar myndbönd hljóðlaus og almennt mjög stutt. Nú skilar Veo 3 átta sekúndna háþróuðum myndbrotum með röddum, samtali og hljóðáhrifum. Í kjölfar kynningarinnar settust fólk strax að spyrja: Hversu vel getur Veo 3 framleitt forfalsaða Oscar-verðlaunaleikara Will Smith að borða spagettí? Stutt samantekt: „Spagettíhrifunin“ í gervigreindarmyndbandsgerð var rösklega byrjað í mars 2023 með fyrstu, nokkuð ógnvekjandi gervigreindarmyndbandi sem var búið til með opnu upprunalegu sniðið líkönum ModelScope. Þessi spagettí dæmi varð svo þekkt að Smith líkti því við ádeilu fyrir tæpum ári síðar, í febrúar 2024. Hér er minning um hvernig upprunalega gervisýningin leit út: Það sem oft er gleymt er að á þessum tíma var paródían af Smith ekki framleidd með bestu gervigreindarvélunum sem til voru—líkön eins og Gen-2 frá Runway höfðu þegar gefið frá sér betri árangur, þó það væri ekki opinberlega aðgengilegt enn. Þó var ModelScope útgáfan skrítin og minnisstæð nokkuð til að verða viðmið um takmarkanir fyrstu kynslóðar gervigreinds myndbands, þegar tæknin þróaðist áfram. Þá í þessari viku svaraði þróunaraðili AI-forritsins Javi Lopez aðdáendum sem vildu endurupplifa spagettíprófið með Veo 3 og deildi niðurstöðum sínum á X. En þegar hann horfði á myndbandið þótti hljóðið sérstakt: falska Smith hljómaði eins og hann væri að tyggja spagettíð. Þessi villa stafar af tilraunatekni Veo 3 við að bæta við hljóðáhrifum, líklega vegna þess að þjálfunargögnin innihéldu mörg dæmi um tygg, ásamt rándrum tónum. Framleiðslugervigreindarmódel virka eins og mynstragreiningar- og spádómakerfi, sem treysta á nægjanlega þjálfunargögn úr ýmsum miðlum til að framleiða sannfærandi útkomu.
Þegar ákveðnir hugtakar eru of mikið eða lítið framsettir í gögnunum koma fram undarlegar framleiðslur og truflanir eins og þessar. Við prófuðum einnig sjálfir að nota Laun: „Will Smith“ var lokað af efnisflokkunarkerfi Google. En með ánægju tókst okkur að nota beiðnina „Svartur maður að borða spagettí“ og fengum til þess svipaða rándurhljóðáhrif (López gæti hafa haft snemma aðgang að prófunarlítið kerfi, eða prófað mismunandi orðalög sem sluppu í gegn). Veo 3 gerir annað en bara framleiða samtal og tónlist; það hefur þegar vakið mikla athygli með mörgum skörpum dæmum á X. Til að prófa hvort figúrinn væri að syngja og borða samtímis, spurðum: „Manneskja syngjandi enskuna gamanóperu um spagettí við eldhúsborð á meðan hann étur það. “ Við höfum gert verulegar framfarir síðan 2023, og gervigreindarmyndbandsgerðartól munu halda áfram að bæta sig í raunveruleika og virkni. Ef það væri ekki fyrir núverandi frægðargluggann hjá Veo 3 hefði við getað búið til myndbönd af Smith syngjandi—eða næstum hvað sem er annað—sem vekur möguleg áhyggjur um tækni gervigreindarmyndbanda. Menningarlegt sérmula er að nálgast hratt. Á þeim nótum, höfum við nýlega framkvæmt okkar eigin umfangsmiklu prófanir á myndbandsgerð með Veo 3 og munum deila þeim niðurstöðum fljótlega í sérútgáfu. Fyrir nú er þetta stutt yfirferð af nýjustu fréttum úr Noðlaleiknum frá Fresh Prince. Bon appétit!
Brief news summary
Google hefur kynnt Veo 3, þróaða gervigreindarmódel fyrir myndbandsgerð sem getur framleitt samstæðu átta sekúnda langt Hágæða myndbönd með hljóði, samtali og hljóðáhrifum—yfirgnæfir fyrri tól sem voru takmörkuð við stæðisskámynd eða mjög stutt klipp. Í prófum tókst Veo 3 að endurmynda viðmiðunarstaðla með því að afrita Oscar-verðlaunaða leikkonuna Will Smith að borða spagettí úr lággæða myndbandi frá 2023. Þó að módelið samstillti myndband og hljóð á árangursríkan hátt, framleiddi það óvenjulegt "kram" hljóð meðan á spagettí-sýningunni stóð, líklega vegna þjálfunargagnasafna sem leyfa hátt um að tyggja hljóð. Efnisathuganir bönnuðu bein einföld "Will Smith" beiðni, en svipaðar inntakstillögur virka enn sem komið er eða valda hljóðvillum. Þrátt fyrir þessi vandamál er Veo 3 frábært við að framleiða samræmt samtal og tónlist, sem hvatar skapandi verkefni eins og leikahúmoríska spagettí-óperu. Þessi þróun táknar mikilvægt skref í átt að raunsærri gervigreindarbúnaði fyrir fjölmiðla, þó takmarkanir á líkneski þjóðhetja séu áfram óumflýjanlegar. Útgáfa Veo 3 hefur valdið menningarlegum umræðum um raunsæi gervigreindarmyndbanda og bætir nýrri áherslu í "Fresh Prince" spagettí-sögu í miðju áframhaldandi prófunum.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

AI keppninn hraðar á sig með stórum tækniuppsumum
Gervigreindalífið varð vitni að umrótinu mikla í þróun síðasta viku, sem sýndi fram á hraða nýsköpun og hörð keppni meðal leiðandi tækniþróunarfyrirtækja.

Getur Google ennþá ráðið för í leitarvélum á tímu…
Á þróunarmannamóti Google árið 2025 gerðu fyrirtæki grein fyrir miklum breytingum á kjarnaleitaraðgerð sinni, lögðu mikilvægi á hlutverk gervigreindar í framtíðinni.

Washington heldur áfram á kriptoplani: Lagafrumvö…
Á þessari viku þáttaröð Byte-Sized Insight um Decentralize hjá Cointelegraph könnum við mikilvæga þróun í bandarískum lögum um dulmálin.

Inngangur að stafrænum eignum: Af hverju eru hlut…
Það liðu yfir 15 ár frá því fyrsta bitcoin var skapað, og rafmynt uppfyllir nú sum af þeim fyrstu loforðum sínum með því að breyta langvarandi fjármálakerfum.

Hér eru sex stærstu lærdómar frá Google I/O, þar …
Á Google I/O ráðstefnunni í vikunni gerði risinn tæknihelmingurinn um 100 tilkynningar sem lýsa yfir mikla ætlun til að ráða yfir gervigreind á ýmsum sviðum—frá endurbætum á leit að uppfærslum á AI módeli og klukku- og klæðabúnaðar tækni.

Bitcoin hækkar yfir 111.000 dollara: Blockchain C…
Bitcoin er aftur að ná alþjóðlegri athygli eftir að hafa farið yfir 111.000 dollar í fyrsta sinn, að stórum hluta vegna innlendra fjárfestanna, breytinga á alþjóðlegri gjaldmiðlastefnu og endurvakinnar krypto bylgju.

Hvað reiknar greindarvélalausnin með að gerast í …
Trump gegn CASA í leiksviði gervigreindar: Að líkja eftir dómsáliti Hæstaréttar Í síðustu viku fór Hæstiréttur yfir Trump gegn CASA, Inc