lang icon Swedish
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 24, 2025, 6:48 a.m.
3

Google Veo 3 AI-Videogenerator: Synkronisering av ljud och video med imponerande realism

På tisdag avslöjade Google Veo 3, en ny AI-bildgenereringsmodell som kan åstadkomma något som ingen större AI-video generator tidigare lyckats med: producera en synkroniserad ljudspår tillsammans med videon. Mellan 2022 och 2024 var tidiga AI-genererade videor tysta och oftast mycket korta. Nu levererar Veo 3 åttasekunders högupplösta klipp komplett med röster, dialoger och ljudeffekter. Efter lanseringen ställde folk genast den självklara benchmark-frågan: Hur bra kan Veo 3 lura att det är Oscar-vinnaren Will Smith som äter spaghetti? En snabb recap: "Spaghetti-benchmark" i AI-video började i mars 2023 med en tidig, ganska omskakande AI-genererad video som skapades med en öppen källkods-syntesmodell kallad ModelScope. Det där spaghetti-exemplet blev så välkänt att Smith skämtade om det nästan ett år senare, i februari 2024. Här är en påminnelse om hur den ursprungliga virala videon såg ut: Vad som ofta glöms bort är att Smith-parodin vid den tidpunkten inte producerades med den bästa AI-videogeneratorn som fanns tillgänglig — en modell kallad Gen-2 från Runway hade redan levererat högre kvalitet, även om den inte var tillgänglig för allmänheten än. Trots det var ModelScope-versionen märklig och minnesvärd nog att bli en referenspunkt för de tidiga AI-videons begränsningar när teknologin utvecklades. Tidigare i veckan svarade AI-applikationsutvecklaren Javi Lopez på fans som ivrigt ville återbesöka spaghetti-testet med Veo 3 och delade sina resultat på X. Men när man såg resultaten, kändes ljudspåret ovanligt: den falska Smith lät som om han gnisslade på spaghettin. Den här buggen beror på Veo 3:s experimentella förmåga att lägga till ljudeffekter, troligen eftersom träningen datamängd inkluderade många exempel på tuggande med knastrande ljud. Generativa AI-modeller fungerar som mönstergissnings- och prediktionssystem, som förlitar sig på tillräcklig träningsdata från olika medier för att producera övertygande resultat.

När vissa koncept är över- eller underrepresenterade i datan, kan det leda till konstiga genereringsartefakter som detta. Vi provade själva att använda samma prompt i Veo 3, men "Will Smith" var blockerad av Googles innehållsfilter. Däremot gav prompten “En svart man som äter spaghetti” ett liknande knastrande ljud (Lopez kan ha haft tidig tillgång till filterfri version eller testat variationer av prompten som gick igenom). Veo 3 imponerar med sin förmåga att generera sammanhängande dialog och musik och har redan inspirerat många slående exempel på X. Vill inte nöja oss med bara en video på en man som äter mycket al dente-nudlar, testade vi om figuren kunde sjunga och äta samtidigt genom att skriva: “En man som sjunger en engelskspråkig komediopera om spaghetti vid ett köksbord medan han äter den. ” Vi har gjort stora framsteg sedan 2023, och AI-videogeneratorer kommer fortsätta att förbättras i realism och funktionalitet. Om det inte vore för Veo 3:s nuvarande filter för kändisar, skulle vi lätt kunna skapa videor av Smith som sjunger—eller gör nästan vad som helst annat—which belyser potentiella oro kring AI-videotekniken. Den kulturella singulariteten närmar sig snabbt. På tal om det, genomförde vi nyligen en egen omfattande serie av videogenereringstester med Veo 3 och kommer snart att dela resultaten i en dedikerad artikel. För tillfället, se detta som en kort uppdatering om Nudel-Prinsen. Smaklig måltid!



Brief news summary

Google har introducerat Veo 3, en avancerad AI-video­syn­tese­modell som kan generera synkroniserade åttasekunders HD-videor med ljud, dialog och ljudeffekter – överträffar tidigare verktyg som varit begränsade till tysta eller mycket korta klipp. I tester lyckades Veo 3 återge ett referensscenario genom att replikera Oscar-vinnande skådespelaren Will Smith som äter spaghetti från en lågkvalitativ video från 2023. Även om modellen effektivt synkroniserade video och ljud, gav den ett ovanligt “krispigt” ljud under spaghetti-scenen, sannolikt på grund av bias i träningsdata som betonar tuggande ljud. Innehållsfiltren blockerar direkta “Will Smith”-anspråk, men liknande inmatningar orsakar fortfarande ljudstörningar. Trots dessa utmaningar är Veo 3 utmärkt på att producera sammanhängande dialog och musik, vilket har inspirerat kreativa projekt som en komisk spaghettiopera. Denna framsteg markerar ett betydande steg mot realistisk AI-genererad multimedia, även om begränsningar kring celebriteters likheter fortfarande utgör hinder. Släppet av Veo 3 har väckt kulturella diskussioner om AI:s videorealism och tillför en ny vinkling till “Fresh Prince”-spaghetti-berättelsen samtidigt som fortsatt testning pågår.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 24, 2025, 9:57 a.m.

AI-tävlingen accelererar med stora teknikannonser…

Artificiell intelligens-branschen upplevde en anmärkningsvärt stor tillväxt av viktiga utvecklingar förra veckan, vilket understryker snabb innovation och intensiv konkurrens bland ledande teknikföretag.

May 24, 2025, 8:23 a.m.

Kan Google fortfarande dominera sökningar i AI-ch…

På Googles utvecklarkonferens 2025 avslöjade företaget en stor översyn av sin grundläggande sökfunktion, med fokus på den viktiga roll som artificiell intelligens kommer att spela i framtiden.

May 24, 2025, 7:36 a.m.

Washington tar nästa steg med kryptovalutor: Lagf…

Denna veckas avsnitt av Byte-Sized Insight på Decentralize med Cointelegraph utforskar en avgörande utveckling i USA:s kryptolagstiftning.

May 24, 2025, 5:55 a.m.

Den digitala tillgångsintroduktionen: Varför akti…

Det har gått över 15 år sedan den första bitcoin skapades, och kryptovaluta uppfyller nu några av sina tidiga löften genom att förändra länge etablerade finansiella system.

May 24, 2025, 5:11 a.m.

Här är de 6 största insikterna från Google I/O, d…

På årets Google I/O-konferens presenterade teknikjätten ungefär 100 tillkännagivanden, vilket visar ambitionen att dominera AI över olika områden – från att revolutionera Sök till att uppdatera AI-modeller och bärbar teknik.

May 24, 2025, 4:18 a.m.

Bitcoin stiger över 111 000 dollar: Blockchain Cl…

Bitcoin får återigen global uppmärksamhet efter att ha passerat 111 000 dollar för första gången, drivet av institutionella investerare, förändrade geopolitiska penningpolitiska dynamiker och en ny crypto-boom.

May 24, 2025, 3:31 a.m.

Vad tror AI att kommer att hända i fallen om medb…

Trump mot CASA i ett AI-kris: Att simulera utslag i Högsta domstolen Förra veckan hörde Högsta domstolen Trump mot CASA, Inc

All news