Tiistaina Google esitteli Veo 3:n, uuden tekoälyvideon synteesimallin, joka pystyy saavuttamaan jotain, mihin mikään suurista tekoälyvideogeneraattoreista ei ole aiemmin kyennyt: synnyttämään synkronoitua ääniraitaa videon kanssa. Vuoden 2022 ja 2024 välillä varhaiset tekoälyn luomat videot olivat hiljaisia ja yleensä hyvin lyhyitä. Nyt Veo 3 tuottaa kahdeksan sekunnin kristallinkimpiarvioita, joissa on ääniä, vuoropuhelua ja ääniefektejä. Julkaisun jälkeen ihmiset esittivät heti ilmiselvän vertailupisteen kysymyksen: Kuinka hyvin Veo 3 pystyy väärennöksessä Oscar-voittajasta näyttelijä Will Smithistä, joka syö spagettia? Pikakatsaus: "Spagetti-vertailu" tekoälyvideoissa alkoi maaliskuussa 2023 varhaisesta, melko epämiellyttävästä tekoälyn luomasta videosta, jonka oli tehnyt avoimen lähdekoodin synteesimalli nimeltä ModelScope. Tämä spagettiesimerkki tuli niin tunnetuksi, että Smith teki siihen pilan lähes vuosi myöhemmin, helmikuussa 2024. Tässä muistutus siitä, miltä alkuperäinen viraalinen video näytti: Usein unohtuu, että tuolloin Smithin pilaa ei ollut tehty parhaalla saatavilla olevalla tekoälyvideogeneraattorilla—aikaisemmin korkealaatuisempia tuloksia oli jo tuottanut Runwayn Gen-2-malli, vaikka se ei ollut vielä julkisesti käytettävissä. Silti ModelScope-versio oli niin outo ja mieleenpainuva, että siitä tuli viitekohta tekoälyvideoiden alkuvaiheen rajoituksille teknologian kehittyessä. Tämän viikon alussa tekoälysovellusten kehittäjä Javi Lopez reagoi faneihin, jotka halusivat palata spagettitestiin Veo 3:n kanssa, ja jakoi löytönsä X-sivustolla. Katsoessaan tuloksia ääni oli kuitenkin epätavallinen: väärennetty Smith kuulosti kuin hän olisi pureskellut spagettia. Tämä häiriö johtuu Veo 3:n kokeellisesta kyvystä lisätä ääniefektejä, luultavasti koska sen koulutusdata sisälsi runsaasti esimerkkejä pureskelusta ja ruskutuksesta. Generatiiviset tekoälymallit toimivat mallintamassa toistuvia ennusteita, jotka perustuvat riittävään opiskelutietoon eri medioista saavuttaakseen uskottavia tuloksia.
Kun tietyt käsitteet ovat liioitellusti tai liian vähän edustettuina datassa, syntyy outoja artiikoita, kuten tämä. Testasimme myös itse kehotteen Veo 3:lla, mutta "Will Smith" oli estetty Googlen sisällönsuodatuksen kautta. Sen sijaan kehotteella "Musta mies syö spagettia" tuloksena saatiin samanlainen ruskutuksen kuuloinen efektin (Lopezilla saattoi olla aikainen, suodattamaton pääsy tai hän saattoi kokeilla kehotusvaihtoehtoja, jotka menivät läpi). Veo 3 yllättää kykynsä kanssa luoda johdonmukaista vuoropuhelua ja musiikkia, mikä on jo inspiroinut useita vaikuttavia esimerkkejä X-sivustolla. Etsimättä vain videota miehestä, joka syö erittäin al dente -pastaa, testasimme, voisiko hahmo myös laulamalla ja syöden samaan aikaan, kehotteella: "Mies laulaa englanninkielistä komediaoopperaa spagetista keittiöpöydän ääressä samalla syöden sitä. " Olemme edistyneet merkittävästi vuodesta 2023 lähtien, ja tekoälyvideogeneraattorit kehittyvät entistä realistisemmiksi ja toimivammiksi. Jollei Veo 3:n nykyinen julkkisrajoitinesto olisi, voisimme helposti luoda videoita Smithistä laulamassa—tai tekevänpä mitä tahansa muuta—mikä korostaa tekoälyvideoteknologian mahdollisia huolia. Kulttuurinen singulariteetti lähestyy vauhdilla. Sitä varten olemme äskettäin tehneet oman laajan sarjan videotuotestauksia Veo 3:lla, ja jaamme nämä tulokset pian omassa erillisessä artikkelissa. Toistaiseksi tämä oli pieni päivitys Nooding Prince -ajasta. Hyvää ruokahalua!
Google Veo 3 AI -videoiden luontityökalu: äänen ja videon synkronointi vaikuttavalla realismilla
Walt Disney Company on käynnistänyt merkittävän oikeustoimen Googlea vastaan lähettämällä varoituskirjeen, jossa syytetään teknologiajättiä Disneyn tekijänoikeudella suojatun materiaalin loukkauksesta generatiivisen tekoälyn (AI) mallien koulutuksessa ja kehittämisessä ilman korvausta.
Passaten tekoälyn (AI) kehittyessä ja yhä suuremmassa määrin integroitumassa digitaaliseen markkinointiin sen vaikutus hakukoneoptimointiin (SEO) kasvaa merkittävästi.
MiniMax ja Zhipu AI, kaksi johtavaa tekoälyyritystä, valmistautuvat järjestämään ensimmäisen julkisen listautumisensa Hong Kongin pörssiin mahdollisesti jo ensi tammikuussa.
Denise Dresser, Slackin toimitusjohtaja, aikoo luopua tehtävästään ja siirtyä OpenAI:iin, yritykseen joka vastaa ChatGPT:stä, toimimaan Chief Revenue Officerina.
Elokuvateollisuus kokee merkittävän muutosvaiheen, kun studiot yhä enemmän ottavat käyttöön tekoälypohjaisia videon synteesi-tekniikoita jälkituotantoprosessien tehostamiseksi.
AI mullistaa sosiaalisen median markkinoinnin tarjoamalla työkaluja, jotka yksinkertaistavat ja parantavat yleisön sitoutumista.
AI-generoitujen vaikuttajien nousu sosiaalisessa mediassa merkitsee merkittävää muutosta digitaalisessa ympäristössä, herättäen laajaa keskustelua verkkokauppojen aitoudesta ja näihin virtuaalisiin persoonaisiin liittyvistä eettisistä kysymyksistä.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today