Í þessari greiningu fjalla ég um núverandi áhuga á texta-til-myndbands (T2V) tækni í sköpunarverkefnum gervigreindarforrita og stórum málalíkönum (LLM). Þótt T2V sé enn á byrjunarstigi er vænst að hún muni ná verulegum framförum og gjörbreyta hvernig við búum til myndbönd. Áberandi vara á þessu sviði er Sora Turbo frá OpenAI, texta-til-myndbands tól sem er í boði fyrir ChatGPT Plus og Pro notendur, með milljónir væntanlegra notenda og vekur talsverða athygli fjölmiðla. Sköpunarverkefni gervigreindar hófst með texta-til-texta (T2T) hæfni og þróaðist til að innihalda texta-til-mynd virkni. Nú er markmiðið að skapa myndbönd út frá texta ábendingum, með áherslu á sjónrænt efni og hugsanlega einnig hljóð. Endanlegt markmið er að taka við hvaða miðlum sem er og breyta þeim í hvaða æskilega form sem er, þekkt sem X-til-X líkanið. Mikilvæg áskorun í T2V er að tryggja að búið myndband endurspegli nákvæmlega ásetning notandans, hugtak sem kallast viðeigandi hæfni eða trúverðugleiki. Núverandi T2V tækni, þar á meðal Sora Turbo, á enn erfitt með að skapa alltaf myndbönd sem samsvara væntingum notenda og nær einungis í meðalskori hvað varðar viðeigandi hæfni, sjónræna gæði, samræmi og varanleika hluta. Vandamál eins og tímaröðarsamræmi, varanleiki hluta og fylgni við eðlisfræði sviðsins eru áskoranir fyrir þróunaraðila.
Þrátt fyrir framfarir hafa T2V úttak tilhneigingu til að vera stutt og geta skort samræmi í lengri röðum. Engu að síður býður Sora Turbo upp á háþróaða eiginleika eins og stílslegar valkosti og handritsgerðir, þó full-lengdar kvikmyndagæði séu enn áskorun. Uppgangur T2V tækni vekur áhyggjur af djúpum fölsunum og misnotkun. Þegar T2V verkfæri verða flóknari og aðgengilegri geta þau gert kleift að búa til raunsæ fölsuð myndbönd á lágmarks kostnaði, sem gæti haft samfélagsleg áhrif. Umræður um siðferði AI, lög og ábyrgð eru mikilvægar þar sem möguleikar AI stækka. OpenAI og aðrir hagsmunaaðilar leggja áherslu á nauðsyn þess að samfélagið vinni saman að því að þróa viðmið og varúðarráðstafanir til að tryggja ábyrga notkun T2V tækninnar. Það er nauðsynlegt fyrir einstaklinga að taka þátt í þessum umræðum til að stýra framþróun AI í jákvæða átt, með áherslu á mikilvægi viðeigandi hæfni—að tryggja að úttak sé viðeigandi og til hagsbóta.
Að kanna framtíðina: Texti-í-myndband tækni í sköpunargervigreind (sjálfvirkni í myndbandagerð með aðstoð gervigreindar).
Stórt söluvöll fallanda tæknifyrirtækja skelfir Wall Street þar sem gríðarlegt bilið milli mati á gervigreindarfyrirtækjum og lágmarks afkomu þeirra verður sífellt víðara.
Nýleg umfangsmikil rannsókn hefur sýnt fram á umbreytingarmátt Generative Artificial Intelligence (GenAI) á afkastagetu fyrirtækja, með sérstakri áherslu á netverslun.
Undanfarin ár hafa samfélagsmiðlar farið sífellt meira af spilum í hugrænni greiningu (AI) til að bæta miðlun efnis, sérstaklega í tengslum við myndbönd.
AI SEO & GEO Netverksráðstefnan, sem fer fram 9.
Snap Inc., móðurfélag Snapchat, hefur tilkynnt um stóra fjárfestingu upp á 400 milljónir dollara til að mynda stefnumótandi samstarf við Perplexity AI, leiðandi fyrirtæki í leitarvélartækni með gervigreind.
16.
Yann LeCun, varaafritstjóri Meta og aðalvísindamaður um gervigreind, leiðandi figúra í gervigreind og frumkvöðull hjá fyrirtækinu, er sagður ætla að hætta hjá Meta til að hefja eigin fyrirtæki sem einbeitir sér að gervigreind.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today