lang icon En
Nov. 21, 2025, 1:20 p.m.
1601

Decart AIjev LSD v2 Preboj omogoča ustvarjanje videa z umetno inteligenco v realnem času z nizko zakasnitvijo

Brief news summary

V zadnjem letu so modeli za razširjanje videa z umetno inteligenco, kot sta OpenAI-jev Sora 2 in Google's Veo 3, napredovali na področju vizualne resničnosti, vendar se soočajo z izzivi glede zakasnitve in omejene dolžine videa zaradi zaporednega generiranja okvirjev. Decart AI-jev LSD v2 premaguje te težave z uporabo kauzalne, avto-regresivne arhitekture, ki omogoča takojšnjo, neprekinjeno ustvarjanje videa brez omejitev glede trajanja. Ključne inovacije, kot so izboljšano prisiljevanje difuzije in nadgradnja zgodovine, preprečujejo kopičenje napak ter omogočajo neskončne, visokokakovostne videe, ki se brezhibno prilagajajo uporabniškemu vnosu. Da bi dosegli podsekundno zakasnitev, potrebno za živo interakcijo, je Decart izpopolnil Nvidia Hopper GPU-je s tehnikami, vključno z “mega jedrom,” arhitekturo-osredotočenim drobljenjem in skrajno destilacijo, kar omogoča hitro odvajanje šuma v kompaktnih modelih. Ta prebojne zmogljivosti podpirajo dinamične uporabnosti, kot so spletno pretakanje v živo, igre, izobraževanje in oblikovanje, ter omogočajo prilagajanje vsebine v realnem času z minimalno zakasnitvijo. LSD v2 predstavlja pomemben napredek pri ustvarjanju AI videov v realnem času brez omejitev, ter premika meje interaktivnega pripovedovanja zgodb in ustvarjalnega izražanja.

V preteklem letu so modeli za razširjanje videa, ki jih poganja umetna inteligenca, naredili izjemen napredek v vizualni realističnosti, kar so dokazali modeli kot so OpenAI-jev Sora 2, Google's Veo 3 in Runway Gen-4. Generiranje videa z umetno inteligenco dosega prelomno fazo, saj najnovejši modeli lahko ustvarjajo osupljive, živopisne posnetke. Vendar arhitektura teh modelov omejuje njihovo uporabo za interaktivne aplikacije v realnem času, saj generatejo video okvir po okvirju prek zapletenih in računalniško zahtevnih korakov. Obdelava vsakega dela pred prehodom na naslednjega povzroča zamudo, kar preprečuje pretočno predvajanje AI videa v živo. Večina strokovnjakov za umetno inteligenco se osredotoča na ustvarjanje posnetkov za kasnejši ogled, medtem ko je živo, takojšnje pretvarjanje videa z AI še vedno oddaljeno za vsaj nekaj let. Ekipa Decart je ta arhitekturna ovira izzvala in razvila LSD v2, model, ki kaže, da je minimalna zakasnitev dosegljiva z novimi pristopi, uporabnimi pri različnih modelih AI. Optimizirali so infrastrukturo za maksimalno izrabo GPU-jev in pospešili postopek odstranjevanja šuma, ki je ključen za preprečevanje kopičenja napak. LSD v2 uporablja kauzalno, avto-regresivno arhitekturo za takojšnje in kontinuirano generiranje videa, brez omejitev trajanja izhoda. Ključne inovacije vključujejo: 1. **Neskončno generiranje z kauzalnimi, avto-regresivnimi modeli** Za omogočanje pretoka videa morajo modeli delovati “kauzalno, ” to pomeni, da ustvarjajo vsak okvir le na podlagi prejšnjih, s čimer zmanjšajo računalniško obremenitev. Ta pristop zagotavlja kontinuiteto, a skozi čas se pojavi kopičenje napak – majhne nepravilnosti, kot so napačno postavljeni senco, postanejo vse bolj popačene, kar omejuje dolžino posnetkov. Da bi to premagali, je Decart izboljšal “diffuzijsko prisilo” za odstranitev šuma pri ustvarjanju posameznih okvirov in uvedel “zgodovinsko razširitev, ” ki trenira modele, da prepoznavajo in popravijo poškodovane izhode. Kauzalni povratni zanko sestavljajo prejšnje generirani okvirji, trenutno vhodni podatki in uporabniški pozivi, kar omogoča modelu, da samodejno prepozna in odpravi napake ter tako brezčasno proizvaja visokokakovostne vsebine. To omogoča stalno razpoložljivo in v živo prilagodljivo urejanje ter transformacijo na podlagi uporabniškega vnosa. 2. **Doseganje podsekundne zakasnitev z optimizacijo GPU-jev** Za interaktivni video v realnem času je potrebno, da vsak okvir nastane v 40 milisekundah ali manj, sicer je prisotna vidna zamuda.

Vendar pa so kauzalni modeli zahtevni za računalniško obdelavo v skladu z načrtom modernih GPU-jev, ki so zasnovani za obdelavo velikih serij, ne pa za nizko zakasnitev. Decart je to rešil z globoko optimizacijo Nvidia-hovih jedr RTX Hopper. Namesto več malih jedr, ki povzročajo pogoste ustavitve, zagon in premike podatkov – kar izgublja čas in pušča veliko zmogljivosti neizkoriščenih – so ustvarili enega “mega jedro, ” ki izvede vse izračune v eni neskončni opravili. Ta pristop znatno poveča izrabo GPU in pospeši obdelavo za vrstni red velikosti, podobno, kot je Henry Ford z uvedbo montažne linije revolucionarno spremenil proizvodnjo s poenostavitvijo zaporednih postopkov. 3. **Rezanje nepotrebnih parametrskih nastavitev in posredne destilacije za učinkovitost** Večnapetostne nevronske mreže imajo pogosto preveč parametrov, kar je odveč za namen ustvarjanja želenih izhodov. Decart je uporabil tehnik “arhitekturno zavestno rezanje” za odstranitev odvečnih parametrov, s čimer so zmanjšali računske zahteve in prilagodili modele strojni opremi. Poleg tega so razvili “posredno destilacijo, ” s katero so majhne, lahke modele izurili, da dosegajo hitrost odstranjevanja šuma, enako kot večji in energijsko zahtevnejši modeli. Ti začasni modeli skrajšajo korake za tvorbo koherentnih okvirjev, kar se sešteje v časovni prihranek in pospeši celotno proizvodnjo videa. Ti preboji skupaj omogočajo generiranje videa z zakasnitvijo manj kot sekundo, kar je ključni mejnik, ki odpre vrata interaktivni uporabi AI videa, ki je prej ni bila možna. Uporabniki lahko nenehno urejajo vsebino v živo, prilagajajo posnetke na podlagi pozivov ali gledalcev. Ta možnost odpira nove perspektive za vplivneže pri prenosu v živo in Twitch streamerje, ki lahko dinamično spreminjajo vsebino med predvajanjem. Poleg zabave ta tehnologija obeta tudi v pogonu iger na srečo v živo, kjer se lahko sekvence prilagajajo v realnem času glede na odločitve igralcev, na primer s poglobljenimi zgodbami, oblikovanimi po njihovi volji. Prav tako vpliva na razširjeno resničnost, poglobljeno izobraževanje in trženje na večjih dogodkih. Poleg tega se videoposnetki, ki jih ustvarja umetna inteligenca, uporabljajo kot motorji nevronskega upodabljanja za strokovnjake, kot so arhitekti in notranji oblikovalci, ki lahko hitro ustvarjajo prototipe stilov in tem prek pozivov pred dokončanjem načrtov. Najbolj izjemno je, da odstranitev zakasnitve pri hkratnem ustvarjanju neomejenega videa omogoča ustvarjalcem, da na interaktiven način raziskujejo dolgoročne vsebine. S posodobitvami scene, razsvetljave, kotov kamere in izrazov likov lahko sproti prilagajajo dogajanje, kar pretvarja pripovedovanje zgodb v dinamično, uporabnikom vodeno izkušnjo. Kfir Aberman, soustanovitelj Decart AI in vodja njihovega urada v San Franciscu, vodi prizadevanja za preoblikovanje raziskav v živo generiranega videa v produkte. Njegovo delo je osredotočeno na ustvarjanje interaktivnih, personaliziranih sistemov umetne inteligence, ki združujejo raziskovalno odličnost z ustvarjalnimi uporabniškimi izkušnjami.


Watch video about

Decart AIjev LSD v2 Preboj omogoča ustvarjanje videa z umetno inteligenco v realnem času z nizko zakasnitvijo

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 17, 2025, 5:24 a.m.

Namestili smo več kot 20 AI agentov in zamenjali …

Na dogodku SaaStr AI London sva Amelia in jaz razpravljali o najini poti kot AI SDR (Sales Development Representative), delila sva vsa najina e-poštna sporočila, podatke in uspešnostne metrike.

Dec. 17, 2025, 5:23 a.m.

Analitika AI marketinga: Merjenje uspeha v dobi a…

V zadnjih letih je analitika trženja doživela znatne spremembe predvsem zaradi napredka na področju umetne inteligence (UI).

Dec. 17, 2025, 5:22 a.m.

Personalizacija videov z umetno inteligenco izbol…

V hitro spreminjajočem se svetu digitalnega marketinga in e-trgovine je personalizacija postala ključna za angažiranje strank in povečanje prodaje.

Dec. 17, 2025, 5:21 a.m.

Revolucioniranje SEO s tehnologijo AI

Kako umetna inteligenca revolucionira SEO strategije V današnjem hitro spreminjajočem se digitalnem okolju so učinkovite SEO strategije bolj pomembne kot kadar koli prej

Dec. 17, 2025, 5:19 a.m.

Platforma za trženje z umetno inteligenco izboljš…

SMM Deal Finder je razvil inovativno platformo, ki poganja umetna inteligenca in je namenjena revolucionarizaciji načina pridobivanja strank za agencije za trženje na družbenih medijih.

Dec. 17, 2025, 5:14 a.m.

Intel namerava kupiti strokovnjaka za umetne inte…

Poročajo, da se Intel v zgodnjih fazah pogovorov zanima za prevzem SambaNova Systems, specialista za AI čipe, s ciljem okrepitve svojega položaja na hitro razvijajočem se trgu AI strojne opreme.

Dec. 16, 2025, 1:29 p.m.

SaaStr AI aplikacija tedna: Kintsugi — umetna int…

Vsak teden osvetljujemo aplikacijo, ki jo poganja AI in rešuje resnične težave za podjetja B2B in v oblaku.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today