lang icon En
Nov. 21, 2025, 1:20 p.m.
1724

Il progresso di Decart AI con LSD v2 consente la generazione di video AI in tempo reale e con bassa latenza

Brief news summary

Nel corso dell'ultimo anno, i modelli di diffusione video con intelligenza artificiale come Sora 2 di OpenAI e Veo 3 di Google hanno migliorato il realismo visivo, ma affrontano ancora sfide legate alla latenza e alla lunghezza limitata dei video a causa della generazione sequenziale di fotogrammi. LSD v2 di Decart AI supera questi problemi grazie a un'architettura causale e autoregressiva che permette la creazione immediata e continua di video senza limiti di durata. Innovazioni chiave come un'implementazione migliorata della diffusione forzata e l'augmentazione della storia evitano l'accumulo di errori, consentendo la generazione infinita di video di alta qualità che si adattano perfettamente all'input dell'utente. Per raggiungere la latenza inferiore al secondo, necessaria per le interazioni in tempo reale, Decart ha ottimizzato le GPU Nvidia Hopper utilizzando tecniche come un "mega kernel", pruning consapevole dell'architettura e distillazione tramite shortcut, che permettono una rapida denoising anche in modelli compatti. Questo progresso supporta applicazioni dinamiche come lo streaming live, il gaming, l'istruzione e il design, offrendo modifiche in tempo reale al contenuto con un ritardo minimo. LSD v2 rappresenta un avanzamento significativo nella generazione di video AI in tempo reale e senza limiti, rivoluzionando lo storytelling interattivo e l'espressione creativa.

Nel corso dell'ultimo anno, i modelli di diffusione video generati dall'IA hanno compiuto progressi notevoli in termini di realismo visivo, come dimostrato da modelli come Sora 2 di OpenAI, Veo 3 di Google e Runway Gen-4. La generazione di video con IA sta raggiungendo una fase cruciale, con gli ultimi modelli in grado di creare clip sorprendentemente realistiche e affascinanti. Tuttavia, l’architettura di questi modelli limita il loro utilizzo in applicazioni interattive in tempo reale, poiché generano i fotogrammi sequenzialmente attraverso passaggi complessi e computazionalmente intensi. Elaborare ogni segmento prima di passare al successivo introduce latenza, impedendo lo streaming live di video con IA. La maggior parte degli specialisti si concentra sulla creazione di clip da visualizzare successivamente, mentre la trasformazione istantanea e in tempo reale dei video con IA ancora sembra essere lontana anni. Il team di Decart ha sfidato questa barriera architetturale e ha sviluppato LSD v2, un modello che dimostra come si possa raggiungere una latenza minima attraverso approcci innovativi applicabili a vari modelli di IA. Hanno ottimizzato l’infrastruttura per massimizzare l’utilizzo delle GPU e accelerato il processo di denoising, essenziale per prevenire l’accumulo di errori. LSD v2 utilizza un’architettura causale auto-regressiva per generare video in modo immediato e continuo, senza limiti di durata dell’output. Le innovazioni chiave includono: 1. **Generazione infinita tramite modelli causali auto-regressivi** Per consentire un output in streaming, i modelli video devono operare in modalità “causale, ” producendo ogni fotogramma basandosi esclusivamente sui fotogrammi precedenti, riducendo il carico computazionale. Questo approccio garantisce continuità, ma nel tempo può portare all’accumulo di errori—piccole imprecisioni come un’ombra fuori luogo diventano sempre più distorte, limitando la durata dei clip. Per contrastare questo problema, Decart ha migliorato il “diffusion forcing” per denoisare i fotogrammi durante la generazione e ha introdotto l’“aggiunta di storia, ” addestrando i modelli a riconoscere e correggere le uscite corrotte. Il ciclo di feedback causale considera i fotogrammi generati in precedenza, l’input attuale e le prompt dell’utente, permettendo al modello di individuare e correggere artefatti, mantenendo alta qualità del contenuto in modo indefinito. Ciò consente editing e trasformazioni in tempo reale, continue, basate sui input dell’utente. 2. **Latenza inferiore al secondo tramite ottimizzazione delle GPU** La generazione di video interattivi in tempo reale richiede che ogni fotogramma venga prodotto entro 40 millisecondi per evitare lag visibili.

Tuttavia, la complessità computazionale dei modelli causali si scontra con la progettazione delle GPU moderne, che privilegiano l’elaborazione di grandi batch rispetto alla bassa latenza. Decart ha affrontato il problema ottimizzando profondamente i kernel Nvidia Hopper. Invece di numerosi kernel piccoli che causano frequenti pause, avvii e spostamenti di dati—che sprecano tempo e lasciano GPU inutilizzata—hanno creato un “mega kernel” unico che esegue tutte le operazioni del modello in un’unica passata continua. Questo metodo incrementa drasticamente l’efficienza dell’utilizzo GPU e accelera i processi di un ordine di grandezza, analogamente a come la catena di montaggio di Henry Ford rivoluzionò la produzione rendendola più efficiente. 3. **Potatura e distillazione con scorciatoie per efficienza** Le reti neurali tendono ad essere sovradimensionate, con molti parametri superflui per la generazione dei risultati desiderati. Decart ha applicato tecniche di “potatura consapevole dell’architettura” per eliminare parametri ridondanti, riducendo il carico computazionale e adattando più strettamente i modelli all’architettura hardware. Inoltre, hanno sviluppato la “distillazione con scorciatoie, ” ovvero il fine-tuning di modelli più piccoli e leggeri per eguagliare la velocità di denoising di modelli più grandi e energivori. Questi modelli ridotti permettono di generare fotogrammi coerenti più rapidamente, generando risparmi di tempo incrementali che accelerano complessivamente il processo di output. Questi progressi permettono di ottenere generazioni di video con latenza inferiore al secondo, una tappa fondamentale che apre alla possibilità di utilizzo interattivo dell’IA nel video. Gli utenti possono modificare contenuti in tempo reale, adattando i video in modo dinamico basandosi su prompt o input del pubblico. Questa capacità apre prospettive interessanti per influencer di live streaming e streamer su Twitch, che potranno modificare continuamente i contenuti durante la trasmissione. Oltre all’intrattenimento, questa tecnologia promette anche applicazioni nei giochi dal vivo, consentendo sequenze generate dall’IA che si adattano in tempo reale alle scelte dei giocatori—come narrazioni ramificate modellate dalle decisioni degli utenti. Influenza anche realtà estesa, educazione immersiva e marketing di eventi su larga scala. Inoltre, i video generati dall’IA funzionano come motori di rendering neurale per professionisti come architetti e interior designer, permettendo prototipi rapidi di stili e temi tramite prompt prima di finalizzare le progettazioni. Ancora più notevole, eliminando la latenza e consentendo generazioni infinite di video, questa tecnologia permette ai creatori di esplorare contenuti di lunga durata in modo interattivo. Possono aggiustare scene, illuminazione, angolature di ripresa e espressioni dei personaggi in tempo reale mentre il video si svolge, trasformando la narrazione in un’esperienza dinamica e guidata dall’utente. Kfir Aberman, membro fondatore di Decart AI e responsabile della sede di San Francisco, guida gli sforzi nel trasformare la ricerca sulla generazione di video in tempo reale in prodotti concreti. Il suo lavoro si concentra sulla creazione di sistemi di IA interattivi e personalizzati, che coniugano eccellenza nella ricerca con esperienze creative per gli utenti.


Watch video about

Il progresso di Decart AI con LSD v2 consente la generazione di video AI in tempo reale e con bassa latenza

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 26, 2025, 5:30 a.m.

La collaborazione di Cognizant con NVIDIA per acc…

Cognizant Technology Solutions ha annunciato importanti avanzamenti nell'intelligenza artificiale (AI) attraverso una partnership strategica con NVIDIA, con l'obiettivo di accelerare l'adozione dell'AI in diversi settori concentrandosi su cinque aree trasformative.

Dec. 26, 2025, 5:17 a.m.

Gli strumenti di moderazione dei contenuti video …

Le piattaforme di social media stanno sempre più integrando tecnologie di intelligenza artificiale (IA) per migliorare la moderazione dei contenuti video condivisi sulle loro reti.

Dec. 26, 2025, 5:16 a.m.

L'impatto della modalità AI sulla SEO: una lama a…

Entro il 2025, l'Intelligenza Artificiale (AI) si appresta a rivoluzionare profondamente il nostro modo di usare Internet, influenzando in modo sostanziale la creazione di contenuti, l'ottimizzazione per i motori di ricerca (SEO) e la fiducia generale nelle informazioni online.

Dec. 26, 2025, 5:16 a.m.

Monetizzatori vs produttori: Come il mercato dell…

Il mercato dell'IA si si prevede che si frammenterà entro il 2026, dopo una fine del 2025 volatile, segnata da vendite di tecnologia, rally, operazioni circolari, emissioni di debito e valutazioni elevate che hanno sollevato preoccupazioni su una bolla dell'IA.

Dec. 26, 2025, 5:12 a.m.

Microsoft Taglia gli Obiettivi di Crescita delle …

Microsoft ha recentemente adeguato i propri obiettivi di crescita delle vendite per i suoi prodotti di intelligenza artificiale (AI), in particolare quelli legati agli agenti AI, dopo che molti dei suoi rappresentanti di vendita non sono riusciti a raggiungere le quote assegnate.

Dec. 25, 2025, 1:36 p.m.

I Democratic avvertono che l'autorizzazione da pa…

I Democratici del Congresso esprimono seria preoccupazione per la possibilità che gli Stati Uniti possano presto iniziare a vendere chip avanzati a uno dei loro principali rivali geopolitici.

Dec. 25, 2025, 1:33 p.m.

Funzionari dell'indipendenza pronti per il proget…

Tod Palmer, giornalista di KSHB 41 che si occupa di sport, affari e della contea orientale di Jackson, ha appreso di questo importante progetto attraverso la sua attività di cronista che copre il Consiglio Comunale di Independence.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today