lang icon En
Feb. 26, 2025, 10:54 p.m.
1962

Il modello rivoluzionario di intelligenza artificiale di Inception: una fusione di tecnologia di diffusione e linguaggio.

Brief news summary

Inception, una startup lanciata dal professor Stefano Ermon di Stanford a Palo Alto, ha presentato un innovativo modello di linguaggio di grandi dimensioni (DLM) basato sulla diffusione. Questo modello integra i punti di forza dei tradizionali modelli di linguaggio di grandi dimensioni (LLM) con le rapide capacità di elaborazione dei modelli di diffusione, noti per la loro abilità nella generazione di contenuti multimediali come immagini, video e audio. Ermon spiega che i LLM tradizionali generano testo in modo sequenziale, portando a output più lenti, mentre i modelli di diffusione sfruttano ampie rappresentazioni di dati per facilitare l'elaborazione parallela. Questo accelera significativamente la produzione di testo, un traguardo raggiunto grazie a una ricerca approfondita condotta da Ermon e il suo studente. Lo sviluppo ha attirato l'interesse delle aziende della Fortune 100 desiderose di migliorare le prestazioni dell'IA riducendo la latenza e ottimizzando l'utilizzo della GPU. Inception offre un'API e varie soluzioni di distribuzione, affermando che i loro DLM possono fornire risultati fino a dieci volte più veloci degli attuali LLM, riducendo nel contempo i costi operativi. Con una forte enfasi sull'efficienza, Inception cerca di affermarsi come attore di riferimento nel dinamico panorama dell'IA.

Inception, una neocostituita azienda di Palo Alto, avviata dal professore di informatica di Stanford Stefano Ermon, afferma di aver creato un modello di intelligenza artificiale rivoluzionario utilizzando la tecnologia di “diffusione”. Questo modello innovativo è chiamato modello linguistico di grandi dimensioni basato su diffusione, o “DLM” in breve. Attualmente, i modelli di intelligenza artificiale generativa che attirano maggiormente l'attenzione possono essere classificati in due tipi principali: modelli linguistici di grandi dimensioni (LLM) e modelli di diffusione. Gli LLM, progettati su architettura a trasformatore, si specializzano nella generazione di testo. In contrasto, i modelli di diffusione, la tecnologia dietro piattaforme di intelligenza artificiale come Midjourney e Sora di OpenAI, si concentrano principalmente sulla generazione di immagini, video e audio. Secondo Inception, il suo modello combina le capacità degli LLM convenzionali, come la generazione di codice e la risposta a domande, con una velocità notevolmente migliorata e costi di calcolo inferiori. Ermon ha condiviso con TechCrunch di aver a lungo esplorato l'applicazione dei modelli di diffusione alla generazione di testo nel suo laboratorio di ricerca a Stanford. Il suo lavoro è emerso dall'osservazione che gli LLM tradizionali operano a un ritmo più lento rispetto alle tecnologie di diffusione. Con gli LLM, ha spiegato Ermon, “non puoi generare la seconda parola finché non hai prodotto la prima, e la terza parola non può essere generata finché le prime due non sono complete”. Cercando un approccio per applicare i meccanismi di diffusione alla generazione di testo, Ermon ha notato che, a differenza degli LLM che operano sequenzialmente, i modelli di diffusione iniziano con un'approssimazione grezza dell'output (ad esempio, un'immagine) e affinano i dati in modo completo in un colpo solo. Ermon ha ipotizzato che generare e modificare ampie sezioni di testo in parallelo potrebbe essere fattibile utilizzando i modelli di diffusione.

Dopo diversi anni di ricerca, lui e uno dei suoi studenti hanno raggiunto un significativo traguardo, che hanno documentato in un articolo di ricerca pubblicato lo scorso anno. Riconoscendo il potenziale di questo progresso, Ermon ha fondato Inception la scorsa estate, collaborando con ex studenti come Aditya Grover, professore presso UCLA, e Volodymyr Kuleshov della Cornell University per co-guidare l'iniziativa. Sebbene Ermon abbia scelto di non rivelare dettagli specifici sul finanziamento di Inception, TechCrunch ha appreso che il Mayfield Fund è tra i suoi investitori. Inception ha già assicurato contratti con vari clienti, tra cui aziende Fortune 100 non nominate, affrontando le loro pressanti esigenze di minore latenza dell'IA e maggiore velocità, secondo Ermon. “I nostri modelli possono sfruttare le GPU in modo significativamente più efficiente”, ha affermato Ermon, riferendosi alle unità di elaborazione grafica tipicamente impiegate per eseguire modelli di produzione. “Credo che questo sia trasformativo e cambierà il modo in cui vengono sviluppati i modelli linguistici. ” L'azienda offre un'API insieme a opzioni per distribuzioni on-premises e su dispositivi edge, supporto per il fine-tuning dei modelli e una gamma di DLM pronti per l'uso adattati a varie applicazioni. Inception afferma che i suoi DLM possono operare fino a 10 volte più velocemente degli LLM tradizionali, con costi che sono anch'essi 10 volte inferiori. Un rappresentante dell'azienda ha informato TechCrunch: “Il nostro modello di codifica ‘piccolo’ è equivalente alle prestazioni del mini [GPT-4o di OpenAI] ma opera a più di 10 volte la velocità. Il nostro modello ‘mini’ supera le piccole alternative open-source come [Llama 3. 1 8B di Meta], raggiungendo oltre 1. 000 token al secondo. ”


Watch video about

Il modello rivoluzionario di intelligenza artificiale di Inception: una fusione di tecnologia di diffusione e linguaggio.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 20, 2025, 1:24 p.m.

5 Attributi Culturali Che Potrebbero Fare la Diff…

Sommario e Riscrittura di “The Gist” sulla Trasformazione dell’IA e la Cultura Organizzativa La trasformazione attraverso l’intelligenza artificiale rappresenta principalmente una sfida culturale piuttosto che puramente tecnologica

Dec. 20, 2025, 1:22 p.m.

Agente di vendita AI: I 5 principali acceleratori…

L'obiettivo ultimo delle aziende è aumentare le vendite, ma una forte concorrenza può ostacolare questo scopo.

Dec. 20, 2025, 1:19 p.m.

AI e SEO: una coppia perfetta per migliorare la v…

L'integrazione dell'intelligenza artificiale (IA) nelle strategie di ottimizzazione per i motori di ricerca (SEO) sta trasformando radicalmente il modo in cui le aziende migliorano la loro visibilità online e attraggono traffico organico.

Dec. 20, 2025, 1:15 p.m.

Progressi nella tecnologia Deepfake: implicazioni…

La tecnologia deepfake ha compiuto progressi significativi recentemente, producendo video manipolati estremamente realistici che rappresentano convincentemente individui mentre fanno o dicono cose che in realtà non hanno mai fatto.

Dec. 20, 2025, 1:13 p.m.

La spinta di Nvidia nell'intelligenza artificiale…

Nvidia ha annunciato un’espansione significativa delle sue iniziative open source, segnando un impegno strategico nel supportare e far crescere l’ecosistema open source nel computing ad alte prestazioni (HPC) e nell’intelligenza artificiale (AI).

Dec. 20, 2025, 9:38 a.m.

Il governatore di New York, Kathy Hochul, firma u…

Il 19 dicembre 2025, il governatore di New York Kathy Hochul ha firmato la legge Responsible Artificial Intelligence Safety and Ethics (RAISE), segnando un traguardo importante nella regolamentazione delle tecnologie avanzate di intelligenza artificiale nello stato.

Dec. 20, 2025, 9:36 a.m.

Stripe lancia Agentic Commerce Suite per le vendi…

Stripe, la società di servizi finanziari programmabili, ha presentato l'Agentic Commerce Suite, una nuova soluzione pensata per permettere alle aziende di vendere attraverso più agenti AI.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today