lang icon En
Feb. 26, 2025, 10:54 p.m.
1980

Model d'IA revolucionari d'Inception: una combinació de tecnologia de difusió i de llenguatge.

Brief news summary

Inception, una startup llançada pel professor de Stanford Stefano Ermon a Palo Alto, ha presentat un innovador model de llenguatge gran (DLM) basat en la difusió. Aquest model integra les forces dels models de llenguatge grans convencionals (LLMs) amb les capacitats de processament ràpid dels models de difusió, coneguts per la seva habilitat en generar contingut multimèdia com imatges, vídeos i àudio. Ermon explica que els LLMs tradicionals generen text de manera seqüencial, cosa que provoca sortides més lentes, mentre que els models de difusió aprofiten representacions de dades extensives per facilitar el processament en paral·lel. Això accelera significativament la producció de text, un avenç aconseguit a través d'una investigació exhaustiva de Ermon i el seu estudiant. El desenvolupament ha atret l’interès de les empreses Fortune 100 que busquen millorar el rendiment de la IA reduint la latència i optimitzant l'ús de GPU. Inception ofereix una API i diverses solucions de desplegament, afirmant que els seus DLM poden proporcionar resultats fins a deu vegades més ràpid que els LLMs actuals mentre redueixen els costos operatius. Amb un fort enfocament en l'eficiència, Inception busca establir-se com un jugador líder en el dinàmic panorama de la IA.

Inception, una empresa newly fundada a Palo Alto, iniciada pel professor de ciències informàtiques de Stanford Stefano Ermon, afirma haver creat un model d'IA revolucionari que utilitza tecnologia de “difusió”. Aquest model innovador es coneix com un model de llenguatge gran basat en la difusió, o “DLM” per abreujar. Actualment, els models d'IA generativa que atreuen més atenció es classifiquen en dues categories principals: models de llenguatge gran (LLMs) i models de difusió. Els LLMs, dissenyats sobre l'arquitectura transformer, es especialitzen en la generació de text. En canvi, els models de difusió, la tecnologia darrere de plataformes d'IA com Midjourney i Sora d'OpenAI, se centren principalment en la generació d'imatges, vídeo i àudio. Segons Inception, el seu model combina les capacitats dels LLMs convencionals—com la generació de codi i la resposta a preguntes—amb una velocitat significativament millorada i costos computacionals més baixos. Ermon va compartir amb TechCrunch que fa temps que explora l'aplicació dels models de difusió a la generació de text al seu laboratori de recerca a Stanford. La seva feina va sorgir de l'observació que els LLMs tradicionals operen a un ritme més lent en comparació amb les tecnologies de difusió. Amb els LLM, Ermon va explicar, “no pots generar la segona paraula fins que no hagis produït la primera, i la tercera paraula no es pot generar fins que les dues primeres no estan completes. ” Buscant un enfocament per aplicar mecanismes de difusió a la generació de text, Ermon va assenyalar que, a diferència dels LLM que operen de manera sequencial, els models de difusió comencen amb una aproximació feta de manera aproximada de la sortida (per exemple, una imatge) i refinan les dades de manera exhaustiva d'una sola vegada. Ermon va teoritzar que generar i modificar grans blocs de text en paral·lel podria ser viable utilitzant models de difusió.

Després de diversos anys de recerca, ell i un dels seus estudiants van aconseguir un èxit significatiu, que van documentar en un article de recerca publicat l'any passat. Reconeixent el potencial d’aquest avanç, Ermon va establir Inception l'estiu passat, incorporant antics alumnes com Aditya Grover, professor a UCLA, i Volodymyr Kuleshov de la Universitat de Cornell per co-liderar l'empresa. Tot i que Ermon va optar per no revelar detalls específics sobre el finançament d'Inception, TechCrunch ha sabut que el Mayfield Fund és un dels seus inversors. Inception ja ha aconseguit contractes amb diversos clients, incloent empreses de Fortune 100 no nomenades, ateses les seves exigències immediates per reduir la latència de l'IA i millorar la velocitat, segons Ermon. “Els nostres models poden aprofitar les GPUs de manera significativament més eficient, ” va afirmar Ermon, referint-se als unitats de processament gràfic que s'utilitzen habitualment per executar models de producció. “Crec que això és transformador i canviarà com es desenvolupen els models de llenguatge. ” L'empresa proporciona una API juntament amb opcions per a la implementació en premises i dispositius edge, suport per a l'ajust de models i una gamma de DLMs llestos per a l'ús adaptats a diverses aplicacions. Inception afirma que els seus DLMs poden funcionar fins a 10 vegades més ràpid que els LLM tradicionals mentre que els costos també són 10 vegades més baixos. Un representant de l'empresa va informar a TechCrunch, “El nostre model de codificació ‘petit’ iguala el rendiment del [GPT-4o mini d'OpenAI] però funciona a més de 10 vegades la velocitat. El nostre model ‘mini’ supera alternatives petites de codi obert com [Llama 3. 1 8B de Meta], assolint més de 1. 000 tokens per segon. ”


Watch video about

Model d'IA revolucionari d'Inception: una combinació de tecnologia de difusió i de llenguatge.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 1:26 p.m.

15 maneres en què les vendes han canviat aquest a…

Durants dels últims 18 mesos, l’equip SaaStr s’ha submergit en l’àmbit de la Intel·ligència Artificial i les vendes, amb una acceleració important a partir de juny de 2025.

Dec. 23, 2025, 1:23 p.m.

GPT-5 d'OpenAI: El que sabem fins ara

OpenAI s’està preparant per llançar GPT-5, el pròxim gran avanç en la seva sèrie de grans models de llenguatge, amb el llançament previst a principis de 2026.

Dec. 23, 2025, 1:20 p.m.

Intel·ligència Artificial en SEO: Transformant la…

La intel·ligència artificial (IA) està remodelant ràpidament el camp de la creació i optimització de contingut dins del màrqueting en motors de cerca (SEO).

Dec. 23, 2025, 1:20 p.m.

Les solucions de videoconferència amb intel·ligèn…

El canvi cap al treball remot ha destacat la necessitat crucial d’eines de comunicació eficaces, el que ha provocat l’augment de solucions de videoconferència amb tecnologia d’intel·ligència Artificial que permeten una col·laboració fluïda a distància.

Dec. 23, 2025, 1:17 p.m.

Mida del mercat de la Intel·ligència Artificial e…

Visió general El Mercat global de la Intel·ligència Artificial (IA) en Medicina està previst que arribi a assolir aproximadament els 156

Dec. 23, 2025, 9:30 a.m.

El Danny Sullivan i el John Mueller de Google sob…

John Mueller de Google va entrevistar en Danny Sullivan, també de Google, al podcast Search Off the Record per parlar sobre "Opinions sobre SEO i SEO per a la IA".

Dec. 23, 2025, 9:26 a.m.

Lexus prova la intel·ligència artificial generati…

Resum breu: Lexus ha llançat una campanya de màrqueting nadalenca creada amb tecnologia d’intel·ligència artificial generativa, segons un comunicat de premsa

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today