Feb. 26, 2025, 10:54 p.m.
1913

Inceptionov revolucionarni AI model: spoj difuzijske i jezične tehnologije

Brief news summary

Inception, startup koji je pokrenuo profesor sa Stanforda Stefano Ermon u Palo Altu, predstavio je inovativni difuzijski model velikog jezika (DLM). Ovaj model integrates snage konvencionalnih modela velikog jezika (LLM) s brzim procesnim sposobnostima difuzijskih modela, poznatih po svojoj sposobnosti generiranja multimedijalnog sadržaja poput slika, videa i zvuka. Ermon objašnjava da tradicionalni LLM-ovi generiraju tekst sekvencijalno, što dovodi do sporijih rezultata, dok difuzijski modeli koriste opsežne reprezentacije podataka za omogućavanje paralelnog procesiranja. To značajno ubrzava proizvodnju teksta, proboj koji je postignut kroz sveobuhvatno istraživanje Er Mona i njegovog studenta. Razvoj je privukao interes Fortune 100 kompanija koje su željne poboljšati performanse AI smanjenjem latencije i optimiziranjem iskorištavanja GPU-a. Inception nudi API i različita rješenja za implementaciju, tvrdeći da njihovi DLM-ovi mogu isporučiti rezultate do deset puta brže od trenutnih LLM-ova, dok istovremeno smanjuju operativne troškove. S naglaskom na efikasnost, Inception nastoji uspostaviti se kao vodeći igrač u dinamičkom AI pejzažu.

Inception, novo osnovano poduzeće u Palo Altu, koje je pokrenuo profesor računalnih znanosti na Stanfordu Stefano Ermon, tvrdi da je stvorilo revolucionarni AI model koristeći tehnologiju "difuzije". Ovaj inovativni model naziva se model velikog jezika temeljen na difuziji, ili skraćeno “DLM”. Trenutno, generativni AI modeli koji privlače najviše pažnje mogu se kategorizirati u dvije glavne vrste: modeli velikog jezika (LLM) i modeli difuzije. LLM-ovi, koji su dizajnirani na temelju transformatorske arhitekture, specijalizirani su za generiranje teksta. S druge strane, modeli difuzije, tehnologija koja pokreće AI platforme poput Midjourney i OpenAI-ovog Sore, prvenstveno se fokusiraju na generiranje slika, videa i zvuka. Prema Inceptionu, njihov model kombinira mogućnosti konvencionalnih LLM-ova—poput generiranja koda i odgovaranja na pitanja—s značajno poboljšanom brzinom i nižim troškovima računanja. Ermon je za TechCrunch otkrio da je dugo istraživao primjenu modela difuzije za generiranje teksta u svom istraživačkom laboratoriju na Stanfordu. Njegov rad proizašao je iz promatranja da tradicionalni LLM-ovi djeluju sporije u usporedbi s tehnologijama difuzije. “S LLM-ovima”, objasnio je Ermon, “ne možete generirati drugu riječ dok ne proizvedete prvu, a treću riječ ne možete generirati sve dok prva dva nisu gotova. ” Tražeći način za primjenu difuzijskih mehanizama u generiranju teksta, Ermon je primijetio da, za razliku od LLM-ova koji djeluju sekvencijalno, modeli difuzije započinju s grubom aproksimacijom izlaza (na primjer, slike) i sveobuhvatno poboljšavaju podatke u jednom potezu. Ermon je teoretizirao da bi generiranje i modificiranje značajnih blokova teksta paralelno moglo biti izvedivo korištenjem modela difuzije.

Nakon nekoliko godina istraživanja, on i jedan od njegovih studenata postigli su značajan napredak, koji su dokumentirali u istraživačkom radu objavljenom prošle godine. Prepoznajući potencijal ovog napretka, Ermon je osnovao Inception prošlog ljeta, dovodeći u tim bivše studente Adityu Grovera, profesora na UCLA-u, i Volodymyra Kuleshova s Cornell Universityja kako bi zajednički vodili poduhvat. Iako Ermon nije htio otkriti specifične detalje financiranja Inceptiona, TechCrunch je saznao da je Mayfield Fund među njegovim investitorima. Inception je već osigurao ugovore s raznim klijentima, uključujući nepomenute Fortune 100 kompanije, rješavajući njihove hitne zahtjeve za nižom latencijom AI-a i povećanom brzinom, prema Ermonu. “Naši modeli mogu značajno učinkovitije iskoristiti GPU-ove”, istaknuo je Ermon, misleći na grafičke procesne jedinice koje se obično koriste za pokretanje produkcijskih modela. “Vjerujem da je ovo transformativno i da će promijeniti način na koji se razvijaju jezični modeli. ” Poduzeće pruža API zajedno s opcijama za implementaciju na licu mjesta i na rubnim uređajima, podršku za fino podešavanje modela, te niz spremnih za korištenje DLM-ova prilagođenih raznim aplikacijama. Inception tvrdi da njegovi DLM-ovi mogu raditi do 10 puta brže od tradicionalnih LLM-ova uz troškove koji su također 10 puta niži. Predstavnik tvrtke informirao je TechCrunch: “Naš ‘mali’ kodni model jednak je performansama [OpenAI-ovog] GPT-4o mini, ali radi brže od više od 10 puta. Naš ‘mini’ model nadmašuje male open-source alternative poput [Meta-ovog] Llama 3. 1 8B, postižući više od 1. 000 tokena u sekundi. ”


Watch video about

Inceptionov revolucionarni AI model: spoj difuzijske i jezične tehnologije

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 5:43 a.m.

Zeta Global (NYSE: ZETA) ističe Athena AI marketi…

Zeta Global najavljuje ekskluzivni program za CES 2026, s naglaskom na AI-om vođeni marketing i evoluciju Athena 15

Dec. 16, 2025, 5:22 a.m.

Tehnike kompresije videa pomoću umjetne inteligen…

U brzom mijenjanom svijetu digitalne zabave, usluge streaminga sve više koriste tehnike kompresije videa temeljenih na umjetnoj inteligenciji (AI) kako bi poboljšale korisničko iskustvo.

Dec. 16, 2025, 5:22 a.m.

Očekuje se da će umjetna inteligencija značajno p…

Kako se približava sezona praznika, AI postaje popularan osobni asistent za kupovinu.

Dec. 16, 2025, 5:20 a.m.

Chicago Tribune tuži Perplexity AI zbog kršenja a…

Chicago Tribune podnio je tužbu protiv Perplexity AI, platforme za odgovore temeljene na umjetnoj inteligenciji, optužujući tvrtku za nezakonito distribuiranje Tribuneovog novinarskog sadržaja i odvraćanje prometa s Tribuneovih platformi.

Dec. 16, 2025, 5:17 a.m.

Meta potvrđuje da grupne poruke na WhatsAppu nisu…

Meta nedavno je razjasnila svoj stav glede korištenja podataka s WhatsApp grupa za trening umjetne inteligencije (AI), čime je odgovorila na široko rasprostranjene dezinformacije i zabrinutosti korisnika.

Dec. 16, 2025, 5:17 a.m.

Izvršni direktor AI SEO Newswirea predstavljen u …

Marcus Morningstar, izvršni direktor AI SEO Newswirea, nedavno je istaknut na blogu Daily Silicon Valley, gdje govori o svom pionirskom radu u novom području koje naziva Generative Engine Optimization (GEO).

Dec. 15, 2025, 1:26 p.m.

AI Pokreće rekordnu prodaju od 336,6 milijardi do…

Analiza Salesforcea o razdoblju kupovine tijekom Cyber Weeka 2025.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today