lang icon En
Feb. 26, 2025, 10:54 p.m.
1954

Inception revoliucinis AI modelis: difuzijos ir kalbos technologijų derinys

Brief news summary

Inception, startuolis, kurį įsteigė Stanfordo profesorius Stefano Ermon Palo Alte, pristatė novatorišką difuzijos pagrindu sukurtą didelės kalbos modelį (DLM). Šis modelis integruoja tradicinių didelių kalbos modelių (LLM) privalumus su greitu difuzijos modelių apdorojimu, kurie garsėja savo gebėjimu generuoti multimedia turinį, pavyzdžiui, vaizdus, vaizdo įrašus ir garsą. Ermonas paaiškina, kad tradiciniai LLM generuoja tekstą nuosekliai, kas lemia lėtesnius rezultatus, tuo tarpu difuzijos modeliai pasinaudoja plačiais duomenų atvaizdais, kad palengvintų paralelinį apdorojimą. Tai žymiai pagreitina teksto gamybą, pasiekimą, kuris buvo realizuotas atlikus išsamius tyrimus, kuriuos vykdė Ermonas ir jo studentas. Šis vystymasis patraukė Fortune 100 įmonių dėmesį, kurios nori pagerinti dirbtinio intelekto veikimą, sumažindamos delsą ir optimizuodamos GPU išnaudojimą. Inception siūlo API ir įvairius diegimo sprendimus, teigdama, kad jų DLM gali suteikti rezultatus iki dešimties kartų greičiau nei šiuo metu naudojami LLM, tuo pačiu mažindama veiklos kaštus. Su stipriu akcentu į efektyvumą, Inception siekia tapti pirmaujančiu žaidėju dinamiškoje dirbtinio intelekto rinkoje.

Inception, neseniai įsteigta įmonė Palo Alto, kurią inicijavo Stanfordo kompiuterių mokslo profesorius Stefano Ermon, teigia sukūrusi revoliucinį AI modelį, naudojantį „difuzijos“ technologiją. Šis novatoriškas modelis vadinamas difuzijos pagrindu sukurtu dideliu kalbos modeliu, arba trumpai „DLM“. Šiuo metu generatyvūs AI modeliai, sulaukiantys didžiausio dėmesio, gali būti suskirstyti į dvi pagrindines rūšis: didelius kalbos modelius (LLM) ir difuzijos modelius. LLM, kurie sukurti remiantis transformatorių architektūra, specializuojasi teksto generavime. Tuo tarpu difuzijos modeliai, esantys už AI platformų, tokių kaip Midjourney ir OpenAI Sora, technologijų, daugiausia dėmesio skiria vaizdų, vaizdo ir garso generavimui. Pasak Inception, jų modelis sujungia tradicinių LLM galimybes - tokias kaip kodo generavimas ir klausimų-atsakymų sistema - su žymiai pagerinta greitaveika ir mažesnėmis kompiuterinėmis sąnaudomis. Ermon pasidalino su TechCrunch, kad jau seniai tyrinėja difuzijos modelių taikymą tekstų generavimui savo tyrimų laboratorijoje Stanforde. Jo darbai atsirado stebint, kad tradiciniai LLM veikia lėčiau nei difuzijos technologijos. Su LLM, paaiškino Ermon, „nesate pajėgus generuoti antro žodžio, kol nesukūrėte pirmo, o trečio žodžio negalima sugeneruoti, kol pirmi du nėra baigti. “ Ieškodamas būdų taikyti difuzijos mechanizmus tekstų generavimui, Ermon pažymėjo, kad, skirtingai nuo LLM, kurie veikia nuosekliai, difuzijos modeliai prasideda nuo grubaus galutinio rezultato (pavyzdžiui, vaizdo) apytakos ir visus duomenis apdoroja vienu metu. Ermon teorijos, kad generuoti ir modifikuoti didelius tekstų blokus lygiagrečiai galėtų būti įmanoma naudojant difuzijos modelius.

Po kelerių metų tyrimų jis ir vienas iš savo studentų pasiekė reikšmingą proveržį, kurį jie užfiksavo moksliniame straipsnyje, paskelbtame pernai. Pripažindamas šio pasiekimo potencialą, Ermon įsteigė Inception praėjusią vasarą, į savo komandą pasikviesdamas buvusius studentus Adityą Groverį, UCLA profesoriumi, ir Volodymyrą Kuleshovą iš Cornell universiteto, kad kartu vadovautų šiam projektui. Nors Ermon nusprendė neatskleisti konkrečių finansavimo detalių apie Inception, TechCrunch sužinojo, kad Mayfield Fund yra vienas iš investuotojų. Pasak Ermon, Inception jau užsitikrino sutartis su įvairiais klientais, įskaitant bevardžius Fortune 100 kompanijas, spręsdama jų skubius reikalavimus dėl mažo AI delsimo ir didesnio greičio. „Mūsų modeliai gali efektyviau išnaudoti GPU“, - teigė Ermon, kalbėdamas apie grafikų procesorius, kurie paprastai naudojami gamybos modelių veikimui. „Manau, kad tai yra transformuojanti ir pakeis, kaip vystomi kalbos modeliai. “ Įmonė teikia API, taip pat galimybes diegti modelius vietoje ir krašto įrenginiuose, palaikyti modelio derinimą ir siūlo įvairias paruoštas DLMs, pritaikytas įvairioms programoms. Inception teigia, kad jų DLM gali veikti iki 10 kartų greičiau nei tradiciniai LLM, o sąnaudos taip pat yra 10 kartų mažesnės. Vienas įmonės atstovas informavo TechCrunch, „Mūsų 'mažas' kodavimo modelis atitinka [OpenAI] GPT-4o mini veikimą, tačiau veikia daugiau nei 10 kartų greičiau. Mūsų 'mini' modelis aplenkia mažus atvirojo kodo alternatyvas, tokias kaip [Meta] Llama 3. 1 8B, pasiekdamas daugiau nei 1, 000 tokenų per sekundę. “


Watch video about

Inception revoliucinis AI modelis: difuzijos ir kalbos technologijų derinys

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 1:28 p.m.

Z.ai greitas augimas ir tarptautinė plėtra dirbti…

Z.ai, anksčiau žinomas kaip Zhipu AI, yra viena iš pirmaujančių Kinijos technologijų įmonių, specializuojasi dirbtinio intelekto srityje.

Dec. 19, 2025, 1:27 p.m.

Dabartis ir ateitis dirbtinio intelekto pardavimu…

Jason Lemkin vadovavo sėklos etapui per SaaStr Fonds finansavimą unikalųjį Owner.com, dirbtinio intelekto pagrindu sukurtą platformą, transformuojančią mažų restoranų veiklą.

Dec. 19, 2025, 1:25 p.m.

Kodėl aš nesutinku su dirbtinio intelekto nuomone…

Metai 2025 buvo dominuojami dirbtinio intelekto (DI), o 2026 m.

Dec. 19, 2025, 1:23 p.m.

Dirbtinio intelekto vaizdo suspaudimo technikos g…

Dirbtinis intelektas (DI) dramatiškai keičia būdą, kaip pristatomas ir patiriamas vaizdo turinys, ypač vaizdo suspaudimo srityje.

Dec. 19, 2025, 1:19 p.m.

Pasinaudojant dirbtiniu intelektu vietinei SEO: p…

Vietinis paieškos optimizavimas dabar yra labai svarbus įmonėms, siekiančioms pritraukti ir išlaikyti klientus savo tiesioginio geografinio regiono ribose.

Dec. 19, 2025, 1:15 p.m.

„„Adobe paleidžia pažangius dirbtinio intelekto a…

„Adobe“ pristatė naują dirbtinio intelekto (DI) agentų paketą, skirtą padėti prekės ženklams stiprinti vartotojų sąveiką jų svetainėse.

Dec. 19, 2025, 9:32 a.m.

Marketplace apžvalga: Kaip „Amazon“ pardavėjai pe…

Javusios Amazonės viešosios gairės, kaip optimizuoti produktų paminėjimus Rufus, jos dirbtinio intelekto valdomo pirkinių asistento, liko nepakitusios, jokių naujų patarimų pardavėjams nepateikta.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today