lang icon En
Feb. 26, 2025, 10:54 p.m.
1960

Револуционерниот AI модел на Inception: Слив на дифузионна и јазична технологија

Brief news summary

Inception, старт ап лансиран од професорот Стефано Ермон од Стенфорди во Пало Алто, откри иновативен модел на голем јазик заснован на дифузија (DLM). Овој модел интегрира предностите на конвенционалните големи јазични модели (LLMs) со брзите процесирачки капацитети на моделите на дифузија, познати по својата способност да генерираат мултимедијално содржина како слики, видеа и аудио. Ермон објаснува дека традиционалните LLM генерираат текст последователно, што доведува до побавни излази, додека моделите на дифузија користат обширни репрезентации на податоци за да овозможат паралелно процесирање. Ова значително го забрзува производството на текст, пробив постигнат преку опсежно истражување на Ермон и неговиот студент. Развојот привлекува интерес од компании од Fortune 100 кои сакаат да ја подобрат перформансата на АИ преку намалување на латентноста и оптимизација на искористеноста на GPU. Inception нуди API и различни решенија за распоредување, тврдејќи дека нивните DLM можат да испорачуваат резултати до десет пати побрзо од сегашните LLM, додека ги намалуваат оперативните трошоци. Со силен акцент на ефикасност, Inception се стреми да се утврди како водечка компанија во динамичниот АИ пејзаж.

Инцепција, нова основана компанија во Пало Алто, иницирана од професорот по компјутерски науки на Станфорд, Стефано Ермон, тврди дека создала иновативен модел на вештачка интелигенција кој користи технологија на "дифузија". Овој иновативен модел се нарекува дифузиони модел на голем јазик, или "DLM" за кратко. В моментов, генеричките AI модели кои привлекуваат најголемо внимание можат да се категоризираат во два главни типа: големи модели на јазик (LLMs) и модели на дифузија. LLMs, кои се дизајнирани на трансформаторска архитектура, се специјализирани за генерирање текст. Спротивно на тоа, моделите на дифузија, технологијата зад AI платформите како што се Midjourney и OpenAI's Sora, главно се фокусираат на генерирање на слики, видео и аудио. Според Инцепција, нивниот модел комбинира можностите на конвенционалните LLMs — како што се генерирање код и одговарање на прашања — со значително подобрена брзина и пониски компјутерски трошоци. Ермон сподели со TechCrunch дека долго време истражува примената на моделите на дифузија за генерирање текст во неговата истражувачка лабораторија на Станфорд. Неговата работа произлезе од набљудувањето дека традиционалните LLMs работат побавно во споредба со технологиите на дифузија. Со LLMs, Ермон објасни, "не можете да генерирате втората реч, дури не сте произведиле првата, и третата реч не може да се генерира додека првите две не се завршени. " Барајќи начин за применување на механизмите на дифузија за генерирање текст, Ермон забележа дека, за разлика од LLMs кои работат последователно, моделите на дифузија започнуваат со груба приближување на излезот (на пример, слика) и опсежно ја усовршуваат податокот во еден потег. Ермон теоретизираше дека генерирањето и изменувањето значителни блокови текст во паралела би можело да биде изводливо со користење на моделите на дифузија.

По неколку години истражување, тој и еден од неговите студенти постигнаа значителен пробив, кој го документираа во истражувачки труд објавен минатата година. Признавајќи го потенцијалот на ова напредување, Ермон ја основа Инцепција минатото лето, доведувајќи во тимот поранешни студенти Адитија Гровер, професор на UCLA, и Володиимир Кулешов од Универзитетот Корнел за заедничко водство на проектот. Иако Ермон реши да не открива конкретни детали за финансирање на Инцепција, TechCrunch дозна дека Mayfield Fund е меѓу нејзините инвеститори. Инцепција веќе обезбеди договори со различни клиенти, вклучувајќи непознати Fortune 100 компании, поради нивните итни потреби за пониска латентност на AI и подобрена брзина, според Ермон. "Нашите модели можат значително поефикасно да користат GPU-ите, " тврди Ермон, реферирајќи на графичките процесорски единици што обично се користат за работа на производствени модели. "Верујам дека ова е трансформативно и ќе ја промени начинот на кој се развиваат јазичните модели. " Компанијата нуди API заедно со опции за имплементација на локални и крајни уреди, поддршка за финна настройка на модели и низа подготвени DLM-ови прилагодени за различни апликации. Инцепција тврди дека нејзините DLM-ови можат да работат до 10 пати побрзо од традиционалните LLMs, при тоа со трошоци кои се 10 пати пониски. Претставник на компанијата информираше TechCrunch: "Нашиот 'мал' модел за кодирање е еднаков на перформансите на [OpenAI's] GPT-4o мини, но работи на повеќе од 10 пати поголема брзина. Нашиот 'мини' модел ги надминува малиот отворен код алтернативи како што е [Meta's] Llama 3. 1 8B, постигнувајќи над 1, 000 токени во секунда. "


Watch video about

Револуционерниот AI модел на Inception: Слив на дифузионна и јазична технологија

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 20, 2025, 1:24 p.m.

5 Културни Атрвјути што Могат да Ја Направат или …

Збор и препишување на „Главната идеја“ за трансформацијата со вештачка интелигенција и организациската култура Трансформацијата со вештачка интелигенција претставува пред сè културолошки предизвик наместо само технолошки

Dec. 20, 2025, 1:22 p.m.

AI Продажен Агенти: Топ 5 Идни Промотори на Прода…

Идеалната цел на бизнисите е да го зголемат обемот на продажбите, но жестоката конкуренција може да го попречи овој цел.

Dec. 20, 2025, 1:19 p.m.

ИИ и SEO: Совршен спој за подобрена онлајн видлив…

Инкорпорацијата на вештачката интелигенција (ВИТ) во стратегиите за оптимизација на пребарувачите (SEO) pangunahing го трансформира начинот на кој претпријатијата ги подобруваат својата онлајн видливост и привлекуваат органски сообраќај.

Dec. 20, 2025, 1:15 p.m.

Напредокови во технологијата за Deepfake: имплика…

Технологијата за длабоки фалсификати неодамна направи значителен напредок, создавајќи високо реалистични манипулирани видеа кои убедливо прикажуваат лица како прават или кажуваат нешта кои всушност не ги правеле.

Dec. 20, 2025, 1:13 p.m.

Отворениот извор на AI на Nvidia: Аквизиција и но…

Нвидиа најави значајно проширување на своите иницијативи за open source, сигнализирајќи стратешка определба за поддршка и напредок на еко-системот open source во високоперформансно пресметување (HPC) и вештачка интелигенција (AI).

Dec. 20, 2025, 9:38 a.m.

Гувернерката на Њујорк, Кети Хочек, потпишува шир…

На 19 декември 2025 година, гувернерката на Њујорк, Кети Хочул, ја потпиша законот за одговорна безбедност и етика во вештачката интелигенција (RAISE), што претставува значаен успешен резултат во регулацијата на напредните технологии на вештачката интелигенција во државата.

Dec. 20, 2025, 9:36 a.m.

Stripe лансира Agentic Commerce Suite за продажба…

Stripe, компанијата за Programmable финансиски услуги, го претстави Agentic Commerce Suite, ново решение кое има за цел да им овозможи на бизнисите да продаваат преку повеќе AI агенти.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today