lang icon En
Feb. 26, 2025, 10:54 p.m.
1946

Rebolusyonaryong AI Model ng Inception: Pagsasama ng Diffusion at Teknolohiyang Wika

Brief news summary

Inception, isang startup na inilunsad ng Stanford professor na si Stefano Ermon sa Palo Alto, ay nagpakilala ng isang makabago at batay sa diffusion na malaking modelo ng wika (DLM). Ang modelong ito ay pinagsasama ang mga lakas ng mga tradisyunal na malaking modelo ng wika (LLMs) at ang mabilis na kakayahan ng pagsasagawa ng mga diffusion model, na kilala sa kanilang kakayahan sa paglikha ng multimedia content tulad ng mga larawan, video, at audio. Ipinaliwanag ni Ermon na ang mga tradisyunal na LLMs ay lumilikha ng teksto nang sunud-sunod, na nagreresulta sa mabagal na output, habang ang mga diffusion model ay gumagamit ng malawak na representasyon ng datos upang mapadali ang sabay-sabay na pagproseso. Ang pag-unlad na ito ay lubos na nagpapabilis sa produksyon ng teksto, isang tagumpay na naabot sa pamamagitan ng masusing pananaliksik ni Ermon at ng kanyang estudyante. Ang pag-unlad na ito ay nakakuha ng interes mula sa mga kumpanya ng Fortune 100 na sabik na mapabuti ang pagganap ng AI sa pamamagitan ng pagbabawas ng latency at pag-optimize ng paggamit ng GPU. Nag-aalok ang Inception ng API at iba't ibang solusyon sa deployment, na nagsasabing ang kanilang DLMs ay makapagbibigay ng mga resulta na hanggang sampung beses na mas mabilis kaysa sa kasalukuyang LLMs habang binabawasan ang mga gastos sa operasyon. Sa malakas na pagbibigay-diin sa kahusayan, layunin ng Inception na maging pangunahing manlalaro sa dynamic na landscape ng AI.

Ang Inception, isang bagong tatag na kumpanya sa Palo Alto, na itinatag ng propesor ng computer science ng Stanford na si Stefano Ermon, ay nag-aangkin ng pagkakalikha ng isang makabagong AI model gamit ang teknolohiyang tinatawag na “diffusion. ” Ang makabagong modelong ito ay tinatawag na diffusion-based large language model, o “DLM” sa madaling salita. Sa kasalukuyan, ang mga generative AI model na nakakakuha ng pinakamaraming atensyon ay maaaring hatiin sa dalawang pangunahing uri: large language models (LLMs) at diffusion models. Ang mga LLM, na dinisenyo sa transformer architecture, ay dalubhasa sa pagbuo ng teksto. Sa kabaligtaran, ang mga diffusion model, ang teknolohiya sa likod ng mga AI platform tulad ng Midjourney at Sora ng OpenAI, ay pangunahing nakatuon sa paglikha ng mga imahe, video, at audio. Ayon sa Inception, ang kanilang modelo ay pinagsasama ang mga kakayahan ng mga tradisyunal na LLM—tulad ng pagbuo ng code at pagsasagot sa mga tanong—na may pinakamalaking napahusay na bilis at mas mababang gastos sa computing. Ibinahagi ni Ermon sa TechCrunch na matagal na niyang sinisiyasat ang aplikasyon ng mga diffusion model sa pagbuo ng teksto sa kanyang research lab sa Stanford. Ang kanyang trabaho ay umusbong mula sa obserbasyon na ang mga tradisyunal na LLM ay tumatakbo sa mas mabagal na bilis kumpara sa mga teknolohiyang diffusion. Ipinaliwanag ni Ermon na sa mga LLM, “hindi mo maaring buuin ang pangalawang salita hangga’t hindi mo pa nagagawa ang una, at ang pangatlong salita ay hindi maaring likhain hangga’t hindi kumpleto ang unang dalawa. ” Naghahanap ng paraan upang ilapat ang mga mekanismo ng diffusion sa pagbuo ng teksto, napansin ni Ermon na, sa kabaligtaran ng mga LLM na tumatakbo nang sunud-sunod, ang mga diffusion model ay nagsisimula sa isang magaspang na pagsasampol ng output (halimbawa, isang imahe) at pinapahusay ang datos nang komprehensibo sa isang pagkakataon. Teorisado ni Ermon na ang paglikha at pagbabago ng malalaking bloke ng teksto nang sabay-sabay ay maaaring maisakatuparan gamit ang mga diffusion model.

Pagkatapos ng ilang taong pananaliksik, siya at isang estudyante niya ay nakamit ang isang makabuluhang tagumpay, na kanilang dokumentado sa isang research paper na inilathala noong nakaraang taon. Nang makilala ang potensyal ng pag-unlad na ito, itinatag ni Ermon ang Inception noong nakaraang tag-init, kasama ang mga dating estudyanteng sina Aditya Grover, isang propesor sa UCLA, at Volodymyr Kuleshov mula sa Cornell University upang mag-co-lead sa proyektong ito. Bagamat pinili ni Ermon na hindi ipahayag ang tiyak na mga detalye ng pagpopondo para sa Inception, nalaman ng TechCrunch na ang Mayfield Fund ay kabilang sa mga namumuhunan nito. Nakakuha na ang Inception ng mga kontrata mula sa iba't ibang kliyente, kabilang ang mga hindi pinangalanang Fortune 100 na kumpanya, sa pamamagitan ng pagtugon sa kanilang mga kagyat na pangangailangan para sa mas mababang latency ng AI at pinahusay na bilis, ayon kay Ermon. “Ang aming mga modelo ay maaaring gumamit ng GPUs nang mas mahusay, ” iginiit ni Ermon, na tumutukoy sa mga graphics processing unit na karaniwang ginagamit sa pagpapatakbo ng mga production model. “Naniniwala ako na ito ay nagbabago at babaguhin ang paraan kung paano nade-develop ang mga language model. ” Nagbibigay ang kumpanya ng isang API kasama ang mga pagpipilian para sa on-premises at edge device deployments, suporta para sa fine-tuning ng modelo, at isang hanay ng mga handang gamitin na DLM para sa iba't ibang aplikasyon. Ipinagmamalaki ng Inception na ang kanilang mga DLM ay maaaring tumakbo ng hanggang 10 beses na mas mabilis kaysa sa mga tradisyunal na LLM habang may gastos na 10 beses na mas mababa. Pahayag ng isang kinatawan ng kumpanya sa TechCrunch, “Ang aming ‘maliit’ na modelo ng coding ay katumbas ng pagganap ng [OpenAI’s] GPT-4o mini ngunit tumatakbo sa higit sa 10 beses na bilis. Ang aming ‘mini’ na modelo ay humah surpass sa mga maliit na open-source alternatives tulad ng [Meta’s] Llama 3. 1 8B, na umaabot ng mahigit 1, 000 tokens kada segundo. ”


Watch video about

Rebolusyonaryong AI Model ng Inception: Pagsasama ng Diffusion at Teknolohiyang Wika

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 5:37 a.m.

Ang mga AI-Generated Deepfake na Video ay Nagdudu…

Ang mabilis na pag-unlad ng artipisyal na intelihensiya ay nagdulot ng kahanga-hangang mga inobasyon, partikular na ang teknolohiyang deepfake.

Dec. 19, 2025, 5:28 a.m.

Si Yann LeCun ng Meta Nakatutok sa Pagtataya ng H…

Si Yann LeCun, isang kilalang eksperto sa AI at malapit nang umalis na bilang pangunahing siyentipiko ng AI sa Meta, ay magpapasimula ng isang makabagbag-damdaming startup sa AI.

Dec. 19, 2025, 5:24 a.m.

Inilunsad ng US ang pagsusuri sa pagbebenta ng mg…

Pinangunahan ng administrasyong Trump ang isang masusing pagsusuri sa pagitan ng mga kagawaran upang isaalang-alang ang pag-apruba sa pag-export ng mga advanced na Nvidia H200 AI chips papuntang Tsina, na isang makabuluhang pagbabago mula sa mga restriksyon noong panahon ni Biden na halos nagbawal sa ganitong uri ng mga benta.

Dec. 19, 2025, 5:24 a.m.

Bakit Napasama Nang Sobrang Lala ang AI Christmas…

Noong Disyembre 2025, inilabas ng McDonald's Netherlands ang isang patalastas para sa Pasko na pinamagatang "It's the Most Terrible Time of the Year," na likha nang buong-buo ng artipisyal na katalinuhan.

Dec. 19, 2025, 5:21 a.m.

Rebolusyon ng AI SEO: Ang Pangangailangan ng Pags…

Ang digital marketing ay nakararanas ng isang malaking pagbabago na pinapalakas ng pag-usbong ng artificial intelligence (AI) sa search engine optimization (SEO).

Dec. 18, 2025, 1:30 p.m.

Micron nagbigay ng positibong tinatanaw na benta …

Bloomberg Ang Micron Technology Inc

Dec. 18, 2025, 1:29 p.m.

Ang Balita at Kaalamang-Kaalaman na Kailangan mo …

Ang kumpiyansa sa generative artificial intelligence (AI) sa gitna ng mga nangungunang propesyonal sa advertising ay umabot sa walang katulad na antas, ayon sa isang kamakailang pag-aaral ng Boston Consulting Group (BCG).

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today