lang icon En
March 20, 2025, 2:47 a.m.
1918

NVIDIA lansira Dynamo: Transformiše AI inferenciju za efikasnost i skalabilnost.

Brief news summary

NVIDIA je predstavila NVIDIA Dynamo, open-source softver za inferencu koji ima za cilj da poboljša efikasnost i skalabilnost AI modela u AI fabrikama. Kako industrija napreduje, optimizacija prihoda od tokena i minimizacija troškova inferencije postaju ključni. Zasnovan na Triton Inference Serveru, Dynamo poboljšava inferencione zadatke na više GPU-a razdvajanjem faza obrade i generacije u velikim jezičkim modelima (LLM). Sa naprednom orkestracijom GPU resursa, Dynamo može potencijalno udvostručiti performanse i prihode za AI fabrike koje koriste Llama modele na NVIDIA Hopper platformi, dok istovremeno povećava generaciju tokena po GPU-u. Njegove istaknute karakteristike uključuju dinamički planirator GPU-a za real-time alokaciju resursa, pametan router za efikasno upravljanje zahtevima, biblioteku za komunikaciju sa niskom latencijom za brzi prenos podataka i specijalizovani menadžer memorije usmeren na smanjenje troškova inferencije. Podržavajući različite okvire, NVIDIA Dynamo nastoji da podstakne usvajanje AI inferencije u preduzećima i cloud okruženjima, olakšavajući efikasno upravljanje složenim AI modelima dok obezbeđuje isplativost i visoke performanse.

**NVIDIA Uvodi NVIDIA Dynamo: Revolucija u AI Inferenciji** Na GTC-u, NVIDIA je predstavila NVIDIA Dynamo, open-source softver za inferenciju koji je dizajniran da poboljša efikasnost i skalabilnost modela AI rezonovanja uz minimalizaciju troškova. Kako AI rezonovanje postaje sve prisutnije, optimizacija zahteva za inferenciju preko flote GPU-a je ključna za maksimizaciju prihoda. Dynamo, naslednik NVIDIA Triton Inference Server™, značajno poboljšava performanse, duplirajući prihode za AI fabrike koje koriste Llama modele na NVIDIA Hopper™ platformi. Kada se pokreće model DeepSeek-R1 na velikom klasteru, optimizacije u Dynamu povećavaju generaciju tokena više od 30 puta po GPU-u. Ključne karakteristike Dynamoa uključuju mogućnost dinamičkog upravljanja alokacijom GPU-a na osnovu potražnje, premeštanje podataka u ekonomične skladišne resurse i optimizaciju korišćenja resursa putem disaggregated serving—gde se obrada i generisanje odgovora odvijaju na različitim GPU-ima. Ovaj pristup poboljšava performanse za modele kao što je nova Llama Nemotron porodica, poboljšavajući vreme odgovora preko nezavisne optimizacije. NVIDIA Dynamo ima za cilj da podrži široku skalabilnost AI inferencije za razne kompanije, uključujući AWS, Google Cloud i druge, olakšavajući usvajanje AI modela.

Sa komponentama kao što su GPU planer za upravljanje resursima, pametni ruter za minimizaciju redundantnih proračuna i napredna biblioteka za komunikaciju sa niskom latencijom, Dynamo pojednostavljuje proces inferencije. Ova tehnološki napredna platforma ne samo da poboljšava efikasnost, već takođe stvara značajne uštede, usklađujući se sa budućim potrebama prilagođenog AI rezonovanja. NVIDIA planira da integriše Dynamo u svoje NIM™ mikroservise i NVIDIA AI Enterprise softversku platformu, koja obećava sigurnost i podršku na nivou proizvodnje. NVIDIA nastavlja da prednjači u akcelerisanom računarstvu, podržana dinamičnim rasponom razvoja u AI tehnologijama. Više informacija je dostupno preko NVIDIA GTC glavnog izlaganja i specifičnih sesija o Dynamu.


Watch video about

NVIDIA lansira Dynamo: Transformiše AI inferenciju za efikasnost i skalabilnost.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 9:34 a.m.

Podaci Salesforcea otkrivaju da veštačka intelige…

Salesforce je objavio detaljno izveštavanje o događaju kupovine tokom Cyber Week 2025, analizirajući podatke sa više od 1,5 milijardi globalnih potrošača.

Dec. 21, 2025, 9:28 a.m.

Uticaj veštačke inteligencije na digitalne reklam…

Tehnologije veštačke inteligencije (VI) postale su centralna sila u transformaciji digitalnog oglašavanja.

Dec. 21, 2025, 9:25 a.m.

Ova tihi kompanija za veštačku inteligenciju Mogl…

Dramatičan rast tehnoloških akcija u poslednje dve godine obogatio je mnoge investitore, i dok slave uspehe sa kompanijama poput Nvidia, Alphabet i Palantir Technologies, ključno je tražiti sledeću veliku priliku.

Dec. 21, 2025, 9:24 a.m.

Sistemi za nadzor video nadzorom zasnovani na veš…

U poslednjim godinama, gradovi širom sveta sve više integrišu veštačku inteligenciju (VI) u sisteme video nadzora radi poboljšanja praćenja javnih prostora.

Dec. 21, 2025, 9:14 a.m.

Generativna Optimizacija Mekana (GEO): Kako rangi…

Pretraga je evoluirao od plavih linkova i liste ključnih reči; sada ljudi direktno postavljaju pitanja AI alatima poput Google SGE, Bing AI i ChatGPT.

Dec. 21, 2025, 5:27 a.m.

Nezavisne delatnosti: Jesu li vaše online prodaje…

Želeli bismo da saznamo više o tome kako su nedavne promene u ponašanju pri online pretraživanju, izazvane usponom veštačke inteligencije, uticale na vaše poslovanje.

Dec. 21, 2025, 5:23 a.m.

Google kaže šta reći klijentima koji žele SEO za …

Danny Sullivan iz Google-a pružio je smernice SEO stručnjacima koji se suočavaju s klijentima željnim najnovijih informacija o strategijama SEO za veštačku inteligenciju.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today