lang icon En
March 20, 2025, 2:47 a.m.
1931

NVIDIA toob turule Dynamo: Teeb AI järeldamise efektiivsemaks ja skaleeritavamaks.

Brief news summary

NVIDIA on tutvustanud NVIDIA Dynamo't, avatud lähtekoodiga järeldustarkvara, mille eesmärk on suurendada AI mudelite efektiivsust ja skalaaritavust AI tehasetes. Kui tööstus areneb, muutub tokeni tulu optimeerimine ja järeldusmaksete minimeerimine hädavajalikuks. Triton Inference Serverile rajatud Dynamo parandab järeldusülesandeid mitme GPU binaarvõimega, lahutades suurte keelemudelite (LLM) töötlemise ja genereerimise etapid. Küpsete GPU ressursside korraldamise abil võib Dynamo potentsiaalselt kahekordistada jõudluse ja tulu AI tehastes, mis kasutavad Llama mudeleid NVIDIA Hopper platvormil, samas suurendades tokenite genereerimist iga GPU kohta. Selle silmapaistvad omadused hõlmavad dünaamilist GPU plaanijat reaalajas ressursside jaotamiseks, nutikat marsruuterit efektiivseks päringute haldamiseks, madala latentsusega suhtlusraamatukogu kiireks andmeedastuseks ning spetsialiseerunud mälu haldurit, mille eesmärk on vähendada järeldusmakseid. Toetades erinevaid raamistikke, püüab NVIDIA Dynamo edendada AI järelduse kasutuselevõttu ettevõtete ja pilves keskkondades, võimaldades keerukate AI mudelite tõhusat haldamist, tagades samas kulutõhususe ja kõrge jõudluse.

**NVIDIA Esitleb NVIDIA Dynamo: AI Järelduste Revolutsioon** GTC-l esitles NVIDIA NVIDIA Dynamo't, avatud lähtekoodiga järeldusprogrammi, mille eesmärk on suurendada AI mõtlemismudelite efektiivsust ja skaleeritavust, vähendades samal ajal kulusid. Kuna AI mõtlemine muutub üha laiemalt levinud, on järeldusosaluste optimeerimine GPU-de flotille äärmiselt oluline tulude maksimeerimise jaoks. Dynamo, NVIDIA Triton Inference Server™ järgija, suurendab jõudlust märkimisväärselt, kahekordistades tulu AI tehastes, mis kasutavad Llama mudeleid NVIDIA Hopper™ platvormil. Suurel klastri DeepSeek-R1 mudeli töötamisel suurendavad Dynamo optimeerimised tokenite genereerimist enam kui 30 korda iga GPU kohta. Dynamo peamised omadused hõlmavad võimalust dünaamiliselt hallata GPU jaotust nõudluse põhjal, andmete ülekandmist kulutõhusasse salvestusse ja ressursside kasutuse optimeerimist läbi jaotamata teenindamise—kus töötlemine ja vastuse genereerimine toimuvad erinevates GPU-des. See lähenemine parandab jõudlust sellistele mudelitele nagu NVIDIA uus Llama Nemotroni perekond, parandades vastamise aegu sõltumatu optimeerimise kaudu. NVIDIA Dynamo eesmärk on toetada ulatuslikku AI järelduste skaleerimist erinevates ettevõtetes, sealhulgas AWS, Google Cloud ja teised, hõlbustades AI mudelite kasutuselevõttu.

Komponendid nagu GPU planeerija ressursside haldamiseks, nutikas marsruuter ülemääraste arvutuste vähendamiseks ja täiustatud madala latentsusega kommunikatsiooniraamatukogu aitavad Dynamo'l järeldusprotsessi sujuvamaks muuta. See tehnoloogiliselt arenenud platvorm mitte ainult ei paranda efektiivsust, vaid toob kaasa ka märkimisväärseid kulude kokkuhoidu, vastates kohandatud mõtlemise AI tuleviku vajadustele. NVIDIA kavatseb integreerida Dynamo oma NIM™ mikroteenustesse ja NVIDIA AI Enterprise tarkvaraplatvormi, mis lubab tootmisvalmis turvalisust ja tuge. NVIDIA jätkab juhtimist kiirendatud arvutamisel, toetatuna dünaamilisest arengust AI tehnoloogiates. Lisainfot on saadaval NVIDIA GTC võtmeettekande ja eriliste sessioonide kaudu Dynamo kohta.


Watch video about

NVIDIA toob turule Dynamo: Teeb AI järeldamise efektiivsemaks ja skaleeritavamaks.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 9:30 a.m.

Google'i Danny Sullivan ja John Mueller AI jaoks …

John Mueller Google’ist korraldas koos Danny Sullivaniga, kes samuti Google’ist on, Search Off the Record podcasti, arutamaks teemat „ Mõtted SEO-st ja AI jaoks

Dec. 23, 2025, 9:26 a.m.

Lexus katsetab generatiivset tehisintellekti uues…

Lühike ülevaade: Lexus on lansseerinud pühade turunduskampaania, mis on loodud generatiivse tehisintellekti abil, teatab pressiteade

Dec. 23, 2025, 9:16 a.m.

2025 oli aasta, mil tehisintellekti loodud videod…

Aastal 2025 toimus sotsiaalmeedias sügavalt muutusi, kuna tehisintellekti loodud videod hakkasid kiiresti domineerima platvormidel nagu YouTube, TikTok, Instagram ja Facebook.

Dec. 23, 2025, 9:15 a.m.

Tehisintellekt tekitab turvalisusprobleemi, mille…

Ettevõtetel võivad olla olemas küberkaitse meeskonnad, kuid paljud jäävad ettevaatlikuks AI süsteemide tegeliku ebaõnnestumise viiside suhtes, väitis AI turvalisuse uurija.

Dec. 23, 2025, 9:07 a.m.

FirstFT: Tehisintellekti võlakoormus ajab USA ett…

Selle saidi oluline komponent ei laadunud üles.

Dec. 23, 2025, 5:21 a.m.

Karjääri muutus 2026. aastal? Kõige lihtsamad teh…

Fotod Paulina Ochoa, Digital Journal Kuidas ligipääsetavad on karjäärid, kus kasutatakse tehisintellekti (TI)? Digitaalõppeplatvormi EIT Campus uus uuring tuvastab Euroopa kõige lihtsamad TI tööde sisseastumisvõimalused aastaks 2026, näidates, et mõne töö jaoks on vajalik ainult 3-6 kuuline koolitus ning teaduskraadi omamine ei ole tingimata nõutav

Dec. 23, 2025, 5:20 a.m.

Tehisintellekt videomängudes: elulisuse ja mängij…

Mängutööstus muutub kiiresti tehisintellekti (AI) tehnoloogiate integreerimise kaudu ning see muudab põhjalikult seda, kuidas mänge arendatakse ja mängijate poolt kogetakse.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today