lang icon En
March 20, 2025, 2:47 a.m.
1919

NVIDIA Inilunsad ang Dynamo: Paghuhubog ng AI Inference para sa Kahusayan at Scalability

Brief news summary

Nagpakilala ang NVIDIA ng NVIDIA Dynamo, isang open-source na software para sa inferensiya na naglalayong mapabuti ang kahusayan at scalability ng mga AI model sa mga AI factory. Sa pag-unlad ng industriya, nagiging mahalaga ang pag-optimize ng kita mula sa token at pagbabawas ng mga gastos sa inferensiya. Naka-base ito sa Triton Inference Server, pinahusay ng Dynamo ang mga gawain sa inferensiya sa maraming GPU sa pamamagitan ng paghiwalay ng mga yugto ng pagproseso at pagbuo sa malalaking modelo ng wika (LLMs). Sa advanced na orkestra ng mga mapagkukunang GPU, maaaring doblehin ng Dynamo ang pagganap at kita para sa mga AI factory na gumagamit ng mga Llama model sa NVIDIA Hopper platform, habang pinapadami ang paggawa ng token sa bawat GPU. Ang mga pangunahing katangian nito ay kinabibilangan ng dynamic GPU planner para sa real-time na pamamahagi ng mga mapagkukunan, isang smart router para sa epektibong pamamahala ng mga kahilingan, isang low-latency communication library para sa mabilis na paglilipat ng data, at isang espesyal na memory manager na naglalayong bawasan ang mga gastos sa inferensiya. Sa pagsuporta sa iba't ibang frameworks, layunin ng NVIDIA Dynamo na pasiglahin ang paggamit ng AI inferensiya sa mga enterprise at cloud environments, na nag-facilitate ng epektibong pamamahala ng mga komplikadong modelo ng AI habang tinitiyak ang pagiging cost-effective at mataas na pagganap.

**NVIDIA Inilunsad ang NVIDIA Dynamo: Rebolusyonaryo sa AI Inference** Sa GTC, inilunsad ng NVIDIA ang NVIDIA Dynamo, isang open-source na software para sa inference na dinisenyo upang mapahusay ang kahusayan at scalability ng mga modelo ng AI reasoning habang pinapababa ang mga gastos. Habang lumalawak ang paggamit ng AI reasoning, mahalaga ang pag-optimize ng mga inference request sa isang grupo ng mga GPU para sa pinakamataas na kita. Ang Dynamo, na kahalili ng NVIDIA Triton Inference Server™, ay lubos na nagpapabuti sa pagganap, pinapadoble ang kita para sa mga pabrika ng AI na gumagamit ng Llama models sa NVIDIA Hopper™ platform. Kapag pinapatakbo ang DeepSeek-R1 model sa isang malaking cluster, ang mga ini-optimize ng Dynamo ay nagpapataas ng generation ng token ng higit sa 30 beses bawat GPU. Kabilang sa mga pangunahing tampok ng Dynamo ang kakayahang dinamikong pamahalaan ang alokasyon ng GPU batay sa demand, pag-aalis ng data sa cost-effective na storage, at pag-optimize ng paggamit ng yaman sa pamamagitan ng disaggregated serving—kung saan ang pagproseso at pagbuo ng tugon ay nangyayari sa iba't ibang GPU. Ang pamamaraang ito ay nagpapabuti sa pagganap para sa mga modelo tulad ng bagong Llama Nemotron family ng NVIDIA, na nagpapabilis sa mga oras ng tugon sa pamamagitan ng independent optimization. Layunin ng NVIDIA Dynamo na suportahan ang malawak na scalability ng AI inference para sa iba't ibang negosyo, kabilang ang AWS, Google Cloud, at iba pa, Pinadali ang pagtanggap ng mga modelo ng AI.

Sa mga bahagi tulad ng GPU Planner upang pamahalaan ang mga yaman, isang Smart Router upang bawasan ang mga redundant computations, at isang advanced Low-Latency Communication Library, pinadali ng Dynamo ang proseso ng inference. Ang makabagong platform na ito ay hindi lamang nagpapabuti sa kahusayan kundi nagdadala rin ng makabuluhang pagtitipid sa gastos, na umaayon sa mga hinaharap na pangangailangan ng custom reasoning AI. Plano ng NVIDIA na isama ang Dynamo sa kanyang NIM™ microservices at sa NVIDIA AI Enterprise software platform, na nangangako ng production-grade security at suporta. Patuloy na nangunguna ang NVIDIA sa accelerated computing, suportado ng isang dynamic na hanay ng mga pag-unlad sa teknolohiya ng AI. Higit pang impormasyon ay magagamit sa pamamagitan ng keynote ng NVIDIA GTC at mga partikular na session sa Dynamo.


Watch video about

NVIDIA Inilunsad ang Dynamo: Paghuhubog ng AI Inference para sa Kahusayan at Scalability

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

Mga Kagamitan sa AI para sa Pagsusuri ng Nilalama…

Ang mga plataporma ng social media ay lalong gumagamit ng artipisyal na intelihensiya (AI) upang mapabuti ang kanilang pagpapalawig sa moderation ng video content, bilang pagtugon sa pagdami ng mga video bilang pangunahing anyo ng online na komunikasyon.

Dec. 21, 2025, 1:38 p.m.

Binabalikan ng US ang kanilang mga limitasyon sa …

BALIK-PAKON NG PATakaran: Matapos ang mga taon ng pagpapatibay ng mga restriksyon, ang desisyon na payagan ang pagbebenta ng mga Nvidia H200 chips sa China ay nagpasiklab ng mga pagtutol mula sa ilan sa mga Republican.

Dec. 21, 2025, 1:38 p.m.

Ang AI ang nasa likod ng mahigit 50,000 na pagkak…

Ang mga pagtanggal ng trabaho na dulot ng artificial intelligence ay markado sa merkado ng trabaho noong 2025, kung saan ang mga malalaking kumpanya ay nag-anunsyo ng libu-libong pagtanggal ng trabaho na iniuugnay sa pag-unlad ng AI.

Dec. 21, 2025, 1:36 p.m.

Inilunsad ang Perplexity SEO Services – ANG NEWME…

Pinapalakas ng RankOS™ ang Nakikita ng Brand at Pagbanggit sa Perplexity AI at Iba pang Search Platform na Pangkatanungan Serbisyo ng Perplexity SEO Agency New York, NY, Disyembre 19, 2025 (GLOBE NEWSWIRE) — Ngayon, ipinakilala ng NEWMEDIA

Dec. 21, 2025, 1:22 p.m.

Ang family office ni Eric Schmidt ay namumuhunan …

Isang orihinal na bersyon ng artikulong ito ay lumabas sa CNBC's Inside Wealth newsletter, na isinulat ni Robert Frank, bilang isang lingguhang mapagkukunan para sa mga mahahalagang investor at mamimili.

Dec. 21, 2025, 1:21 p.m.

Pangunahing Paghahatid tungkol sa Kinabukasan ng …

Nakatuon ang mga headline sa billion-dollar na investment ng Disney sa OpenAI at nanghuhula kung bakit pinili ng Disney ang OpenAI kaysa sa Google, na kanilang kasalukuyang inuusig dahil sa diumano’y paglabag sa copyright.

Dec. 21, 2025, 9:34 a.m.

Ipinapakita ng datos mula sa Salesforce na ang AI…

Naglabas ang Salesforce ng isang detalyadong ulat tungkol sa Cyber Week shopping event noong 2025, na sinusuri ang datos mula sa mahigit 1.5 bilyong shopaholic sa buong mundo.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today