lang icon En
March 20, 2025, 2:47 a.m.
1952

NVIDIA Melancarkan Dynamo: Mengubah Inferens AI untuk Kecekapan dan Skala

Brief news summary

NVIDIA telah memperkenalkan NVIDIA Dynamo, sebuah perisian inferens sumber terbuka yang bertujuan untuk meningkatkan kecekapan dan kebolehan skala model AI di kilang AI. Dengan perkembangan dalam industri, mengoptimumkan pendapatan token dan meminimumkan kos inferens menjadi penting. Dibina di atas Triton Inference Server, Dynamo meningkatkan tugas inferens merentasi pelbagai GPU dengan memisahkan tahap pemprosesan dan penjanaan dalam model bahasa besar (LLM). Dengan pengurusan sumber GPU yang maju, Dynamo berpotensi menggandakan prestasi dan pendapatan untuk kilang AI yang menggunakan model Llama pada platform NVIDIA Hopper, sambil meningkatkan penjanaan token bagi setiap GPU. Ciri-ciri utamanya termasuk perancang GPU dinamik untuk pengagihan sumber secara masa nyata, penghala pintar untuk pengurusan permintaan yang cekap, perpustakaan komunikasi latensi rendah untuk pemindahan data yang cepat, dan pengurus memori khusus yang bertujuan mengurangkan kos inferens. Dengan menyokong pelbagai rangka kerja, NVIDIA Dynamo bercita-cita untuk memacu penerimaan inferens AI dalam persekitaran perusahaan dan awan, memudahkan pengurusan model AI yang kompleks dengan memastikan keberkesanan kos dan prestasi tinggi.

**NVIDIA Memperkenalkan NVIDIA Dynamo: Merevolusi Inferens AI** Di GTC, NVIDIA melancarkan NVIDIA Dynamo, perisian inferens sumber terbuka yang direka untuk mempertingkatkan kecekapan dan kebolehkendalian model pemikiran AI sambil mengurangkan kos. Dengan penyebaran pemikiran AI yang semakin meluas, mengoptimumkan permintaan inferens di seluruh kumpulan GPU adalah penting untuk memaksimumkan pendapatan. Dynamo, pengganti kepada NVIDIA Triton Inference Server™, secara ketara meningkatkan prestasi, menggandakan pendapatan untuk kilang AI yang menggunakan model Llama di platform NVIDIA Hopper™. Apabila menjalankan model DeepSeek-R1 pada kluster besar, pengoptimuman Dynamo meningkatkan penghasilan token lebih daripada 30 kali setiap GPU. Ciri utama Dynamo termasuk kemampuan untuk mengurus pengagihan GPU secara dinamik berdasarkan permintaan, memindahkan data ke penyimpanan yang kos efektif, dan mengoptimumkan penggunaan sumber melalui penyajian terpisah—di mana pemprosesan dan penjanaan respons berlaku pada GPU yang berbeza. Pendekatan ini meningkatkan prestasi model seperti keluarga Llama Nemotron yang baru dari NVIDIA, dengan meningkatkan masa respons melalui pengoptimuman yang bebas. NVIDIA Dynamo bertujuan untuk menyokong penskalaan inferens AI yang luas untuk pelbagai syarikat, termasuk AWS, Google Cloud, dan lain-lain, memudahkan penerimaan model AI.

Dengan komponen seperti Perancang GPU untuk mengurus sumber, Penghala Pintar untuk meminimumkan pengiraan berulang, dan Perpustakaan Komunikasi Rendah-Latensi yang canggih, Dynamo memperkemaskan proses inferens. Platform yang canggih ini bukan sahaja meningkatkan kecekapan tetapi juga mendorong penjimatan kos yang ketara, sejajar dengan keperluan masa depan bagi AI pemikiran khusus. NVIDIA merancang untuk mengintegrasikan Dynamo ke dalam mikroservis NIM™ dan platform perisian NVIDIA AI Enterprise, yang menjanjikan keselamatan dan sokongan tahap pengeluaran. NVIDIA terus memimpin dalam pengkomputeran yang dipercepat, disokong oleh pelbagai perkembangan dinamik dalam teknologi AI. Maklumat lanjut boleh didapati melalui ucaptama NVIDIA GTC dan sesi khusus mengenai Dynamo.


Watch video about

NVIDIA Melancarkan Dynamo: Mengubah Inferens AI untuk Kecekapan dan Skala

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 27, 2025, 1:23 p.m.

AI Mempercepat Transformasi Digital Dalam Industr…

Di SMM 2024, pameran perdagangan maritim antarabangsa utama yang diadakan di Hamburg, peranan penting kecerdasan buatan (AI) dalam mempercepat transformasi digital industri maritim dipersembahkan secara menonjol.

Dec. 27, 2025, 1:23 p.m.

-Demokrat memberi amaran bahawa membenarkan Trump…

Demokrat Kongres menyampaikan kebimbangan serius mengenai kemungkinan bahawa Amerika Syarikat akan mula menjual cip canggih kepada salah satu pesaing geopolitik utamanya tidak lama lagi.

Dec. 27, 2025, 1:22 p.m.

AlphaCode Google DeepMind: Era Baharu dalam Penga…

Google DeepMind baru-baru ini memperkenalkan satu sistem kecerdasan buatan inovatif yang dipanggil AlphaCode, menandakan lonjakan penting dalam pembangunan perisian yang dibantu AI.

Dec. 27, 2025, 1:20 p.m.

Kumpulan pembiayaan OpenAI: pengumpulan dana seba…

OpenAI dilaporkan sedang bersedia untuk mengumpul dana baharu sehingga US$100 bilion, berpotensi meningkatkan penilaiannya kepada US$830 bilion yang menakjubkan.

Dec. 27, 2025, 1:14 p.m.

Permainan Video AI Mencapai Satu Pencapaian dalam…

Industri permainan sedang mengalami transformasi besar yang didorong oleh kecerdasan buatan (AI) canggih, terutamanya dalam rendering grafik yang realistik.

Dec. 27, 2025, 1:12 p.m.

Alat SEO Berkuasa AI: Merevolusikan Strategi Pema…

Kecerdasan Buatan (AI) sedang mengubah pemasaran digital secara mendalam, memberikan impak besar kepada Pengoptimuman Enjin Carian (SEO).

Dec. 27, 2025, 9:35 a.m.

Cara Menilai Ketelusan AI dalam Alat Pemasaran: F…

Rebekah Carter Kenaikan pesat AI dalam pemasaran adalah luar biasa—dari ujian awal penjana kandungan hinggalah AI kini membentuk keseluruhan bajet iklan, saluran kandungan, dan segmen pelanggan

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today