lang icon En
March 20, 2025, 2:47 a.m.
1930

NVIDIA Lancia Dynamo: Trasformare l'Inferenzia AI per Efficienza e Scalabilità

Brief news summary

NVIDIA ha introdotto NVIDIA Dynamo, un software di inferenza open-source progettato per migliorare l'efficienza e la scalabilità dei modelli di intelligenza artificiale nelle fabbriche di IA. Con il progredire del settore, ottimizzare le entrate dai token e ridurre al minimo i costi di inferenza diventa essenziale. Basato sul Triton Inference Server, Dynamo migliora i compiti di inferenza su più GPU separando le fasi di elaborazione e generazione nei modelli di linguaggio di grandi dimensioni (LLM). Con un'orchestrazione avanzata delle risorse GPU, Dynamo può potenzialmente raddoppiare le prestazioni e le entrate per le fabbriche di IA che utilizzano modelli Llama sulla piattaforma NVIDIA Hopper, aumentando la generazione di token per GPU. Le sue caratteristiche di punta includono un pianificatore GPU dinamico per l'allocazione delle risorse in tempo reale, un router intelligente per una gestione efficiente delle richieste, una libreria di comunicazione a bassa latenza per un rapido trasferimento dei dati e un gestore di memoria specializzato volto a ridurre i costi di inferenza. Supportando vari framework, NVIDIA Dynamo mira a guidare l'adozione dell'inferenza IA negli ambienti aziendali e cloud, facilitando la gestione efficace di modelli di IA complessi garantendo al contempo costi contenuti e alte prestazioni.

**NVIDIA Introduce NVIDIA Dynamo: Rivoluzionando l'Inferenza AI** Durante il GTC, NVIDIA ha lanciato NVIDIA Dynamo, un software di inferenza open-source progettato per migliorare l'efficienza e la scalabilità dei modelli di ragionamento AI mantenendo contenuti i costi. Man mano che il ragionamento AI diventa più diffuso, ottimizzare le richieste di inferenza su una flotta di GPU è essenziale per massimizzare i ricavi. Dynamo, il successore di NVIDIA Triton Inference Server™, aumenta significativamente le prestazioni, raddoppiando i ricavi per le fabbriche AI che utilizzano modelli Llama sulla piattaforma NVIDIA Hopper™. Quando viene eseguito il modello DeepSeek-R1 su un ampio cluster, le ottimizzazioni di Dynamo incrementano la generazione di token di oltre 30 volte per GPU. Le caratteristiche principali di Dynamo includono la capacità di gestire dinamicamente l'allocazione delle GPU in base alla domanda, di trasferire i dati a storage economici e di ottimizzare l'utilizzo delle risorse attraverso l'erogazione disaggregata, in cui l'elaborazione e la generazione della risposta avvengono su GPU diverse. Questo approccio migliora le prestazioni per modelli come la nuova famiglia Llama Nemotron di NVIDIA, migliorando i tempi di risposta tramite un'ottimizzazione indipendente. NVIDIA Dynamo mira a supportare una scalabilità estesa dell'inferenza AI per diverse imprese, tra cui AWS, Google Cloud e altri, facilitando l'adozione dei modelli AI.

Con componenti come un Piano GPU per gestire le risorse, un Router Intelligente per ridurre i calcoli ridondanti e una Libreria Avanzata di Comunicazione a Bassa Latenza, Dynamo semplifica il processo di inferenza. Questa piattaforma tecnologicamente avanzata non solo migliora l'efficienza, ma genera anche significativi risparmi sui costi, allineandosi con le future esigenze dell'AI personalizzata. NVIDIA prevede di integrare Dynamo nei suoi microservizi NIM™ e nella piattaforma software NVIDIA AI Enterprise, che promette sicurezza e supporto di qualità produzione. NVIDIA continua a guidare nel calcolo accelerato, supportata da una gamma dinamica di sviluppi nelle tecnologie AI. Maggiori informazioni sono disponibili tramite il keynote di NVIDIA GTC e sessioni specifiche su Dynamo.


Watch video about

NVIDIA Lancia Dynamo: Trasformare l'Inferenzia AI per Efficienza e Scalabilità

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 1:22 p.m.

AIMM: Framework basato sull'Intelligenza Artifici…

AIMM: Un Framework Innovativo Basato sull'Intelligenza Artificiale per Rilevare Manipolazioni del Mercato Azionario Influenzate dai Social Media Nell'odierno ambiente di trading azionario in rapido cambiamento, i social media sono emersi come una forza chiave nel plasmare le dinamiche di mercato

Dec. 22, 2025, 1:16 p.m.

Esclusiva: Filevine acquisisce Pincites, società …

La società di tecnologia legale Filevine ha acquisito Pincites, una piattaforma di revisione contrattuale guidata dall’intelligenza artificiale, rafforzando la sua presenza nel diritto societario e transazionale e avanzando la sua strategia incentrata sull’AI.

Dec. 22, 2025, 1:16 p.m.

L'impatto dell'IA sulla SEO: Trasformare le prati…

L'intelligenza artificiale (IA) sta rimodellando rapidamente il campo dell'ottimizzazione per i motori di ricerca (SEO), offrendo ai marketer digitali strumenti innovativi e nuove opportunità per affinare le proprie strategie e ottenere risultati superiori.

Dec. 22, 2025, 1:15 p.m.

Vantaggi recenti nella rilevazione di deepfake tr…

I progressi nell'intelligenza artificiale hanno svolto un ruolo fondamentale nella lotta alla disinformazione, consentendo la creazione di algoritmi sofisticati progettati per rilevare i deepfake—video manipolati in cui il contenuto originale viene alterato o sostituito per produrre rappresentazioni false intese a ingannare gli spettatori e diffondere informazioni misleading.

Dec. 22, 2025, 1:14 p.m.

Le 5 migliori sistemi di vendita AI che converton…

L’ascesa dell’IA ha rivoluzionato le vendite sostituendo cicli lunghi e follow-up manuali con sistemi rapidi e automatizzati che operano 24/7.

Dec. 22, 2025, 1:12 p.m.

Ultime notizie su Intelligenza Artificiale e Mark…

Nel rapido e continuo evolversi del campo dell’intelligenza artificiale (IA) e del marketing, recenti sviluppi significativi stanno plasmando l’industria, introducendo nuove opportunità e sfide.

Dec. 22, 2025, 9:22 a.m.

Secondo un rapporto, OpenAI registra margini migl…

La pubblicazione affermava che l'azienda ha migliorato il suo "margine di calcolo", una metrica interna che rappresenta la porzione di ricavi rimanenti dopo aver coperto i costi dei modelli operativi per gli utenti paganti dei suoi prodotti aziendali e consumer.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today