NVIDIA's Colossus: Größter KI-Supercomputer der Welt mit 100.000 Hopper GPUs
Brief news summary
NVIDIA hat den xAI Colossus Supercomputer-Cluster in Memphis gestartet, der nun als der größte KI-Supercomputer weltweit anerkannt wird und mit 100.000 NVIDIA Hopper GPUs ausgestattet ist. Colossus, optimiert für hyper-skalierte KI-Anwendungen, nutzt das NVIDIA Spectrum-X™ Ethernet-Netzwerk, das Standard-Ethernet mit Remote Direct Memory Access (RDMA)-Technologie kombiniert. Dieser fortschrittliche Supercomputer ist hauptsächlich für das Training großer Grok-Sprachmodelle für Chatbots konzipiert, die auf X Premium-Abonnenten abzielen, mit ehrgeizigen Plänen, in Zukunft auf 200.000 GPUs zu skalieren. In beeindruckenden 122 Tagen gebaut, liefert Colossus herausragende Leistung mit null Latenz, keinem Paketverlust und einem Datendurchsatz von 95% — was die typische 60% Leistung von Standardsystemen Ethernet deutlich übertrifft. Elon Musk hat das Potenzial des Supercomputers für transformative Auswirkungen gelobt und die entscheidende Rolle von NVIDIA im Großmaßstab-KI-Modelltraining hervorgehoben. Die Spectrum-X-Plattform umfasst den SN5600 Ethernet-Switch, der Geschwindigkeiten von bis zu 800 Gb/s schaffen kann und eine adaptive Routenführung bietet, die für die Verbesserung von KI-Cloud-Operationen entscheidend ist. NVIDIA bleibt an der Spitze der beschleunigten Datenverarbeitung und KI-Entwicklungen, während darauf hingewiesen wird, dass die tatsächlichen Leistungsergebnisse in verschiedenen Märkten und Technologien variieren können.NVIDIA hat bekannt gegeben, dass xAI's Colossus-Supercomputer-Cluster, ausgestattet mit 100. 000 NVIDIA Hopper GPUs in Memphis, Tennessee, diese Größe mit der NVIDIA Spectrum-X™ Ethernet-Netzwerkplattform erreicht hat. Diese Plattform ist für optimale Leistung in großen KI-Fabriken entwickelt, wobei auf Standards basierendes Ethernet für sein Remote Direct Memory Access (RDMA)-Netzwerk genutzt wird. Colossus, jetzt der größte KI-Supercomputer der Welt, wird verwendet, um xAI's Grok-Familie von großen Sprachmodellen zu trainieren, darunter Chatbots für X Premium-Abonnenten. xAI plant, Colossus auf insgesamt 200. 000 Hopper GPUs zu erweitern. Aufgebaut in bemerkenswerten 122 Tagen – eine signifikante Verkürzung gegenüber dem typischen Zeitrahmen für solche Systeme – begann Colossus das Training nur 19 Tage nach der Einrichtung des ersten Racks. Während des Trainings des umfangreichen Grok-Modells erlebt Colossus eine außergewöhnliche Netzwerkleistung, indem es 95% Durchsatz beibehält und keine Anwendungslatenzverschlechterung oder Paketverlust aufgrund der Spectrum-X-Staukontrolle erfährt. Im Gegensatz dazu hat Standard-Ethernet Schwierigkeiten mit Flusskollisionen und erreicht nur 60% Datendurchsatz. Gilad Shainer, NVIDIA's Senior Vice President für Netzwerke, betonte die kritische Natur von KI, die verbesserte Leistung, Sicherheit, Skalierbarkeit und Kosteneffizienz erfordert, die die Spectrum-X Plattform für Innovatoren wie xAI bietet.
Elon Musk lobte Colossus als das „leistungsstärkste Trainingssystem der Welt“ und erkannte die Bemühungen von xAI und NVIDIA an. Ein xAI-Sprecher betonte, dass die Kombination von NVIDIA's Hopper GPUs und Spectrum-X-Technologie ein noch nie da gewesenes Training von KI-Modellen in großem Maßstab ermöglicht. Zentral für die Spectrum-X-Plattform ist der Spectrum SN5600 Ethernet-Switch, der Geschwindigkeiten von bis zu 800 Gb/s unterstützt, kombiniert mit NVIDIA’s BlueField-3® SuperNICs für verbesserte Leistung. Das Spectrum-X Ethernet-Netzwerk bringt fortschrittliche Funktionen, die zuvor nur mit InfiniBand assoziiert wurden, darunter adaptive Routenführung, Staukontrolle und verbesserte Sichtbarkeit und Leistung für Multi-Tenant-KI-Umgebungen. NVIDIA führt in der beschleunigten Datenverarbeitung, aber zukunftsgerichtete Aussagen über die Vorteile und die Leistung seiner Technologien tragen Risiken, die die tatsächlichen Ergebnisse beeinflussen können. Faktoren wie globale wirtschaftliche Bedingungen, Abhängigkeit von Dritten und technologische Konkurrenz können die Ergebnisse beeinflussen. NVIDIA liefert regelmäßig Updates durch SEC-Filings. © 2024 NVIDIA Corporation. Alle Rechte vorbehalten.
Watch video about
NVIDIA's Colossus: Größter KI-Supercomputer der Welt mit 100.000 Hopper GPUs
Try our premium solution and start getting clients — at no cost to you