DeepSeeks V3-Modell übertrifft Technologieriesen durch Budget-Innovation.

DeepSeek's V3-Modell wurde über zwei Monate für 5, 58 Millionen US-Dollar entwickelt und nutzte dabei weniger Rechenressourcen als seine Wettbewerber. Lesezeit: 2 Minuten Warum Sie SCMP vertrauen können Berichtet von Ben Jiang in Peking Veröffentlicht und aktualisiert: 18:45 Uhr, 27. Dezember 2024 DeepSeek, ein chinesisches Start-up, hat die globale KI-Branche mit seinem neuen großen Sprachmodell (LLM) aufgerüttelt, das in Benchmark-Tests Modelle von Meta Platforms und dem ChatGPT-Ersteller OpenAI übertroffen hat. Das in Hangzhou ansässige Unternehmen gab am Donnerstag über WeChat bekannt, dass sein LLM, DeepSeek V3, über 671 Milliarden Parameter verfügt und in etwa zwei Monaten für 5, 58 Millionen US-Dollar trainiert wurde.
Dabei verwendete es bemerkenswert weniger Rechenressourcen als die von größeren Technologiefirmen entwickelten Modelle. Ein LLM unterstützt generative KI-Dienste wie ChatGPT, und eine hohe Parameteranzahl ist entscheidend für die Anpassung an komplexe Datenmuster und die Erstellung präziser Vorhersagen. Der Informatiker Andrej Karpathy, ein Gründungsmitglied des OpenAI-Teams, kommentierte den Bericht des chinesischen Start-ups über sein neues KI-Modell auf der Social-Media-Plattform X: „DeepSeek macht es einfach . . . mit einem offenen Gewichts-Release eines erstklassigen LLM, das mit einem Witz von einem Budget trainiert wurde. “ Offene Gewichte bedeuten die Veröffentlichung nur der vortrainierten Parameter oder Gewichte eines KI-Modells, wodurch Dritte das Modell für Inferenz und Feinabstimmung nutzen können, aber nicht den Trainingscode, den ursprünglichen Datensatz, Architekturdetails und die Trainingsmethodik erhalten. Die Schaffung eines starken LLMs durch DeepSeek mit einem weit geringeren Budget als das, was größere Unternehmen wie Meta und OpenAI normalerweise investieren, unterstreicht den Fortschritt chinesischer KI-Unternehmen, trotz US-Sanktionen, die ihren Zugang zu fortschrittlichen Halbleitern einschränken, die für das Training von Modellen erforderlich sind.
Brief news summary
Das chinesische Start-up DeepSeek hat in der globalen KI-Szene mit der Veröffentlichung seines neuen großen Sprachmodells (LLM), DeepSeek V3, für Aufsehen gesorgt. Mit 671 Milliarden Parametern wurde es in nur zwei Monaten zu Kosten von 5,58 Millionen US-Dollar trainiert. Trotz der Nutzung von weniger Rechenressourcen im Vergleich zu Giganten wie Meta und OpenAI übertraf DeepSeek V3 seine Konkurrenten in Benchmark-Tests. Dieser Erfolg zeigt den Fortschritt chinesischer KI-Unternehmen, selbst angesichts der US-Sanktionen, die den Zugang zu fortschrittlichen Halbleitern einschränken. DeepSeek V3 ist für generative KI-Dienste essenziell, da es in der Lage ist, komplexe Daten zu verwalten und präzise Vorhersagen zu liefern. Andrej Karpathy von OpenAI lobte DeepSeeks effizienten Trainingsansatz, der durch das Teilen nur vortrainierter Gewichte erreicht wurde, wodurch andere das Modell nutzen können, ohne seinen Trainingscode oder seine Datensätze offenzulegen. Diese innovative Strategie markiert einen wichtigen Schritt für chinesische KI-Firmen im hart umkämpften globalen Markt.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

Kryptos kühnter Versuch, den Aktienmarkt auf der …
Melden Sie sich an, um auf Ihr Portfolio zuzugreifen Anmelden

Meta sucht 29 Milliarden Dollar bei Private-Credi…
Meta Platforms befindet sich derzeit in fortgeschrittenen Verhandlungen mit mehreren renommierten Investmentfirmen – darunter Apollo Global Management, KKR, Brookfield, Carlyle und PIMCO – mit dem Ziel, 29 Milliarden US-Dollar zu mobilisieren, um den Ausbau von KI-fokussierten Rechenzentren in den Vereinigten Staaten zu unterstützen.

Digital Asset sammelt 135 Millionen Dollar ein, u…
Die am Dienstag (24.

Der Aufstieg der KI-Resurrection: Ethische und ps…
Der Aufstieg der künstlichen Intelligenz hat ein komplexes Phänomen namens „digitale Auferstehung“ eingeführt, bei dem Technologie die Bilder, Stimmen und Verhaltensweisen Verstorbener rekonstruiert.

Erstmals sind SpaceX-Aktien jetzt über Blockchain…
Einst träumte ich davon, Astronaut zu werden.

Trump plant einstweilige Verfügungen, um das Wach…
Die Trump-Regierung bereitet aktiv eine Reihe von Exekutivmaßnahmen vor, um den Ausbau der künstlichen Intelligenz (KI)-Technologien in den Vereinigten Staaten zu beschleunigen.

GENIUS-Gesetz Fortschritte im Senat, Stabilcoin-G…
Der Senat hat die Debatte über den parteiübergreifenden GENIUS-Gesetzentwurf ("Gearing Up for Emerging New Innovations with Unbiased Secure Stablecoins") beendet, was einen wichtigen Schritt zur Etablierung eines umfassenden regulatorischen Rahmens für Stablecoins darstellt.