DeepSeek veröffentlicht bahnbrechendes Open-Source-KI-Modell, das US-Konkurrenten übertrifft.

Am 20. Januar veröffentlichte DeepSeek, ein wenig bekanntes KI-Forschungslabor aus China, ein Open-Source-Modell, das schnell Aufmerksamkeit im Silicon Valley erregte. Das Unternehmen behauptet in seiner Veröffentlichung, dass DeepSeek-R1 führende Modelle wie die von OpenAI in verschiedenen Mathematik- und Argumentationsbenchmarks übertrifft, was bedeutende Fähigkeiten zu geringeren Kosten und mit einem Fokus auf Offenheit demonstriert. Der Erfolg von DeepSeek verdeutlicht einen neuen Weg für chinesische Tech-Firmen inmitten des Technologiekaltes; angesichts von US-Exporteinschränkungen haben viele von der Entwicklung von Modellen in der Ursprungsphase zu Anwendungen in der Nachgelagerten gewechselt. DeepSeek hingegen hat sich darauf konzentriert, die Strukturen von KI-Modellen zu optimieren und Ressourcen effizient zu nutzen. Gegründet von Liang Wenfeng, einem Masterabsolventen der Informatik, entstand DeepSeek aus High-Flyer, einem renommierten quantitativen Hedgefonds, der sich zunächst auf Forschungsarbeiten im Bereich Deep Learning konzentrierte. Der Hedgefonds sammelte Ressourcen für die KI-Entwicklung, was zur Gründung von DeepSeek führte und einen Fokus auf langfristige technologische Ziele anstelle von unmittelbarem Profit widerspiegelt.
Liang erklärte, dass wissenschaftliche Neugier diesen Schritt antrieb und hob dabei den Schwerpunkt auf die Förderung von grundlegender KI-Forschung im Gegensatz zu kommerziellen Anwendungen hervor. Das Team von DeepSeek besteht hauptsächlich aus frisch promovierten Absolventen führender chinesischer Universitäten und fördert ein kollaboratives Umfeld, das sich auf bahnbrechende Forschung konzentriert. Dieser Ansatz unterscheidet sich von den üblichen Praktiken in etablierten chinesischen Tech-Firmen, wo der Wettbewerb um Ressourcen oft die Innovation behindert. Liang stellt fest, dass junge Forscher besser für hochgradige Investitionsprojekte geeignet sind, da sie engagiert sind und utilitaristische Überlegungen fehlen. Das Unternehmen sieht sich Herausforderungen durch die Exporteinschränkungen der US-Regierung gegenüber, die den Zugang zu fortschrittlichen KI-Chips einschränken. Ursprünglich im Besitz eines Bestands von 10. 000 Nvidia H100-Chips, erforderte die Wettbewerbsfähigkeit von DeepSeek effizientere Methoden zum Training der Modelle. Das Team implementierte ingenieurtechnische Strategien und innovative Designs wie Multi-head Latent Attention (MLA) und Mixture-of-Experts, die die erforderliche Rechenleistung zum Training ihres neuesten Modells im Vergleich zu Metas Llama 3. 1 erheblich reduzierten. Der Open-Source-Ansatz von DeepSeek hat im globalen KI-Forschungsgemeinschaft Wohlwollen gewonnen und es dem Unternehmen ermöglicht, Mitarbeiter und Nutzer zu gewinnen, die für die Verbesserung seiner Modelle notwendig sind. Diese Veränderung in der bestehenden KI-Landschaft könnte die Effektivität der aktuellen US-Exporteinschränkungen in Frage stellen, indem sie zeigt, dass hochmoderne Modelle mit optimierter Ressourcennutzung entwickelt werden können, was zu potenziellen Veränderungen in den Wahrnehmungen der AI-Fähigkeiten Chinas führen könnte.
Brief news summary
Am 20. Januar stellte das chinesische KI-Labor DeepSeek sein Open-Source-Modell DeepSeek-R1 vor, das in Silicon Valley für seine außergewöhnlichen mathematischen Fähigkeiten und sein Denkvermögen gelobt wurde und etablierte Wettbewerber wie OpenAI übertrifft. Diese Veröffentlichung findet vor dem Hintergrund erhöhte technologischer Spannungen zwischen den USA und China statt, gekennzeichnet durch Exportbeschränkungen, die Chinas Zugang zu fortschrittlichen Technologien behindern. In diesem Zusammenhang betont DeepSeek die Softwareoptimierung und Open-Source-Initiativen als Beweis für seine innovativen Fähigkeiten. Gegründet von Liang Wenfeng des Hedgefonds High-Flyer, konzentriert sich DeepSeek auf langfristige Forschung statt auf kurzfristige Gewinne. Sein Team aus jungen Doktoranden fördert ein kollaboratives Umfeld und hebt sich von dem wettbewerbsorientierten Ethos ab, das in vielen Tech-Unternehmen vorherrscht. Um den US-Einschränkungen für hochentwickelte Chips wie Nvidias H100 entgegenzuwirken, hat DeepSeek seine Modellarchitektur für ein effizienteres Training verfeinert. Durch die Nutzung von Strategien wie Multi-head Latent Attention und Mixture-of-Experts funktioniert das Modell von DeepSeek mit erheblich reduzierten Rechenressourcen im Vergleich zu seinen Wettbewerbern. Diese strategische Anpassung ermöglicht es DeepSeek, die KI in China trotz anhaltender Exportherausforderungen weiter voranzutreiben.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

Senat streicht KI-Klausel aus GOP-Gesetzentwurf n…
Am 1.

Aktien tokenisieren: Ein neues Kapitel in der Blo…
Coinbase, eine führende Kryptowährungsbörse, hat einen bedeutenden Schritt in Richtung Umgestaltung des traditionellen Aktienhandels unternommen, indem sie die Genehmigung bei der US-Börsenaufsichtsbehörde SEC (Securities and Exchange Commission) beantragt hat, um tokenisierte Aktien anzubieten.

Robinhood führt Aktien-Tokenisierung und Layer-2-…
Am Montag kündigte Robinhood die Einführung von Token an, die es seinen Kunden in der Europäischen Union ermöglichen, über 200 US-Aktien und börsengehandelte Fonds (ETFs), darunter beliebte Namen wie Nvidia, Apple und Microsoft, zu handeln.

Apple erwägt, Anthropic oder OpenAI einzusetzen, …
Apple erforscht die Integration von Künstlicher Intelligenz-Technologien, die von Anthropic oder OpenAI entwickelt wurden, um Siri zu verbessern, was eine bedeutende Abkehr von der bisherigen reliance auf eigene KI-Modelle darstellt.

Europas KI-Gigafabrik-Initiative zieht 76 Angebot…
Die Europäische Union hat einen bemerkenswerten Anstieg des Interesses an ihrem ehrgeizigen Plan zur Errichtung von KI-Gigafabriken erlebt, was das wachsende Engagement Europas für die Weiterentwicklung der Künstlichen Intelligenz widerspiegelt.

Arbitrums ARB-Token schießt um 20 % nach oben weg…
Arbitrum’s ARB-Token erlebte einen deutlichen Anstieg und stieg innerhalb von 48 Stunden um fast 20 %.

US-Senat debattiert über bundesweiten Moratorium …
Der US-Senat diskutiert einen überarbeiteten Vorschlag, der einen fünfjährigen bundesweiten Moratoriums gegen staatliche Regelungen für künstliche Intelligenz (KI) vorsieht, angesichts der Bedenken über die schnelle Entwicklung von KI und deren Auswirkungen auf Privatsphäre, Sicherheit und geistiges Eigentum.