DeepSeek'in Çığır Açan AI Modelleri, Amerikan Rakiplerini Geride Bırakıyor ve Silikon Vadisi'nde Endişelere Neden Oluyor

Çin merkezli nispeten bilinmeyen bir yapay zeka laboratuvarı, daha küçük bütçelerle ve daha az gelişmiş çiplerle geliştirilmesine rağmen, en iyi Amerikalı rakiplerin performansını aşan yapay zeka modelleri tanıtarak Silicon Valley'de endişelere yol açtı. DeepSeek olarak bilinen bu laboratuvar, Aralık ayı sonunda ücretsiz ve açık kaynaklı bir büyük dil modeli başlattı ve bunun, Nvidia'nın daha az güçlü H800 çiplerini kullanarak, sadece iki ayda 6 milyon doların altında bir maliyetle yaratıldığını iddia etti. Bu son gelişmeler, ABD'nin yapay zeka konusundaki avantajını kaybetmekte olduğu endişelerini artırdı ve büyük teknoloji şirketlerinin yapay zeka modelleri ve veri merkezlerine yaptığı önemli yatırımların etkinliği konusunda şüpheler doğurdu. Birçok üçüncü taraf benchmark değerlendirmesinde, DeepSeek'in modeli Meta'nın Llama 3. 1, OpenAI'ın GPT-4o ve Anthropic'in Claude Sonnet 3. 5 gibi dikkate değer rakiplerini geride bırakarak karmaşık problem çözme, matematik ve kodlama gibi alanlarda üstün doğruluk sergiledi. Pazartesi günü, DeepSeek, OpenAI'ın en son o1 modelini birçok üçüncü taraf değerlendirmesinde geride bırakan bir akıl yürütme modeli olan r1'i tanıttı. İsviçre'nin Davos kentindeki Dünya Ekonomik Forumu'nda bir tartışma sırasında Microsoft CEO'su Satya Nadella, "Yeni DeepSeek modeli, çıkarım süresi hesaplamasında mükemmel olan ve son derece hesaplama verimli bir açık kaynak modelini etkili bir şekilde geliştirdiği için inanılmaz derecede etkileyici. Çin'deki gelişmeleri çok ciddiye almalıyız, " yorumunu yaptı. DeepSeek, ABD hükümeti tarafından dayatılan sıkı yarı iletken kısıtlamalarını aşmayı başardı; bu kısıtlamalar, Nvidia'nın H100'leri gibi gelişmiş çiplere erişimi kısıtlıyor. Son başarılar, DeepSeek'in bu düzenlemeleri aşmanın yollarını bulduğunu veya ihracat kısıtlamalarının beklendiği kadar sınırlayıcı olmadığını gösteriyor. Benchmark'tan Genel Ortak Chetan Puttagunta, "Güçlü bir büyük modeli distilasyon adı verilen bir teknikle kullanabiliyorlar, " diye açıkladı. "Temelde, çok büyük bir model, daha küçük bir modele belirli alanlarda yeteneklerini geliştirmesinde yardımcı oluyor.
Bu yaklaşım aslında çok maliyet etkin. " DeepSeek ve kurucusu Liang WenFeng hakkında bilgi oldukça sınırlı. Laboratuvar, yaklaşık 8 milyar dolarlık varlığa sahib olduğu bildirilen High-Flyer Quant adlı bir Çin hedge fonundan ortaya çıktı. DeepSeek, Çin'deki yapay zeka ortamında yalnız değil. Önde gelen yapay zeka araştırmacısı Kai-Fu Lee, kendi girişimi 01. ai'nin yalnızca 3 milyon dolarlık bir yatırımla geliştirildiğini belirtti. Ayrıca, TikTok'un ana şirketi ByteDance, Çarşamba günü modeline bir güncelleme duyurarak, OpenAI'ın o1 modelini önemli bir benchmark testinde geride bıraktığını iddia etti. Perplexity CEO'su Aravind Srinivas, "İhtiyaç, icadın anasıdır, " dedi. "Karşılaştıkları zorluklar sonucunda, çok daha verimli bir şey yarattılar. "
Brief news summary
DeepSeek, Çin'de yükselen bir AI laboratuvarı, uygun fiyatlı yapay zeka modeliyle önde gelen ABD teknoloji şirketlerini geride bıraktığı için Silikon Vadisi'nde önemli bir ilgi görmektedir. Aralık ayında kurulan şirket, sadece iki ay içinde, 6 milyon doların altında bir finansman ve Nvidia’nın H800 çiplerini kullanarak ücretsiz, açık kaynaklı büyük bir dil modeli piyasaya sürmeyi başardı. Bu hızlı ilerleme, ABD'nin yapay zeka alanındaki hakimiyeti hakkında endişeleri arttırmakta ve Amerikan firmalarının ağır yatırımlarının etkinliğini sorgulamaktadır. Değerlendirmeler, DeepSeek'in modelinin özellikle karmaşık görevlerde Meta'nın Llama 3.1'i, OpenAI’nin GPT-4o'sunu ve Anthropic’in Claude Sonnet 3.5'ini sürekli olarak geride bıraktığını göstermektedir. r1 akıl yürütme modeli, OpenAI'nin o1'ini aşması nedeniyle endüstri liderleri, Microsoft CEO'su Satya Nadella da dahil olmak üzere, övgüyle karşılanmıştır. ABD'nin yarı iletken sınırlamalarına rağmen, DeepSeek'in başarısı bu zorlukların nasıl aşılabileceğini gösteren yenilikçi yöntemleri ortaya koymaktadır. Liang WenFeng tarafından kurulan ve High-Flyer Quant hedge fonu tarafından desteklenen DeepSeek, Çin'in hızla değişen derin öğrenme alanındaki ilerlemesinin direncini göstermektedir.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

Neden Herkes SoundHound AI Hissesi Hakkında Konuş…
Anahtar Noktalar SoundHound, çeşitli sektörlere hizmet veren bağımsız bir Yapay Zeka ses platformu sunuyor ve toplam erişilebilir pazar büyüklüğü (TAM) 140 milyar dolar seviyesinde

Telegram'ın TON Ekosistemi: Blockchain Hakimiyeti…
Blokzincir endüstrisinde bir sonraki sınır sadece teknik yenilik değil, aynı zamanda kitlesel benimsemedir ve Telegram’ın TON ekosistemi, Open Platform (TOP) tarafından güçlendirilerek öncü konumda yer alıyor.

16 milyar şifre sızdı. Artık blockchain tabanlı d…
16 Milyar Parola Sızıntısı: Gerçek Ne Oldu?

Üretimde Yapay Zeka: Üretim Süreçlerini Optimize …
Yapay zeka (AI), gelişmiş teknoloji entegrasyonu sayesinde üretim süreçlerini optimize ederek imalat endüstrisini temel anlamda dönüştürüyor.

Bağımsız Yayıncılar, Google'ın Yapay Zeka Genel B…
Bağımsız yayıncılar koalisyonu, Avrupa Komisyonu’na antitröst şikayetinde bulunarak Google’ı AI Overviews özelliği aracılığıyla piyasa suistimalleri yapmakla suçladı.

Kongre Kripto Haftası'nı İlan Ediyor: ABD Yasama …
Anahtar Noktalar: Amerika Birleşik Devletleri Temsilciler Meclisi, 14 Temmuz haftasını üç kritik kripto yasasının ilerletilmesine ayıracak: CLARITY Yasası, GENIUS Yasası ve Anti-CBDC Gözetim Devleti Yasası

Ilya Sutskever, Yapay Zeka Yetenekleri Yarışması …
İlya Sutskever, 2024 yılında kurduğu Yapay Zeka girişimi Safe Superintelligence (SSI)’nin liderliğini üstlendi.