Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Dec. 26, 2024, 8:59 p.m.
1417

DeepSeek V3: Çin'in Önde Gelen Açık Yapay Zeka Modeli Tanıtıldı

Çinli bir laboratuvar, bugüne kadarki en güçlü "açık" yapay zeka modellerinden biri olan DeepSeek V3'ü tanıttı. Yapay zeka firması DeepSeek tarafından geliştirilen model, ticari uygulamalar dahil çoğu kullanım için geliştiricilerin indirip değiştirmelerine olanak tanıyan bir lisansla Çarşamba günü yayımlandı. DeepSeek V3, kodlama, çeviri ve metin tabanlı komutlardan makale ve e-posta yazma gibi çeşitli görevlerde üstün performans gösteriyor. DeepSeek'in iç testlerine göre, DeepSeek V3, hem indirilebilir "açık" modelleri hem de yalnızca API aracılığıyla erişilebilen "kapalı" yapay zeka modellerini geride bıraktı. Programlama yarışmaları için bir platform olan Codeforces üzerindeki kodlama yarışmalarında, Meta'nın Llama 3. 1 405B, OpenAI'nin GPT-4o ve Alibaba'nın Qwen 2. 5 72B gibi diğer modelleri geride bırakarak bir adım öne çıkıyor. Ayrıca, bir modelin mevcut kodla entegre olacak şekilde yeni kod yazabilme yeteneğini değerlendirmek için tasarlanmış Aider Polyglot testinde de üstünlük sağlıyor. DeepSeek V3, 14. 8 trilyon token'dan oluşan bir veri kümesi üzerinde eğitildi. Veri biliminde, token'lar ham verinin parçalarını temsil eder ve 1 milyon token yaklaşık 750. 000 kelimeye eşittir. Model ayrıca, karar vermek için kullandığı iç değişkenler olan 671 milyar parametre (AI geliştirme platformu Hugging Face'da 685 milyar) ile oldukça büyük. Bu boyut Llama 3. 1 405B’nin 405 milyar parametresinin yaklaşık 1. 6 katıdır. Genellikle, daha fazla parametreye sahip modeller daha iyi performans gösterir, ancak verimli çalışabilmeleri için güçlü bir donanım gerektirir. Optimize edilmemiş bir DeepSeek V3, makul hızlar için yüksek kaliteli GPU'ların bulunduğu bir bankaya ihtiyaç duyar. Uygun olmamasına rağmen, DeepSeek V3 bir başarıdır. DeepSeek, modeli yaklaşık iki ayda Çinli şirketlerin ABD Ticaret Bakanlığı tarafından satın alması yasaklanan Nvidia H800 GPU'larının bulunduğu bir veri merkezinde eğitti.

Firma, DeepSeek V3'ü eğitmek için yalnızca 5. 5 milyon dolar harcadığını, bu miktarın OpenAI'nin GPT-4 gibi modellerin maliyetinin bir kısmı olduğunu iddia ediyor. Ancak modelin siyasi görüşleri bir nebze sınırlıdır. Örneğin, Tiananmen Meydanı konusuna yorum yapmaz. Çinli bir şirket olarak, DeepSeek, modelin yanıtlarının "temel sosyalist değerleri" korumasını sağlayan Çin internet düzenlemelerine tabidir. Birçok Çin yapay zeka sistemi, Xi Jinping rejimi hakkında tartışmalar gibi düzenleyicileri rahatsız edebilecek konulardan kaçınır. Yakın zamanda OpenAI'nin o1 "akıl yürütme" modeline rakip olarak DeepSeek-R1'i tanıtan DeepSeek, ilgi çekici bir organizasyondur. Yüksek-Flyer Capital Management tarafından desteklenen, ticaret için yapay zeka kullanan bir Çin hedge fonudur. Yüksek-Flyer, model eğitimleri için kendi sunucu kümelerini inşa ediyor ve bunlardan biri, bildirildiğine göre, 10, 000 Nvidia A100 GPU içeriyor ve 1 milyar yen (~138 milyon dolar) maliyetindedir. Bilgisayar bilimi mezunu Liang Wenfeng tarafından kurulan Yüksek-Flyer, DeepSeek aracılığıyla "süper zeki" yapay zekaya ulaşmayı hedefliyor. Wenfeng bu yılın başlarında verdiği bir röportajda, OpenAI gibi kapalı kaynaklı yapay zekayı "geçici" bir avantaj olarak tanımlamıştı. "Bu, başkalarının yetişmesini engellemedi, " diye gözlemledi. Gerçekten de.



Brief news summary

Çin'in önde gelen AI şirketlerinden DeepSeek, açık kaynaklı AI modeli DeepSeek V3'ü piyasaya sürdü. Bu model, geliştiricilerin indirmelerine, değiştirmelerine ve ticari uygulamalar dahil çeşitli amaçlar için kullanmalarına olanak tanır. DeepSeek V3, kodlama, çeviri ve yazma görevlerinde genellikle Meta, OpenAI ve Alibaba gibi rakiplerinin önüne geçerek üstün performans sergiler. Bu yetenekleri, 14.8 trilyon token ve 671 milyar parametreden oluşan büyük bir veri seti üzerinde kapsamlı bir şekilde eğitilmesinden kaynaklanmaktadır ve bu, 405 milyar parametreye sahip Meta'nın Llama 3.1 modelinden daha fazladır. Büyük veri seti, optimize kullanım için güçlü donanım gerektirir. DeepSeek, iki ay boyunca Nvidia H800 GPU'larını kullandı ve bu sayede OpenAI'nin GPT-4'üne kıyasla maliyet etkin bir eğitim süreci elde etti. Güçlü özelliklerine rağmen, model, Tiananmen Meydanı gibi Çin yönetmeliklerine uyum sağlamak amacıyla siyasi açıdan hassas konularla ilgili zorluklarla karşılaşmaktadır. High-Flyer Capital Management, büyük Nvidia GPU kümeleri dahil olmak üzere AI sunucu altyapısına yatırım yaparak DeepSeek'i desteklemekte ve kapalı kaynaklı AI'nin sınırlamalarını aşarak AI'yi "süper zeki" sistemlere doğru geliştirmeyi amaçlamaktadır.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Learn how AI can help your business.
Let’s talk!

Hot news

July 5, 2025, 2:21 p.m.

Neden Herkes SoundHound AI Hissesi Hakkında Konuş…

Anahtar Noktalar SoundHound, çeşitli sektörlere hizmet veren bağımsız bir Yapay Zeka ses platformu sunuyor ve toplam erişilebilir pazar büyüklüğü (TAM) 140 milyar dolar seviyesinde

July 5, 2025, 2:13 p.m.

Telegram'ın TON Ekosistemi: Blockchain Hakimiyeti…

Blokzincir endüstrisinde bir sonraki sınır sadece teknik yenilik değil, aynı zamanda kitlesel benimsemedir ve Telegram’ın TON ekosistemi, Open Platform (TOP) tarafından güçlendirilerek öncü konumda yer alıyor.

July 5, 2025, 10:37 a.m.

16 milyar şifre sızdı. Artık blockchain tabanlı d…

16 Milyar Parola Sızıntısı: Gerçek Ne Oldu?

July 5, 2025, 10:15 a.m.

Üretimde Yapay Zeka: Üretim Süreçlerini Optimize …

Yapay zeka (AI), gelişmiş teknoloji entegrasyonu sayesinde üretim süreçlerini optimize ederek imalat endüstrisini temel anlamda dönüştürüyor.

July 5, 2025, 6:31 a.m.

Bağımsız Yayıncılar, Google'ın Yapay Zeka Genel B…

Bağımsız yayıncılar koalisyonu, Avrupa Komisyonu’na antitröst şikayetinde bulunarak Google’ı AI Overviews özelliği aracılığıyla piyasa suistimalleri yapmakla suçladı.

July 5, 2025, 6:14 a.m.

Kongre Kripto Haftası'nı İlan Ediyor: ABD Yasama …

Anahtar Noktalar: Amerika Birleşik Devletleri Temsilciler Meclisi, 14 Temmuz haftasını üç kritik kripto yasasının ilerletilmesine ayıracak: CLARITY Yasası, GENIUS Yasası ve Anti-CBDC Gözetim Devleti Yasası

July 4, 2025, 2:21 p.m.

Ilya Sutskever, Yapay Zeka Yetenekleri Yarışması …

İlya Sutskever, 2024 yılında kurduğu Yapay Zeka girişimi Safe Superintelligence (SSI)’nin liderliğini üstlendi.

All news