lang icon En
Jan. 2, 2026, 9:10 a.m.
1902

Deepseek, Verimli Büyük Dil Modeli Eğitimi İçin Çoklu-Kontraintli Hiper-Bağlantılar Sunuyor

Brief news summary

Çinli yapay zeka şirketi Deepseek, büyük dil modellerinin eğitim maliyetini azaltmayı ve verimliliği artırmayı amaçlayan yeni bir eğitim yöntemi olan Manifold-Constrained Hyper-Connections (mHC) tanıttı. Bu yaklaşımlar, 2024 yılında Bytedance tarafından geliştirilen ve Microsoft Research Asia'nın ResNet mimarisine dayanan Hyper-Connections teknolojisine dayanıyor. Deepseek’in mHC yöntemi, hedeflenmiş altyapı düzeyinde yapılan optimizasyonlar sayesinde ek hesaplama yükü olmadan daha istikrarlı ve ölçeklenebilir eğitim süreçleri sunuyor. Şirket, mHC’yi 27 milyar parametreye kadar olan dil modellerinde başarıyla test etti ve büyük model eğitimini daha erişilebilir ve verimli hale getirerek yapay zekanın gelecekteki gelişimine olumlu katkılar sağlayabilecek umut verici sonuçlar elde etti.

Çinli yapay zeka şirketi Deepseek, Güney Çin Sabahları'na göre, büyük dil modellerinin daha verimli ve maliyet açısından uygun şekilde eğitilmesini amaçlayan yeni bir eğitim tekniği olan Manifold-Kısıtlı Hiper Bağlantılar (mHC) yöntemini tanıttı. Bu yaklaşım, Bytedance'ın 2024 yılında geliştirdiği orijinal Hiper Bağlantılar (Hyper-Connections) kavramının bir ilerlemesidir. Bu teknoloji ise Microsoft Research Asia tarafından geliştirilen klasik ResNet mimarisine dayanıyor. Deepseek, mHC'nin hedefe yönelik altyapı seviyesindeki optimizasyonlar sayesinde daha kararlı ve ölçeklenebilir eğitim sağladığını, böylece hesaplama maliyetlerini artırmadan başardığını belirtiyor.

Araştırmacılar, yöntemi 27 milyar parametreye kadar olan modeller üzerinde başarılı şekilde test etti ve olumlu sonuçlar elde etti.


Watch video about

Deepseek, Verimli Büyük Dil Modeli Eğitimi İçin Çoklu-Kontraintli Hiper-Bağlantılar Sunuyor

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 17, 2026, 5:24 a.m.

TechSmith'in 2024 Video İzleyici Araştırması, ins…

TechSmith Şirketi, görsel iletişimde önde gelen önemli bir lider olarak, 2024 Video İzleyici Araştırması'nı yayımladı.

Feb. 17, 2026, 5:16 a.m.

İstihbarat satışlarını ön plana taşıyan yapay zek…

Özet Yapay zeka (YZ), Hindistan’da satış ekiplerini dönüştürmekte olup, yalnızca yöneticilere değil, ön cephede çalışan personele de güç kazandırmaktadır

Feb. 17, 2026, 5:15 a.m.

Meta Platforms, Yapay Zeka Girişimi Scale AI'a 10…

Haziran 2025'te, Meta Platforms Inc.

Feb. 16, 2026, 1:26 p.m.

ByteDance, Viral Cruise ile Pitt Klip'i sonrası y…

ByteDance, Seedance 2.0’yu bir haftadan kısa bir süre önce piyasaya sürdü ve dünya genelindeki sanatçılar arasında, Tom Cruise ve Brad Pitt’in savaşını gösteren viral bir yapay zeka ile oluşturulmuş kliple tepkilere neden oldu.

Feb. 16, 2026, 1:24 p.m.

Satış Yapabilen Bir Yapay Zeka Ses Kaydedici mi? …

Ofis çalışanları için ideal senaryo, toplantıları kaydeden, konuşmaları metne döken ve bunları uygulanabilir görevlere dönüştüren bir cihazdaki butona dokunmaktan ibarettir.

Feb. 16, 2026, 1:21 p.m.

Microsoft'un Yapay Zeka Destekli Yardımcısı: Ofis…

Microsoft, yaygın olarak kullanılan Office Paketi'ne resmi olarak Yapay Zeka destekli asistanı Copilot'u entegre etti ve bu, kullanıcıların üretkenlik yazılımlarıyla etkileşiminde büyük bir gelişmeyi simgeliyor.

Feb. 16, 2026, 9:26 a.m.

Seedance 2.0

Seedance 2.0, ByteDance adlı teknoloji şirketi tarafından yaratılan en ileri seviye bir görüntüden videoya ve metinden videoya modelidir.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today