lang icon En
Jan. 2, 2026, 9:10 a.m.
1907

Deepseek iepazīstina ar dažādu ģeometriju ierobežotiem hiperķēdēm efektīvai lielo valodu modeļu apmācībai

Brief news summary

Ķīnas AI uzņēmums Deepseek ir ieviesis jaunu apmācību metodi ar nosaukumu Manifold-Constrained Hyper-Connections (mHC), mērķējot uz lielāku efektivitāti un zemākām izmaksām lielo valodu modeļu apmācībā. Šī pieeja balstās uz Hyper-Connections tehnoloģiju, ko sākotnēji izstrādāja Bytedance 2024. gadā, kas savukārt ir balstīta uz Microsoft Research Asia izstrādāto ResNet arhitektūru. Deepseek mHC metode nodrošina stabilākus un mērogojamākus apmācības procesus bez papildu aprēķinu sloga, pateicoties precīzām infrastruktūras līmeņa optimizācijām. Uzņēmums veiksmīgi ir pārbaudījis mHC ar valodas modeļiem, kuros ir līdz pat 27 miljardiem parametru, demonstrējot cerības rosinātus rezultātus, kas var ietekmēt AI attīstību nākotnē, padarot lielo modeļu apmācību pieejamāku un efektīvāku.

Ķīnas AI uzņēmums Deepseek ir ieviests jaunu apmācību tehniku ar nosaukumu Manifold-Constrained Hyper-Connections (mHC), kas pēc South China Morning Post domām, ļauj nodrošināt efektīvāku un izmaksu ziņā izdevīgāku lielu valodu modeļu apmācību. Šī pieeja ir attīstība sākotnējai Hyper-Connections koncepcijai, ko Bytedance izstrādāja 2024. gadā.

Šī tehnoloģija ir balstīta uz klasisko ResNet arhitektūru, ko izstrādāja Microsoft Research Asia. Deepseek norāda, ka mHC nodrošina stabilāku un mērogojamāku apmācību bez papildu aprēķinu izmaksu palielināšanas, pateicoties mērķtiecīgām optimizācijām infrastruktūras līmenī. Pētījumu autori ir veiksmīgi pārbaudījuši metodi uz modeļiem ar līdz pat 27 miljardiem parametru, sasniedzot pozitīvus rezultātus.


Watch video about

Deepseek iepazīstina ar dažādu ģeometriju ierobežotiem hiperķēdēm efektīvai lielo valodu modeļu apmācībai

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 17, 2026, 5:24 a.m.

TechSmith 2024. gada video skatītāja pētījums atk…

TechSmith Corporation, vadošais vizuālās komunikācijas līderis, ir publicējis 2024.

Feb. 17, 2026, 5:16 a.m.

AI kara priekšā: Pārveidojot pārdošanas intelektu…

Sižets Mākslīgais intelekts (MI) pārveido pārdošanas komandas Indijā, dodot spēku ne tikai vadītājiem, bet arī tieši darbiniekiem uz frontes

Feb. 17, 2026, 5:15 a.m.

Meta Platforms paziņo par 10 miljardu dolāru iegu…

2025.

Feb. 16, 2026, 1:26 p.m.

ByteDance apsola stingrāk kontrolēt savu jauno AI…

ByteDance pirms nepilnas nedēļas izlaida Seedance 2.0, izraisot neapmierinātību starp māksliniekiem visā pasaulē ar vīrusu kļuvušu AI veidotu klipu, kurā redzami Tom Cruise un Brads Pits, kas cīnās.

Feb. 16, 2026, 1:24 p.m.

Vai mākslīgā intelekta balss reģistrators, kas sp…

Idealais scenārijs biroja darbiniekiem ir vienkārši nospiest pogu uz ierīces, kas ieraksta sanāksmes, pārraksta sarunas un pārvērš tās pārvietojamos uzdevumos.

Feb. 16, 2026, 1:21 p.m.

Microsoft AI vadīts Copilot: uzlabojot produktivi…

Microsoft oficiāli ir integrējis mākslīgā intelekta vadītu palīgu, Copilot, sava plaši izmantotā Office pakotnē, kas ir būtisks solis uz priekšu lietotāju mijiedarbībā ar produktivitātes programmatūru.

Feb. 16, 2026, 9:26 a.m.

Seedance 2.0

Seedance 2.0 ir modernākais attēls uz video un teksta uz video modeļa izstrādājums, ko radījusi tehnoloģiju kompānija ByteDance.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today