Jan. 25, 2025, 11:13 a.m.
4422

DeepSeek laiž klajā revolucionāru atvērtā koda mākslīgā intelekta modeli, kas pārspēj ASV konkurentus.

Brief news summary

20. janvārī Ķīnas AI laboratorija DeepSeek atklāja savu atvērtā koda modeli DeepSeek-R1, kas ir ieguvis atzinību Silikona ielejā par izcilām matemātikas un loģiskās domāšanas prasmēm, pārspējot tādus nostiprinātus konkurentus kā OpenAI. Šī izlaiduma fonā ir pastiprinātās ASV-Ķīnas tehnoloģiskās spriedzes, ko raksturo eksporta ierobežojumi, kas apgrūtina Ķīnas piekļuvi augsto tehnoloģiju resursiem. Atbildot uz to, DeepSeek uzsver programmatūras optimizāciju un atvērtā koda iniciatīvas kā pierādījumu savām inovāciju spējām. DeepSeek, ko dibinājis Liang Wenfeng no hedge fonda High-Flyer, koncentrējas uz ilgtermiņa pētījumiem, nevis īstermiņa peļņu. Tās komanda, kurā ietilpst neseni doktora grāda absolventi, veicina sadarbības vidi, atšķirot sevi no konkurences gara, kas ir raksturīgs daudziem tehnoloģiju uzņēmumiem. Lai pretotos ASV ierobežojumiem attiecībā uz augstas klases mikroshēmām, piemēram, Nvidia H100, DeepSeek ir uzlabojusi sava modeļa arhitektūru efektīvākai apmācībai. Izmantojot stratēģijas, piemēram, Multi-head latent attention un Mixture-of-experts, DeepSeek modelis darbojas ar ievērojami samazinātām datortehnoloģiju resursu prasībām salīdzinājumā ar konkurentiem. Šī stratēģiskā pielāgošanās ļauj DeepSeek turpināt AI attīstību Ķīnā, neskatoties uz pastāvīgajiem eksporta izaicinājumiem.

2023. gada 20. janvārī Ķīnas mazāk zināmais mākslīgā intelekta pētniecības centrs DeepSeek izlaiž open-source modeli, kas ātri piesaistīja uzmanību Silikona ielejā. Uzņēmuma publikācija apgalvo, ka DeepSeek-R1 pārspēj vadošos modeļus, piemēram, OpenAI modeļus, dažādos matemātikas un loģiskās domāšanas testos, demonstrējot ievērojamas spējas, samazinot izmaksas un uzsverot atklātību. DeepSeek panākumi ilustrē jaunu ceļu Ķīnas tehnoloģiju uzņēmumiem tehnoloģiju aukstā kara apstākļos; saskaroties ar ASV eksporta ierobežojumiem, daudzi ir pārgājuši no augšupējo modeļu veidošanas uz lejupējo pielietojumu attīstību. Tomēr DeepSeek ir koncentrējies uz mākslīgā intelekta modeļu struktūru optimizēšanu un resursu efektīvu izmantošanu. DeepSeek dibināja Liang Wenfeng, datorsistēmu maģistra grādu ieguvējs, un uzņēmums izveidojās no High-Flyer, pazīstama kvantitatīvā hedžfondā, kas sākotnēji koncentrējās uz dziļā mācīšanās pētījumiem. Hedžfonda uzkrātie resursi mākslīgā intelekta attīstībai noveda pie DeepSeek izveides, kas atspoguļo pāreju uz ilgtermiņa tehnoloģiskajiem mērķiem, nevis tūlītējām peļņas iespējām.

Liang apgalvoja, ka zinātniskā ziņkārība bija iemesls šim uzņēmumam, akcentējot uzmanību uz pamata mākslīgā intelekta pētījumu attīstīšanu, nevis komercializētām lietojumprogrammām. DeepSeek komanda galvenokārt sastāv no nesenajiem doktora grādu ieguvējiem no vadošām Ķīnas universitātēm, veicinot sadarbības vidi, kas koncentrējas uz revolucionāriem pētījumiem. Šī pieeja atšķiras no tradicionālajām praksēm izveidotajos Ķīnas tehnoloģiju uzņēmumos, kur sacensība par resursiem bieži kavē inovācijas. Liang norāda, ka jauni pētnieki ir labāk piemēroti augstas investīciju projektu īstenošanai, pateicoties viņu iesaistei un utilitāro apsvērumu trūkumam. Uzņēmums saskaras ar ASV valdības eksporta kontroles radītajiem izaicinājumiem, kas ierobežo piekļuvi moderniem mākslīgā intelekta mikroshēmām. Sākotnēji, turot 10 000 Nvidia H100 mikroshēmu krājumus, DeepSeek spēja konkurēt, kas prasīja efektīvākas modeļu apmācības metodes. Komanda īstenoja inženierijas stratēģijas un inovatīvus dizainus, piemēram, Multi-head Latent Attention (MLA) un Mixture-of-Experts, būtiski samazinot apstrādes jaudu, kas nepieciešama, lai apmācītu savu jaunāko modeli, salīdzinot ar Meta's Llama 3. 1. DeepSeek open-source pieeja ir ieguvusi labvēlību globālajā mākslīgā intelekta pētniecības kopienā, ļaujot piesaistīt līdzstrādniekus un lietotājus, kas nepieciešami modeļu uzlabošanai. Šī pāreja esošajā mākslīgā intelekta ainavā var apstrīdēt pašreizējo ASV eksporta kontroles efektivitāti, demostrējot, ka modernus modeļus var izstrādāt, optimizējot resursu izmantošanu, kas var novest pie potenciālām izmaiņām uzskatā par Ķīnas mākslīgā intelekta spējām.


Watch video about

DeepSeek laiž klajā revolucionāru atvērtā koda mākslīgā intelekta modeli, kas pārspēj ASV konkurentus.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 15, 2025, 1:26 p.m.

Cilvēku radītais intelekts veicina rekorda vērtās…

Salesforce analīze par 2025.

Dec. 15, 2025, 1:24 p.m.

AI iznīcināšanas riski: Musk un Amodei brīdina pa…

Straujais mākslīgā intelekta (MI) attīstības process izraisījis būtisku debatēšanu un bažas starp ekspertiem, īpaši par tā ilgtermiņa ietekmi uz cilvēci.

Dec. 15, 2025, 1:21 p.m.

Ienāc pirms Wall Street to dara: šis AI mārketing…

Šis ir sponsorizēts saturs; Barchart nesaporšo zemāk minētās mājaslapas vai produktus.

Dec. 15, 2025, 1:16 p.m.

Google DeepMind’s AlphaCode: Mākslīgais intelekts…

Google DeepMind nesen veicināja jauna inovatīva mākslīgā intelekta sistēma AlphaCode, kas nozīmē lielu soli uz priekšu mākslīgā intelekta un programmatūras izstrādes jomā.

Dec. 15, 2025, 1:15 p.m.

Lai Zināmtās SEO Eksperti Izskaidro, Kāpēc Mākslī…

Esmu cieši uzraudzījis agentu ĒTA meklētājprogrammu optimizācijas (SEO) parādīšanos, pārliecināts, ka, pūšot uz priekšu ar iespējām attīstoties nākamo gadu laikā, aģenti ievērojami ietekmēs nozari.

Dec. 15, 2025, 1:10 p.m.

Salesforce’s Peter Lington par sagatavošanos aizs…

Peter Lingtons, Salesforce kara karaspēka nodaļas viceprezidents, uzsver uzlaboto tehnoloģiju transformējošo ietekmi uz Kara departamentu tuvāko trīs līdz piecu gadu laikā.

Dec. 15, 2025, 9:35 a.m.

Sprout Social stratēģiskā pozīcija mainīgajā soci…

Sprout Social ir stingri nostiprinājies kā vadošais spēlētājs sociālo mediju pārvaldības nozarē, pieņemot avanzētas mākslīgā intelekta tehnoloģijas un veidojot stratēģiskas partnerattiecības, kas veicina inovācijas un uzlabo pakalpojumu piedāvājumu.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today