lang icon En
Feb. 2, 2025, 4:07 p.m.
2500

DeepSeek ievieš pirmās paaudzes mākslīgā intelekta modeļus, kas konkurē ar OpenAI GPT-4.

Brief news summary

20. janvārī Ķīnas AI jaunuzņēmums DeepSeek prezentēja savus uzlabotos secinājumu modeļus, tostarp DeepSeek-R1, kas ir paredzēts, lai konkurētu ar OpenAI augstākajiem modeļiem, tajā pašā laikā efektīvi darbojoties uz mazāk jaudīgas aparatūras. Ievērojami, ka V3 modelis prasa tikai 5,6 miljonus ASV dolāru apmācībai, kas ir ievērojami zemāka summa nekā OpenAI 100 miljoni dolāru GPT-4 modelim. R1 modeļa atvērtā kodi iedrošina tā pieņemšanu dažādās nozarēs. DeepSeek izmanto "ekspertu maisījuma" pieeju, aktivizējot tikai nepieciešamās modeļa daļas, kas paaugstina efektivitāti ierobežotā aparatūrā. Šī metode, apvienojot datu kompresiju un uzlabotu slodzes līdzsvarošanu, paātrina apmācību un samazina secinājumu izmaksas, padarot AI pieejamāku. Šie sasniegumi sniedz lielas iespējas tādām kompānijām kā Apple un Meta. Apple mērķis ir uzlabot savas iekšējās AI iespējas, pievēršoties lietotāju privātumam un uzlabojot klientu iesaisti. Savukārt Meta plāno integrēt DeepSeek tehnoloģijas, lai paplašinātu savus AI pakalpojumus, cenšoties optimizēt ieņēmumus, izmantojot savu atvērtā koda Llama modeli.

2023. gada 20. janvārī Ķīnas mākslīgā intelekta jaunuzņēmums DeepSeek prezentēja savus pirmās paaudzes argumentācijas modeļus, izsakot iespaidīgus apgalvojumus par to iespējām. DeepSeek-R1 modelis, kā ziņots, nodrošina tādu pašu veiktspēju kā OpenAI labākie modeļi, neskatoties uz to, ka tas izstrādāts uz zemākas kvalitātes aparatūras. Šis sasniegums ir īpaši iespaidīgs, ņemot vērā, ka tā apmācība izmaksāja tikai 5, 6 miljonus dolāru, salīdzinot ar OpenAI 100 miljoniem dolāru par GPT-4. DeepSeek R1 ir balstīts uz tā V3 lielā valodas modeļa un ir pilnīgi atvērtā koda, kas potenciāli var pārveidot mākslīgā intelekta nozari. Uzņēmuma uzmanība uz aparatūras efektivitāti ir radusies no eksporta ierobežojumiem uz Nvidia H100 GPU Ķīnā, kas mudināja viņus ieviest H800 un tehnoloģijas, kā 'ekspertu maisījums' (DeepSeekMoE), kas aktivizē tikai nepieciešamās modeļa daļas. Tas samazina datu pārsūtīšanas prasības un uzlabo apmācību efektivitāti. Šie uzlabojumi ne tikai paātrina apmācību laikus, bet arī padara to lētāku un pieejamāku, izmantojot AI inferenci uz mazāk jaudīgas aparatūras.

Tā rezultātā uzņēmumi, piemēram, Apple un Meta, var gūt ievērojamu labumu. Apple uzņēmumam, kas prioritārā kārtībā uzsver datu privātumu un apstrādi ierīcē, DeepSeek metožu integrācija varētu uzlabot AI funkcijas tādās ierīcēs kā iPhone, potenciāli palielinot pārdošanu un pakalpojumu ieņēmumus. A18 Pro mikroshēmas uzlabotā atmiņas joslas platuma atbalsta šādus uzlabojumus, ļaujot ieviest tādas funkcijas kā gudrāka Siri un ofline tulkošana. Meta arī palielina savus ieguldījumus mākslīgajā intelektā, paredzot 60% pieaugumu kapitāla izdevumos līdz 2025. gadam. Atverot savu Llama modeli, Meta cenšas maksimizēt efektivitāti savās AI ieviešanās. AI inferences izmaksu samazināšana varētu atvērt ievērojamus ienākumus Meta, atvieglojot AI risinājumu skalēšanu tās 3 miljardiem lietotāju. DeepSeek inovācijas sniedz Meta nepieciešamos rīkus, lai uzlabotu tās AI iespējas un rentabilitāti.


Watch video about

DeepSeek ievieš pirmās paaudzes mākslīgā intelekta modeļus, kas konkurē ar OpenAI GPT-4.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 5:37 a.m.

Mākslīgā intelekta radītie dziļfake video rada ja…

Strauji attīstoties mākslīgajai intelektai, ir radusies ievērojama inovācija – deepfake tehnoloģija.

Dec. 19, 2025, 5:28 a.m.

Meta vadītājs Yann LeCun mērķē uz jauna mākslīgā …

Yann LeCun, ievērojams mākslīgā intelekta pētnieks un drīz jau bijušais Meta galvenais AI zinātniekis, ir uzsācis jaunu, strauji ietekmējošu AI uzņēmumu.

Dec. 19, 2025, 5:24 a.m.

ASV veic pārskatīšanu par uzlaboto Nvidia mākslīg…

Tremona administrācija ir uzsākusi visaptverošu starpdepartamenta pārskatīšanu, lai apsvērtu Nvidia uzlaboto H200 AI mikroshēmu eksporta apstiprināšanu uz Ķīnu, kas iezīmē svarīgu pavērsienu no Baidena administrācijas ierobežojumiem, kas faktiski aizliedza šādus pārdošanas darījumus.

Dec. 19, 2025, 5:24 a.m.

Kāpēc McDonald's Mākslīgā Intelekta Ziemassvētku …

In December 2025.

Dec. 19, 2025, 5:21 a.m.

Grūtskripts SEO revolūcija: vajadzība pēc pielāgo…

Digitālā mārketinga lauks piedzīvo ievērojamas pārmaiņas, ko veicina mākslīgā intelekta (MI) izaugsme meklētājprogrammu optimizācijā (MKO).

Dec. 18, 2025, 1:30 p.m.

Micron sniedz rožu krāsas pārdošanas prognozi, jo…

Bloomberg Micron Technology Inc, lielākā Amerikas Savienoto Valstu atmiņhardware mikroshēmu ražotāja, ir izdevusi optimistisku prognozi par pašreizējo ceturksni, norādot, ka pieaugošais pieprasījums un ražošanas deficīts ļauj uzņēmumam noteikt augstākas cenas par saviem produktiem

Dec. 18, 2025, 1:29 p.m.

Jaunumi un informācija, kas jums ir nepieciešama …

Paļāvība uz ģeneratīvo mākslīgā intelektu (MI) starp vadošajiem nozares reklāmas profesionāļiem sasniedz nepieredzētas līmeņus, liecina nesenā Boston Consulting Group (BCG) pētījuma dati.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today