lang icon En
Dec. 26, 2024, 8:59 p.m.
13390

DeepSeek V3: Kifaa Bora cha AI cha Uchina Kilichozinduliwa

Brief news summary

DeepSeek, kampuni inayoongoza ya AI nchini China, imezindua DeepSeek V3, mfano wa AI wa chanzo huria. Mfano huu unawawezesha watengenezaji kupakua, kurekebisha, na kuutumia kwa madhumuni mbalimbali, ikijumuisha matumizi ya kibiashara. DeepSeek V3 ni mahiri katika kazi za usimbaji, tafsiri, na uandishi, mara nyingi ikipita washindani kama Meta, OpenAI, na Alibaba katika vigezo vya upimaji. Uwezo wake unatokana na mafunzo yake makubwa kwenye seti ya data ya trilioni 14.8 za tokens na vigezo bilioni 671, ambayo ni zaidi ya Meta's Llama 3.1 iliyo na vigezo bilioni 405. Seti hii kubwa ya data inahitaji vifaa vya kisasa kwa matumizi bora. DeepSeek ilitumia Nvidia H800 GPUs kwa muda wa miezi miwili, na kusababisha mchakato wa mafunzo wa gharama nafuu ikilinganishwa na GPT-4 ya OpenAI. Licha ya nguvu zake, mfano huu unakabiliwa na changamoto katika mada nyeti kisiasa, kama vile Tiananmen Square, ili kuendana na kanuni za China. High-Flyer Capital Management inaunga mkono DeepSeek kwa kuwekeza katika miundombinu ya seva ya AI, ikijumuisha makundi makubwa ya GPU za Nvidia, ikiwa na lengo la kusonga mbele AI kuelekea mifumo "inayoakili sana" na kushinda mipaka ya AI za chanzo cha ndani.

Maabara ya Kichina imezindua mojawapo ya mifano ya AI yenye nguvu zaidi "iliyowazi" hadi sasa, inayoitwa DeepSeek V3. Imeundwa na kampuni ya AI, DeepSeek, ilitolewa Jumatano chini ya leseni inayoruhusu, kuruhusu watengenezaji kupakua na kuibadilisha kwa matumizi mengi, ikiwa ni pamoja na matumizi ya kibiashara. DeepSeek V3 ina uwezo mkubwa katika kazi mbalimbali zinazoegemea maandishi kama vile kuweka misimbo, kutafsiri, na kuandika insha na barua pepe kutoka kwa maelekezo. Kulingana na majaribio ya ndani ya DeepSeek, DeepSeek V3 inazidi mifano inayoweza kupakuliwa, "ilivyo wazi" na mifano ya AI "iliyofungwa" ambayo inaweza kufikiwa tu kupitia API. Katika mashindano ya kuweka misimbo kwenye Codeforces, jukwaa la mashindano ya programu, DeepSeek inashinda mifano mingine, ikiwa ni pamoja na Llama 3. 1 405B ya Meta, GPT-4o ya OpenAI, na Qwen 2. 5 72B ya Alibaba. Inafanya vizuri sana pia katika jaribio la Aider Polyglot, linaloandaliwa kutathmini kama mfano unaweza kuandika msimbo mpya unaounganika na msimbo uliopo. DeepSeek V3 ilifundishwa kwa seti ya data ya trilioni 14. 8 ya tokeni. Katika sayansi ya data, tokeni inawakilisha vipande vya data mbichi, ambapo tokeni milioni 1 ni takriban sawa na maneno 750, 000. Mfano huu pia ni mkubwa kwa ukubwa, ukiwa na viashiria bilioni 671 (au bilioni 685 kwenye jukwaa la AI la Hugging Face), ambavyo ni vigezo vya ndani ambavyo mifano hutumia kufanya maamuzi. Ukubwa huu ni takriban mara 1. 6 ya ile ya Llama 3. 1 405B ya viashiria bilioni 405. Kwa kawaida, mifano yenye viashiria vingi hufanya vizuri zaidi, lakini pia inahitaji vifaa vya kisasa kutekelezwa kwa ufanisi. DeepSeek V3 isiyoboreshwa inahitaji benki ya GPU za hali ya juu kwa kasi ya kuridhisha. Licha ya kutokuwa na ufanisi kabisa, DeepSeek V3 ni mafanikio.

DeepSeek ilifundisha mfano huu katika muda wa miezi miwili takriban kwa kutumia kituo cha data cha Nvidia H800 GPU, ambazo makampuni ya Kichina yalikatazwa hivi karibuni kupata na Idara ya Biashara ya Marekani. Kampuni inadai ilitumia tu dola milioni 5. 5 kufundisha DeepSeek V3, sehemu ya gharama ya mifano kama GPT-4 ya OpenAI. Hata hivyo, maoni ya kisiasa ya mfano huu yamezuiliwa kiasi. Kwa mfano, haitatoa maoni juu ya mada ya Tiananmen Square. Kama kampuni ya Kichina, DeepSeek inazingatia kanuni za mtandao wa Kichina, kuhakikisha majibu ya mfano yanazingatia "maadili ya msingi ya kijamaa. " Mifumo mingi ya AI ya Kichina huepuka mada ambazo zinaweza kusababisha wasiwasi kwa waangalizi, kama vile majadiliano kuhusu utawala wa Xi Jinping. DeepSeek, ambayo ilianzisha hivi karibuni DeepSeek-R1 kama mshindani wa mfano wa "hoja" wa OpenAI’s o1, ni shirika la kuvutia. Inadhaminiwa na High-Flyer Capital Management, mfuko wa ua wa Kichina unaotumia AI kwa biashara. High-Flyer inajenga makundi yake ya seva kwa mafunzo ya mifano, mojawapo ukiwa na GPU 10, 000 za Nvidia A100 na gharama ya yen bilioni 1 (~dola milioni 138). Ilianzishwa na Liang Wenfeng, mhitimu wa sayansi ya kompyuta, High-Flyer inalenga kufikia AI "ya akili isiyo na kikomo" kupitia DeepSeek. Wenfeng, katika mahojiano mapema mwaka huu, alielezea AI iliyofungwa kama OpenAI kuwa na “faida ya muda mfupi. ” “[Haijazuia wengine kufikia kiwango], ” alibainisha. Kweli kabisa.


Watch video about

DeepSeek V3: Kifaa Bora cha AI cha Uchina Kilichozinduliwa

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 9:34 a.m.

Data za Salesforce zinaonyesha kuwa AI na Maajent…

Salesforce imetoa ripoti kamili kuhusu tukio la Ununuzi la Cyber Week la mwaka wa 2025, ikichambua data kutoka kwa zaidi ya waunuzi bilioni 1.5 duniani kote.

Dec. 21, 2025, 9:28 a.m.

Mtafuna wa AI kwa Kampeni za Matangazo ya Kidigit…

Teknolojia za akili bandia (AI) zimekuwa nguvu kuu katika kubadilisha jamii ya matangazo ya kidijitali.

Dec. 21, 2025, 9:25 a.m.

Kampuni hii Imara ya AI Inaweza Kuwa mshindi mkub…

Kuongezeka kwa kihistoria kwa hisa za teknolojia katika miaka miwili iliyopita kumewafaidi wawekezaji wengi, na wakati wakisherehekea mafanikio na kampuni kama Nvidia, Alphabet, na Palantir Technologies, ni muhimu kutafuta fursa kubwa ifuatayo.

Dec. 21, 2025, 9:24 a.m.

Mifumo ya Uangalizi wa Video ya AI Inaongeza Hatu…

Mwaka jana, miji duniani kote yanaendelea kuingiza akili bandia (AI) kwenye mifumo ya uangalizi wa video ili kuboresha ufuatiliaji wa maeneo ya umma.

Dec. 21, 2025, 9:14 a.m.

Uboreshaji wa Injini za Kizazi (GEO): Jinsi ya Ku…

Utafutaji umebadilika zaidi ya linku za buluu na orodha za maneno muhimu; sasa, watu huuliza maswali moja kwa moja kwa vifaa vya AI kama Google SGE, Bing AI, na ChatGPT.

Dec. 21, 2025, 5:27 a.m.

Biashara zilizojitegemea: Je, mauzo yako ya mtand…

Tungependa kujifunza zaidi kuhusu jinsi mabadiliko ya hivi karibuni katika tabia za utafutaji mtandaoni, yanayosababishwa na kuibuka kwa AI, yameathiri biashara yako vipi.

Dec. 21, 2025, 5:23 a.m.

Google Inasema Je! Kutoa Ushauri Graph kwa Wateja…

Mwandishi wa Google, Danny Sullivan, alitoa mwongozo kwa wataalamu wa SEO wanaoshughulikia wateja wenye hamu ya kupokea habari kuhusu mikakati ya SEO inayotumia AI.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today