lang icon En
Dec. 27, 2024, 6:57 a.m.
10768

A DeepSeek V3 modellje büdzsébarát innovációval felülmúlja a tech óriásokat.

Brief news summary

A kínai start-up, a DeepSeek, nagy feltűnést keltett a globális mesterséges intelligencia színtéren új nagynyelvi modellje, a DeepSeek V3 bemutatásával. A modell 671 milliárd paraméterrel rendelkezik, és mindössze két hónap alatt, 5,58 millió amerikai dollár költséggel tréningezték. Annak ellenére, hogy kevesebb számítási erőforrást használt olyan nagyvállalatokhoz képest, mint a Meta és az OpenAI, a DeepSeek V3 felülmúlta versenytársait a benchmark teszteken. Ez a siker a kínai AI vállalatok fejlődését mutatja, még az Egyesült Államok által bevezetett, fejlett félvezetőkhöz való hozzáférést korlátozó szankciók ellenére is. A DeepSeek V3 elengedhetetlen a generatív AI szolgáltatásokhoz, köszönhetően annak, hogy képes kezelni az összetett adatokat és pontos előrejelzéseket nyújtani. OpenAI-tól Andrej Karpathy méltatta a DeepSeek hatékony tréning megközelítését, amely csak az előképzett súlyok megosztásával valósul meg, lehetővé téve mások számára a modell használatát anélkül, hogy felfednék a tréning kódját vagy az adathalmazokat. Ez az innovatív stratégia fontos lépést jelent a kínai AI cégek számára a rendkívül versenyképes globális piacon.

A DeepSeek V3 modelljét két hónap alatt fejlesztették ki 5, 58 millió amerikai dollár költséggel, kevesebb számítási erőforrás felhasználásával, mint versenytársai. Olvasási idő: 2 perc Miért bízhat meg az SCMP-ben Ben Jiang beszámolója Pekingből Közzétéve és frissítve: 2024. december 27. , 18:45 A DeepSeek, egy kínai start-up, megrengette a globális AI ipart új, nagy nyelvi modelljével (LLM), amely a Meta Platforms és a ChatGPT alkotója, az OpenAI modelljeit felülmúlta a benchmark tesztekben. A hangcsoui székhelyű vállalat csütörtökön a WeChaten bejelentette, hogy LLM-je, a DeepSeek V3, 671 milliárd paraméterrel rendelkezik, és körülbelül két hónap alatt lett betanítva 5, 58 millió amerikai dollár költséggel, jóval kevesebb számítási erőforrás mellett, mint amit nagyobb technológiai cégek használnak. Egy LLM támogatja a generatív AI szolgáltatásokat, mint például a ChatGPT, és a magas paraméter szám kulcsfontosságú a komplex adatmintákhoz való alkalmazkodás és a pontos előrejelzések készítése szempontjából. Andrej Karpathy, az OpenAI alapító csapatának tagja, megjegyezte a kínai start-up új AI modelljének jelentését, kijelentette a X közösségi média platformon: „A DeepSeek megkönnyíti a dolgát…

egy határszintű LLM súlyainak nyílt kiadásával, vicces költségvetésen képzett. ” A nyílt súlyok azt jelentik, hogy egy AI modell csak előre betanított paramétereit, vagy súlyait adják ki, lehetővé téve harmadik felek számára a modell használatát következtetésekre és finomhangolásra, de nem biztosítva a betanítási kódot, eredeti adatokat, architektúra részleteket vagy betanítási módszertant. Az a tény, hogy a DeepSeek erőteljes LLM-et hozott létre lényegesen kisebb költségvetésből, mint amit olyan nagyvállalatok mint a Meta és az OpenAI általában befektetnek, kiemeli a kínai AI cégek előrehaladását, azzal együtt is, hogy amerikai szankciók korlátozzák hozzáférésüket a modellképzéshez szükséges fejlett félvezetőkhöz.


Watch video about

A DeepSeek V3 modellje büdzsébarát innovációval felülmúlja a tech óriásokat.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 12, 2025, 1:42 p.m.

A Disney jogi lépéseket tett a Google ellen az AI…

A Walt Disney Company jogi lépéseket tett a Google ellen, amikor felszólító levelet küldött, melyben felhívta a figyelmet arra, hogy a techóriás megsértette a Disney által birtokolt szerzői jog védelem alatt álló tartalmakat a generatív mesterséges intelligencia (AI) modellek képzése és fejlesztése során, anélkül, hogy kártérítést fizetett volna.

Dec. 12, 2025, 1:35 p.m.

Mesterséges intelligencia és a keresőmotor-optima…

Ahogy a mesterséges intelligencia (MI) fejlődik és egyre inkább beépül a digitális marketingbe, annak hatása a keresőoptimalizálásra (SEO) egyre jelentősebbé válik.

Dec. 12, 2025, 1:33 p.m.

Mesterséges Intelligencia: MiniMax és a Zhipu AI …

A MiniMax és a Zhipu AI, két vezető műszaki intelligenciával foglalkozó vállalat, várhatóan már jövő év januárjában nyilvánosan jegyzésre kerül a Hong Kong-i Tőzsdén.

Dec. 12, 2025, 1:31 p.m.

Az OpenAI a Slack vezérigazgatóját, Denise Dresse…

Denise Dresser, a Slack vezérigazgatója, hamarosan távozik pozíciójából, hogy az OpenAI-nál, a ChatGPT mögött álló cégnél, a Chief Revenue Officer (Üzleti Értékesítési Igazgató) legyen.

Dec. 12, 2025, 1:30 p.m.

Az AI videó szintézis technikák javítják a filmké…

A filmipar jelentős átalakuláson megy keresztül, mivel a stúdiók egyre inkább alkalmazzák a mesterséges intelligencia (MI) videó szintézise technikákat, hogy javítsák a utómunka folyamatokat.

Dec. 12, 2025, 1:24 p.m.

19 legjobb közösségi média Mesterséges Intelligen…

Az AI forradalmasítja a közösségi média marketinget úgy, hogy eszközöket kínál, amelyek leegyszerűsítik és fokozzák a közönségelkötelezettséget.

Dec. 12, 2025, 9:42 a.m.

AI influenszerek a közösségi médiában: lehetősége…

Az AI által generált influencerek megjelenése a közösségi médiában jelentős változást jelez a digitális környezetben, és széleskörű vitákat váltott ki az online interakciók hitelességéről és az ezekhez kapcsolódó etikai kérdésekről.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today