lang icon En
Feb. 2, 2025, 4:07 p.m.
2467

A DeepSeek piacra dobta első generációs mesterséges intelligencia modelleit, amelyek versenyeznek az OpenAI GPT-4-jével.

Brief news summary

Január 20-án a DeepSeek kínai mesterséges intelligencia start-up bemutatta fejlett érvelési modelljeit, köztük a DeepSeek-R1-et, amelyet azzal a céllal terveztek, hogy versenyezzen az OpenAI csúcsmodelljeivel, miközben hatékonyan működik gyengébb hardveren. Különösen figyelemre méltó, hogy a V3 modellhez mindössze 5,6 millió dollár szükséges a kiképzéshez, ami jelentősen alacsonyabb, mint az OpenAI 100 millió dolláros költsége a GPT-4-hez. Az R1 modell nyílt forráskódú jellege ösztönzi az iparágak közötti elfogadást. A DeepSeek egy "szakértők keveréke" megközelítést alkalmaz, amely csak a szükséges szegmenseket aktiválja a modellen belül, ez növeli a hatékonyságot a korlátozott hardveren. Ez a módszer, a adatkompresszióval és a fejlettebb terheléselosztással kombinálva, felgyorsítja a kiképzést és csökkenti az infereálási költségeket, ezáltal a mesterséges intelligencia hozzáférhetőbbé válik. Ezek az fejlesztések jelentős lehetőségeket kínálnak olyan cégeknek, mint az Apple és a Meta. Az Apple célja, hogy javítsa a készüléken belüli mesterséges intelligencia képességeit, a felhasználói adatvédelemre és a jobb ügyfélkapcsolatra összpontosítva. Ezzel szemben a Meta tervei között szerepel a DeepSeek technológiai integrálása az AI szolgáltatásaik bővítésére, célul tűzve ki a bevételek optimalizálását az Open-source Llama modelljükön keresztül.

2023. január 20-án a DeepSeek, egy kínai AI startup, bemutatta első generációs érvelési modelljeit, amelyekről figyelemre méltó állításokat tettek a képességeikre vonatkozóan. A DeepSeek-R1 modell teljesítménye állítólag megegyezik az OpenAI csúcsmodelljeinek teljesítményével, annak ellenére, hogy gyengébb hardveren fejlesztették. Ez az eredmény különösen lenyűgöző, mivel mindössze 5, 6 millió dollárba került a betanítása, míg az OpenAI GPT-4 esetében 100 millió dollárról van szó. A DeepSeek R1 a V3 nagy nyelvi modellre épül, és teljesen nyílt forráskódú, ami potenciálisan átalakíthatja az AI ipart. A cég hardverhatékonyságra fókuszál, ami a Nvidia H100 GPU-k Kínában alkalmazott exportkorlátozásaiból ered, így innovatív megoldásokkal, mint például a H800 és a "mixture of experts" (DeepSeekMoE) technikával dolgoznak, amely csak azokat a modellrészleteket aktiválja, amelyekre éppen szükség van. Ez csökkenti az adatátviteli követelményeket és javítja a betanítás hatékonyságát. Ezek a fejlesztések nemcsak a betanítási időket gyorsítják, hanem olcsóbbá és hozzáférhetőbbé teszik az AI inferenciát gyengébb hardveren.

Ennek következményeként olyan cégek, mint az Apple és a Meta jelentős előnyökhöz juthatnak. Az Apple, amely prioritásként kezeli az adatvédelmet és az eszközön történő feldolgozást, a DeepSeek módszereinek integrálásával fokozhatja az AI funkciókat olyan eszközökön, mint az iPhone, potenciálisan növelve az értékesítést és a szolgáltatási bevételeket. Az A18 Pro chip frissített memóriasávszélessége támogatja ezeket a fejlesztéseket, lehetővé téve olyan funkciókat, mint a okosabb Siri és az offline fordítások. A Meta is növeli az AI-ra fordított befektetéseit, és várhatóan 60%-os emelkedést tervez a tőke kiadásokban 2025-re. A Llama modell nyílt forráskódúvá tételével a Meta maximálni kívánja az AI megvalósításainak hatékonyságát. Az AI inferencia költségeinek csökkentése jelentős nyereséget szabadíthat fel a Meta számára, megkönnyítve az AI megoldások skálázását a 3 milliárd felhasználója számára. A DeepSeek innovációi olyan eszközöket adnak a Meta kezébe, amelyek szükségesek az AI képességek és a profitabilitás fokozásához.


Watch video about

A DeepSeek piacra dobta első generációs mesterséges intelligencia modelleit, amelyek versenyeznek az OpenAI GPT-4-jével.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 1:29 p.m.

SaaStr AI alkalmazás a héten: Kintsugi — az AI, a…

Minden héten kiemelünk egy AI-alapú alkalmazást, amely valódi problémákat old meg B2B és felhőalapú cégek számára.

Dec. 16, 2025, 1:24 p.m.

Az AI szerepe a helyi SEO stratégiákban

A mesterséges intelligencia (MI) egyre nagyobb mértékben befolyásolja a helyi keresőoptimalizálási (SEO) stratégiákat.

Dec. 16, 2025, 1:22 p.m.

IND Technology 33 millió dolláros finanszírozást …

Az IND Technology, egy ausztrál cég, amely az infrastruktúra felügyeletével foglalkozik közművállalatok számára, 33 millió dolláros növekedési finanszírozást kapott, hogy erősítse mesterséges intelligencia-alapú erőfeszítéseit a tűzvészek és áramszünetek megelőzésében.

Dec. 16, 2025, 1:21 p.m.

Az AI-bevezetések bonyolulttá válhatnak a kiadók …

Az utóbbi hetekben egyre több kiadó és márka szembesült jelentős visszhanggal, miközben kísérleteznek a mesterséges intelligencia (MI) alkalmazásával tartalom-előállítási folyamataikban.

Dec. 16, 2025, 1:17 p.m.

A Google Labs és a DeepMind bemutatja a Pomelli-t…

A Google Labs, a Google DeepMind-del együttműködésben, bemutatta a Pomelli-t, egy mesterséges intelligencia alapú kísérletet, amelyet kis- és középvállalkozások márkázott marketingkampányaik fejlesztésére terveztek.

Dec. 16, 2025, 1:15 p.m.

A mesterséges intelligencia videófelismerése javí…

A mai gyorsan bővülő digitális világban a közösségi média cégek egyre inkább áttérnek a fejlett technológiák alkalmazására a online közösségeik védelme érdekében.

Dec. 16, 2025, 9:37 a.m.

Miért lehet 2026 az év az anti-AI marketing számá…

Egy változat ebből a történetből megjelent a CNN Business Nightcap hírlevelében.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today