lang icon En
Jan. 23, 2025, 11:01 p.m.
3978

DeepSeek-R1: Nákladově efektivní čínský AI model soutěží s OpenAI's o1

Brief news summary

Jazykový model DeepSeek-R1, vyvinutý čínským startupem, přitahuje značný zájem díky své nákladové efektivitě v porovnání s modely OpenAI. Počáteční analýzy odhalily R1's působivé schopnosti v oblastech jako chemie, matematika a programování, přičemž výzkumník Elvis Saravia poznamenal, že má "šokující a zcela nečekané" schopnosti. Je pozoruhodné, že DeepSeek používá systém "otevřených váh," který podporuje spolupráci a zlepšování algoritmů mezi výzkumníky, na rozdíl od proprietárních metod OpenAI. Dále R1 funguje za přibližně jednu třicetinovou cenu nabídek OpenAI, což umožňuje dostupnější možnosti testování. Tento vývoj odráží rychlý pokrok v čínském sektoru jazykových modelů, i navzdory omezením USA na export technologií AI. Odborníci naznačují, že efektivita R1 představuje trend směrem k optimalizaci zdrojů spíše než pouze ke zvyšování výpočetní síly, což naznačuje zmenšování technologického gapu mezi USA a Čínou. Tento pokrok může podnítit příležitosti ke spolupráci v oblasti AI a posunout se směrem k překonání konvenčních konkurenčních dynamik.

Velký jazykový model vyvinutý v Číně, známý jako DeepSeek-R1, vzrušuje vědce jako nákladově efektivní a otevřenou alternativu k modelům uvažování, jako je o1 od OpenAI. Tyto modely produkují odpovědi v sekvenci, která napodobuje lidské uvažování, což je činí schopnějšími než starší jazykové modely při řešení vědeckých otázek, což potenciálně přináší prospěch výzkumu. První hodnocení R1, které bylo zahájeno 20. ledna, naznačují, že jeho výkon v úlohách týkajících se chemie, matematiky a programování konkuruje o1 – což zaujalo výzkumníky při jeho vydání OpenAI v září. „To je ohromující a zcela nečekané, “ komentoval Elvis Saravia, výzkumník v oblasti AI a spoluzakladatel britské poradenské firmy DAIR. AI, na platformě X. R1 je pozoruhodný z ještě jednoho důvodu. Start-up DeepSeek, sídlící v Hangzhou, učinil model „otevřenou váhou“, což umožňuje vědcům analyzovat a vylepšovat algoritmus. Je publikován pod licencí MIT, což umožňuje volné opětovné použití, i když není zcela otevřený zdroj, protože tréninková data zůstávají utajena. „Transparentnost, kterou DeepSeek prokázal, je pozoruhodná, “ uvádí Mario Krenn, vedoucí Laboratoře umělého vědce na Max Planck Institute for the Science of Light v Erlangenu v Německu. Naopak, o1 a další modely od OpenAI v San Franciscu, včetně nedávného o3, jsou považovány za „v podstatě černé skříňky, “ dodává. Ačkoli nelze zcela eliminovat halucinace AI, určité techniky mohou pomoci zmírnit jejich dopad. DeepSeek nezveřejnil celkové náklady na trénink R1, ale účtuje uživatelům přibližně jednu třicetinu provozních nákladů o1.

Společnost také vyvinula mini „destilované“ verze R1, což umožňuje výzkumníkům s omezenými výpočetními zdroji experimentovat s modelem. Krenn poznamenává: „Experiment, který stál přes 300 liber s o1, stál méně než 10 dolarů s R1, “ což zdůrazňuje významný rozdíl, který by mohl ovlivnit budoucí přijetí. R1 je součástí vzrůstu čínských velkých jazykových modelů (LLM). Vznikl ze zajišťovacího fondu, DeepSeek získal uznání minulý měsíc s vydáním chatbota jménem V3, který překonal hlavní konkurenty navzdory omezenému rozpočtu. Odborníci odhadují, že náklady na hardwarový pronájem pro trénink modelu činily kolem 6 milionů dolarů, zatímco více než 60 milionů dolarů stála Meta's Llama 3. 1 405B, která využívala 11krát více výpočetních zdrojů. Vzrušení kolem DeepSeek pramení částečně z jeho úspěchu při vývoji R1 navzdory americkým exportním kontrolám omezujícím přístup čínských společností k špičkovým AI procesorům. „To, že to pochází z Číny, dokazuje, že efektivní řízení zdrojů je důležitější než pouhá výpočetní síla, “ tvrdí François Chollet, výzkumník AI založený v Seattlu ve Washingtonu. Pokroky DeepSeek naznačují, že „rozdíl, který byl dříve považován za vedoucí postavení USA, se výrazně zúžil, “ poznamenal Alvin Wang Graylin, technologický expert v Bellevue ve Washingtonu, který je spojen s tchajwanskou společností na virtuální technologie HTC, na platformě X. „Obě země by měly zvážit spolupracující strategii pro vývoj pokročilé AI, místo aby pokračovaly v současné marné závodě ve zbrojení. “


Watch video about

DeepSeek-R1: Nákladově efektivní čínský AI model soutěží s OpenAI's o1

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 1:15 p.m.

Umělá inteligence pro rozpoznávání videa zlepšuje…

V dnešní rychle se rozšiřující digitální krajině společnosti sociálních médií stále častěji přijímají pokročilé technologie, aby ochránily své online komunity.

Dec. 16, 2025, 9:37 a.m.

Proč by mohl být rok 2026 rokem anti-AI marketingu

Verze této povídky se objevila v newsletteru CNN Business Nightcap.

Dec. 16, 2025, 9:29 a.m.

SEO řízené umělou inteligencí: změna hry pro malé…

V dnešním rychle se rozvíjejícím digitálním trhu mají malé podniky často potíže soupeřit s většími podniky kvůli rozsáhlým zdrojům a pokročilým technologiím, které velké firmy využívají pro online viditelnost a přilákání zákazníků.

Dec. 16, 2025, 9:28 a.m.

Nvidia získává SchedMD, aby posílila iniciativy o…

Nvidia, globální lídr v oblasti technologií grafického zpracování a umělé inteligence, oznámil akvizici společnosti SchedMD, softwarové firmy specializující se na řešení umělé inteligence.

Dec. 16, 2025, 9:22 a.m.

Obchodní vůdci souhlasí, že AI je budoucnost. Jen…

Vedení podniků napříč různými odvětvími nadále vnímají generativní umělou inteligenci (AI) jako transformující sílu schopnou přetvořit provoz, zapojení zákazníků a strategické rozhodování.

Dec. 16, 2025, 9:20 a.m.

Vizuální konference s umělou inteligencí: Zlepšen…

V dnešním rychle se rozvíjejícím prostředí vzdálené práce a virtuální komunikace výrazně pokročily platformy pro videokonference začleněním sofistikovaných funkcí umělé inteligence (AI).

Dec. 16, 2025, 9:19 a.m.

IOC integruje pokročilé technologie umělé intelig…

Mezinárodní olympijský výbor (MOV) hodlá v nadcházejících olympijských hrách zavést pokročilé technologie umělé inteligence (AI) za účelem zvýšení operační efektivity a zlepšení zážitku diváků.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today