Velký jazykový model vyvinutý v Číně, známý jako DeepSeek-R1, vzrušuje vědce jako nákladově efektivní a otevřenou alternativu k modelům uvažování, jako je o1 od OpenAI. Tyto modely produkují odpovědi v sekvenci, která napodobuje lidské uvažování, což je činí schopnějšími než starší jazykové modely při řešení vědeckých otázek, což potenciálně přináší prospěch výzkumu. První hodnocení R1, které bylo zahájeno 20. ledna, naznačují, že jeho výkon v úlohách týkajících se chemie, matematiky a programování konkuruje o1 – což zaujalo výzkumníky při jeho vydání OpenAI v září. „To je ohromující a zcela nečekané, “ komentoval Elvis Saravia, výzkumník v oblasti AI a spoluzakladatel britské poradenské firmy DAIR. AI, na platformě X. R1 je pozoruhodný z ještě jednoho důvodu. Start-up DeepSeek, sídlící v Hangzhou, učinil model „otevřenou váhou“, což umožňuje vědcům analyzovat a vylepšovat algoritmus. Je publikován pod licencí MIT, což umožňuje volné opětovné použití, i když není zcela otevřený zdroj, protože tréninková data zůstávají utajena. „Transparentnost, kterou DeepSeek prokázal, je pozoruhodná, “ uvádí Mario Krenn, vedoucí Laboratoře umělého vědce na Max Planck Institute for the Science of Light v Erlangenu v Německu. Naopak, o1 a další modely od OpenAI v San Franciscu, včetně nedávného o3, jsou považovány za „v podstatě černé skříňky, “ dodává. Ačkoli nelze zcela eliminovat halucinace AI, určité techniky mohou pomoci zmírnit jejich dopad. DeepSeek nezveřejnil celkové náklady na trénink R1, ale účtuje uživatelům přibližně jednu třicetinu provozních nákladů o1.
Společnost také vyvinula mini „destilované“ verze R1, což umožňuje výzkumníkům s omezenými výpočetními zdroji experimentovat s modelem. Krenn poznamenává: „Experiment, který stál přes 300 liber s o1, stál méně než 10 dolarů s R1, “ což zdůrazňuje významný rozdíl, který by mohl ovlivnit budoucí přijetí. R1 je součástí vzrůstu čínských velkých jazykových modelů (LLM). Vznikl ze zajišťovacího fondu, DeepSeek získal uznání minulý měsíc s vydáním chatbota jménem V3, který překonal hlavní konkurenty navzdory omezenému rozpočtu. Odborníci odhadují, že náklady na hardwarový pronájem pro trénink modelu činily kolem 6 milionů dolarů, zatímco více než 60 milionů dolarů stála Meta's Llama 3. 1 405B, která využívala 11krát více výpočetních zdrojů. Vzrušení kolem DeepSeek pramení částečně z jeho úspěchu při vývoji R1 navzdory americkým exportním kontrolám omezujícím přístup čínských společností k špičkovým AI procesorům. „To, že to pochází z Číny, dokazuje, že efektivní řízení zdrojů je důležitější než pouhá výpočetní síla, “ tvrdí François Chollet, výzkumník AI založený v Seattlu ve Washingtonu. Pokroky DeepSeek naznačují, že „rozdíl, který byl dříve považován za vedoucí postavení USA, se výrazně zúžil, “ poznamenal Alvin Wang Graylin, technologický expert v Bellevue ve Washingtonu, který je spojen s tchajwanskou společností na virtuální technologie HTC, na platformě X. „Obě země by měly zvážit spolupracující strategii pro vývoj pokročilé AI, místo aby pokračovaly v současné marné závodě ve zbrojení. “
DeepSeek-R1: Nákladově efektivní čínský AI model soutěží s OpenAI's o1
V dnešní rychle se rozšiřující digitální krajině společnosti sociálních médií stále častěji přijímají pokročilé technologie, aby ochránily své online komunity.
Verze této povídky se objevila v newsletteru CNN Business Nightcap.
V dnešním rychle se rozvíjejícím digitálním trhu mají malé podniky často potíže soupeřit s většími podniky kvůli rozsáhlým zdrojům a pokročilým technologiím, které velké firmy využívají pro online viditelnost a přilákání zákazníků.
Nvidia, globální lídr v oblasti technologií grafického zpracování a umělé inteligence, oznámil akvizici společnosti SchedMD, softwarové firmy specializující se na řešení umělé inteligence.
Vedení podniků napříč různými odvětvími nadále vnímají generativní umělou inteligenci (AI) jako transformující sílu schopnou přetvořit provoz, zapojení zákazníků a strategické rozhodování.
V dnešním rychle se rozvíjejícím prostředí vzdálené práce a virtuální komunikace výrazně pokročily platformy pro videokonference začleněním sofistikovaných funkcí umělé inteligence (AI).
Mezinárodní olympijský výbor (MOV) hodlá v nadcházejících olympijských hrách zavést pokročilé technologie umělé inteligence (AI) za účelem zvýšení operační efektivity a zlepšení zážitku diváků.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today