lang icon En
Jan. 24, 2025, 4:55 p.m.
4049

DeepSeek's banebrydende AI-modeller overgår amerikanske konkurrenter, hvilket vækker bekymring i Silicon Valley.

Brief news summary

DeepSeek, et stigende AI-laboratorium i Kina, får betydelig opmærksomhed i Silicon Valley på grund af sin overkommelige AI-model, der overgår dem fra førende amerikanske tech-virksomheder. Virksomheden blev grundlagt i december og lancerede med succes en gratis, open-source stor sprogmodel på bare to måneder ved at bruge under 6 millioner dollar i funding og Nvidias H800-chips. Denne hurtige fremgang vækker bekymring for amerikansk dominans inden for AI og sætter spørgsmålstegn ved effektiviteten af de store investeringer fra amerikanske virksomheder. Evalueringer viser, at DeepSeeks model konsekvent overgår konkurrenter som Metas Llama 3.1, OpenAIs GPT-4o og Anthropics Claude Sonnet 3.5, især i komplekse opgaver. Deres r1 ræsonneringsmodel har fået ros for at overgå OpenAIs o1 og har fået anerkendelse fra brancheledere, herunder Microsofts CEO Satya Nadella. På trods af amerikanske restriktioner på halvledere viser DeepSeeks succes innovative metoder til at navigere i disse udfordringer. DeepSeek, grundlagt af Liang WenFeng og støttet af hedgefonden High-Flyer Quant, er et eksempel på Kinas modstandsdygtighed i de hastigt skiftende dyb læringslandskaber.

Et relativt obskurt AI-laboratorium baseret i Kina har vakt bekymring i Silicon Valley ved at introducere AI-modeller, der overstiger præstationen af de bedste amerikanske modparter, på trods af at de er udviklet med mindre budgetter og mindre avancerede chips. Laboratoriet, kendt som DeepSeek, lancerede en gratis og open-source stor sprogmodel i slutningen af december og hævdede, at den blev skabt på blot to måneder til en pris under 6 millioner dollars, ved hjælp af Nvidias mindre kraftfulde H800-chips. Disse nylige fremskridt har næret bekymringer om, at USA mister sin førerposition inden for kunstig intelligens og har rejst tvivl om de substansielle investeringer foretaget af store tech-virksomheder i AI-modeller og datacentre. I flere tredjeparts benchmark-evalueringer overgik DeepSeeks model bemærkelsesværdige konkurrenter, herunder Metas Llama 3. 1, OpenAIs GPT-4o og Anthropics Claude Sonnet 3. 5, hvilket viste overlegen nøjagtighed inden for områder som kompleks problemløsning, matematik og kodning. Mandag præsenterede DeepSeek r1, en ræsonneringsmodel, som også overgik OpenAIs seneste o1-model i adskillige tredjeparts vurderinger. Under en diskussion på Verdensøkonomisk Forum i Davos, Schweiz, bemærkede Microsofts CEO Satya Nadella: "Den nye DeepSeek-model er utrolig imponerende for effektivt at udvikle en open-source model, der excellerer i inferenstidberegning og er ekstremt compute-effektiv. Vi må tage udviklingen fra Kina meget alvorligt. " DeepSeek har formået at navigere de strenge semiconductorkrav, som den amerikanske regering har indført, hvad angår adgang til avancerede chips som Nvidias H100. De seneste gennembrud antyder, at DeepSeek enten har opdaget metoder til at omgå disse reguleringer, eller at eksportrestriktionerne ikke har været så begrænsende som forventet. "De kan udnytte en robust, stor model gennem en teknik, der kaldes distillation, " forklarede Chetan Puttagunta, General Partner hos Benchmark. "Grundlæggende hjælper en meget stor model en mindre model med at forbedre dens evner inden for specifikke områder.

Denne tilgang er faktisk meget omkostningseffektiv. " Information om DeepSeek og dets grundlægger, Liang WenFeng, er sparsommelig. Laboratoriet stammer fra en kinesisk hedgefond ved navn High-Flyer Quant, som angiveligt forvalter omkring 8 milliarder dollars i aktiver. DeepSeek er ikke alene i det kinesiske AI-landskab. Den fremtrædende AI-forsker Kai-Fu Lee har bemærket, at hans startup 01. ai blev udviklet med en investering på blot 3 millioner dollars. Derudover annoncerede ByteDance, moderselskabet til TikTok, en opdatering af sin model onsdag, hvor de hævdede, at den oversteg OpenAIs o1 i en betydelig benchmark-test. "Behovet er opfindelsens moder, " sagde Aravind Srinivas, CEO for Perplexity. "Stillet over for udfordringer endte de med at skabe noget langt mere effektivt. "


Watch video about

DeepSeek's banebrydende AI-modeller overgår amerikanske konkurrenter, hvilket vækker bekymring i Silicon Valley.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today