lang icon English
Jan. 23, 2025, 11:01 p.m.
3755

DeepSeek-R1: En kostnadseffektiv kinesisk AI-modell som konkurrerer med OpenAIs o1

Brief news summary

DeepSeek-R1 språkmodellen, utviklet av et kinesisk oppstartsselskap, tiltrekker seg betydelig interesse på grunn av sin kostnadseffektivitet i forhold til OpenAIs modeller. Innledende analyser avslører R1s imponerende kapasiteter innen områder som kjemi, matematikk og programmering, med forsker Elvis Saravia som bemerker dens "vill og totalt uventede" evner. Spesielt bruker DeepSeek et "åpent vekt"-system, som oppfordrer til samarbeid og forbedring av algoritmer blant forskere, i motsetning til OpenAIs proprietære metoder. Videre opererer R1 til omtrent en trettiendedel av kostnaden til OpenAIs tilbud, noe som muliggjør rimeligere testmuligheter. Denne utviklingen reflekterer raske fremskritt i Kinas språkmodellsektor, selv midt i amerikanske restriksjoner på eksport av AI-teknologi. Eksperter indikerer at R1s effektivitet representerer en trend mot ressursoptimalisering snarere enn kun å forbedre datakraft, noe som antyder et krympende teknologisk gap mellom USA og Kina. Denne fremgangen kan skape muligheter for samarbeid innen AI-feltet, og bevege seg bort fra konvensjonelle konkurransedynamikker.

En stor språkmodell utviklet i Kina, kjent som DeepSeek-R1, begeistrer forskere som et kostnadseffektivt og åpent alternativ til resonnementmodeller som OpenAIs o1. Disse modellene produserer svar i en sekvens som etterligner menneskelig resonnement, noe som gjør dem mer kompetente enn eldre språkmodeller i å takle vitenskapelige problemer, og de kan vise seg å være gunstige for forskning. Tidlige vurderinger av R1, som ble lansert 20. januar, indikerer at ytelsen i oppgaver relatert til kjemi, matematikk og koding konkurrerer med o1 – som imponerte forskere ved sin utgivelse av OpenAI i september. “Dette er fantastisk og helt uventet, ” kommenterte Elvis Saravia, en AI-forsker og medgründer av det britisk-baserte AI-konsulentfirmaet DAIR. AI, på X. R1 er bemerkelsesverdig av en annen grunn. Oppstarten DeepSeek, basert i Hangzhou, har gjort modellen ‘open-weight’, som lar forskere analysere og forbedre algoritmen. Den er publisert under en MIT-lisens, som gjør det mulig med gratis gjenbruk, selv om den ikke er helt åpen kilde, ettersom treningsdataene forblir uoppgitt. “Åpenheten som DeepSeek viser, er bemerkelsesverdig, ” sier Mario Krenn, leder for Artificial Scientist Lab ved Max Planck-instituttet for lysets vitenskap i Erlangen, Tyskland. I kontrast blir o1 og andre modeller fra OpenAI i San Francisco, inkludert den nylige o3, betraktet som “essensielt svarte bokser, ” bemerker han. Selv om AI-hallusinasjoner ikke kan elimineres helt, kan visse teknikker bidra til å redusere deres innvirkning. DeepSeek har ikke offentliggjort de totale kostnadene for å trene R1, men de tar betalt fra brukere omtrent en trettiende av o1s driftsutgifter.

Selskapet har også utviklet mini ‘destillert’ versjoner av R1, som lar forskere med begrensede datakraftressurser eksperimentere med modellen. Krenn bemerker: “Et eksperiment som kostet over 300 pund med o1, kostet mindre enn 10 dollar med R1, ” noe som fremhever en betydelig forskjell som kan påvirke fremtidig adopsjon. R1 er en del av en økning i kinesiske store språkmodeller (LLM). DeepSeek, som oppsto fra en hedgefond, fikk anerkjennelse forrige måned med lanseringen av en chatbot kalt V3, som overgikk store konkurrenter til tross for et begrenset budsjett. Eksperter estimere at leieutstyret for trening av modellen var rundt 6 millioner dollar, sammenlignet med over 60 millioner dollar for Metas Llama 3. 1 405B, som brukte 11 ganger datakraften. Begeistringen rundt DeepSeek skyldes delvis deres prestasjon i å utvikle R1 midt i amerikanske eksportkontroller som begrenser kinesiske selskapers tilgang til toppmoderne AI-prosesseringsbrikker. “Det faktum at det stammer fra Kina viser at effektiv ressursforvaltning er mer kritisk enn ren datakraft, ” hevder François Chollet, en AI-forsker basert i Seattle, Washington. DeepSeeks fremskritt indikerer at “gapet som tidligere ble oppfattet som et amerikansk fortrinn, har blitt betydelig innskrenket, ” observerte Alvin Wang Graylin, en teknologiekspert i Bellevue, Washington, som er tilknyttet det Taiwan-baserte immersive teknologi-selskapet HTC, på X. “Begge land bør vurdere en samarbeidsstrategi for utvikling av avansert AI i stedet for å fortsette den nåværende nytteløse våpenkappløpet. ”


Watch video about

DeepSeek-R1: En kostnadseffektiv kinesisk AI-modell som konkurrerer med OpenAIs o1

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 17, 2025, 5:24 a.m.

AI-selskap hevder at kinesiske spioner brukte der…

Anthropic, selskapet bak AI-chatboten Claude, hevder å ha identifisert kinesisk-støttede hackere som bruker verktøyet deres til å gjennomføre automatiserte cyberangrep mot omtrent 30 globale organisasjoner.

Nov. 17, 2025, 5:22 a.m.

AI-video komprimeringsteknikker forbedrer strømme…

I dagens digitale landskap, hvor videokonsumet er på et all-time høyt, streber strømmetjenester etter å forbedre brukeropplevelsen og optimalisere ressursene.

Nov. 17, 2025, 5:22 a.m.

SES AI Corporation samarbeider med Hyundai Motor …

SES AI Corporation og Hyundai Motor Group har nylig inngått et betydelig partnerskap for å utvikle B-eksemplaret av litium-metallbatterier, noe som markerer et strategisk skritt for å fremme neste generasjons batteriteknologier, spesielt for elektriske kjøretøy (EV).

Nov. 17, 2025, 5:14 a.m.

AI-drevne markedsføringsstrategier: En banebryter…

Kunstig intelligens (KI) omformer markedsføringsbransjen i en rasende fart ved å introdusere innovative verktøy som øker kundesamsvar og optimaliserer reklamekampanjer.

Nov. 17, 2025, 5:14 a.m.

eBay's AI-drevne Black Friday-omveltning: Endring…

Når Black Friday og Cyber Monday 2025 nærmer seg, implementerer eBay viktige policyendringer rettet mot høytvolums-selgere, inkludert justerte listinggrenser og forbedrede promotjonsverktøy.

Nov. 17, 2025, 5:12 a.m.

Data: Oversatte nettsteder får 327 % mer synlighe…

Dette innlegget ble sponset av Weglot, og meningene som uttrykkes er sponsorens egne.

Nov. 16, 2025, 1:28 p.m.

AI-videovisning forbedrer sports-overføringsopple…

Sportssendinger over hele verden tar raskt i bruk kunstig intelligens (AI) videanalytikk for å forvandle direktesendinger av sport.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today