lang icon En
Jan. 23, 2025, 11:01 p.m.
4111

DeepSeek-R1: En omkostningseffektiv kinesisk AI-model, der konkurrerer med OpenAIs o1.

Brief news summary

DeepSeek-R1 sprogmodel, udviklet af en kinesisk opstart, vækker betydelig interesse på grund af sin omkostningseffektivitet i forhold til OpenAIs modeller. Indledende analyser afslører R1's imponerende kapaciteter inden for områder som kemi, matematik og programmering, hvor forskeren Elvis Saravia bemærker dens "vilde og helt uventede" evner. Bemærkelsesværdigt anvender DeepSeek et "åben-vægt" system, som fremmer samarbejde og algoritmeforbedring blandt forskere, i modsætning til OpenAIs proprietære metoder. Desuden opererer R1 til omkring en tredjedel af prisen på OpenAIs tilbud, hvilket muliggør mere overkommelige testmuligheder. Denne udvikling afspejler hurtige fremskridt i Kinas sprogmodelsektor, selv midt i amerikanske restriktioner på eksport af AI-teknologi. Eksperter indikerer, at R1's effektivitet repræsenterer en tendens mod ressourceoptimering snarere end kun at forbedre den beregningsmæssige kraft, hvilket antyder en formindskelse af det teknologiske hul mellem USA og Kina. Denne fremgang kan fremme muligheder for samarbejde inden for AI-feltet, som bevæger sig ud over de konventionelle konkurrenceforhold.

En stor sprogmodel udviklet i Kina, kendt som DeepSeek-R1, vækker begejstring blandt forskere som et omkostningseffektivt og åbent alternativ til ræsonneringsmodeller som OpenAI's o1. Disse modeller producerer svar i en sekvens, der efterligner menneskelig ræsonnering, hvilket gør dem mere dygtige end ældre sprogmodeller til at tackle videnskabelige spørgsmål, hvilket potentielt kan være gavnligt for forskning. Tidlige vurderinger af R1, som blev lanceret den 20. januar, indikerer, at dens præstationer i opgaver relateret til kemi, matematik og kodning kan konkurrere med o1— som imponerede forskere ved sin frigivelse fra OpenAI i september. “Dette er fantastisk og helt uventet, ” kommenterede Elvis Saravia, AI-forsker og medstifter af det britisk-baserede AI-konsulentfirma DAIR. AI, på X. R1 er bemærkelsesværdig af en anden grund. Start-up’en DeepSeek, med base i Hangzhou, har gjort modellen ‘åben-vægt’, hvilket giver forskere mulighed for at analysere og forbedre algoritmen. Den er offentliggjort under en MIT-licens, som muliggør gratis genbrug, selvom den ikke er helt open source, da træningsdataene forbliver uoplyste. “Den gennemsigtighed, som DeepSeek viser, er bemærkelsesværdig, ” siger Mario Krenn, leder af Artificial Scientist Lab ved Max Planck Instituttet for Lysets Videnskab i Erlangen, Tyskland. I modsætning hertil betragtes o1 og andre modeller fra OpenAI i San Francisco, herunder den nyeste o3, som “essentielt sorte bokse, ” bemærker han. Selvom AI-hallucinationer ikke kan elimineres helt, kan visse teknikker hjælpe med at mindske deres indvirkning. DeepSeek har ikke offentliggjort den samlede omkostning ved at træne R1, men de opkræver brugere omkring en tredivendedel af o1's driftsomkostninger.

Virksomheden har også udviklet mini ‘distillerede’ versioner af R1, som giver forskere med begrænsede computerressourcer mulighed for at eksperimentere med modellen. Krenn bemærker, “Et eksperiment, der kostede over £300 med o1, var mindre end $10 med R1, ” hvilket fremhæver en betydelig forskel, der kan påvirke fremtidig adoption. R1 er en del af en bølge af kinesiske store sprogmodeller (LLMs). DeepSeek, der kommer fra en hedgefond, har fået anerkendelse i sidste måned med frigivelsen af en chatbot ved navn V3, som overgik store konkurrenter trods et begrænset budget. Eksperter estimerer, at hardwarelejen til træning af modellen var omkring $6 millioner, sammenlignet med over $60 millioner for Metas Llama 3. 1 405B, som anvendte 11 gange så mange computerressourcer. Begejstringen omkring DeepSeek stammer delvist fra deres præstation i at udvikle R1 trods amerikanske eksportkontroller, der begrænser kinesiske virksomheders adgang til top-tier AI-behandlingschips. “Det faktum, at det kommer fra Kina, viser, at effektiv ressourceforvaltning er vigtigere end ren beregningskraft, ” hævder François Chollet, en AI-forsker baseret i Seattle, Washington. DeepSeeks fremskridt indikerer, at “kløften, der tidligere blev opfattet som en amerikansk føring, er blevet betydeligt indsnævret, ” bemærkede Alvin Wang Graylin, en teknologiekspert i Bellevue, Washington, som er tilknyttet det Taiwan-baserede immersive teknologi firma HTC, på X. “Begge lande bør overveje en samarbejdsstrategi for udvikling af avanceret AI i stedet for at fortsætte den nuværende meningsløse våbenkappestrid. ”


Watch video about

DeepSeek-R1: En omkostningseffektiv kinesisk AI-model, der konkurrerer med OpenAIs o1.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today