En stor språkmodell utviklet i Kina, kjent som DeepSeek-R1, begeistrer forskere som et kostnadseffektivt og åpent alternativ til resonnementmodeller som OpenAIs o1. Disse modellene produserer svar i en sekvens som etterligner menneskelig resonnement, noe som gjør dem mer kompetente enn eldre språkmodeller i å takle vitenskapelige problemer, og de kan vise seg å være gunstige for forskning. Tidlige vurderinger av R1, som ble lansert 20. januar, indikerer at ytelsen i oppgaver relatert til kjemi, matematikk og koding konkurrerer med o1 – som imponerte forskere ved sin utgivelse av OpenAI i september. “Dette er fantastisk og helt uventet, ” kommenterte Elvis Saravia, en AI-forsker og medgründer av det britisk-baserte AI-konsulentfirmaet DAIR. AI, på X. R1 er bemerkelsesverdig av en annen grunn. Oppstarten DeepSeek, basert i Hangzhou, har gjort modellen ‘open-weight’, som lar forskere analysere og forbedre algoritmen. Den er publisert under en MIT-lisens, som gjør det mulig med gratis gjenbruk, selv om den ikke er helt åpen kilde, ettersom treningsdataene forblir uoppgitt. “Åpenheten som DeepSeek viser, er bemerkelsesverdig, ” sier Mario Krenn, leder for Artificial Scientist Lab ved Max Planck-instituttet for lysets vitenskap i Erlangen, Tyskland. I kontrast blir o1 og andre modeller fra OpenAI i San Francisco, inkludert den nylige o3, betraktet som “essensielt svarte bokser, ” bemerker han. Selv om AI-hallusinasjoner ikke kan elimineres helt, kan visse teknikker bidra til å redusere deres innvirkning. DeepSeek har ikke offentliggjort de totale kostnadene for å trene R1, men de tar betalt fra brukere omtrent en trettiende av o1s driftsutgifter.
Selskapet har også utviklet mini ‘destillert’ versjoner av R1, som lar forskere med begrensede datakraftressurser eksperimentere med modellen. Krenn bemerker: “Et eksperiment som kostet over 300 pund med o1, kostet mindre enn 10 dollar med R1, ” noe som fremhever en betydelig forskjell som kan påvirke fremtidig adopsjon. R1 er en del av en økning i kinesiske store språkmodeller (LLM). DeepSeek, som oppsto fra en hedgefond, fikk anerkjennelse forrige måned med lanseringen av en chatbot kalt V3, som overgikk store konkurrenter til tross for et begrenset budsjett. Eksperter estimere at leieutstyret for trening av modellen var rundt 6 millioner dollar, sammenlignet med over 60 millioner dollar for Metas Llama 3. 1 405B, som brukte 11 ganger datakraften. Begeistringen rundt DeepSeek skyldes delvis deres prestasjon i å utvikle R1 midt i amerikanske eksportkontroller som begrenser kinesiske selskapers tilgang til toppmoderne AI-prosesseringsbrikker. “Det faktum at det stammer fra Kina viser at effektiv ressursforvaltning er mer kritisk enn ren datakraft, ” hevder François Chollet, en AI-forsker basert i Seattle, Washington. DeepSeeks fremskritt indikerer at “gapet som tidligere ble oppfattet som et amerikansk fortrinn, har blitt betydelig innskrenket, ” observerte Alvin Wang Graylin, en teknologiekspert i Bellevue, Washington, som er tilknyttet det Taiwan-baserte immersive teknologi-selskapet HTC, på X. “Begge land bør vurdere en samarbeidsstrategi for utvikling av avansert AI i stedet for å fortsette den nåværende nytteløse våpenkappløpet. ”
DeepSeek-R1: En kostnadseffektiv kinesisk AI-modell som konkurrerer med OpenAIs o1
Anthropic, selskapet bak AI-chatboten Claude, hevder å ha identifisert kinesisk-støttede hackere som bruker verktøyet deres til å gjennomføre automatiserte cyberangrep mot omtrent 30 globale organisasjoner.
I dagens digitale landskap, hvor videokonsumet er på et all-time høyt, streber strømmetjenester etter å forbedre brukeropplevelsen og optimalisere ressursene.
SES AI Corporation og Hyundai Motor Group har nylig inngått et betydelig partnerskap for å utvikle B-eksemplaret av litium-metallbatterier, noe som markerer et strategisk skritt for å fremme neste generasjons batteriteknologier, spesielt for elektriske kjøretøy (EV).
Kunstig intelligens (KI) omformer markedsføringsbransjen i en rasende fart ved å introdusere innovative verktøy som øker kundesamsvar og optimaliserer reklamekampanjer.
Når Black Friday og Cyber Monday 2025 nærmer seg, implementerer eBay viktige policyendringer rettet mot høytvolums-selgere, inkludert justerte listinggrenser og forbedrede promotjonsverktøy.
Dette innlegget ble sponset av Weglot, og meningene som uttrykkes er sponsorens egne.
Sportssendinger over hele verden tar raskt i bruk kunstig intelligens (AI) videanalytikk for å forvandle direktesendinger av sport.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today