lang icon English
Dec. 26, 2024, 8:59 p.m.
12804

DeepSeek V3: Kinas ledende åpne AI-modell avduket

Brief news summary

DeepSeek, et ledende kinesisk AI-selskap, har lansert DeepSeek V3, en åpen kildekode AI-modell. Denne modellen gjør det mulig for utviklere å laste ned, endre og bruke den til ulike formål, inkludert kommersielle applikasjoner. DeepSeek V3 utmerker seg i koding, oversettelse og skriving, og overgår ofte konkurrenter som Meta, OpenAI og Alibaba i tester. Dens evner skyldes omfattende opplæring på et stort datasett med 14,8 billioner tokens og 671 milliarder parametere, som er mer enn Metas Llama 3.1 med 405 milliarder parametere. Dette enorme datasettet krever kraftig maskinvare for optimal bruk. DeepSeek brukte Nvidia H800 GPU-er i to måneder, noe som resulterte i en kostnadseffektiv treningsprosess sammenlignet med OpenAIs GPT-4. Til tross for sine styrker står modellen overfor utfordringer med politisk sensitive temaer, som Tiananmen-plassen, for å overholde kinesiske forskrifter. High-Flyer Capital Management støtter DeepSeek ved å investere i AI-serverinfrastruktur, inkludert store Nvidia GPU-klynger, med mål om å fremme AI mot "superintelligente" systemer og overvinne begrensningene til lukkede AI-modeller.

Et kinesisk laboratorium har avduket en av de kraftigste "åpne" AI-modellene til dags dato, kalt DeepSeek V3. Utviklet av AI-selskapet DeepSeek, ble den lansert onsdag under en tillatende lisens, som gjør det mulig for utviklere å laste ned og modifisere modellen for de fleste bruksområder, inkludert kommersielle applikasjoner. DeepSeek V3 utmerker seg i ulike tekstbaserte oppgaver som koding, oversetting, og skriving av essays og e-poster fra oppfordringer. Ifølge DeepSeeks interne tester, overgår DeepSeek V3 både nedlastbare "åpne" modeller og "lukkede" AI-modeller som kun er tilgjengelige via en API. I kodekonkurranser på Codeforces, en plattform for programmeringskonkurranser, overgår DeepSeek andre modeller, inkludert Metas Llama 3. 1 405B, OpenAIs GPT-4o, og Alibabas Qwen 2. 5 72B. Den utmerker seg også i Aider Polyglot-testen, som er designet for å vurdere om en modell kan skrive ny kode som integreres med eksisterende kode. DeepSeek V3 ble trent på et datasett med 14, 8 billioner tokens. I datavitenskap representerer tokens deler av rådata, hvor 1 million tokens tilsvarer omtrent 750 000 ord. Modellen er også massiv i størrelse, med 671 milliarder parametere (eller 685 milliarder på AI-utviklingsplattformen Hugging Face), som er de interne variablene modellene bruker for å ta beslutninger. Denne størrelsen er omtrent 1, 6 ganger Llama 3. 1 405Bs 405 milliarder parametere. Vanligvis presterer modeller med flere parametere bedre, men de krever også kraftig maskinvare for å kjøre effektivt. En ikke-optimalisert DeepSeek V3 trenger en bank av high-end GPUer for rimelige hastigheter. Til tross for sin upraktiskhet, er DeepSeek V3 en prestasjon.

DeepSeek trente modellen på omtrent to måneder ved bruk av et datasenter av Nvidia H800 GPUer, som kinesiske selskaper nylig ble forhindret fra å anskaffe av det amerikanske handelsdepartementet. Selskapet hevder det bare brukte 5, 5 millioner dollar for å trene DeepSeek V3, en brøkdel av kostnaden for modeller som OpenAIs GPT-4. Imidlertid er modellens politiske synspunkter noe begrenset. For eksempel, vil den ikke kommentere Tiananmen-plassen. Som et kinesisk selskap er DeepSeek underlagt kinesisk internettregulering, som sikrer at modellens svar opprettholder "kjerne sosialistiske verdier. " Mange kinesiske AI-systemer unngår emner som kan opprøre regulatorer, slik som diskusjoner om Xi Jinping-regimet. DeepSeek, som nylig introduserte DeepSeek-R1 som en konkurrent til OpenAIs o1 "reasoning" modell, er en interessant organisasjon. Den er støttet av High-Flyer Capital Management, et kinesisk hedgefond som bruker AI til trading. High-Flyer bygger sine egne serverklynger for modelltrening, som angivelig inkluderer 10 000 Nvidia A100 GPUer og koster 1 milliard yen (~138 millioner dollar). Startet av Liang Wenfeng, en datavitenskapsutdannet, har High-Flyer som mål å oppnå "superintelligent" AI gjennom DeepSeek. Wenfeng, i et intervju tidligere i år, beskrev lukkede AI-kilder som OpenAIs som en “midlertidig” fordel. "[Det] har ikke stoppet andre fra å ta igjen, " observerte han. Faktisk.


Watch video about

DeepSeek V3: Kinas ledende åpne AI-modell avduket

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 12, 2025, 1:31 p.m.

Coca-Colas AI-julespotkaster utløser reaksjoner

Coca-Cola, som i lang tid har blitt feiret for sine ikoniske juleannonser, har møtt betydelig motstand med sin julekampanje for 2025 som tungt bruker generativ AI.

Nov. 12, 2025, 1:26 p.m.

SMM Pilot tilbyr AI-drevet vekstplattform for små…

SMM Pilot er en avansert vekstplattform drevet av kunstig intelligens som revolusjonerer hvordan små og mellomstore bedrifter (SMB) innen e-handel og affiliate-markedsføring forbedrer sin tilstedeværelse på sosiale medier og sine digitale markedsføringsstrategier.

Nov. 12, 2025, 1:23 p.m.

3 måter markedsføringsledere kan bruke kunstig in…

AI er i ferd med å gå fra å være et lovende konsept til å bli en integrert del av markedsføringsdriften.

Nov. 12, 2025, 1:18 p.m.

Kling AI: Kinas tekst-til-video-modell

Kling AI, utviklet av det kinesiske teknologiselskapet Kuaishou og lansert i juni 2024, er et betydelig gjennombrudd innen AI-drevet innholdsproduksjon, med spesialisering i å konvertere naturlige språktekster til videoer av høy kvalitet.

Nov. 12, 2025, 1:17 p.m.

AI-forbedret SEO-analyse: Gir dypere innsikt for …

Kunstig intelligens er grunnleggende i ferd med å reforme feltet innen SEO-analyse, og baner vei for en ny æra av data-drevne markedsføringsstrategier.

Nov. 12, 2025, 1:11 p.m.

CoreWeave's verdsettelse skyter i været i takt me…

CoreWeave, en ledende leverandør av AI-infrastruktur, har opplevd en betydelig verdsettelsesøkning ettersom selskapet utvider innen den raskt voksende AI-sektoren.

Nov. 12, 2025, 9:24 a.m.

Mennesker tilbake til markedsføring?

De siste årene har kunstig intelligens (KI) endret mange bransjer, spesielt reklame, ved å muliggjøre rask og storstilte innholdsskaping.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today