lang icon English
Dec. 27, 2024, 6:57 a.m.
10304

DeepSeeks V3-modell overgår teknologigiganter med budsjettinnovasjon

Brief news summary

Den kinesiske oppstartsbedriften DeepSeek har fått oppmerksomhet i den globale AI-scenen med lanseringen av sin nye store språkmodell (LLM), DeepSeek V3. Med 671 milliarder parametere ble den trent på bare to måneder til en kostnad av 5,58 millioner amerikanske dollar. Til tross for å bruke færre databehandlingsressurser sammenlignet med giganter som Meta og OpenAI, overgikk DeepSeek V3 sine konkurrenter i benchmark-tester. Denne suksessen viser fremgangen til kinesiske AI-selskaper, selv i møte med amerikanske sanksjoner som begrenser tilgangen til avanserte halvledere. DeepSeek V3 er essensiell for generative AI-tjenester på grunn av dens evne til å håndtere komplekse data og levere presise prediksjoner. Andrej Karpathy fra OpenAI berømmet DeepSeek for deres effektive treningsmetode, som ble oppnådd ved kun å dele forhåndstrente vekter, slik at andre kan bruke modellen uten å avsløre treningskode eller datasett. Denne innovative strategien markerer et viktig steg for kinesiske AI-selskaper i det sterkt konkurransepregede globale markedet.

DeepSeeks V3-modell ble utviklet over to måneder for 5, 58 millioner USD, og brukte færre datamaskinressurser enn konkurrentene. Lesetid: 2 minutter Hvorfor du kan stole på SCMP Rapportert av Ben Jiang i Beijing Publisert og oppdatert: 18:45, 27. desember 2024 DeepSeek, en kinesisk start-up, har rystet den globale AI-industrien med sin nye store språkmodell (LLM), som har overgått modeller fra Meta Platforms og ChatGPT-skaperen OpenAI i benchmark-testene. Det Hangzhou-baserte selskapet kunngjorde via WeChat torsdag at deres LLM, DeepSeek V3, har hele 671 milliarder parametere og ble trent over omtrent to måneder til en kostnad på 5, 58 millioner USD, ved å bruke betydelig færre datamaskinressurser enn de som er utviklet av større teknologiselskaper. En LLM støtter generative AI-tjenester som ChatGPT, og et høyt parameterantall er avgjørende for å tilpasse seg komplekse datamønstre og gjøre presise prediksjoner. Dataforsker Andrej Karpathy, et grunnleggermedlem i OpenAI, kommenterte den kinesiske start-upens rapport om den nye AI-modellen på sosiale medieplattformen X, og sa, "DeepSeek får det til å se enkelt ut …

med en åpen vektutgivelse av en frontlinje-LLM trent på et budsjett som er til å le av. " Åpne vekter innebærer å kun slippe de forhåndstrente parameterne, eller vektene, til en AI-modell, slik at tredjepartsaktører kan bruke modellen til inferens og finjustering, men uten å gi tilgang til treningskoden, det originale datasettet, arkitekturdetaljene og treningsmetodikken. DeepSeeks opprettelse av en sterk LLM med et budsjett langt mindre enn det større selskaper som Meta og OpenAI vanligvis investerer, fremhever fremgangen gjort av kinesiske AI-firmaer, til tross for amerikanske sanksjoner som begrenser deres tilgang til avanserte halvledere som er nødvendige for å trene modeller.


Watch video about

DeepSeeks V3-modell overgår teknologigiganter med budsjettinnovasjon

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 12, 2025, 1:31 p.m.

Coca-Colas AI-julespotkaster utløser reaksjoner

Coca-Cola, som i lang tid har blitt feiret for sine ikoniske juleannonser, har møtt betydelig motstand med sin julekampanje for 2025 som tungt bruker generativ AI.

Nov. 12, 2025, 1:26 p.m.

SMM Pilot tilbyr AI-drevet vekstplattform for små…

SMM Pilot er en avansert vekstplattform drevet av kunstig intelligens som revolusjonerer hvordan små og mellomstore bedrifter (SMB) innen e-handel og affiliate-markedsføring forbedrer sin tilstedeværelse på sosiale medier og sine digitale markedsføringsstrategier.

Nov. 12, 2025, 1:23 p.m.

3 måter markedsføringsledere kan bruke kunstig in…

AI er i ferd med å gå fra å være et lovende konsept til å bli en integrert del av markedsføringsdriften.

Nov. 12, 2025, 1:18 p.m.

Kling AI: Kinas tekst-til-video-modell

Kling AI, utviklet av det kinesiske teknologiselskapet Kuaishou og lansert i juni 2024, er et betydelig gjennombrudd innen AI-drevet innholdsproduksjon, med spesialisering i å konvertere naturlige språktekster til videoer av høy kvalitet.

Nov. 12, 2025, 1:17 p.m.

AI-forbedret SEO-analyse: Gir dypere innsikt for …

Kunstig intelligens er grunnleggende i ferd med å reforme feltet innen SEO-analyse, og baner vei for en ny æra av data-drevne markedsføringsstrategier.

Nov. 12, 2025, 1:11 p.m.

CoreWeave's verdsettelse skyter i været i takt me…

CoreWeave, en ledende leverandør av AI-infrastruktur, har opplevd en betydelig verdsettelsesøkning ettersom selskapet utvider innen den raskt voksende AI-sektoren.

Nov. 12, 2025, 9:24 a.m.

Mennesker tilbake til markedsføring?

De siste årene har kunstig intelligens (KI) endret mange bransjer, spesielt reklame, ved å muliggjøre rask og storstilte innholdsskaping.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today