lang icon English
Dec. 27, 2024, 6:57 a.m.
10326

DeepSeek'i V3 mudel ületab tehnoloogiahiide eelarveinnovatsiooniga.

Brief news summary

Hiina start-up DeepSeek on teinud rahvusvahelisel tehisintellekti areenil suurt furoori oma uue suure keelemudeli (LLM) DeepSeek V3 väljalaskmisega. 671 miljardi parameetriga mudel treeniti vaid kahe kuuga ja selleks kulutati 5,58 miljonit USA dollarit. Vaatamata sellele, et DeepSeek kasutas vähem arvutusressursse kui suurfirma Meta ja OpenAI, ületas DeepSeek V3 oma konkurente jõudlustestides. See edu demonstreerib Hiina tehisintellekti ettevõtete edusamme, vaatamata USA sanktsioonidele, mis piiravad juurdepääsu täiustatud pooljuhtidele. DeepSeek V3 on generatiivsete tehisintellektiteenuste jaoks hädavajalik, kuna see suudab hallata keerukaid andmeid ja pakkuda täpseid prognoose. Andrej Karpathy OpenAI-st kiitis DeepSeek'i tõhusat treenimisviisi, mis saavutati jagades ainult eeltreenitud kaalu, võimaldades teistel mudelit kasutada ilma treenimiskoodi või -andmestikke avalikustamata. See uuenduslik strateegia tähistab olulist sammu Hiina tehisintellekti firmadele ülemaailmsel turul tugevas konkurentsis.

DeepSeeki V3 mudel töötati kahe kuu jooksul välja 5, 58 miljoni USA dollari eest, kasutades vähem arvutusressursse kui konkurendid. Lugemisaeg: 2 minutit Miks saate usaldada SCMP-d Raporteeris Ben Jiang Pekingis Avaldatud ja uuendatud: 27. detsember 2024, kell 18. 45 Hiina idufirma DeepSeek on oma suure keelemudeliga (LLM) raputanud ülemaailmset tehisintellekti tööstust, ületades Meta Platformsi ja ChatGPT looja OpenAI mudeleid etalonkatsetes. Hangzhous asuv ettevõte teatas neljapäeval WeChati vahendusel, et nende LLM, DeepSeek V3, omab 671 miljardit parameetrit ning see õpetati ligikaudu kahe kuu jooksul 5, 58 miljoni USA dollari eest, kasutades märkimisväärselt vähem arvutusressursse kui suuremate tehnoloogiaettevõtete arendatud mudelid. LLM toetab generatiivseid tehisintellekti teenuseid nagu ChatGPT, ning suur parameetrite arv on oluline keerukate andmemustritega kohanemiseks ja täpsete ennustuste tegemiseks. Arvutiteadlane Andrej Karpathy, OpenAI asutajameeskonna liige, kommenteeris Hiina idufirma teadet oma uue tehisintellekti mudeli kohta, öeldes sotsiaalmeedial X, "DeepSeek näeb asja lihtsana . . .

frontier-kvaliteediga LLM, mille avalikud kaalud on välja antud naljaka eelarvega. " Avatud kaalud tähendavad vaid treenitud parameetrite või "kaalude" vabastamist AI mudelist, võimaldades kolmandatel osapooltel kasutada mudelit järeldusteks ja peenhäälestamiseks, kuid mitte pakkuda treeningkoodi, algset andmekogumit, arhitektuuri detaile ja koolitusmetoodikat. DeepSeeki tugev LLM väikese eelarvega loomine, vähem kui suured ettevõtted nagu Meta ja OpenAI tavaliselt investeerivad, toob esile Hiina tehisintellekti firmade edusammud, hoolimata USA sanktsioonidest, mis piiravad nende juurdepääsu täiustatud pooljuhtidele, mis on vajalikud mudelite õpetamiseks.


Watch video about

DeepSeek'i V3 mudel ületab tehnoloogiahiide eelarveinnovatsiooniga.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 14, 2025, 1:26 p.m.

Anthropic avastas tehisintellekti juhitava häkkim…

Anthropic, juhtiv tehisintellekti ettevõte, on avalikustanud murrangulise ja murettekitava arengusuuna küberturvalisuses: esimese dokumenteeritud juhtumi, kus tehisintellekt iseseisvalt juhib häkkimiskampaaniat.

Nov. 14, 2025, 1:25 p.m.

AI-ga loodud Sora videod ICE läbipääsude kohta on…

„Vaata sammast, härra, liigu edasi,” ütleb ICE-tähise ja “POICE” märgistusega märkega politseinikke kandev ohvitser Mehhikost pärit näootsaga mehele, kes on riietunud Walmarti töötaja vesti.

Nov. 14, 2025, 1:18 p.m.

Kevin Reilly nimetati tehisintellekti nõustamisfi…

Kevin Reilly, kogenud Hollywoodi juht, keda tuntakse tema olulise rolli tõttu tuntuimate telesarjade nagu "Sopranod", "The Office" ja "Glee" toimumisel, on võtnud vastu uue väljakutse ja astunud Kartel, Beverly Hillsis baseeruva tehisintellekti loovnõustamise ettevõtte, tegevjuhi rolli.

Nov. 14, 2025, 1:14 p.m.

Google seisab Euroopa Liidu konkurentsivõistluse …

Euroopa Liit on algatanud suure antitrust-uurimise Google’i rämpsposti poliitika kohta pärast muresid mitmetelt uudisteväljaannete poolt kogu Euroopas.

Nov. 14, 2025, 1:12 p.m.

Dealism käivitab esimese Vibe Sellingil põhineva …

SINGAPURA, 13.

Nov. 14, 2025, 9:31 a.m.

Tehisintellekti juhitud SEO: Järgmisel tasandil d…

Tehisintellekt (AI) muutub kiiresti digitaalmarkkinimises transformatiivseks jõuks, eriti otsingumootorite optimeerimises (SEO).

Nov. 14, 2025, 9:22 a.m.

Tehisintellekt on liitlane, mitte vaenlane

Shelley E. Kohan tervitab Leigh Sevinit, Endeari kaasasutajat, kes pakub kaasaegset CRM-lahendust omnikanalilisele jaemüügibrändile.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today