lang icon En
Jan. 25, 2025, 11:13 a.m.
4473

DeepSeek lançoi një model shkencor të hapur të AI që e kalon konkurrentët amerikanë.

Brief news summary

Më 20 janar, laboratori kinez i Inteligjencës Artificiale DeepSeek prezantoi modelin e tij të hapur, DeepSeek-R1, i cili ka marrë vlerësime në Silicon Valley për aftësitë e tij të shkëlqyera në matematikë dhe arsyetim, duke e kaluar konkurrencën e njohur si OpenAI. Ky lëshim zhvillohet në një kontekst të tensioneve të rritura teknologjike mes SHBA-së dhe Kinës, të karakterizuara nga kufizimet në eksport që pengojnë aksesin e Kinës në teknologjitë e avancuara. Në përgjigje, DeepSeek thekson optimizimin e softuerit dhe iniciativat e kodit të hapur si një dëshmi e kapacitetit të tij inovativ. E themeluar nga Liang Wenfeng i fondit hedging High-Flyer, DeepSeek përqendrohet në kërkimin afatgjatë në vend të fitimeve afatshkurtra. Ekipi i tij i diplomatëve të rinj promovon një ambient bashkëpunues, duke e diferencuar veten nga etika konkurruese që mbizotëron në shumë kompani teknologjike. Për të përballuar kufizimet e SHBA-së mbi çipat e nivelit të lartë si H100 i Nvidia, DeepSeek ka rafinuar arkitekturën e modelit të tij për trajnime më efikase. Duke shfrytëzuar strategji si Vëmendja Latente me Krye të Shumta dhe Përzierja e Ekspertëve, modeli i DeepSeek funksionon me burime kompjuterike të reduktuara ndjeshëm krahasuar me konkurrentët e tij. Kjo përshtatje strategjike lejon DeepSeek të vazhdojë përparimin e Inteligjencës Artificiale në Kinë pavarësisht sfidave të vazhdueshme në eksport.

Më 20 janar, DeepSeek, një laborator kërkimesh për inteligjencën artificiale më pak i njohur nga Kina, publikoi një model me kod të hapur që shpejt tërhoqi vëmendjen në Silicon Valley. Papri i kompanisë pretendon se DeepSeek-R1 e kalon modelet kryesore si ato të OpenAI në mënyra të ndryshme, në matematikë dhe arsyetim, duke demonstruar kapacitete të rëndësishme me një kosto më të ulët dhe me një theks në hapjen. Supriza e DeepSeek ilustron një rrugë të re për kompanitë teknologjike kineze në mes të luftës teknologjike; përballë kufizimeve të eksportit të SHBA-së, shumë prej tyre janë orientuar nga ndërtimi i modeleve në aplikacione të poshtme. Megjithatë, DeepSeek është fokusuar në optimizimin e strukturave të modeleve AI dhe përdorimin efikas të burimeve. E themeluar nga Liang Wenfeng, një diplomant i master's në shkencën kompjuterike, DeepSeek doli nga High-Flyer, një fond hedging kuantitativ, i njohur që në fillim përqendrohej në kërkimin në mësimin e thellë. Fondi hedging grumbulloi burime për zhvillimin e AI-së, duke çuar në krijimin e DeepSeek, që reflekton një kalim drejt qëllimeve teknologjike afatgjata në vend të fitimeve të menjëhershme. Liang tha se kurioziteti shkencor e nxiti këtë sipërmarrje, duke theksuar fokusin në avancimin e kërkimeve themelore në AI në vend të aplikacioneve komerciale. Ekipa e DeepSeek përbëhet kryesisht nga diplomantë të rinj doktorature nga universitetet kryesore kineze, duke promovuar një ambient bashkëpunues të përqendruar në kërkime novatore.

Ky qasje ndryshon nga praktikat tipike në kompanitë teknologjike të vendosura kineze, ku konkurrenca për burime shpesh pengon inovacionin. Liang vëren se kërkuesit e rinj janë më të përshtatshëm për projekte me investime të larta për shkak të përkushtimit të tyre dhe mungesës së konsideratave utilitare. Kompania përballet me sfida nga kontrolli i eksportit të qeverisë amerikane, i cili kufizon aksesin në çipa të avancuar AI. Fillimisht duke pasur një rezervë prej 10, 000 çipash Nvidia H100, aftësia e DeepSeek për t'u konkurruar kërkonte metoda më të efikase të trajnim-modelit. Ekipa zbatoi strategji inxhinierike dhe dizajne novatore si Multi-head Latent Attention (MLA) dhe Mixture-of-Experts, duke reduktuar ndjeshëm fuqinë kompjuterike të nevojshme për të trajnuar modelin e saj më të fundit në krahasim me Llama 3. 1 të Meta-s. Qasja me kod të hapur e DeepSeek ka tërhequr mirëkuptim në komunitetin global të kërkimeve për AI, duke i lejuar asaj të tërheqë kontribues dhe përdorues të nevojshëm për përmirësimin e modeleve të saj. Ky kalim në peizazhin ekzistues të AI-së mund të sfidojë efektivitetin e kontrolleve aktuale të eksporteve të SHBA-së duke demonstruar se modelet e përparuara mund të zhvillohen me përdorim të optimizuar të burimeve, duke çuar në ndryshime të mundshme në perceptimet e kapaciteteve të AI-së kineze.


Watch video about

DeepSeek lançoi një model shkencor të hapur të AI që e kalon konkurrentët amerikanë.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 20, 2025, 5:27 a.m.

Kampanjat më të mira të marketingut kundër AI-në …

Marketingu kundër-AI dikur dukej si një trend niçe në internet, por është bërë pjesë kryesore në mes të kundërshtimit të AI-së në reklama, duke treguar autenticitet dhe lidhje njerëzore.

Dec. 20, 2025, 5:23 a.m.

Përparimet në Teknologjinë Deepfake: Ndikimet për…

Teknologjia deepfake ka avancuar me shpejt në vitet e fundit, duke sjellë përparime të jashtëzakonshme në prodhimin e videove të manipuluara shumë realistike.

Dec. 20, 2025, 5:19 a.m.

CEO i Microsoft-it, Satya Nadella, thekson integr…

Microsoft po rrit përkushtimin e saj ndaj inovacionit në inteligjencën artificiale nën udhëheqjen vizionare të CEO-së Satya Nadella.

Dec. 20, 2025, 5:14 a.m.

Nga kërkimi te zbuluarja: si Inteligjenca Artific…

Tani mund të bëni pyetje shumë specifike për një model gjuhësor të madh (LLM)—si për shembull kërkesa për mbështetje arke në një distancë të caktuar për blerje—dhe të merrni përgjigje të qarta, të pasura me kontekst, si p.sh., “Ja tre opsione të afërta që përputhen me kriteret tuaja.

Dec. 20, 2025, 5:14 a.m.

A mund të mbështesë rikthimi i shitjeve të drejtu…

C3.ai, Inc.

Dec. 19, 2025, 1:28 p.m.

Rritja e Shpejtë dhe Zgjerimi Ndërkombëtar i Z.ai…

Z.ai, më parë i njohur si Zhipu AI, është një kompani kryesore teknologjike kineze që specializohet në inteligjencën artificiale.

Dec. 19, 2025, 1:27 p.m.

Tani dhe e ardhmja e Inteligjencës Artificiale në…

Jason Lemkin udhëhoqi raundin e parapërgatitjes përmes fondit SaaStr në unicorn-in Owner.com, një platformë e drejtuar nga inteligjenca artificiale që transformon mënyrën si operojnë restorantet e vogla.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today