lang icon En
Jan. 23, 2025, 11:01 p.m.
4009

DeepSeek-R1: Një Model i Zgjuar Kinez Kostot e Efektshme që Rivalizon OpenAI-në o1

Brief news summary

Modeli i gjuhës DeepSeek-R1, i zhvilluar nga një startup kinez, po tërheq interes të konsiderueshëm për shkak të efikasitetit të tij në raport me modelet e OpenAI. Analizat fillestare zbulojnë aftësitë e impresionante të R1 në fusha siç janë kimia, matematika dhe programimi, me kërkuesin Elvis Saravia që thekson aftësitë e tij "të çmendura dhe krejt të papritura". Veçanërisht, DeepSeek përdor një sistem "peshash të hapura", që inkurajon bashkëpunimin dhe përmirësimin e algoritmeve mes kërkuesve, në kontrast me metodat pronësore të OpenAI. Për më tepër, R1 funksionon me rreth një të tretin e kostos së ofertave të OpenAI, duke mundësuar mundësi testimi më të përballueshme. Ky zhvillim pasqyron avancime të shpejta në sektorin e modeleve të gjuhës në Kinë, edhe në mes të kufizimeve amerikane për eksportet e teknologjisë AI. Ekspertët tregojnë se efikasiteti i R1 përfaqëson një tendencë drejt optimizimit të burimeve në vend të përmirësimit të thjeshtë të fuqisë kompjuterike, që sugjeron një zvogëlim të hendekut teknologjik mes SHBA-së dhe Kinës. Ky progres mund të krijojë mundësi për bashkëpunim në fushën e AI-së, përtej dinamikave konkurruese konvencionale.

Një model i madh gjuhësor i zhvilluar në Kinë, i njohur si DeepSeek-R1, po emocionon shkencëtarët si një alternativë kostot-eefektive dhe të hapur ndaj modeleve të arsyetimit si o1 i OpenAI. Këta modele prodhojnë përgjigje në një sekuencë që imiton arsyetimin njerëzor, duke i bërë ata më të aftë se modelet e vjetra të gjuhës në përballjen me çështjet shkencore, duke potencialisht sjellë përfitime për kërkimin. Vlerësimet e para të R1, e cila u lançua më 20 janar, tregojnë se performanca e saj në detyrat që lidhen me kimikën, matematikën dhe kodimin rivalizon atë të o1— e cila impresionoi studiuesit pas publikimit të saj nga OpenAI në shtator. “Kjo është e mahnitshme dhe krejtësisht e papritur, ” komentoi Elvis Saravia, një kërkues AI dhe bashkëthemelues i firmës këshillimore të AI, DAIR. AI, me seli në Mbretërinë e Bashkuar, në X. R1 është e veçantë për një tjetër arsye. Start-up-i DeepSeek, me bazë në Hangzhou, e ka bërë modelin ‘pesha të hapura’, duke lejuar studiuesit të analizojnë dhe përmirësojnë algoritmin. Është publikuar nën një licencë MIT, duke mundësuar ripërdorim të lirë, megjithëse nuk është plotësisht burim i hapur, pasi të dhënat e trajnimit mbeten të paqarta. “Transparenca që tregon DeepSeek është e jashtëzakonshme, ” thotë Mario Krenn, kreu i Laboratorit të Shkencëtarëve Artificiale në Institutin Max Planck për Shkencën e Dritës në Erlangen, Gjermani. Në kontrast, o1 dhe modele të tjera nga OpenAI në San Francisco, përfshirë o3, konsiderohen "ndërtesa esencialisht të errëta, " vëren ai. Ndërsa halucionet e AI-së nuk mund të eliminohen plotësisht, disa teknika mund të ndihmojnë në lehtësimin e ndikimit të tyre. DeepSeek nuk ka zbuluar kostot totale të trajnimit të R1, por i ngarkon përdoruesit rreth një të tridhjetën e shpenzimeve operative të o1. Kompania gjithashtu ka zhvilluar versione mini ‘të distiluar’ të R1, duke lejuar studiuesit me burime të kufizuara kompjuterike të eksperimentojnë me modelin.

Krenn vëren, “Një eksperiment që kushtonte mbi £300 me o1 ishte më pak se $10 me R1, ” duke theksuar një diferencë të rëndësishme që mund të ndikojë në adoptimin e ardhshëm. R1 është pjesë e një rritjeje të modeleve të mëdha të gjuhës (LLMs) kineze. Duke dalë nga një fond të mbrojtur, DeepSeek fitoi njohje muajin e kaluar me publimin e një chatbot-i të quajtur V3, i cili tejkaloi konkurentët kryesorë pavarësisht një buxheti të kufizuar. Ekspertët shënojnë se qeraja e harduerit për trajnimin e modelit ishte rreth $6 milion, krahasuar me mbi $60 milion për Llama 3. 1 405B të Meta, e cila përdori 11 herë më shumë burime kompjuterike. Entuziazmi rreth DeepSeek buron pjesërisht nga arritja e saj në zhvillimin e R1 përballë kontrollave të eksportit të SHBA që kufizojnë qasjen e kompanive kineze në çipat e procesimit të AI-së të nivelit të lartë. “Fakti që origjinon nga Kina tregon se menaxhimi efektiv i burimeve është më kritik se sa fuqia e madhe kompjuterike, ” thotë François Chollet, një kërkues AI me bazë në Seattle, Washington. Përparimet e DeepSeek tregojnë se “shkalla e parë e perceptuar si një avantazh amerikan është ngushtuar ndjeshëm, ” vuri në dukje Alvin Wang Graylin, një ekspert teknologjie në Bellevue, Washington, i cili është i lidhur me kompaninë tajvaneze të teknologjisë immersive HTC, në X. “Të dy vendet duhet të konsiderojnë një strategji bashkëpunimi për zhvillimin e AI-së së avancuar përveçse të vazhdojnë të garojnë në një garë të pafrytshme armësh. ”


Watch video about

DeepSeek-R1: Një Model i Zgjuar Kinez Kostot e Efektshme që Rivalizon OpenAI-në o1

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 1:28 p.m.

Rritja e Shpejtë dhe Zgjerimi Ndërkombëtar i Z.ai…

Z.ai, më parë i njohur si Zhipu AI, është një kompani kryesore teknologjike kineze që specializohet në inteligjencën artificiale.

Dec. 19, 2025, 1:27 p.m.

Tani dhe e ardhmja e Inteligjencës Artificiale në…

Jason Lemkin udhëhoqi raundin e parapërgatitjes përmes fondit SaaStr në unicorn-in Owner.com, një platformë e drejtuar nga inteligjenca artificiale që transformon mënyrën si operojnë restorantet e vogla.

Dec. 19, 2025, 1:25 p.m.

Pse jam kundër AI-së për trenat mediatike dhe të …

Viti 2025 u dominua nga Inteligjenca Artificiale, dhe gjithashtu viti 2026 do të ndjekë të njëjtën tendencë, me inteligjencën digjitale që qëndron si ndërprerësi kryesor në media, marketing dhe reklama.

Dec. 19, 2025, 1:23 p.m.

Teknikat e Kompresionit të Video--së në AI përmir…

Inteligjenca artificiale (IA) po transformon mënyrën se si ofrohet dhe përjeton përmbajtja video, veçanërisht në fushën e kompresionit të videos.

Dec. 19, 2025, 1:19 p.m.

Duke shfrytëzuar inteligjen artificiale për SEO l…

Optimizimi i kërkimit lokal është tani jashtëzakonisht i rëndësishëm për bizneset që synojnë të tërheqin dhe të mbajnë klientët në zonën e tyre gjeografike të afërt.

Dec. 19, 2025, 1:15 p.m.

Adobe Lanson Agjentët e Avancuar të Inteligjencës…

Adobe ka zbuluar një koleksion të ri agentësh të inteligjencës artificiale (AI) të destinuar për të ndihmuar markat të përmirësojnë ndërveprimet me konsumatorët në faqet e tyre të internetit.

Dec. 19, 2025, 9:32 a.m.

Prezanti për Tregun: Si shitësit e Amazon po rish…

Udhëzimet publike të Amazon për optimizimin e përmendjeve të produkteve për Rufus, asistentin e blerjes të nxjerrë nga inteligjenca artificiale, mbeten të pandryshuara, pa u ofruar këshilla të reja për shitësit.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today