lang icon English
Dec. 27, 2024, 6:57 a.m.
10340

DeepSeek-овата V3 модел ја надминува технолошката конкуренција со буџетска иновација.

Brief news summary

Кинескиот стартап DeepSeek направи сензација на глобалната сцена на вештачка интелигенција со објавувањето на новиот модел за јазична обработка, DeepSeek V3. Со 671 милијарда параметри, тој беше обучен за само два месеци со трошок од 5,58 милиони американски долари. И покрај користењето на помалку компјутерски ресурси во споредба со гиганти како Meta и OpenAI, DeepSeek V3 ги надмина своите конкуренти во тестовите за перформанси. Овој успех ја покажува напредокот на кинеските компании за вештачка интелигенција, дури и соочени со санкции од САД кои го ограничуваат пристапот до напредни полупроводници. DeepSeek V3 е од суштинско значење за генеративните AI услуги поради неговата способност да управува со комплексни податоци и да дава прецизни предвидувања. Andrej Karpathy од OpenAI го пофали ефективниот пристап на DeepSeek во тренирањето, постигнат со споделување само на претходно обучените тежини, дозволувајќи им на другите да го користат моделот без да го откријат кодот за тренирање или збирките на податоци. Оваа иновативна стратегија претставува важен чекор за кинеските AI фирми на жестоко конкурентниот глобален пазар.

DeepSeek-овиот модел V3 беше развиен во период од два месеци за 5, 58 милиони американски долари, користејќи помалку компјутерски ресурси од своите конкуренти. Време за читање: 2 минути Зошто можете да му верувате на SCMP Репортер: Бен Џианг во Пекинг Објавено и ажурирано: 6:45 часот, 27 декември 2024 DeepSeek, кинески стартап, го вознемири глобалниот ИИ сектор со својот нов модел на голем јазичен модел (LLM), кој во бенчмарк тестовите ги надминува моделите од Meta Platforms и ChatGPT креаторот OpenAI. Компанијата со седиште во Хангџоу објави преку WeChat во четвртокот дека нејзиниот LLM, DeepSeek V3, има 671 милијарда параметри и беше обучен за период од околу два месеци со трошок од 5, 58 милиони американски долари, користејќи значително помалку компјутерски ресурси од оние развиени од поголемите компании. LLM го поддржува генеративниот ИИ сервис како ChatGPT, а високата бројка на параметри е клучна за адаптирање на сложени обрасци на податоци и прецизни предвидувања. Компјутерскиот научник Андре Карпати, член на основниот тим на OpenAI, коментираше за извештајот на кинескиот стартап за својот нов модел за ИИ, изјавувајќи на платформата за социјални мрежи X, „DeepSeek го прави да изгледа лесно . . .

со отворено објавување на тежините на модел од гранична класа обучен со смешен буџет. “ Отворените тежини подразбираат објавување само на предобучените параметри, или тежините, на ИИ моделот, дозволувајќи им на трети страни да го користат моделот за предвидувања и фино прилагодување, но не и да го обезбедуваат тренингот кодот, оригиналниот сет на податоци, деталите за архитектура и методологијата на обука. Создавањето на силен LLM од страна на DeepSeek со буџет многу помал од тој што обично го инвестираат поголемите компании како Meta и OpenAI, ги истакнува постигнувањата на кинеските ИИ компании, и покрај американските санкции што го ограничуваат нивниот пристап до напредни полупроводници, неопходни за обука на модели.


Watch video about

DeepSeek-овата V3 модел ја надминува технолошката конкуренција со буџетска иновација.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 16, 2025, 9:21 a.m.

ИС ја убива маркетингот како што го знаеме — па ш…

Марк Andreessen во 2011 година изјави дека „софверот я јаде светот“, што особено се одрази во маркетингот, достигнувајќи врв неодамна на фестивалот Кан е Лајонс, каде технолошките гиганти како Амазон, Гугл, Мета, Мајкрософт, Нетфликс, Пинтерест, Reddit, Спотифи и Salesforce ги преземаа традиционалните агенции за маркетинг.

Nov. 16, 2025, 9:19 a.m.

Модот за вештачка интелигенција на Google сега мо…

Гугл е нетърпелив да користите неговиот вештачки интелект за да ви помогне при пазарувањето за празниците и сега овозможи AI Mode и Gemini да ве директно поврзуваат со производи.

Nov. 16, 2025, 9:18 a.m.

Тивкиот разбој на Генеративната вештачка интелиге…

Во денешниот брзо еволуирачки корпоративен технолошки пејзаж, алатките за генеративна вештачка интелигенција (GenAI), како ChatGPT и Gemini, стануваат суштински за секојдневната работа, наместо да се сметаат за футуристички концепти.

Nov. 16, 2025, 9:14 a.m.

Алатки за уредување видеа со вештачка интелигенци…

Во последните години, вештачката интелигенција направи извонреден напредок во видеото уредување, променувајќи ги фундаментално начинот на кој креаторите на содржина приоѓаат кон својот занает.

Nov. 16, 2025, 9:14 a.m.

Информации за вештачката интелигенција го зголему…

Гугл неодамна лансира два првовпечатливи функции базирани на вештачка интелигенција — AI Прегледи и Search Generative Experience (SGE) — кои доведоа до значително зголемување на глобалната активност по пребарувањето.

Nov. 16, 2025, 5:29 a.m.

Ажурирања на YouTube AI во 2025 година

YouTube брзо се развива со интегрирање на напредни алатки засновани на вештачка интелигенција за подобрување на пристапноста на содржината, безбедноста и монетизацијата за креаторите.

Nov. 16, 2025, 5:20 a.m.

Кинески хакери ја оружуваат вештачката интелигенц…

Компанијата за вештачка интелигенција Anthropic објави дека открила што верува дека е првиот голем сајбер напад во голем размер, главно изведен од страна на вештачка интелигенција, припишувајќи ја операцијата на кинеска хакерска група поддржана од државата, која искористи собствениот модел Claude Code на Anthropic за да проникне во околу 30 глобални цели.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today