lang icon En
Jan. 23, 2025, 11:01 p.m.
3993

DeepSeek-R1: Икономически ефективен китайски AI модел, който съперничи на OpenAI's o1

Brief news summary

Езиковият модел DeepSeek-R1, разработен от китайски стартъп, привлича значителен интерес благодарение на своята ценова ефективност в сравнение с моделите на OpenAI. Първоначалните анализи разкриват впечатляващите способности на R1 в области като химия, математика и програмиране, като изследователят Елвис Саравия отбелязва неговите "необичайни и напълно неочаквани" умения. Забележително е, че DeepSeek използва система с "открити тежести", което насърчава сътрудничество и подобряване на алгоритмите сред изследователите, в контекста на собствените методи на OpenAI. Освен това, R1 работи на цена около една тридесета от предлагането на OpenAI, което осигурява по-достъпни възможности за тестване. Това развитие отразява бързите напредъци в сектора на езиковите модели в Китай, дори на фона на ограниченията на САЩ относно износа на технологии за изкуствен интелект. Експертите посочват, че ефективността на R1 представлява тенденция към оптимизация на ресурсите, а не само към увеличаване на изчислителната мощ, което предполага свиване на технологичната пропаст между САЩ и Китай. Напредъкът може да създаде възможности за сътрудничество в областта на изкуствения интелект, преминавайки отвъд традиционните динамики на конкуренцията.

Голям езиков модел, разработен в Китай, известен като DeepSeek-R1, вълнува учените като икономична и открита алтернатива на модели за разсъждения като o1 на OpenAI. Тези модели генерират отговори в последователност, която имитира човешкото разсъждение, което ги прави по-умели от по-старите езикови модели в решаването на научни проблеми, като потенциално полезни за изследванията. Ранните оценки на R1, който стартира на 20 януари, показват, че резултатите му при задачи, свързани с химия, математика и програмиране, са на нивото на o1, който впечатли изследователите при освобождаването си от OpenAI през септември. „Това е удивително и напълно неочаквано, “ коментира Елвис Саравия, изследовател на ИИ и съосновател на британската консултантска фирма за ИИ DAIR. AI, в X. R1 е забележителен по още една причина. Стартиращата компания DeepSeek, базирана в Ханджоу, е направила модела „с отворени тежести“, позволявайки на изследователите да анализират и усъвършенстват алгоритъма. Той е публикуван под MIT лиценз, което позволява свободно повторно използване, макар и да не е напълно с отворен код, тъй като данните за обучение остават незаявени. „Прозрачността, проявена от DeepSeek, е забележителна, “ заявява Марио Крън, ръководител на Лабораторията за изкуствени учени в Макс Планк института за светлинни науки в Ерланген, Германия. В контекста на това, o1 и другите модели от OpenAI в Сан Франциско, включително новия o3, се считат за „всъщност черни кутии, “ отбелязва той. Въпреки че халацинантите на ИИ не могат да бъдат напълно елиминирани, определени техники могат да помогнат за намаляване на техния ефект. DeepSeek не е разкрил общата цена за обучение на R1, но таксува потребителите около една-тритата от оперативните разходи на o1. Компанията също е разработила мини „дестилирани“ версии на R1, позволяващи на изследователи с ограничени компютърни ресурси да експериментират с модела.

Крън отбелязва: „Експеримент, който е струвал над £300 с o1, беше по-малко от $10 с R1, “ подчертавайки значителна разлика, която може да повлияе на бъдещото приемане. R1 е част от нарастваща вълна китайски големи езикови модели (LLMs). Излязъл от хедж фонд, DeepSeek получи признание миналия месец с освобождаването на чатбот на име V3, който изпревари основните конкуренти, въпреки ограничен бюджет. Експерти оценяват, че наемането на хардуер за обучението на модела е било около $6 милиона, в сравнение с над $60 милиона за Llama 3. 1 405B на Meta, който е използвал 11 пъти повече компютърни ресурси. Вълнението около DeepSeek произтича частично от постижението му в разработването на R1 сред американски износни ограничения, ограничаващи достъпа на китайските компании до водещи ИИ процесорни чипове. „Фактът, че произхожда от Китай, демонстрира, че ефективното управление на ресурсите е по-критично от чистата изчислителна мощ, “ твърди Франсоа Шолет, изследовател на ИИ, базиран в Сиатъл, Вашингтон. Напредъкът на DeepSeek индикира, че „разликата, която преди се възприемаше като водеща позиция на САЩ, значително се е свила, “ отбеляза Алвин Уанг Гръйлин, технологичен експерт в Белвю, Вашингтон, свързан с тайванската компания за имерсивна технология HTC, в X. „И двете държави трябва да обмислят кооперативна стратегия за разработване на напреднал ИИ, вместо да продължават текущата безполезна надпревара във въоръжаването. “


Watch video about

DeepSeek-R1: Икономически ефективен китайски AI модел, който съперничи на OpenAI's o1

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 17, 2025, 1:35 p.m.

Microsoft Copilot Studio позволява създаването на…

Microsoft представи своето най-ново 혁овение – Copilot Studio, мощна платформа, предназначена да трансформира начина, по който бизнесите интегрират изкуствения интелект в ежедневните си работни процеси.

Dec. 17, 2025, 1:34 p.m.

AI автопилот на Tesla: Напредък и предизвикателст…

Системата за изкуствен интелект Autopilot на Tesla наскоро претърпя значителни напредъци, представлявайки голямо развитие в еволюцията на технологиите за автономно шофиране.

Dec. 17, 2025, 1:29 p.m.

Изграждането на дата центрове за изкуствен интеле…

Бързото изграждане на центрове за данни с изкуствен интелект (ИИ) предизвиква неочакван ръст в търсенето на мед, ключов елемент в технологичната инфраструктура.

Dec. 17, 2025, 1:21 p.m.

Nextech3D.ai назначава глобален ръководител по пр…

Nextech3D.ai (CSE: NTAR, OTC: NEXCF, FSE: 1SS), компания, фокусирана върху изкуствен интелект и специализирана в технологиите за събития, 3D моделиране и решения за пространствено изчисление, обяви назначаването на Джеймс МакГинис за Глобален директор продажби, който ще ръководи глобалната си търговска организация в условията на фокус върху разрастване на приходите и разширяване на комерсиалните операции до 2026 година.

Dec. 17, 2025, 1:17 p.m.

Изкуственият интелект за синтез на видео позволяв…

Технологията за синтезиране на видео с изкуствен интелект бързо преобразува обучението по езици и създаването на съдържание, като позволява реално време преводи в рамките на видеа.

Dec. 17, 2025, 1:13 p.m.

Изкуственият интелект на Google за търсене: Поддъ…

В декември 2025 г.

Dec. 17, 2025, 9:32 a.m.

Първият по рода си изкуствен интелект като агент …

Изкуственият интелект бързо преобразува множество индустрии, като сектора на недвижимите имоти не е изключение.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today