lang icon Russian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Dec. 26, 2024, 8:59 p.m.
535

DeepSeek V3: Представлена ведущая открытая AI-модель Китая

Китайская лаборатория представила одну из самых мощных «открытых» моделей ИИ на сегодняшний день, названную DeepSeek V3. Разработанная фирмой DeepSeek, она была выпущена в среду под разрешительной лицензией, позволяющей разработчикам загружать и модифицировать её для большинства целей, включая коммерческие приложения. DeepSeek V3 превосходит в различных задачах, связанных с текстами, таких как программирование, перевод и написание эссе и писем по запросам. Согласно внутренним тестам DeepSeek, DeepSeek V3 превосходит как доступные для скачивания «открытые» модели, так и «закрытые» модели ИИ, которые доступны только через API. В соревнованиях по программированию на платформе Codeforces DeepSeek превосходит другие модели, включая Llama 3. 1 405B от Meta, GPT-4o от OpenAI и Qwen 2. 5 72B от Alibaba. Она также выделяется в тесте Aider Polyglot, который предназначен для оценки способности модели писать новый код, интегрирующийся с существующим. DeepSeek V3 была обучена на наборе данных из 14, 8 триллионов токенов. В области науки о данных токены представляют собой части необработанных данных, причем 1 миллион токенов примерно эквивалентен 750 000 словам. Модель также огромна по размеру, имеет 671 миллиард параметров (или 685 миллиардов на платформе Hugging Face), которые являются внутренними переменными, используемыми моделями для принятия решений. Этот размер примерно в 1, 6 раза превышает 405 миллиард параметров модели Llama 3. 1 405B. Как правило, модели с большим количеством параметров работают лучше, но им также требуется мощное оборудование для эффективной работы. Неоптимизированная DeepSeek V3 нуждается в множестве высокопроизводительных GPUs для разумной скорости. Несмотря на непрактичность, DeepSeek V3 является достижением.

Компания обучила модель примерно за два месяца, используя дата-центр с Nvidia H800 GPUs, которые недавно были запрещены для покупки китайскими компаниями Министерством торговли США. Компания утверждает, что потратила лишь 5, 5 миллионов долларов на обучение DeepSeek V3, что является малой долей стоимости таких моделей, как GPT-4 от OpenAI. Тем не менее, политические взгляды модели несколько ограничены. Например, она не будет комментировать тему площади Тяньаньмэнь. Как китайская компания, DeepSeek подчиняется китайскому интернет-регулированию, гарантируя, что ответы модели поддерживают «основные социалистические ценности». Многие китайские системы ИИ избегают тем, способных вызвать недовольство регулирующих органов, таких как обсуждения режима Си Цзиньпина. Недавно представившая DeepSeek-R1 как конкурента модели «рассуждений» o1 от OpenAI, DeepSeek является интригующей организацией. Поддерживаемая китайским хедж-фондом High-Flyer Capital Management, использующим ИИ для торговли, компания строит собственные серверные кластеры для обучения моделей, один из которых включает 10 000 Nvidia A100 GPUs и стоит 1 миллиард йен (~138 миллионов долларов). Основанная выпускником факультета компьютерных наук Лян Венфэном, High-Flyer стремится достичь «сверхразумного» ИИ через DeepSeek. В интервью ранее в этом году Венфэн описал закрытый исходный код ИИ как временное преимущество. «[Это] не помешало другим догнать их», заметил он. Действительно.



Brief news summary

DeepSeek, ведущая китайская компания в области ИИ, запустила DeepSeek V3, модель искусственного интеллекта с открытым исходным кодом. Эта модель позволяет разработчикам загружать, изменять и использовать её для различных целей, включая коммерческие приложения. DeepSeek V3 превосходит конкурентов, таких как Meta, OpenAI и Alibaba, в задачах программирования, перевода и написания текстов. Её возможности обусловлены обширным обучением на большом наборе данных из 14.8 триллионов токенов и 671 миллиарда параметров, что больше, чем у Llama 3.1 от Meta с 405 миллиардами параметров. Этот огромный набор данных требует мощного оборудования для оптимального использования. DeepSeek использовал графические процессоры Nvidia H800 в течение двух месяцев, что сделало процесс обучения более экономичным по сравнению с GPT-4 от OpenAI. Несмотря на свои сильные стороны, модель сталкивается с проблемами на политически чувствительные темы, такие как Тяньаньмэнь, чтобы соответствовать китайским законам. High-Flyer Capital Management поддерживает DeepSeek, инвестируя в инфраструктуру серверов для ИИ, включая крупные кластеры графических процессоров Nvidia, с целью продвижения ИИ к "суперинтеллектуальным" системам и преодоления ограничений закрытого искусственного интеллекта.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

June 5, 2025, 10:49 p.m.

Google представляет Ironwood TPU для ИИ-инференции

Google представила свой новейший прорыв в области аппаратного обеспечения для искусственного интеллекта — TPU Ironwood, самый продвинутый индивидуальный ускоритель ИИ на сегодняшний день.

June 5, 2025, 9:23 p.m.

Beyond the Noise: Поиск осязаемого будущего блокч…

Область блокчейна вышла за рамки начальных спекуляций и превратилась в сферу, требующую дальновидного лидерства, объединяющего передовые инновации с реальной практической ценностью.

June 5, 2025, 9:13 p.m.

ИИ в развлечениях: Создание виртуальных реальност…

Искусственный интеллект трансформирует индустрию развлечений, существенно улучшая виртуальную реальность (VR).

June 5, 2025, 7:55 p.m.

Блокчейн берет на себя крупную задачу по ведению …

Один из крупнейших округов США придает блокчейну важную новую роль: управление записями о недвижимости.

June 5, 2025, 7:46 p.m.

Coign выпустила первый полностью созданный с помо…

Компания Coign, предоставляющая кредитные карты и ориентированная на консервативных потребителей, запустила то, что она называет первым в индустрии финансовых услуг национальным телерекламным роликом, полностью созданным с помощью искусственного интеллекта.

June 5, 2025, 6:23 p.m.

Блокчейн Bitzero, поддерживаемый Mr. Wonderful, о…

Под «комбинированием владения активами, недорогой возобновляемой энергией и стратегической оптимизацией майнингового оборудования» компания заявляет, что «разработала модель, которая более прибыльна за единицу дохода, чем у традиционных майнеров, даже в условиях после халвинга».

June 5, 2025, 6:05 p.m.

Саммит AI+ подчеркивает трансформирующее влияние …

На недавнем саммите AI+ в Нью-Йорке эксперты и лидеры отрасли собрались, чтобы исследовать быстро растущее влияние искусственного интеллекта во множестве сфер.

All news