Feb. 2, 2025, 4:07 p.m.
2458

DeepSeek запускає моделі штучного інтелекту першого покоління, що конкурують з GPT-4 від OpenAI.

Brief news summary

20 січня китайський стартап у сфері штучного інтелекту DeepSeek представив свої розвинені моделі розуміння, серед яких DeepSeek-R1, призначену для конкуренції з найкращими моделями OpenAI, одночасно ефективно працюючи на менш потужному обладнанні. Зокрема, модель V3 вимагає лише 5,6 мільйонів доларів на навчання, що набагато менше, ніж 100 мільйонів доларів для GPT-4 від OpenAI. Відкритий код моделі R1 сприяє її впровадженню в різних галузях. DeepSeek використовує підхід "міксування експертів", активуючи лише необхідні сегменти моделі, що підвищує ефективність на обмеженому обладнанні. Цей метод, у поєднанні зі стисненням даних і покращеним балансуванням навантаження, прискорює навчання та знижує витрати на інференцію, роблячи штучний інтелект більш доступним. Ці досягнення відкривають великі можливості для компаній, таких як Apple і Meta. Apple прагне поліпшити свої можливості штучного інтелекту на пристроях, зосереджуючи увагу на конфіденційності користувачів і покращенні взаємодії з клієнтами. У свою чергу, Meta планує інтегрувати технології DeepSeek для розширення своїх послуг у сфері штучного інтелекту, прагнучи оптимізувати доходи через свою відкриту модель Llama.

20 січня китайський стартап у сфері штучного інтелекту DeepSeek представив свої перші моделі мислення першого покоління, зробивши вражаючі заяви щодо їх можливостей. Модель DeepSeek-R1, за словами розробників, демонструє продуктивність, що співвідноситься з найкращими моделями OpenAI, незважаючи на те, що вона була розроблена на менш потужному апаратному забезпеченні. Це досягнення є особливо вражаючим, враховуючи, що навчання коштувало лише 5, 6 мільйона доларів у порівнянні з 100 мільйонами доларів, витраченими на GPT-4 компанією OpenAI. Модель R1 побудована на основі великої мовної моделі V3 і є абсолютно відкритою, що може істотно змінити індустрію штучного інтелекту. Зосередження компанії на ефективності апаратного забезпечення зумовлено експортними обмеженнями на графічні процесори Nvidia H100 у Китаї, що спонукало їх до інновацій, використовуючи H800 та такі техніки, як «суміш експертів» (DeepSeekMoE), яка активує лише частини моделі за потребою. Це знижує вимоги до передачі даних і покращує ефективність навчання. Ці досягнення не тільки прискорюють час навчання, але також роблять його дешевшим і більш доступним для виконання інференції штучного інтелекту на менш потужному апаратному забезпеченні.

В результаті такі компанії, як Apple та Meta, можуть значно виграти. Для Apple, яка надає пріоритет приватності даних та обробці на пристрої, інтеграція методів DeepSeek може покращити функції штучного інтелекту на таких пристроях, як iPhone, що може позитивно вплинути на продажі та доходи від послуг. Оновлена смуга пропускання пам'яті чіпа A18 Pro підтримує такі покращення, що дозволяє реалізувати такі функції, як більш розумний Siri та офлайн-переклади. Meta також збільшує свої інвестиції в штучний інтелект, прогнозуючи 60% зростання капітальних витрат до 2025 року. Відкриття моделі Llama має на меті максимізувати ефективність у впровадженні штучного інтелекту. Зменшення витрат на інференцію ШІ може відкрити значні прибутки для Meta, сприяючи масштабуванню рішень ШІ для її 3 мільярдів користувачів. Інновації DeepSeek надають Meta необхідні інструменти для покращення її можливостей у сфері штучного інтелекту та прибутковості.


Watch video about

DeepSeek запускає моделі штучного інтелекту першого покоління, що конкурують з GPT-4 від OpenAI.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 15, 2025, 1:26 p.m.

Інтелектуальний штучний інтелект приводить до рек…

Аналіз платформи Salesforce щодо торгівельного періоду Cyber Week 2025 показує рекордний світовий розмір роздрібних продажів, що склав 336,6 мільярдів доларів, що на 7% більше ніж у попередньому році.

Dec. 15, 2025, 1:24 p.m.

Ризики вимирання штучного інтелекту: Маск та Амод…

Швидкий розвиток штучного інтелекту (ШІ) викликає значні дебати та занепокоєння серед експертів, особливо щодо його довгострокового впливу на людство.

Dec. 15, 2025, 1:21 p.m.

Зайдіть раніше за Уолл-Стріт: цей акційний сектор…

Це спонсорський контент; Barchart не підтримує сайти чи продукти, згадані нижче.

Dec. 15, 2025, 1:16 p.m.

AlphaCode від Google DeepMind: штучний інтелект з…

Нещодавно компанія Google DeepMind представила інноваційну систему штучного інтелекту під назвою AlphaCode, що є значним проривом у сфері штучного інтелекту та розробки програмного забезпечення.

Dec. 15, 2025, 1:15 p.m.

Відомий експерт з SEO пояснює, чому штучні агенти…

Я тісно слідкую за появою агентського SEO, переконаний, що з прогресом можливостей у найближчі кілька років агенти значно вплинуть на індустрію.

Dec. 15, 2025, 1:10 p.m.

Пітер Лінгтон з Salesforce про підготовку захисни…

Пітер Лінгтон, віце-президент з регіону в департаменті війни Salesforce, підкреслює трансформаційний вплив, який сучасні технології матимуть на Департамент Війни протягом наступних трьох-п’яти років.

Dec. 15, 2025, 9:35 a.m.

Стратегічна позиція Sprout Social у змінному ланд…

Sprout Social міцно закріпив за собою статус провідного гравця в індустрії управління соціальними мережами, активно впроваджуючи передові технології штучного інтелекту та укладаючи стратегічні партнерства, що сприяють інноваціям та розширенню сервісів.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today