lang icon En
Sept. 26, 2025, 2:42 p.m.
3773

ChatGPT від OpenAI третьої версії виграв шаховий турнір штучного інтелекту на Kaggle, перемігши Grok 4 Ілона Маска

Brief news summary

OpenAI’s ChatGPT o3 виграв турнір на платформі Kaggle, який тестував найсильніші великі мовні моделі (ВММ), що грають у шахи, перемігши в фіналі Grok 4 від xAI Елона Маска. У змаганні брали участь вісім універсальних ВММ від провідних компаній з штучного інтелекту, таких як OpenAI, xAI, Google, Anthropic, DeepSeek та Moonshot AI, усі грали за стандартними шаховими правилами без спеціалізованих двигунів. Gemini від Google зайняв третє місце, здолавши ще одну модель від OpenAI. Хоча Grok 4 виявив обіцянку на початку, він допустив критичні тактичні помилки, зокрема багаторазово втрачаючи ферзя, що сприяло його поразці, зазначив аналітик Chess.com Педро Пінята. На відміну від цього, гросмейстер Хікура Накамура високо оцінив ChatGPT o3 за його послідовну та безпомилкову тактику. Елона Маск визнав поразку Grok 4, але наголосив, що шахи не є її головною зоною фокусування. Це змагання висвітлило як потенціал, так і обмеження універсальних ВММ у складних галузях, заснованих на правилах, при цьому моделі типу ChatGPT o3 демонстрували високі результати у конкурентних умовах. Організатори вважають шахи важливим орієнтиром для розвитку штучного інтелекту у сферах логіки, планування та стійкості.

OpenAI’s ChatGPT o3 став переможцем турніру, організованого на платформі Kaggle, з метою визначення найсильнішої великої мовної моделі для гри в шахи, здолавши модель Grok 4 від Elon Musk у фінальному раунді. Триденний турнір включав вісім універсальних LLM від компаній, таких як OpenAI, xAI, Google, Anthropic, DeepSeek та Moonshot AI, усі змагалися за стандартними шаховими правилами без допомоги спеціалізованих шахових двигунів. Gemini від Google зайняв третє місце, перемігши ще одного представника OpenAI. Grok 4 розпочав турнір з сильної позиції, але зазнав поразки у фінальній грі проти OpenAI o3, допустивши кілька тактичних помилок, зокрема втрату кількох ферзів. «До півфіналу здавалося, що ніщо не здатне зупинити Grok 4», — зазначив автор Chess. com Педро Пінята, але його виступ «зруйнувався під тиском» у останній день.

Гросмейстер Хікару Німамура, який проводить живі коментарі, зауважив: «Grok зробив так багато помилок у цих іграх, а OpenAI ні». Elon Musk знехтував поразкою, описуючи попередні успіхи Grok як «побічний ефект» і зазначаючи, що xAI «майже не приділяла уваги шахам». Результат матчу додає ще одну публічну сторінку до суперечки між Musk’s xAI і OpenAI, компаніями, співзаснованими людьми, які колись співпрацювали. Шахи довго служили еталоном для можливостей штучного інтелекту: такі досягнення, як AlphaGo від DeepMind, перемога над топ-гравцями в Го, стали віхами. Однак цей захід на Kaggle був унікальним у тому, що тестувалися універсальні великі мовні моделі, а не спеціалізовані шахові двигуни, що підкреслює їхню здатність — або неспроможність — справлятися з складними завданнями, заснованими на правилах. Результати показують, що хоча o3 зберігав стабільну стратегічну гру під тиском, крах Grok 4 виявив нерівномірність у деяких LLM при зіткненні з складними умовами. Організатори й коментатори прогнозують, що шахи та подібні структуровані виклики і надалі залишатимуться цінними інструментами для оцінки логіки, планування та стійкості моделей ШІ у міру їхнього розвитку.


Watch video about

ChatGPT від OpenAI третьої версії виграв шаховий турнір штучного інтелекту на Kaggle, перемігши Grok 4 Ілона Маска

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

Інструменти автоматичної модерації відео контенту…

Платформи соціальних мереж дедалі активніше застосовують штучний інтелект (ШІ) для покращення модерації відеоконтенту, щоб упоратися з зростанням кількості відео як домінуючої форми онлайн-комунікації.

Dec. 21, 2025, 1:38 p.m.

США знову переглядає обмеження на експорт чіпів д…

ПЕРЕГЛЯД ПОЛІТИКИ: Після років посилення обмежень рішення дозволити продажі чіпів Nvidia H200 у Китай викликало заперечення з боку деяких республіканців.

Dec. 21, 2025, 1:38 p.m.

Штучний інтелект був причиною понад 50 000 скороч…

Звільнення через штучний інтелект визначили ринок праці 2025 року, оскільки великі компанії оголосили тисячі скорочень робочих місць, пов’язаних із досягненнями в галузі ШІ.

Dec. 21, 2025, 1:36 p.m.

Запуск сервісів Perplexity SEO – провідне агентст…

RankOS™ підвищує видимість бренду та цитування у Perplexity AI та інших пошукових платформах на основі відповідей Послуги SEO-агенції Perplexity Нью-Йорк, NY, 19 грудня 2025 року (GLOBE NEWSWIRE) — компанія NEWMEDIA

Dec. 21, 2025, 1:22 p.m.

Казначейство родини Еріха Шмітта інвестує в 22 ст…

Оригінальна версія цієї статті з’явилася у журналі CNBC Inside Wealth, автором якої є Роберт Франк.

Dec. 21, 2025, 1:21 p.m.

Майбутнє маркетингу: Чому «просто достатньо добре…

Заголовки зосереджувалися на мільярдних інвестиціях Disney у OpenAI та спекуляціях щодо того, чому Disney обрала OpenAI замість Google, з яким вона судиться через нібито порушення авторських прав.

Dec. 21, 2025, 9:34 a.m.

Дані Salesforce показують, що штучний інтелект і …

Компанія Salesforce опублікувала детальний звіт про покупкову подію Cyber Week 2025, аналізуючи дані понад 1,5 мільярда глобальних покупців.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today