lang icon En
Sept. 26, 2025, 2:42 p.m.
4074

ChatGPT d'OpenAI o3 guanya el torneig d'IA d'escacs de Kaggle derrotant el Grok 4 d'Elon Musk

Brief news summary

OpenAI’s ChatGPT o3 va guanyar un torneig a Kaggle que va posar a prova els models de llenguatge grans (LLMs) més potents per jugar a l’escacs, derrotant el xAI Grok 4 d’Elon Musk en la final. La competició va incloure vuit LLMs d’ús general de les principals empreses d’IA com OpenAI, xAI, Google, Anthropic, DeepSeek i Moonshot AI, tots jugant segons les normes estàndard d’escacs sense motors especialitzats. Gemini de Google va aconseguir la tercera posició després de superar un altre model d’OpenAI. Tot i que Grok 4 va mostrar un potencial primerenc, va cometre errors tàctics crítics, com perdre la seva dama de manera repetida, fet que va contribuir a la seva derrota, com va assenyalar l’analista de Chess.com Pedro Pinhata. En canvi, el gran mestre Hikaru Nakamura va elogiar ChatGPT o3 per la seva estratègia constant i lliure d’errors. Elon Musk va reconèixer la derrota de Grok 4 però va destacar que el tauler d’escacs no és el seu enfocament principal. L’esdeveniment va posar de manifest tant les capacitats com les limitacions dels LLMs d’ús general en àmbits complexos i basats en regles, amb models com ChatGPT o3 demostrant un bon rendiment sota condicions competives. Els organitzadors veuen l’escacs com un referent important per avançar en el raonament, la planificació i la resiliència de la IA.

OpenAI’s ChatGPT o3 va sorgir com a guanyador d’un torneig organitzat per Kaggle dissenyat per identificar el model de gran llenguatge jugant a l’escacs més fort, derrotant el model Grok d’xAI de Elon Musk a la ronda final. La competició de tres dies va comptar amb vuit LLM de propòsit general de companyies com OpenAI, xAI, Google, Anthropic, DeepSeek i Moonshot AI, tots competint segons les normes estàndard d’escacs sense l’ajuda de motors especialitzats d’escacs. Gemini de Google va aconseguir el tercer lloc després de vèncer un altre participant d’OpenAI. Grok 4 va començar fortament el torneig d’escacs d’IA a Kaggle, però es va aturar a la darrera partida contra l’o3 d’OpenAI, cometent diversos errors tàctics, incloent-hi múltiples pèrdues de reina. “Fins a les semifinals, semblava que res podria aturar Grok 4”, va observar l’escriptor de Chess. com Pedro Pinhata, tot i que el seu rendiment “s’enfonsà sota pressió” el darrer dia.

El Gran Mestre Hikaru Nakamura, que va fer comentaris en directe, va dir: “Grok va cometre tants errors en aquestes partides, però OpenAI no. ” Elon Musk va minimitzar la derrota, descrivint la forta actuació anterior de Grok com un “efecte secundari” i mentioning que xAI havia “gastat gairebé cap esforç en escacs”. El resultat del partit afegeix un altre capítol públic a la rivalitat entre Musk’s xAI i OpenAI, companyies cofundades per persones que una vegada van col·laborar. Els escacs han servit històricament com a punt de referència per a les capacitats de la IA, amb fites com el triomf d’AlphaGo de DeepMind sobre els millors jugadors humans de Go. No obstant això, aquest esdeveniment de Kaggle va ser únic en provar els grans models de llenguatge de propòsit general en lloc d’especialistes en escacs, destacant la seva capacitat—o manca d’aquesta—per manejar tasques complexes basades en regles. Els resultats mostren que tot i que l’o3 va mantenir un joc estable i estratègic sota pressió, l’enfonsament de Grok 4 va posar de manifest inconsistències en alguns LLM quan es van trobar amb condicions adverses. Organitzadors i comentaristes preveuen que els escacs i desafiaments estructurats similars continuaran sent eines valuoses per avaluar el raonament, la planificació i la robustesa a mesura que els models d’IA progressin.


Watch video about

ChatGPT d'OpenAI o3 guanya el torneig d'IA d'escacs de Kaggle derrotant el Grok 4 d'Elon Musk

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 30, 2025, 9:31 a.m.

Trec en vendes tecnològiques i utilitzo la IA a d…

Aquest assaig narrat per a qui m’ha explicat la seva experiència prové d’una conversa amb Antoine Wade, professional de vendes tecnològiques resident a Sant Antoni.

Dec. 30, 2025, 9:24 a.m.

Meta Platforms anuncia una inversió de 10.000 mil…

Meta Platforms Inc.

Dec. 30, 2025, 9:23 a.m.

El paper d'alumini de coure HVLP viu un augment d…

El mercat global de làmines de coure HVLP (de perfil molt baix) està experimentant un creixement significatiu aquest any, impulsat principalment per la creixent demanda de servidors d’IA.

Dec. 30, 2025, 9:14 a.m.

L'explosió del mercat de processadors d'IA

Jon Peddie, fundador i president de Jon Peddie Research, va ser l’invitat principal al programa de l’notable podcaster tecnològic Kenneth Wong, on va parlar sobre l’expansió ràpida de la indústria de processadors d’IA i les fluctuacions diàries d’aquest mercat de mil milions de dòlars.

Dec. 30, 2025, 9:13 a.m.

Intel·ligència artificial i SEO: Comprendre la si…

La relació en evolució entre la intel·ligència artificial (IA) i l’optimització per a motors de cerca (SEO) està transformant profundament el paisatge del màrqueting digital.

Dec. 30, 2025, 9:13 a.m.

Intel·ligència artificial en la producció de víde…

La fase de postproducció de la producció de vídeo està experimentant una gran transformació amb la creixent adopció de tecnologies d'intel·ligència artificial (IA).

Dec. 30, 2025, 5:25 a.m.

Reestructuració de lideratge d'Intel enmig de la …

Intel Corporation ha iniciat importants canvis de lideratge i reduccions de la plantilla a les seves operacions de foneria com a part d’una reestructuració corporativa més àmplia destinada a reenfocar la seva estratègia empresarial per afrontar millor el mercat de la intel·ligència artificial (IA), que evoluciona ràpidament.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today