ChatGPT d’OpenAI o3 a émergé comme le vainqueur d’un tournoi organisé par Kaggle, conçu pour identifier le modèle de langage large jouant aux échecs le plus performant, battant le modèle Grok de xAI d’Elon Musk lors de la dernière étape. La compétition de trois jours réunissait huit LLM à usage général issus de sociétés telles qu’OpenAI, xAI, Google, Anthropic, DeepSeek et Moonshot AI, tous en compétition selon les règles standard d’échecs, sans l’aide d’engines spécialisés. Gemini de Google a obtenu la troisième place après avoir battu un autre concurrent d’OpenAI. Grok 4 a bien commencé le tournoi d’échecs de Kaggle mais a vacillé lors du dernier match contre o3 d’OpenAI, commettant plusieurs erreurs tactiques, notamment la perte de plusieurs dames. « Jusqu’aux demi-finales, il semblait que rien ne pourrait arrêter Grok 4 », a déclaré le rédacteur de Chess. com Pedro Pinhata, mais ses performances « se sont effondrées sous la pression » le dernier jour. Le grand maître Hikaru Nakamura, qui commentait en direct, a remarké : « Grok a fait tellement d’erreurs dans ces parties, mais OpenAI n’en a pas fait.
» Elon Musk a minimisé la défaite, qualifiant la performance précédente de Grok de « effet secondaire » en ajoutant que xAI avait « dépensé presque aucun effort sur les échecs ». Le résultat du match ajoute un nouveau chapitre public à la rivalité entre xAI de Musk et OpenAI, des entreprises cofondées par des personnes ayant autrefois collaboré. Les échecs ont historiquement servi de référence pour les capacités de l’IA, avec des jalons comme AlphaGo de DeepMind qui a triomphé des meilleurs joueurs humains de Go. Cependant, cet événement Kaggle était unique en testant des modèles de langage large à usage général plutôt que des moteurs d’échecs spécialisés, mettant en lumière leur capacité — ou leur incapacité — à gérer des tâches complexes basées sur des règles. Les résultats montrent que, si o3 a maintenu un jeu stratégique et régulier sous pression, l’effondrement de Grok 4 a révélé des incohérences chez certains LLM face à des conditions adverses. Organisateurs et commentateurs pensent que les échecs et d’autres défis structurés continueront d’être des outils précieux pour évaluer le raisonnement, la planification et la robustesse des modèles d’IA à mesure qu’ils progresseront.
ChatGPT d'OpenAI o3 remporte le tournoi d'échecs IA de Kaggle en battant Grok 4 d'Elon Musk
Examen des « hallucinations » de l'IA et explosions de Gaza dimanche Thomas Copeland, journaliste de BBC Verify Live Alors que nous préparons la clôture de cette couverture en direct, voici un résumé des principaux sujets du jour
Le défi auquel les marketeurs sont confrontés aujourd’hui est de harness the potential de l’IA sans compromettre les objectifs de durabilité — une question que nous, chez Brandtech, explorons avec nos clients et collègues de l’industrie.
D’ici 2028, on prévoit que 10 pour cent des professionnels de la vente utiliseront le temps ainsi gagné grâce à l’intelligence artificielle (IA) pour s’engager dans le « sur-emploi », une pratique où des individus occupent secrètement plusieurs emplois simultanément.
OpenAI s’est rapidement imposé comme une force majeure dans le domaine de l’intelligence artificielle grâce à une série de partenariats stratégiquement conçus avec des entreprises de premier plan dans la technologie et l’infrastructure à l’échelle mondiale.
Une étude récente révèle de grandes différences dans la façon dont les sites d’information réputés et les sites de désinformation gèrent l’accès des robots d’IA via les fichiers robots.txt, un protocole web contrôlant les permissions des robots.
Samedi, le président Donald Trump a partagé une vidéo générée par intelligence artificielle montrant une scène où il se trouve dans un avion de chasse lâchant ce qui semble être des excréments sur des manifestants américains.
Nvidia Corp.
Automate Marketing, Sales, SMM & SEO
and get clients on autopilot — from social media and search engines. No ads needed
and get clients today