Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Dec. 24, 2024, 5:49 p.m.
266

Percée du Modèle OpenAI o3 sur la Référence ARC-AGI : Un Pas Vers une IA Avancée

Le modèle o3 d’OpenAI a réalisé une avancée surprenante en IA en obtenant un score de 75, 7 % sur le benchmark ARC-AGI, une version améliorée atteignant 87, 5 %. Bien que cela soit impressionnant, cela ne signifie pas l'arrivée de l'intelligence générale artificielle (AGI). Le benchmark ARC-AGI, basé sur le Corpus de Raisonnement Abstrait, évalue la capacité de l'IA à accomplir des tâches complexes et inédites avec des puzzles visuels. Il est difficile en raison de sa conception, qui empêche les solutions par la force brute à travers un simple entraînement de données. Le benchmark comprend un ensemble d'entraînement public de 400 exemples et des ensembles d'évaluation plus difficiles. Des ensembles de tests privés et semi-privés garantissent une évaluation impartiale sans exposer l'IA à des connaissances préalables. Auparavant, l’o1 d’OpenAI n’avait atteint que 32 % sur le benchmark ARC-AGI, et la méthode du chercheur Jeremy Berman avait atteint 53 %. François Chollet, créateur de l’ARC, décrit la performance de l’o3 comme un grand bond en IA, montrant une adaptabilité auparavant inédite dans les modèles GPT. Malgré l’attention considérable autour de l’o3, il n’est pas significativement plus grand que les modèles antérieurs, le marquant comme une véritable amélioration qualitative plutôt qu’un simple progrès incrémental.

Cependant, il engendre des coûts élevés : de 17 à 20 dollars et 33 millions de tokens par puzzle pour un faible calcul, augmentant substantiellement pour des réglages de calcul élevé. Chollet souligne la « synthèse de programmes » pour résoudre de nouveaux problèmes, impliquant de petits programmes combinables. Bien que peu de détails sur le fonctionnement de l’o3 existent, on suppose un raisonnement en chaîne avec des mécanismes de recherche et un apprentissage par renforcement pour affiner les solutions, bien que les opinions à ce sujet soient divisées parmi les experts. Malgré son appellation, l’ARC-AGI n’est pas un test pour l’AGI. Chollet déclare que bien que l’o3 ait des capacités avancées, ce n’est pas de l’AGI car il échoue encore à des tâches simples et ne peut pas apprendre de façon autonome sans entrée externe. La vérification indépendante remet en question les résultats d’OpenAI, suggérant que l’o3 a été ajusté avec les données d’entraînement ARC. Les chercheurs proposent de tester ces systèmes dans de nouveaux environnements au-delà d’ARC pour confirmer leurs compétences d’abstraction et de raisonnement. L’équipe de Chollet développe un nouveau benchmark défiant pour l’o3, alors que les humains pourraient résoudre la plupart des puzzles facilement, soulignant l’écart entre l’IA actuelle et une véritable AGI.



Brief news summary

Le modèle o3 d'OpenAI représente une avancée significative en intelligence artificielle, atteignant un score de 75,7 % sur le benchmark ARC-AGI, tandis que sa variante à haute puissance de calcul atteint un impressionnant 87,5 %. L'ARC-AGI évalue la capacité d'une IA à gérer des tâches visuelles nouvelles et complexes, soulignant l'intelligence adaptative. Malgré ces progrès, o3 ne se qualifie pas encore comme une véritable intelligence artificielle générale (AGI) car il lutte encore avec des tâches simples et nécessite une guidance humaine pour le raisonnement. Auparavant, le score le plus élevé sur l'ARC-AGI était de 53 %, réalisé en utilisant un mélange de modèles et d'algorithmes génétiques. François Chollet, l'architecte d'ARC, considère o3 comme un bond substantiel dans l'IA adaptative, dépassant les simples avancées incrémentales. Bien que o3 exige une puissance de calcul significative, ces exigences devraient diminuer avec le temps. Le succès du modèle pourrait être lié à la "synthèse de programmes," qui consiste à concevoir de petits programmes pour résoudre des tâches. Des discussions sont en cours sur l'incorporation de l'apprentissage par renforcement et des stratégies de recherche dans le modèle, bien que les détails de l'architecture restent non révélés. Bien que les réussites de o3 en ARC-AGI soient remarquables, elles ne sont pas équivalentes à l'AGI. Les experts, y compris Chollet, insistent sur le fait qu'exceller en ARC-AGI n'est pas synonyme d'atteindre l'AGI. De nouveaux défis sont en cours de développement pour mieux évaluer les modèles d'IA, particulièrement leur adaptabilité au-delà des scénarios d'entraînement initiaux. Ces efforts suggèrent un changement dans la formation et l'évaluation de l'IA, indiquant des progrès vers l'AGI, bien que l'objectif ultime ne soit pas encore atteint.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

June 21, 2025, 2:35 p.m.

L'intelligence artificielle et la blockchain stim…

Le paysage des paiements évolue rapidement, avec de nombreuses startups à la tête d’innovations qui reshaping le secteur bancaire, notamment dans des domaines émergents tels que les stablecoins et l’intelligence artificielle (IA).

June 21, 2025, 2:18 p.m.

SoftBank propose un centre d'IA et de robotique d…

Le fondateur de SoftBank, Masayoshi Son, a dévoilé un plan ambitieux visant à créer un pôle d'intelligence artificielle (IA) et de robotique d'une valeur d'un billion de dollars en Arizona, dans le but de renforcer la capacité de fabrication de haute technologie des États-Unis et de positionner le pays en tant que leader mondial en technologie avancée et innovation.

June 21, 2025, 10:23 a.m.

SEC demande des formulaires S-1 révisés pour l'ap…

La Securities and Exchange Commission (SEC) des États-Unis a récemment demandé des dépôts modifiés pour les fonds négociés en bourse (ETFs) proposés basés sur Solana, ce qui indique une possible accélération du processus d’approbation de ces produits financiers.

June 21, 2025, 10:19 a.m.

Les points forts de la recherche d'Anthropic révè…

Une étude récente d'Anthropic, une société de recherche en intelligence artificielle de renom, a révélé des tendances préoccupantes chez les modèles avancés de langage en IA.

June 21, 2025, 6:17 a.m.

Apple envisage d'acquérir la startup de recherche…

Apple Inc., connue pour ses produits et services innovants, aurait entamé des discussions internes précoces concernant une possible acquisition de Perplexity, une startup spécialisée dans les technologies de recherche pilotées par l'IA.

June 21, 2025, 6:17 a.m.

Discussion sur l'intelligence artificielle et la …

Rejoignez-nous pour un événement captivant et informatif qui explore les dernières avancées en Intelligence Artificielle (IA) et en technologie Blockchain.

June 20, 2025, 2:26 p.m.

Ford explore le stockage décentralisé de données …

La société Ford Motor, une entreprise du Fortune 500, s'est associée à Iagon et Cloud Court pour lancer une preuve de concept (PoC) axée sur le stockage décentralisé des données juridiques, selon une annonce datée du 18 juin.

All news