lang icon English
Dec. 24, 2024, 5:49 p.m.
4625

ओपनएआय O3 मॉडेलचा ARC-AGI बेंचमार्कवरील उल्लेखनीय प्रगती: प्रगत AI कडे एक पाऊल

Brief news summary

OpenAI च्या o3 मॉडेलने कृत्रिम बुद्धिमत्तेत लक्षणीय प्रगती साधली आहे, ARC-AGI बेंचमार्कवर 75.7% गुण मिळवले आहेत, आणि त्याच्या उच्च-संगणक प्रकाराने 87.5% पर्यंत गुण मिळवले आहेत. ARC-AGI एखाद्या AI च्या नवीन आणि जटिल दृश्य कामांना हाताळण्याच्या क्षमतेचे मापन करते, अनुकूल बुद्धिमत्तेला अधोरेखित करते. या प्रगती असूनही, o3 खरे कृत्रिम जनरल इंटेलिजन्स (AGI) म्हणून पात्र ठरत नाही कारण त्याला अजूनही साध्या कामांमध्ये अडचणींना सामोरे जावे लागते आणि विचारासाठी मानवी मार्गदर्शनाची आवश्यकता असते. यापूर्वी, उच्चतम ARC-AGI गुण 53% होता, जो मॉडेल्स आणि जेनेटिक अल्गोरिदमच्या मिश्रणाचा वापर करून साधला गेला होता. ARC चे निर्माता फ्रांस्वा शोल्ले, o3 ला अंतर्ज्ञानशील AI मध्ये एक मोठा उडाण असल्याचे मानतात, केवळ घुसखोरी विकसित करण्याच्या पलीकडे जाणारे. o3 ला लक्षणीय संगणकीय शक्तीची आवश्यकता आहे तरी, या मागण्या वेळोवेळी कमी येतील असा अंदाज आहे. मॉडेलचा यश "प्रोग्राम सिंथेसिस" शी संबंधित असू शकतो, ज्यामध्ये कामांना सोडवण्यासाठी लहान प्रोग्राम तयार करणे समाविष्ट आहे. मॉडेलमध्ये बळकटीकरण शिक्षण आणि शोध धोरणे समाविष्ट करण्याबद्दल चर्चेदेखील चालू आहेत, जरी स्थापत्य तपशील अद्याप उघड केलेले नाहीत. ARC-AGI मध्ये o3 ची साधना उल्लेखनीय आहे, परंतु ती AGI च्या समतुल्य नाही. Chollet सह तज्ञ असा विचार करतात की ARC-AGI मध्ये उत्कृष्टता प्राप्त करणे म्हणजे AGI प्राप्त करण्यासारखे नाही. नवीन आव्हाने विकसित केली जात आहेत जे AI मॉडेल्सची चांगली मूल्यांकन करण्यास मदत करतील, विशेषतः त्यांच्या आरंभीच्या प्रशिक्षण परिस्थितीं पलिकडे जाण्याच्या क्षमतेला. हे प्रयत्न AI प्रशिक्षण आणि मूल्यांकनात बदल सुचवतात, AGI कडे प्रगतीची दिशादर्शक आहे तरी अंतिम उद्दिष्ट अद्याप प्राप्त झालेले नाही.

OpenAI च्या o3 मॉडेलने ARC-AGI बेंचमार्कमध्ये 75. 7% गुण मिळवून AI मध्ये एक आश्चर्यजनक प्रगती साधली आहे, ज्यात सुधारित आवृत्तीने 87. 5% गाठले. हे प्रभावी असले तरी, हे कृत्रिम सर्वसामान्य बुद्धिमत्ता (AGI) येण्याचे सूचक नाही. ARC-AGI बेंचमार्क, रिसनिंग कॉर्पसवर आधारित, AI ची जटिल, नवीन कार्ये दृश्य कोडीसह चाचणी करते. साध्या डेटा प्रशिक्षणाद्वारे बृट-फोर्स सोल्युशन टाळण्यासाठी त्याची रचना अवघड आहे. बेंचमार्कमध्ये 400 उदाहरणांची सार्वजनिक प्रशिक्षण संचिका आणि अधिक आव्हानात्मक मूल्यांकन संच समावेश आहे. खाजगी आणि अर्ध-खाजगी परीक्षण संच AI ला पूर्वज्ञान न देता अविरोधित मूल्यमापन सुनिश्चित करतात. पूर्वी, OpenAI च्या o1 ने ARC-AGI वर फक्त 32% गाठले, आणि संशोधक जेरेमी बर्मनच्या पद्धतीने 53% गाठले. ARC चे निर्माता फ्रँकोइस चोलेट, o3 च्या कामगिरीला AI मध्ये एक मोठी झेप म्हणून वर्णन करतात, GPT मॉडेल्समध्ये यापूर्वी न पाहिलेली अनुकूलता दर्शवितो. o3 च्या प्रमुखपणाचे असूनही, हे मॉडेल मागील मॉडेल्सपेक्षा मोठे नाही, त्याला एक सत्य गुणात्मक सुधारणा म्हणून चिन्हांकित करते, केवळ वाढते नवनिर्मित उन्नत नाही.

तरीही, याचे उच्च खर्च आहेत: कमी-कंप्युटमध्ये प्रति कोडे $17 ते $20 आणि 33 दशलक्ष टोकन, उच्च-कंप्युट सेटिंग्जसाठी मोठ्या प्रमाणात वाढणे. नवीन समस्यांचे निराकरण करण्यासाठी 'प्रोग्राम सिंथेसिस' वर चोलेट भर देतात, ज्यामध्ये छोटे, संयोजनात्मक कार्यक्रम समाविष्ट आहेत. o3च्या यांत्रिकतेवर विरळ माहिती असूनही, विचार प्रक्रियेची साखळी शोध प्रणाली आणि समाधानाच्या वृद्धीसाठी रेइनफोर्समेंट लर्निंग (RL) यांचा समावेश होऊ शकतो असा (विवादित) अनुमान आहे. त्याच्या नावानुसार, ARC-AGI AGI ची चाचणी नाही. चोलेट म्हणतात की o3 ची प्रगत क्षमता असूनही, ते AGI नाही कारण ते अद्याप साध्या कार्यांत अयशस्वी ठरते आणि बाह्य इनपुटशिवाय स्वायत्तपणे शिकू शकत नाही. स्वतंत्र तपासणीत OpenAI च्या निकालांवर प्रश्न उपस्थित केले, हे दर्शवित की o3 ARC प्रशिक्षण डेटावर फाइन-ट्यून केले गेले होते. संशोधक ARC पलीकडे या प्रणालींचा अभिप्राय आणि विचार कौशल्ये निश्चित करण्यासाठी चाचणी करण्याची शिफारस करतात. चोलेटची टीम o3 साठी आव्हानात्मक नवीन बेंचमार्क विकसित करत आहे, तर बहुतांश कोडी माणसे सहज सोडवू शकतात, वर्तमान AI आणि खऱ्या AGIमधील अंतर अधोरेखित करत आहे.


Watch video about

ओपनएआय O3 मॉडेलचा ARC-AGI बेंचमार्कवरील उल्लेखनीय प्रगती: प्रगत AI कडे एक पाऊल

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 14, 2025, 1:26 p.m.

Anthropic ने चीनशी संबंधित AI-चालित हॅकिंग मोहिमा…

अँथ्रोपिक, एक अग्रगण्य AI कंपनी, सायबरसुरक्षेत एक नवा आणि धोकादायक विकास उघडकीस आणला आहे: AI स्वयंपाकाने हॅकिंग मोहिमा चालवणाऱ्या पहिल्या प्रलेखित प्रकरणाचे निदान.

Nov. 14, 2025, 1:25 p.m.

आय-निर्मित सोरा व्हिडिओजे ICE छाप्यांचे आहेत फेसबुकव…

“आपली पायरी लक्षात ठेवा, सभा, पुढे चालत रहा,” असा एक पोलिस अधिकारी ज्याच्या वेस्टवर ICE असे लिहिलेले आहे आणि “POICE” असे टॅग लावलेले आहे, असे म्हणतात एका Latino दिसणाऱ्या माणसाला जो Walmart च्या कर्मचारी वेस्टमध्ये घालणारा आहे.

Nov. 14, 2025, 1:18 p.m.

केविन रेइलि यांच्या कडून एआय सल्लागार कंपनी कार्टेलच्…

केविन रिली, एक अनुभवी हॉलीवूड कार्यकारी, ज्यांना "द सोप्रानोज," "द ऑफिस," आणि "ग्ली" या लक्षणीय टीव्ही मालिकांच्या सुरुवातीस महत्त्वाची भूमिका निर्वाहल्यामुळे ओळखले जाते, त्यांनी बेव्हरली हिल्समधील आर्टिफिशियल इंटेलिजन्स क्रिएटीव्ह कन्सल्टन्सी कर्टेलचे सीईओ म्हणून नवीन आव्हान स्वीकारले आहे.

Nov. 14, 2025, 1:14 p.m.

गुगलवर स्पॅम धोरणांमुळे युरोपीयन प्रतिज्ञा तपासणी सु…

युरोपियन युनियनने Googleच्या स्पॅम धोरणांवर मोठ्या प्रमाणावर ऍंटिट्रस्ट तपास सुरू केला आहे, त्यानंतर युरोपभरच्या अनेक वृत्तपत्र प्रकाशकांकडून चिंता व्यक्त करण्यात आली आहे.

Nov. 14, 2025, 1:12 p.m.

डीलिझमने व्हाइब विक्रीवर आधारित पहिले एआय विक्री एजं…

सिंगापूर, १३ नोव्हेंबर, २०२५ /PRNewswire/ -- सिंगापूरस्थित DEALISM PTE.

Nov. 14, 2025, 9:31 a.m.

एआय-चालित एसईओ: डिजिटल मार्केटिंगमधील पुढील सीमा

कृत्रिम बुद्धिमत्ता (AI) ही डिजिटल मार्केटिंगमध्ये लवकरच एक परिवर्तनकारी शक्ती बनत आहे, विशेषतः सर्च इंजिन ऑप्टिमायझेशन (SEO) मध्ये.

Nov. 14, 2025, 9:22 a.m.

आयआय एक मित्र आहे, शत्रू नाही

शेली ई.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today