lang icon English
Jan. 14, 2025, 7:39 p.m.
1900

ओपनएआयचा o3 मॉडेल ARC-AGI चाचणीवर विक्रम मोडतो.

Brief news summary

OpenAIचा नवीनतम चॅटबॉट, o3, कृत्रिम बुद्धिमत्तेत एक मोठी उडी दर्शवतो, ARC-AGI चाचणीवर 87.5% गुण जोडून, 55.5% च्या मागील सर्वोत्तम पेक्षा लक्षणीय उच्च. ही चाचणी विकसित करणारे फ्रान्सुआ चॉलेट o3 च्या वर्धित विचारशक्ती आणि सर्वसामान्यीकरण क्षमतांमुळे याला एक महत्वाची प्रगती मानतात. या प्रगतीच्या बावजूद, o3 अद्याप कृत्रिम सर्वसामान्य बुद्धिमत्ता (AGI) म्हणून पात्र नाही, जरी ते FrontierMath सारख्या इतर मूल्यांकनांवर चांगले कार्य करते. ARC-AGI चाचणीचे खरे विचार मूल्यांकन करण्यातील प्रभावीपणा चर्चेस पात्र आहे. AI बेंचमार्किंग तज्ञ डेव्हिड रेन एआय साठी निष्पक्ष संज्ञानात्मक चाचण्या तयार करण्याच्या अडचणींचा मुद्दा उचलतात. जरी OpenAI ने o3 च्या आर्किटेक्चरचे specifics उघड केले नाहीत, असे सुचवले जाते की o3 अनेक विचारशृंखलांचा वापर करून इष्टतम उपाय शोधतो—एक पद्धत जी संगणकीय दृष्ट्या तीव्र आहे व त्यासाठी प्रत्येक कार्यासाठी 14 मिनिटे लागतात. AGI साठीचा शोध अद्याप निश्चित वेळापत्रकाशिवाय सुरू आहे. OpenAI च्या 2024 MLE-बेंच आणि Yue च्या MMMU सारख्या आगामी मूल्यांकनांना जागतिक परिदृश्य मूल्यांकनावर लक्ष केंद्रित केले आहे, जिथे अचूकता आणि ऊर्जा कार्यक्षमता प्राधान्य दिले जाते. जरी o3 उल्लेखनीय प्रगती दर्शवतो, तरी AGI प्राप्त करण्याचा मार्ग धूसर आहे, अधिक अचूकपणे AI विचार क्षमतांचे मोजमाप करण्यासाठी अधिक प्रगत बेंचमार्कची आवश्यकता ठळकपणे दिसून येते.

OpenAIच्या प्रायोगिक चॅटबॉट मॉडेल, o3 ने अलीकडेच ARC-AGI चाचणीवर प्रभावी 87. 5% गुण मिळवले, ज्यामुळे मागील AI विक्रमी 55. 5% चा मोठ्या प्रमाणात मागे टाकले. हे कृत्रिम सामान्य बुद्धिमत्ता (AGI) ची दिशेने महत्त्वपूर्ण पाऊल आहे, ज्याचे वर्णन मनुष्यांसारखे विचार, योजना आणि शिकण्यास सक्षम प्रणाली म्हणून केले जाते. ARC-AGI चाचणी विकसित करणारे AI संशोधक फ्रँकोइस चॉलेट o3 च्या उल्लेखनीय विचार आणि सामान्यीकरण क्षमतांचे कौतुक करतात, तरी AGI पूर्णपणे साध्य झालेले नाही असे ते मानतात. o3 मॉडेलने इतर अनेक मापनांमध्ये चांगली कामगिरी केली आहे, जसे की Epoch AI ची आव्हानात्मक FrontierMath चाचणी. तथापि, डेव्हिड रीन आणि अन्य तज्ञ हा प्रश्न उपस्थित करतात की ARC-AGI खरोखर AI च्या तर्क आणि सामान्यीकरण क्षमतांचे मापन करते का, आणि त्यासाठी अधिक चांगल्या मूल्यांकनांची गरज असल्याचे सांगतात. OpenAI ने o3 च्या कार्यप्रणालीविषयी तपशील उघड केलेला नाही, परंतु ते o1 मॉडेलच्या 'विचाराच्या साखळी' तर्काचे अनुसरण करते. काहीजण अनुमान करतात की o3 सर्वोत्तम उत्तर मिळवण्यासाठी अनेक तर्कसाखळ्या निर्माण करते. त्याच्या उच्च कामगिरीच्या बाबतीत, o3 चा चाचणी प्रक्रियाही महाग आणि वेळखाऊ आहे, प्रत्येक कामासाठी सुमारे 14 मिनिटे लागतात, ज्यामुळे टिकवण्याच्या क्षमतेबद्दल चिंता वाढतात. AGI ची संकल्पना स्पष्ट परिभाषेची कमतरता आहे, ज्यामुळे AI हे कधी साध्य करू शकते याबाबत सहमतीचा अभाव आहे.

प्रगतीचे परीक्षण करण्यासाठी विविध चाचण्या विकसित केल्या जात आहेत, जसे की रीनचे Google-Proof Q&A आणि OpenAI चे 2024 मधील MLE-bench, जे वास्तव जीवनातील समस्यांसह AI ला आव्हान देते. चांगल्या मोजमापांना खात्री असू शकली पाहिजे की AI ला प्रशिक्षणादरम्यान चाचणी प्रश्न आलेले नाहीत आणि खऱ्या तर्काला शॉर्टकट्सशिवाय आवश्यक आहे. झियांग युए परीक्षांमधील गोंधळलेल्या, वास्तव जीवनातील स्थिती आणि ऊर्जा कार्यक्षमतेच्या महत्त्वावर जोर देतात. युएचे MMMU मापदंड चॅटबॉट्सचे विद्यापीठस्तरीय कामांवर मूल्यमापन करते, ज्यामध्ये OpenAI चे o1 सध्याच्या विक्रमी 78. 2% गुणासह आहे. त्याच्या उलट, ARC-AGI प्राथमिक कौशल्यांवर केंद्रित आहे, जसे की गणित आणि नमुना ओळख, परीक्षार्थींना परिणाम काढण्यासाठी डिझाइन रूपांतरण देणं. युए ARC-AGI च्या AI क्षमतांचे मूल्यांकन करण्यात अद्वितीय दृष्टिकोनाची प्रशंसा करतात.


Watch video about

ओपनएआयचा o3 मॉडेल ARC-AGI चाचणीवर विक्रम मोडतो.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 17, 2025, 5:24 a.m.

एआय कंपनीने दावा केला की चिनी गुप्तहेरांनी त्याची त…

अन्त्रोपीक, एआय चॅटबॉट क्लॉडचे निर्माते, म्हणते की त्यांनी त्यांचा टूल वापरून सुमारे 30 आंतराष्ट्रीय संस्थांवर स्वयंचलित सायबर हल्ले करण्यासाठी चीन सरकारला पाठिंबा देणाऱ्या हॅकर्सची ओळख पटवली आहे.

Nov. 17, 2025, 5:22 a.m.

एआय व्हिडओ संकुचन तंत्रे प्रवाहाची गुणवत्ता सुधारणे

आजच्या डिजिटल क्षेत्रात, जिथे व्हिडिओ वापर सर्वकालीन उंचीवर आहे, स्ट्रीमिंग सेवा वापरकर्ता अनुभव वाढविण्यास आणि संसाधने ऑप्टिमाइझ करण्याचा प्रयत्न करत आहेत.

Nov. 17, 2025, 5:22 a.m.

SES AI कॉर्पोरेशनने Hyundai Motor Group सोबत सहयोग…

SES AI कॉर्पोरेशन आणि ह्यุนडाई मोटर ग्रुप यांचे नुकतेच महत्त्वाचे भागीदारी करून लिथियम-मेटल बॅटरींच्या बी-नमुन्याचा संयुक्त विकास केला आहे, ज्यामुळे आगामी प्रजातीच्या बॅटरी तंत्रज्ञानाच्या प्रगतीसाठी एक धोरणात्मक टप्पा झाले आहे, विशेषतः इलेक्ट्रिक वाहनांसाठी (EV).

Nov. 17, 2025, 5:14 a.m.

आयआय-शक्तीमय विपणन धोरणे: व्यवसायांसाठी एक गेम चेंजर

कृत्रिम बुद्धिमत्ता (AI) विपणन क्षेत्रावर खोलगच्चपणे परिणाम करत आहे, नवीन साधने सादर करून ज्यामुळे ग्राहकांची आर्थिक वाढ होते आणि जाहिरातींच्या मोहिमा अधिक कार्यक्षम बनतात.

Nov. 17, 2025, 5:14 a.m.

eBayचे AI-सक्षम ब्लॅक फ्रायडेची अवस्था: 2025 च्या सायब…

ब्लॅक फ्रायडे आणि सायबर मंडे २०२५ जवळ येते आहे, त्याच्यादृष्टीने eBay काही महत्त्वाच्या धोरणात्मक बदलांना अंमलात आणत आहे, ज्यामध्ये उच्च विक्री करणाऱ्या विक्रेत्यांसाठी सूची सीमा स्वच्छ करणे आणि उत्पन्न वाढवणारे प्रचारात्मक साधने वाढवणे यांचा समावेश आहे.

Nov. 17, 2025, 5:12 a.m.

डेटा: अनुवादित साइट्सनी AI ओव्हरव्यूमध्ये ३२७% अधिक द…

ही पोस्ट वेग्लोट द्वारा प्रायोजित आहे, आणि व्यक्त केलेले मत ही प्रायोजकाची आहे.

Nov. 16, 2025, 1:28 p.m.

एआय व्हिडिओ विश्लेषण स्पोर्ट्स प्रसारणाचा अनुभव वाढवते

जगभरातील क्रीडा प्रसारणक उच्च वेगाने कृत्रिम बुद्धिमत्ता (AI) व्हिडीओ विश्लेषण स्वीकारत आहेत, जे लाइव्ह खेळ सादरीकरणांना नव्याने रूप देत आहे.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today