Az OpenAI O3 modellje mérföldkőhöz érkezett az AI tesztelésében.

Az OpenAI legújabb nagy nyelvi modellje, az "o3" néven ismert, még nem került széles körben kiadásra, de a kezdeti tesztek utalnak képességeire. A modellt röviden bemutatták egy promóciós videóban, kevés részlettel a képességeiről. Különösen figyelemre méltó, hogy az o3-at tesztelték az "Abstraction and Reasoning Corpus for Artificial General Intelligence" (ARC-AGI) nevű benchmarkon, amely egy modell újdonságokhoz való alkalmazkodási képességét méri. Ebben a tesztben az o3 76%-os pontosságot ért el, felülmúlva a Mechanical Turkon dolgozók emberi eredményeit, amit egyesek áttörésnek tekintenek az AI új feladatok megoldási képességében. François Chollet, aki az ARC-AGI-t fejlesztette, kiemeli, hogy az o3 eredménye jelentős ugrást mutat az AI képességében, ami arra utal, hogy az o3 hamarosan versenyezhet az emberi munkával. Bár Chollet korábban szkeptikus volt azzal kapcsolatban, hogy az AI eléri az emberi szintű intelligenciát, elismeri ezt a fejleményt mint egy változást.
Az ARC-AGI teszt vizuális rejtvények megoldásából áll, amelyek nem támaszkodnak nyelvre, új módon kihívást jelentve az olyan modelleknek, mint az o3. Sikerei ellenére az o3 módszerei továbbra is homályosak zárt forráskódú természetéből adódóan. Chollet feltételezi, hogy a modell architektúrája jelentősen eltér az elődeitől, egy próbakeresési megközelítést alkalmazva, hasonlóan a Google AlphaZero-jához. Azonban Chollet megjegyzi, hogy az OpenAI nem közölte, mennyi erőforrást igényelt az ARC-AGI pontszámok elérése, ami befolyásolhatja az észlelt hatékonyságot. Az o3 általános alkalmazkodóképessége még kérdéses, mivel kifejezetten az ARC-AGI tesztre képezték ki. Chollet hangsúlyozza, hogy bár az o3 ígéretes, még mindig elbukik néhány egyszerű feladaton, ami arra utal, hogy még nem érte el az AGI (általános mesterséges intelligencia) szintet. Tervezi egy frissített ARC-AGI verzió kiadását, hogy tovább kihívást jelentsen az olyan modelleknek, mint az o3, jelezve, hogy az igazi AGI egyelőre még nincs elérhető közelségben.
Brief news summary
Az OpenAI legújabb nyelvi modellje, az "o3," jelentős előrelépést tett az AI fejlesztésében azáltal, hogy 76%-os eredményt ért el az "Abstraction and Reasoning Corpus for Artificial General Intelligence" (ARC-AGI) teszten, ezzel meghaladva az emberi átlagot, amely alig több mint 75%. Ez történelmi teljesítményt jelent, mivel ez az első eset, hogy egy AI ilyen szintű eredményt ért el, és jelentős előrelépést képvisel a problémamegoldás és alkalmazkodás terén. François Chollet, az ARC-AGI teszt létrehozója és a Google AI tudósa, ezt "valódi áttörésnek" nevezte, ami a mesterséges intelligencia növekvő képességét tükrözi, hogy emberihez hasonló feladatokat hajtson végre. Mindazonáltal Chollet megjegyezte, hogy ez nem jelenti azt, hogy az o3 elérte az emberi szintű általános mesterséges intelligenciát (AGI), mivel még mindig küzd egyszerűbb feladatokkal. Felvetette, hogy az architektúrális újítások, esetleg a Monte Carlo fa kereséshez hasonló megközelítések, hozzájárulhattak az o3 teljesítményéhez. Noha az o3 nagy lépést jelent előre, még nem érte el az univerzális emberi intelligencia szintjét, és a jövőbeli ARC-AGI változatok új kihívásokat jelenthetnek az AI modellek számára.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

A JPMorgan hidat képez a blokklánc és a hagyomány…
A JPMorgan sikeresen végrehajtott egy úttörő pilot tranzakciót, amely összeköti a hagyományos finanszírozást és a blokklánc technológiát az Ondo Finance-szel és a Chainlink-kel való együttműködés révén.

Szoftverfejlesztő elveszítette az évi 150 ezer do…
Az Anthropic vezérigazgatója, Dario Amodei előrejelzi, hogy a mesterséges intelligencia a jövő évre minden kódolási feladatot el tud majd látni, de ez egyes szoftvermérnökök számára létszükségleti válságot okoz.

A JPMorgan Kinexys kiépíti kapcsolatát a nyilváno…
A JPMorgan (JPM) első lépéseit tette nyilvános blokklánc hálózatán a Kinexys Digitális Fizetési Platformon keresztül, amikor sikeresen elszámolt egy tokenizált amerikai kincstárjegy tranzakciót az Ondo Chain tesztnetjén.

Marc Benioff az AI forradalmi hatásáról beszél a …
Marc Benioff, a Salesforce vezérigazgatója és a Time magazin társtulajdonosa nemrégiben nyilatkozott az Financial Timesnak, ahol véleményt fejtett ki a mesterséges intelligencia (MI) átalakító hatásáról az üzleti életben, a társadalomban és a globális politikában.

A JP Morgan blokkchaintal számla az Ondo nyilváno…
Ma ma az Ondo Finance bejelentette, hogy a JP Morgan Kinexys Digital Payments (egykor JPM Coin néven ismert) felhasználásával hajtottak végre egy delivery versus payment tranzakciót az OUSG tokenizált pénzpiaci alapjának rendezésére az Ondo blokkláncon.

Az Egyesült Államok közel jár egy megállapodáshoz…
Az Egyesült Államok közel áll egy előzetes megállapodás véglegesítéséhez az Egyesült Arab Emírségek (EAE) oldalán, amely szerint az EAE évente akár 500 000 Nvidia legfejlettebb AI-chipet importálhat majd 2025-től.

A JPMorgan Chase átlépi a „falakkal körülvett ker…
© 2025 Fortune Media IP Limited.