lang icon Hungarian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Dec. 27, 2024, 10:02 p.m.
1

Az OpenAI O3 modellje mérföldkőhöz érkezett az AI tesztelésében.

Az OpenAI legújabb nagy nyelvi modellje, az "o3" néven ismert, még nem került széles körben kiadásra, de a kezdeti tesztek utalnak képességeire. A modellt röviden bemutatták egy promóciós videóban, kevés részlettel a képességeiről. Különösen figyelemre méltó, hogy az o3-at tesztelték az "Abstraction and Reasoning Corpus for Artificial General Intelligence" (ARC-AGI) nevű benchmarkon, amely egy modell újdonságokhoz való alkalmazkodási képességét méri. Ebben a tesztben az o3 76%-os pontosságot ért el, felülmúlva a Mechanical Turkon dolgozók emberi eredményeit, amit egyesek áttörésnek tekintenek az AI új feladatok megoldási képességében. François Chollet, aki az ARC-AGI-t fejlesztette, kiemeli, hogy az o3 eredménye jelentős ugrást mutat az AI képességében, ami arra utal, hogy az o3 hamarosan versenyezhet az emberi munkával. Bár Chollet korábban szkeptikus volt azzal kapcsolatban, hogy az AI eléri az emberi szintű intelligenciát, elismeri ezt a fejleményt mint egy változást.

Az ARC-AGI teszt vizuális rejtvények megoldásából áll, amelyek nem támaszkodnak nyelvre, új módon kihívást jelentve az olyan modelleknek, mint az o3. Sikerei ellenére az o3 módszerei továbbra is homályosak zárt forráskódú természetéből adódóan. Chollet feltételezi, hogy a modell architektúrája jelentősen eltér az elődeitől, egy próbakeresési megközelítést alkalmazva, hasonlóan a Google AlphaZero-jához. Azonban Chollet megjegyzi, hogy az OpenAI nem közölte, mennyi erőforrást igényelt az ARC-AGI pontszámok elérése, ami befolyásolhatja az észlelt hatékonyságot. Az o3 általános alkalmazkodóképessége még kérdéses, mivel kifejezetten az ARC-AGI tesztre képezték ki. Chollet hangsúlyozza, hogy bár az o3 ígéretes, még mindig elbukik néhány egyszerű feladaton, ami arra utal, hogy még nem érte el az AGI (általános mesterséges intelligencia) szintet. Tervezi egy frissített ARC-AGI verzió kiadását, hogy tovább kihívást jelentsen az olyan modelleknek, mint az o3, jelezve, hogy az igazi AGI egyelőre még nincs elérhető közelségben.



Brief news summary

Az OpenAI legújabb nyelvi modellje, az "o3," jelentős előrelépést tett az AI fejlesztésében azáltal, hogy 76%-os eredményt ért el az "Abstraction and Reasoning Corpus for Artificial General Intelligence" (ARC-AGI) teszten, ezzel meghaladva az emberi átlagot, amely alig több mint 75%. Ez történelmi teljesítményt jelent, mivel ez az első eset, hogy egy AI ilyen szintű eredményt ért el, és jelentős előrelépést képvisel a problémamegoldás és alkalmazkodás terén. François Chollet, az ARC-AGI teszt létrehozója és a Google AI tudósa, ezt "valódi áttörésnek" nevezte, ami a mesterséges intelligencia növekvő képességét tükrözi, hogy emberihez hasonló feladatokat hajtson végre. Mindazonáltal Chollet megjegyezte, hogy ez nem jelenti azt, hogy az o3 elérte az emberi szintű általános mesterséges intelligenciát (AGI), mivel még mindig küzd egyszerűbb feladatokkal. Felvetette, hogy az architektúrális újítások, esetleg a Monte Carlo fa kereséshez hasonló megközelítések, hozzájárulhattak az o3 teljesítményéhez. Noha az o3 nagy lépést jelent előre, még nem érte el az univerzális emberi intelligencia szintjét, és a jövőbeli ARC-AGI változatok új kihívásokat jelenthetnek az AI modellek számára.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 15, 2025, 1:35 a.m.

A JPMorgan hidat képez a blokklánc és a hagyomány…

A JPMorgan sikeresen végrehajtott egy úttörő pilot tranzakciót, amely összeköti a hagyományos finanszírozást és a blokklánc technológiát az Ondo Finance-szel és a Chainlink-kel való együttműködés révén.

May 15, 2025, 1:17 a.m.

Szoftverfejlesztő elveszítette az évi 150 ezer do…

Az Anthropic vezérigazgatója, Dario Amodei előrejelzi, hogy a mesterséges intelligencia a jövő évre minden kódolási feladatot el tud majd látni, de ez egyes szoftvermérnökök számára létszükségleti válságot okoz.

May 14, 2025, 11:44 p.m.

A JPMorgan Kinexys kiépíti kapcsolatát a nyilváno…

A JPMorgan (JPM) első lépéseit tette nyilvános blokklánc hálózatán a Kinexys Digitális Fizetési Platformon keresztül, amikor sikeresen elszámolt egy tokenizált amerikai kincstárjegy tranzakciót az Ondo Chain tesztnetjén.

May 14, 2025, 11:40 p.m.

Marc Benioff az AI forradalmi hatásáról beszél a …

Marc Benioff, a Salesforce vezérigazgatója és a Time magazin társtulajdonosa nemrégiben nyilatkozott az Financial Timesnak, ahol véleményt fejtett ki a mesterséges intelligencia (MI) átalakító hatásáról az üzleti életben, a társadalomban és a globális politikában.

May 14, 2025, 10:13 p.m.

A JP Morgan blokkchaintal számla az Ondo nyilváno…

Ma ma az Ondo Finance bejelentette, hogy a JP Morgan Kinexys Digital Payments (egykor JPM Coin néven ismert) felhasználásával hajtottak végre egy delivery versus payment tranzakciót az OUSG tokenizált pénzpiaci alapjának rendezésére az Ondo blokkláncon.

May 14, 2025, 9:44 p.m.

Az Egyesült Államok közel jár egy megállapodáshoz…

Az Egyesült Államok közel áll egy előzetes megállapodás véglegesítéséhez az Egyesült Arab Emírségek (EAE) oldalán, amely szerint az EAE évente akár 500 000 Nvidia legfejlettebb AI-chipet importálhat majd 2025-től.

May 14, 2025, 8:39 p.m.

A JPMorgan Chase átlépi a „falakkal körülvett ker…

© 2025 Fortune Media IP Limited.

All news