lang icon English
Dec. 20, 2024, 11:02 p.m.
2511

o3 líkan OpenAI: Framfarir í átt að AGI með árangri í ARC áskorun

Brief news summary

O3 líkanið frá OpenAI hefur vakið verulega athygli fyrir að standa sig vel í ARC áskoruninni, sem metur rökhæfileika gervigreindar. Það náði 75,7% skori á "hálfum-lykil" prófinu, en sérfræðingar vara við að þetta jafngildi ekki byltingu í átt að almennri gervigreind (AGI). Líkanið mætti áskorunum í "lykil" prófinu vegna takmarkaðra úthalds í úrvinnslu en náði óopinberu 87,5% skori þegar því var veitt meiri úrvinnslugeta. Sérfræðingar í gervigreind eins og Melanie Mitchell og François Chollet leggja áherslu á að þessar niðurstöður tákni ekki AGI. Áskoruninni er ætlað að leggja meiri áherslu á rökhugsun en hráan útreikningskraft, sem undirstrikar þennan mun. Chollet bendir á að sönn AGI ætti að sýna yfirburði í verkefnum sem auðveld eru fyrir menn en flókin fyrir vélar. Þó að árangur o3 líkansins bendi til framfara í gervigreind, er frekari rannsókn nauðsynleg til að skilja hæfileika þess til fulls. Skipuleggjendur ARC áskorunarinnar ætla að kynna erfiðari mat á árinu 2025 til að halda áfram að kanna framfarir gervigreindar. ARC verðlaunin eru áfram laus þar til líkan vinnur aðalverðlaunin og deilir opinberlega lausn sinni.

Gerð gervigreindar líkanið o3 frá OpenAI hefur náð verulegum árangri á ARC-áskoruninni, prófi fyrir rökhugsun gervigreindar, sem hefur vakið áhuga sumra sem velta fyrir sér hvort hún hafi náð almennri gervigreind (AGI). Þó leggja skipuleggjendur ARC-áskorunarinnar áherslu á að þrátt fyrir að o3 hafi náð þessum áfanga, hafi það hvorki unnið stóra verðlaunin í keppninni né náð AGI, sem þýðir að um er að ræða greind á borð við mannlega greind. O3-líkanið, arftaki stórra tungumálalíkana eins og ChatGPT, stóð sig í verkefnum sem voru hönnuð til að prófa almenna greind með mynstragreiningu í lituðum grindum. ARC-áskorunin krefst takmarkana á reikniafl til að koma í veg fyrir að leysa verkefnin með hráu afli. Líkanið frá OpenAI náði opinberlega 75, 7% skori, í samræmi við fjárhagsmörk keppninnar, en uppfyllti ekki strangari einkaprófunarskilyrði sem ákvarða úrslitin um stóru verðlaunin. Óopinberlega náði o3 87, 5% skori með því að nota mun meira reikniafl, með kostnaði sem nam þúsundum á hvert verkefni—mun hærra en keppnin leyfir. Þrátt fyrir að fara fram úr venjulegu mannaskori, 84%, hefur AGI ekki verið náð, eins og skipuleggjendur áskorunarinnar og sérfræðingar í gervigreind fullyrða. Líkanið átti einnig erfitt með að leysa yfir 100 verkefni jafnvel með verulegum reikniafli. Rannsakendur á sviði gervigreindar, eins og François Chollet hjá Google, benda á að leysa verkefni með hreinni útreikningum vinnur gegn tilgangi þess að sýna AGI.

Chollet og aðrir sérfræðingar leggja áherslu á að sönn AGI myndi útrýma áskoruninni um að búa til verkefni sem eru einföld fyrir menn en erfið fyrir gervigreind. Sem stendur táknar afrekið hjá o3 framfarir en ekki AGI. Tækniiðnaðurinn heldur áfram að glíma við nýlegan samdrátt í framvindu gervigreindar miðað við fyrri miklar framfarir. Möguleikinn er þó enn til staðar að gervigreindarmódel gætu fljótlega sigrast á viðmiðum keppninnar, með sumum þegar yfir 81% í prófunum. Framundan eru næstu skref, þ. m. t. annar, erfiðari prófapakki sem er væntanlegur árið 2025. Lokamarkmiðið er að einhver nái að opna lausn sem vinnur stóru verðlaunin.


Watch video about

o3 líkan OpenAI: Framfarir í átt að AGI með árangri í ARC áskorun

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 14, 2025, 1:26 p.m.

Anthropic uppgötvar tölvuþrautaherferð sem er knú…

Anthropic, leiðandi fyrirtæki á sviði sýndarvélmenna, hefur tilkynnt um byltingarkennda og áhyggjuefandi þróun í gagnageymd: fyrsta skjallega tilvikið þar sem gervigreind sjálfstætt stýrir tölvuárásarmynstri.

Nov. 14, 2025, 1:25 p.m.

AI-unnuð Sora myndbönd af íslenksu komuð leitum e…

“Passaðu þig, herra, haldið áfram að hreyfa þig,” segir lögreglufulltrúi sem er í vesti með merki ICE og flísi merktum „LÖGREYSLAN“ við mann sem virðist vera latínómætur, búinn vesti frá Walmart.

Nov. 14, 2025, 1:18 p.m.

Kevin Reilly ráðinn forstjóri hjá gervigreindarfy…

Kevin Reilly, reyndur Hollywood-stjórnandi sem er þekktur fyrir lykil hlutverk sitt í að koma á fót merkjum sjónvarpsþátta eins og „The Sopranos“, „The Office“ og „Glee“, hefur tekið að sér nýtt verkefni sem forstjóri Kartel, AI sköpunarráðgjafar sem er staðsett í Beverly Hills.

Nov. 14, 2025, 1:14 p.m.

Google stendur frammi fyrir samkeppnislögsókn ESB…

Evrópusambandið hef urðum umfangsmikla samkeppnishindrandi rannsókn á stefnu Google í baráttunni við ruslpóst, í kjölfar áhyggjna frá fjölmörgum fréttafyrirtækjum víðs vegar um Evrópu.

Nov. 14, 2025, 1:12 p.m.

Dealism kynna fyrsta gervigreinda söluyfirráð sem…

SÍKILJINGABÆR, 13.

Nov. 14, 2025, 9:31 a.m.

vélaraleg greining á leitartækni: Næsta landamæri…

Gervigreind (AI) er í örum vexti að verða umbreytandi afl í stafrænum markaðssetningu, sérstaklega innan leitarvélastarfs.

Nov. 14, 2025, 9:22 a.m.

Gervigreind er liðmaður, ekki óvinur

Shelley E. Kohan bætir við Leigh Sevin, meðstofnanda Endear, CRM lausnar sem sérsniðin er að nútíma omnichannel verslunarbönkum.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today