lang icon English
Dec. 24, 2024, 5:49 p.m.
4633

OpenAI o3 líkans bylting á ARC-AGI viðmiðinu: Skref í átt að háþróaðri gervigreind

Brief news summary

O3 líkanið frá OpenAI markar umtalsvert skref fram á við í gervigreind, með því að ná 75,7% skori á ARC-AGI viðmiðinu, á meðan afbrigði þess með mikla útreikninga nær glæsilegum 87,5%. ARC-AGI metur getu gervigreindar til að ráða við ný og flókin sjónræn verkefni, og leggur áherslu á aðlögunarhæfni greindar. Þrátt fyrir þessa framvindu er o3 enn ekki raunveruleg almenn gervigreind (AGI) þar sem það á í erfiðleikum með einföld verkefni og þarf enn mannlega leiðsögn til rökhugsunar. Fyrra hæsta ARC-AGI skor var 53%, náð með blöndu af líkönum og erfðaforritun. François Chollet, hönnuður ARC, álítur o3 vera mikilvægt stökk í aðlögun greindar, sem fer fram úr einföldum viðbótarframförum. Þó að o3 krefjist mikilla útreikninga, er búist við að þessar kröfur minnki með tímanum. Árangur líkansins gæti tengst "forritasamþættingu," sem felur í sér að búa til lítil forrit til að leysa verkefni. Umræða stendur yfir um að samþætta styrkingarnám og leitaraðferðir í líkanið, þó að smáatriði um arkitektúr þess séu ekki opinberuð. Þó að árangur o3 í ARC-AGI sé eftirtektarverður, jafngildir hann ekki AGI. Sérfræðingar, þar á meðal Chollet, leggja áherslu á að framúrskarandi árangur í ARC-AGI samsvari ekki ná AGI. Ný verkefni eru í þróun til að meta betur gervigreindarlíkön, sérstaklega aðlögunarhæfni þeirra umfram upphafleg þjálfunarsvið. Þessi vinna bendir til breytinga í þjálfun og mati á gervigreind, sem gefur til kynna framvindu í átt að AGI, þó að lokamarkinu sé enn ekki náð.

O3 líkan OpenAI hefur gert óvænt framfarir í gervigreind með því að ná 75, 7% á ARC-AGI viðmiðuninni, þar sem endurbætt útgáfa nær 87, 5%. Þótt þetta sé áhrifamikið, bendir það ekki til þess að við séum komin með almenna gervigreind (AGI). ARC-AGI viðmiðun, sem grundvallast á Abstract Reasoning Corpus, prófar getu gervigreindar við flókin, ný verkefni með sjónþrautum. Þetta er erfitt vegna hönnunar sem forðast einfalda gagnalausnir með þjálfun gagna. Viðmiðið inniheldur opinþjálfunardæmi með 400 dæmum og krefjandi matssett. Einkarekna og hálf-opin prófunarsöfn tryggja frekari hlutlausa mat án þess að gefa AI fyrri almenna þekkingu. Áður náði o1 frá OpenAI aðeins 32% á ARC-AGI, og aðferðafræði Jeremy Berman náði 53%. François Chollet, höfundur ARC, lýsir frammistöðu o3 sem stórum áfanga í gervigreind, sem sýnir aðlögunarhæfni sem áður hefur verið óþekkt í GPT líkani. Þrátt fyrir mikla athygli í kringum o3, er það ekki verulega stærra en fyrrum módel, sem merkir raunverulega gæðabreytingu frekar en einfaldan smávægilegan framför.

Þó felur það í sér mikinn kostnað: $17 til $20 og 33 milljónir tákna á þraut fyrir lágróf, sem eykst til muna í hágrófar umhverfi. Chollet leggur áherslu á „forritasamsetningu“ til að leysa ný vandamál, sem felur í sér litlar, samsettar forritseiningar. Þótt fáar upplýsingar séu til um vélvirki o3, eru tilgátur um keðjuröksemdafærslu með leitaraðferðum og styrkingarnám til endurbóta, þótt misjöfn sjónarmið séu meðal sérfræðinga um þetta. Þrátt fyrir nafn sitt er ARC-AGI ekki próf fyrir AGI. Chollet segir að þó o3 hafi aukið hæfileika sé það ekki AGI þar sem það bregst einföld verkefni og getur ekki lært sjálfstætt án ytri inngripa. Sjálfstæð eftirfylgd efast um niðurstöður OpenAI, bendandi til þess að o3 hafi verið fínstillt á ARC þjálfunargögn. Rannsakendur leggja til að prófa þessi kerfi í nýjum umhverfum utan ARC til að staðfesta abstraksjónir þeirra og rökfærnisfærni. Hóp Chollet er að þróa nýtt viðmiðunarpróf fyrir o3, en menn geta leyst flest svr puzzles auðveldlega, sem undirstrikar bilið milli núverandi gervigreindar og sannrar AGI.


Watch video about

OpenAI o3 líkans bylting á ARC-AGI viðmiðinu: Skref í átt að háþróaðri gervigreind

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 14, 2025, 1:26 p.m.

Anthropic uppgötvar tölvuþrautaherferð sem er knú…

Anthropic, leiðandi fyrirtæki á sviði sýndarvélmenna, hefur tilkynnt um byltingarkennda og áhyggjuefandi þróun í gagnageymd: fyrsta skjallega tilvikið þar sem gervigreind sjálfstætt stýrir tölvuárásarmynstri.

Nov. 14, 2025, 1:25 p.m.

AI-unnuð Sora myndbönd af íslenksu komuð leitum e…

“Passaðu þig, herra, haldið áfram að hreyfa þig,” segir lögreglufulltrúi sem er í vesti með merki ICE og flísi merktum „LÖGREYSLAN“ við mann sem virðist vera latínómætur, búinn vesti frá Walmart.

Nov. 14, 2025, 1:18 p.m.

Kevin Reilly ráðinn forstjóri hjá gervigreindarfy…

Kevin Reilly, reyndur Hollywood-stjórnandi sem er þekktur fyrir lykil hlutverk sitt í að koma á fót merkjum sjónvarpsþátta eins og „The Sopranos“, „The Office“ og „Glee“, hefur tekið að sér nýtt verkefni sem forstjóri Kartel, AI sköpunarráðgjafar sem er staðsett í Beverly Hills.

Nov. 14, 2025, 1:14 p.m.

Google stendur frammi fyrir samkeppnislögsókn ESB…

Evrópusambandið hef urðum umfangsmikla samkeppnishindrandi rannsókn á stefnu Google í baráttunni við ruslpóst, í kjölfar áhyggjna frá fjölmörgum fréttafyrirtækjum víðs vegar um Evrópu.

Nov. 14, 2025, 1:12 p.m.

Dealism kynna fyrsta gervigreinda söluyfirráð sem…

SÍKILJINGABÆR, 13.

Nov. 14, 2025, 9:31 a.m.

vélaraleg greining á leitartækni: Næsta landamæri…

Gervigreind (AI) er í örum vexti að verða umbreytandi afl í stafrænum markaðssetningu, sérstaklega innan leitarvélastarfs.

Nov. 14, 2025, 9:22 a.m.

Gervigreind er liðmaður, ekki óvinur

Shelley E. Kohan bætir við Leigh Sevin, meðstofnanda Endear, CRM lausnar sem sérsniðin er að nútíma omnichannel verslunarbönkum.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today