lang icon English
Dec. 27, 2024, 10:02 p.m.
3292

OpenAI O3 mudel saavutab tehisintellekti testimisel verstaposti.

Brief news summary

OpenAI uusim keelemudel "o3" on teinud märkimisväärseid edusamme AI arenduses, saavutades "Tehisintellekti Üldintellekti Abstraktsiooni ja Arutlemise Korpuse" (ARC-AGI) testis 76% skoori, ületades inimeste keskmise, mis on veidi üle 75%. See on ajalooline saavutus, kuna tegemist on esimese korraga, kui AI saavutab sellise taseme, tähistades märkimisväärset edenemist probleemi lahendamises ja kohandumisvõimes. François Chollet, ARC-AGI testi looja ja Google AI teadlane, nimetas seda "tõeliseks läbimurdeks," mis kajastab AI kasvavat võimet täita inimesele sarnaseid ülesandeid. Siiski märkis Chollet, et see ei tähenda, et o3 oleks jõudnud tehisintellekti üldintellekti (AGI) tasemele, kuna tal on endiselt raskusi lihtsamate ülesannete lahendamisel. Ta pakkus, et arhitektuurilised uuendused, võib-olla sarnased Monte Carlo puuotsinguga, võisid o3 sooritusele kaasa aidata. Kuigi o3 on oluline samm edasi, ei ole see veel jõudnud universaalse inimmõistuse tasemele ja tulevased ARC-AGI iteratsioonid võivad AI mudelitele uute väljakutsetega esineda.

OpenAI uusim suur keelemudel, tuntud kui "o3, " pole veel laialdaselt kättesaadav, kuid esialgsed testid viitavad selle võimetele. Mudelit tutvustati lühidalt reklaamvideos, andmata palju üksikasju selle funktsioonide kohta. Märkimisväärselt testiti o3 „Abstraction and Reasoning Corpus for Artificial General Intelligence” (ARC-AGI) abil, mis on loodud mudeli võime mõõtmiseks kohaneda uute olukordadega. Selles testis saavutas o3 76% täpsuse, ületades Mechanical Turki töötajate inimtulemused, tähistades seda kui mõne arvates läbimurret AI suutlikkuses uusi ülesandeid lahendada. ARC-AGI loojaks on François Chollet, kes toob esile o3 skoori kui märkimisväärset arenguhüpet AI võimekuses, viidates sellele, et o3 võiks varsti inimeste tööga konkureerida. Kuigi Chollet on varem olnud skeptiline tehisintellekti inimtasemele jõudmise suhtes, tunnistab ta seda arengut kui muutust.

ARC-AGI test hõlmab visuaalsete mõistatuste lahendamist, mis ei tugine keelele, seades sellised mudelid nagu o3 uutel viisidel proovile. Hoolimata oma edusammudest jäävad o3 meetodid suletud lähtekoodiga olemuse tõttu läbipaistmatuks. Chollet spekuleerib, et mudeli arhitektuur erineb oluliselt oma eelkäijatest, kasutades testiaja otsingu lähenemist, mis sarnaneb Google'i AlphaZero omaga. Kuid Chollet märgib, et OpenAI pole avalikustanud ARC-AGI skooride saavutamise ressursikulu, mis võib mõjutada tajutavat tõhusust. Küsimused o3 üldisest kohanemisvõimest püsivad, kuna mudelit on spetsiaalselt koolitatud ARC-AGI testi jaoks. Chollet rõhutab, et kuigi o3 tõotab palju, ebaõnnestub see mõnel lihtsal ülesandel, viidates sellele, et see ei ole veel AGI (üldine tehisintellekt) tasemel. Ta plaanib välja anda uuendatud versiooni ARC-AGI-st, et veelgi proovile panna selliseid mudeleid nagu o3, viidates sellele, et tõeline AGI on praegu veel kättesaamatu.


Watch video about

OpenAI O3 mudel saavutab tehisintellekti testimisel verstaposti.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 14, 2025, 1:26 p.m.

Anthropic avastas tehisintellekti juhitava häkkim…

Anthropic, juhtiv tehisintellekti ettevõte, on avalikustanud murrangulise ja murettekitava arengusuuna küberturvalisuses: esimese dokumenteeritud juhtumi, kus tehisintellekt iseseisvalt juhib häkkimiskampaaniat.

Nov. 14, 2025, 1:25 p.m.

AI-ga loodud Sora videod ICE läbipääsude kohta on…

„Vaata sammast, härra, liigu edasi,” ütleb ICE-tähise ja “POICE” märgistusega märkega politseinikke kandev ohvitser Mehhikost pärit näootsaga mehele, kes on riietunud Walmarti töötaja vesti.

Nov. 14, 2025, 1:18 p.m.

Kevin Reilly nimetati tehisintellekti nõustamisfi…

Kevin Reilly, kogenud Hollywoodi juht, keda tuntakse tema olulise rolli tõttu tuntuimate telesarjade nagu "Sopranod", "The Office" ja "Glee" toimumisel, on võtnud vastu uue väljakutse ja astunud Kartel, Beverly Hillsis baseeruva tehisintellekti loovnõustamise ettevõtte, tegevjuhi rolli.

Nov. 14, 2025, 1:14 p.m.

Google seisab Euroopa Liidu konkurentsivõistluse …

Euroopa Liit on algatanud suure antitrust-uurimise Google’i rämpsposti poliitika kohta pärast muresid mitmetelt uudisteväljaannete poolt kogu Euroopas.

Nov. 14, 2025, 1:12 p.m.

Dealism käivitab esimese Vibe Sellingil põhineva …

SINGAPURA, 13.

Nov. 14, 2025, 9:31 a.m.

Tehisintellekti juhitud SEO: Järgmisel tasandil d…

Tehisintellekt (AI) muutub kiiresti digitaalmarkkinimises transformatiivseks jõuks, eriti otsingumootorite optimeerimises (SEO).

Nov. 14, 2025, 9:22 a.m.

Tehisintellekt on liitlane, mitte vaenlane

Shelley E. Kohan tervitab Leigh Sevinit, Endeari kaasasutajat, kes pakub kaasaegset CRM-lahendust omnikanalilisele jaemüügibrändile.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today