O3 model OpenAI-ja postiže prekretnicu u testiranju vještačke inteligencije.
Brief news summary
Najnoviji jezički model OpenAI-a, "o3," postigao je značajan napredak u razvoju umjetne inteligencije ostvarivši 76% na testu "Korpus za apstrakciju i zaključivanje za općenitu umjetnu inteligenciju" (ARC-AGI), što nadmašuje prosjek ljudskih postignuća nešto iznad 75%. Ovo je povijesno dostignuće jer je ovo prvi put da je AI postigao ovaj nivo, označavajući značajan napredak u rješavanju problema i prilagodljivosti. François Chollet, tvorac ARC-AGI testa i naučnik u Google AI, ovo je nazvao "pravim probojem," što odražava rastuću sposobnost AI-a da obavlja zadatke nalik ljudskim. Ipak, Chollet je naglasio da to ne znači da je o3 dostigao opću umjetnu inteligenciju (AGI) jer se i dalje suočava s problemima kod jednostavnijih zadataka. Predložio je da su arhitektonske inovacije, moguće slične Monte Carlo pretrazi stabla, možda doprinijele performansama o3. Iako je o3 veliki korak naprijed, još uvijek nije dosegao nivo univerzalne ljudske inteligencije, a buduće verzije ARC-AGI mogu predstavljati nove izazove za AI modele.Najnoviji veliki jezički model kompanije OpenAI, poznat kao "o3, " još uvijek nije široko objavljen, ali preliminarni testovi ukazuju na njegove sposobnosti. Model je ukratko predstavljen putem promotivnog videa, s malo detalja o njegovim mogućnostima. Značajno je da je o3 testiran korištenjem "Korpusa za apstraktnu i rezonirajuću inteligenciju" (ARC-AGI), mjerila osmišljenog za ocjenjivanje sposobnosti modela da se prilagođava novim situacijama. U ovom testu, o3 je postigao tačnost od 76%, nadmašivši rezultate ljudi zabilježene od strane radnika sa Mechanical Turka, što neki smatraju probojem u sposobnosti AI-a da se nosi s novim zadacima. François Chollet, koji je razvio ARC-AGI, ističe da rezultat modela o3 pokazuje značajan iskorak u AI sposobnostima, sugerirajući da bi o3 uskoro mogao konkurisati ljudskom radu. Iako je Chollet ranije bio skeptičan prema ideji da AI može doseći ljudski nivo inteligencije, priznaje ovaj razvoj kao promjenu.
ARC-AGI test uključuje rješavanje vizualnih zagonetki koje ne oslanjaju na jezik, što modelima poput o3 predstavlja nove izazove. Uprkos uspjesima, metode modela o3 ostaju nejasne zbog njegove zatvorene prirode. Chollet spekuliše da se arhitektura modela značajno razlikuje od prethodnika, koristeći pristup pretrage u stvarnom vremenu sličan onom koji koristi Google-ov AlphaZero. Međutim, Chollet primjećuje da OpenAI nije objavio koliko je resursa utrošeno za postizanje ARC-AGI rezultata, što bi moglo utjecati na percipiranu efikasnost. Pitanja o općoj prilagodljivosti modela o3 ostaju, jer je bio specifično obučen za ARC-AGI test. Chollet naglašava da, iako o3 pokazuje obećanje, još uvijek ne uspijeva riješiti neke jednostavne zadatke, sugerirajući da još nije dosegao nivo AGI (opće umjetne inteligencije). Planira objaviti ažuriranu verziju ARC-AGI kako bi dodatno izazvao modele poput o3, što ukazuje da prava AGI još uvijek nije dostižna.
Watch video about
O3 model OpenAI-ja postiže prekretnicu u testiranju vještačke inteligencije.
Try our premium solution and start getting clients — at no cost to you