Jan. 26, 2025, 8:30 a.m.
2291

Humanitina Posljednja Ispitivanja: Nova Izazov za Napredne AI Sustave

Brief news summary

Kako mogućnosti umjetne inteligencije (A.I.) izazivaju zabrinutost, stručnjaci se suočavaju s izazovom stvaranja testova koje A.I. ne može lako položiti. Povijesno gledano, napredak u A.I. mjeri se kroz standardizirane procjene slične S.A.T.-u, koje ocjenjuju vještine u matematici, znanosti i logici. Međutim, kako su A.I. modeli napredovali, odlično su se snalazili na ovim testovima, što je dovelo do razvoja težih procjena koje podsjećaju na ispite na razini diplome. Nedavni modeli iz tvrtki kao što su OpenAI, Google i Anthropic izvrsno su prolazili na ovim naprednim testovima, ističući nedostatnost postojećih metoda procjene. U svjetlu ovog problema, istraživači iz Centra za sigurnost A.I. i Scale AI pokreću "Posljednji ispit čovječanstva", koji je opisan kao najteži test za A.I. sustave do sada. Ova inicijativa, koju predvodi stručnjak za sigurnost A.I. Dan Hendrycks, nastoji se uhvatiti u koštac s hitnim pitanjem: Jesu li A.I. sustavi sada preinteligentni da bismo ih mogli točno procijeniti?

Ako tražite novi razlog za nelagodu u vezi s umjetnom inteligencijom, razmislite o ovome: neki od najbriljantnijih umova na svijetu imaju poteškoća u stvaranju testova koje A. I. sustavi ne mogu položiti. Godinama su se A. I. sustavi ocjenjivali korištenjem raznih standardiziranih referentnih testova. Mnogi od ovih testova sadržavali su izazovna pitanja na razini SAT-a iz predmeta kao što su matematika, znanost i logika. Praćenje rezultata ovih modela tijekom vremena davalo je grubu naznaku o napretku u A. I. Međutim, A. I. sustavi su na kraju postali izvrsni u tim procjenama, što je potaknulo razvoj težih testova—često s pitanjima s kojima se diplomci mogu suočiti na svojim ispitima. Na žalost, ni ti testovi ne daju dobre rezultate. Novi modeli iz tvrtki poput OpenAI, Googlea i Anthropic postizali su visoke rezultate na mnogim izazovima na razini doktorata, umanjujući učinkovitost testova i postavljajući zabrinjavajuće pitanje: postaju li A. I. sustavi preinteligentni za našu procjenu? Ovaj tjedan, istraživači iz Centra za sigurnost A. I.

i Scale AI planiraju ponuditi potencijalni odgovor: novu procjenu nazvanu "Posljednji ispit čovječanstva, " za koju tvrde da je najteži test ikada postavljen A. I. sustavima. Posljednji ispit čovječanstva osmislio je Dan Hendrycks, istaknuti istraživač sigurnosti A. I. i direktor Centra za sigurnost A. I. (Izvorni naziv testa, "Posljednji otpor čovječanstva, " napušten je zbog prevelike teatralnosti. ) Hvala vam na razumijevanju dok potvrđujemo pristup. Ako ste u načinu čitanja, molimo vas da izađete i prijavite se na svoj Times račun, ili se pretplatite za potpuni pristup The Timesu. Hvala vam na razumijevanju tijekom procesa verifikacije. Već ste pretplatnik?Prijavite se. Želite potpuni pristup The Timesu?Pretplatite se.


Watch video about

Humanitina Posljednja Ispitivanja: Nova Izazov za Napredne AI Sustave

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 15, 2025, 1:26 p.m.

AI Pokreće rekordnu prodaju od 336,6 milijardi do…

Analiza Salesforcea o razdoblju kupovine tijekom Cyber Weeka 2025.

Dec. 15, 2025, 1:24 p.m.

Rizici izumiranja umjetne inteligencije: Musk i A…

Brzi razvoj umjetne inteligencije (UI) izazvao je značajne rasprave i zabrinutost među stručnjacima, osobito u pogledu njenog dugoročnog utjecaja na čovječanstvo.

Dec. 15, 2025, 1:21 p.m.

Uđite prije Wall Streeta: Ova dionica AI marketin…

Ovo je sponzorirani sadržaj; Barchart ne podržava ni web stranice ni proizvode spomenute u nastavku.

Dec. 15, 2025, 1:16 p.m.

AlphaCode od Google DeepMind: AI natječe u progra…

Google DeepMind nedavno je predstavio inovativni sustav umjetne inteligencije nazvan AlphaCode, što predstavlja veliki iskorak u području umjetne inteligencije i razvoja softvera.

Dec. 15, 2025, 1:15 p.m.

Dobro poznati SEO objašnjava zašto će AI agenti d…

Pažljivo promatram pojavu agentnog SEO-a, uvjeren da će agenti značajno utjecati na industriju kako se sposobnosti budu razvijale u idućih nekoliko godina.

Dec. 15, 2025, 1:10 p.m.

Peter Lington iz Salesforcea o pripremi obrambeni…

Peter Lington, potpredsjednik za područje u Odjelu za rat Salesforcea, ističe transformacijski učinak koji će napredne tehnologije imati na Odjel za rat u sljedeće tri do pet godina.

Dec. 15, 2025, 9:35 a.m.

Strateška pozicija Sprout Social-a u mijenjajućem…

Sprout Social čvrsto se etablirao kao vodeći igrač u području upravljanja društvenim mrežama usvajanjem napredne AI tehnologije i sklapanjem strateških partnerstava koja potiču inovacije i unapređuju ponudu usluga.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today