lang icon En
Jan. 26, 2025, 8:30 a.m.
2357

Posljednji ispit čovječanstva: Novi izazov za napredne AI sisteme

Brief news summary

Dok sposobnosti umjetne inteligencije (A.I.) izazivaju zabrinutost, stručnjaci se suočavaju sa izazovom stvaranja testova koje A.I. ne može lako položiti. Historijski gledano, napredak u A.I. mjeri se kroz standardizirane procjene slične S.A.T.-u, koje ocjenjuju vještine u matematici, nauci i logici. Međutim, kako su modeli A.I. napredovali, izvanredno su se snalazili na ovim testovima, što je dovelo do razvoja težih ocjena koje podsjete na ispite na postdiplomskom nivou. Nedavni modeli kompanija kao što su OpenAI, Google i Anthropic izvanredno su se ponašali na ovim naprednim testovima, naglašavajući nedostatnost trenutnih metoda evaluacije. U svjetlu ovog pitanja, istraživači iz Centra za sigurnost A.I. i Scale AI pokreću "Posljednji ispit čHumanosti," opisan kao najizazovniji test za A.I. sisteme do sada. Ova inicijativa, koju predvodi stručnjak za sigurnost A.I. Dan Hendrycks, ima za cilj odgovoriti na hitno pitanje: Da li su A.I. sistemi sada previše inteligentni da bismo ih tačno ocijenili?

Ako tražite novi razlog za osjećaj nelagode zbog umjetne inteligencije, razmislite o ovome: neki od najsvjetlijih umova na svijetu imaju poteškoća u kreiranju testova koje A. I. sistemi ne mogu proći. Godinama su A. I. sistemi ocjenjivani koristeći razne standardizovane testove. Mnogi od tih testova sadržavali su izazovna pitanja na nivou SAT-a iz predmeta poput matematike, nauke i logike. Praćenje rezultata ovih modela tokom vremena pružalo je grubu naznaku napredovanja u A. I. Međutim, A. I. sistemi su na kraju postali odlični na ovim procjenama, što je podstaklo razvoj težih testova—često sa pitanjima koja bi studenti na postdiplomskom nivou mogli da naiđu na svojim ispitima. Nažalost, ti testovi takođe ne postižu dobre rezultate. Novi modeli iz kompanija kao što su OpenAI, Google i Anthropic postižu visoke rezultate na mnogim izazovima na nivou doktorskih studija, što umanjuje efikasnost testova i otvara zabrinjavajuće pitanje: postaju li A. I. sistemi previše inteligentni da bismo ih mogli ocenjivati? Ove sedmice, istraživači iz Centra za sigurnost A. I.

i Scale AI planiraju ponuditi mogući odgovor: novu evaluaciju pod nazivom “Posljednji ispit čhumanosti, ” za koju tvrde da je najizazovniji test ikada dat A. I. sistemima. Posljednji ispit čhumanosti osmislio je Dan Hendrycks, poznati istraživač sigurnosti A. I. i direktor Centra za sigurnost A. I. (Prvobitni naziv testa, “Posljednji otpor čhumanosti, ” odbačen je zbog prekomjerne teatralnosti. ) Hvala vam na razumijevanju dok potvrđujemo pristup. Ako ste u režimu čitanja, molimo vas da napustite i prijavite se na svoj Times račun, ili se pretplatite za potpuni pristup The Times-u. Hvala vam na razumijevanju tokom procesa verifikacije. Već ste pretplaćeni?Prijavite se. Želite potpuni pristup The Times-u?Pretplatite se.


Watch video about

Posljednji ispit čovječanstva: Novi izazov za napredne AI sisteme

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 5:27 a.m.

Nezavisne kompanije: Jesu li vaše online prodaje …

Željeli bismo saznati više o tome kako su nedavne promjene u ponašanju pronalaska na internetu, izazvane porastom umjetne inteligencije, utjecale na vaše poslovanje.

Dec. 21, 2025, 5:23 a.m.

Google govori šta reći klijentima koji žele SEO z…

Googleov Danny Sullivan pružio je smjernice SEO stručnjacima koji rade s klijentima željnima informacija o strategijama SEO-a za umjetnu inteligenciju.

Dec. 21, 2025, 5:22 a.m.

Usred procvata umjetne inteligencije, zalihe odre…

Usred brzog napretka tehnologije umjetne inteligencije, globalni lanac snabdijevanja za kritične komponente suočava se sa sve većim pritiskom, posebno u isporuci AI čip modula koji su ključni za napajanje naprednih AI aplikacija.

Dec. 21, 2025, 5:19 a.m.

Salesforce se slaže da će preuzeti Qualified za a…

iHeartMedia se udružio s Viantom kako bi predstavio programatsko oglašavanje na svojim platformama za streaming audio, radio emitiranje i podcast ponudu.

Dec. 21, 2025, 5:18 a.m.

Nvidijina otvorena inicijativa za AI: Akvizicija …

Nvidia je nedavno najavila veliko širenje svojih inicijativa otvorenog koda, što predstavlja značajnu prekretnicu u tech industriji.

Dec. 21, 2025, 5:13 a.m.

AI-generisani videozapisi postaju sve popularniji…

Porast videa generiranih putem AI-ja duboko mijenja dijeljenje sadržaja na platformama društvenih mreža.

Dec. 20, 2025, 1:24 p.m.

5 Kulturalnih Atributa Koji Mogu Ili Osujetiti Il…

Sažetak i prepis “Bitno” o transformaciji AI i organizacijskoj kulturi Transformacija umjetne inteligencije uglavnom predstavlja kulturni izazov, a ne samo tehnološki

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today