Ako tražite novi razlog za nelagodu u vezi s umjetnom inteligencijom, razmislite o ovome: neki od najbriljantnijih umova na svijetu imaju poteškoća u stvaranju testova koje A. I. sustavi ne mogu položiti. Godinama su se A. I. sustavi ocjenjivali korištenjem raznih standardiziranih referentnih testova. Mnogi od ovih testova sadržavali su izazovna pitanja na razini SAT-a iz predmeta kao što su matematika, znanost i logika. Praćenje rezultata ovih modela tijekom vremena davalo je grubu naznaku o napretku u A. I. Međutim, A. I. sustavi su na kraju postali izvrsni u tim procjenama, što je potaknulo razvoj težih testova—često s pitanjima s kojima se diplomci mogu suočiti na svojim ispitima. Na žalost, ni ti testovi ne daju dobre rezultate. Novi modeli iz tvrtki poput OpenAI, Googlea i Anthropic postizali su visoke rezultate na mnogim izazovima na razini doktorata, umanjujući učinkovitost testova i postavljajući zabrinjavajuće pitanje: postaju li A. I. sustavi preinteligentni za našu procjenu? Ovaj tjedan, istraživači iz Centra za sigurnost A. I.
i Scale AI planiraju ponuditi potencijalni odgovor: novu procjenu nazvanu "Posljednji ispit čovječanstva, " za koju tvrde da je najteži test ikada postavljen A. I. sustavima. Posljednji ispit čovječanstva osmislio je Dan Hendrycks, istaknuti istraživač sigurnosti A. I. i direktor Centra za sigurnost A. I. (Izvorni naziv testa, "Posljednji otpor čovječanstva, " napušten je zbog prevelike teatralnosti. ) Hvala vam na razumijevanju dok potvrđujemo pristup. Ako ste u načinu čitanja, molimo vas da izađete i prijavite se na svoj Times račun, ili se pretplatite za potpuni pristup The Timesu. Hvala vam na razumijevanju tijekom procesa verifikacije. Već ste pretplatnik?Prijavite se. Želite potpuni pristup The Timesu?Pretplatite se.
Humanitina Posljednja Ispitivanja: Nova Izazov za Napredne AI Sustave
Analiza Salesforcea o razdoblju kupovine tijekom Cyber Weeka 2025.
Brzi razvoj umjetne inteligencije (UI) izazvao je značajne rasprave i zabrinutost među stručnjacima, osobito u pogledu njenog dugoročnog utjecaja na čovječanstvo.
Ovo je sponzorirani sadržaj; Barchart ne podržava ni web stranice ni proizvode spomenute u nastavku.
Google DeepMind nedavno je predstavio inovativni sustav umjetne inteligencije nazvan AlphaCode, što predstavlja veliki iskorak u području umjetne inteligencije i razvoja softvera.
Pažljivo promatram pojavu agentnog SEO-a, uvjeren da će agenti značajno utjecati na industriju kako se sposobnosti budu razvijale u idućih nekoliko godina.
Peter Lington, potpredsjednik za područje u Odjelu za rat Salesforcea, ističe transformacijski učinak koji će napredne tehnologije imati na Odjel za rat u sljedeće tri do pet godina.
Sprout Social čvrsto se etablirao kao vodeći igrač u području upravljanja društvenim mrežama usvajanjem napredne AI tehnologije i sklapanjem strateških partnerstava koja potiču inovacije i unapređuju ponudu usluga.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today