News
>
Humanitina Posljednja Ispitivanja: Nova Izazov za Napredne AI Sustave

Jan. 26, 2025, 8:30 a.m.

Humanitina Posljednja Ispitivanja: Nova Izazov za Napredne AI Sustave

Brief news summary

Kako mogućnosti umjetne inteligencije (A.I.) izazivaju zabrinutost, stručnjaci se suočavaju s izazovom stvaranja testova koje A.I. ne može lako položiti. Povijesno gledano, napredak u A.I. mjeri se kroz standardizirane procjene slične S.A.T.-u, koje ocjenjuju vještine u matematici, znanosti i logici. Međutim, kako su A.I. modeli napredovali, odlično su se snalazili na ovim testovima, što je dovelo do razvoja težih procjena koje podsjećaju na ispite na razini diplome. Nedavni modeli iz tvrtki kao što su OpenAI, Google i Anthropic izvrsno su prolazili na ovim naprednim testovima, ističući nedostatnost postojećih metoda procjene. U svjetlu ovog problema, istraživači iz Centra za sigurnost A.I. i Scale AI pokreću "Posljednji ispit čovječanstva", koji je opisan kao najteži test za A.I. sustave do sada. Ova inicijativa, koju predvodi stručnjak za sigurnost A.I. Dan Hendrycks, nastoji se uhvatiti u koštac s hitnim pitanjem: Jesu li A.I. sustavi sada preinteligentni da bismo ih mogli točno procijeniti?

Ako tražite novi razlog za nelagodu u vezi s umjetnom inteligencijom, razmislite o ovome: neki od najbriljantnijih umova na svijetu imaju poteškoća u stvaranju testova koje A. I. sustavi ne mogu položiti. Godinama su se A. I. sustavi ocjenjivali korištenjem raznih standardiziranih referentnih testova. Mnogi od ovih testova sadržavali su izazovna pitanja na razini SAT-a iz predmeta kao što su matematika, znanost i logika. Praćenje rezultata ovih modela tijekom vremena davalo je grubu naznaku o napretku u A. I. Međutim, A. I. sustavi su na kraju postali izvrsni u tim procjenama, što je potaknulo razvoj težih testova—često s pitanjima s kojima se diplomci mogu suočiti na svojim ispitima. Na žalost, ni ti testovi ne daju dobre rezultate. Novi modeli iz tvrtki poput OpenAI, Googlea i Anthropic postizali su visoke rezultate na mnogim izazovima na razini doktorata, umanjujući učinkovitost testova i postavljajući zabrinjavajuće pitanje: postaju li A. I. sustavi preinteligentni za našu procjenu? Ovaj tjedan, istraživači iz Centra za sigurnost A. I.

i Scale AI planiraju ponuditi potencijalni odgovor: novu procjenu nazvanu "Posljednji ispit čovječanstva, " za koju tvrde da je najteži test ikada postavljen A. I. sustavima. Posljednji ispit čovječanstva osmislio je Dan Hendrycks, istaknuti istraživač sigurnosti A. I. i direktor Centra za sigurnost A. I. (Izvorni naziv testa, "Posljednji otpor čovječanstva, " napušten je zbog prevelike teatralnosti. ) Hvala vam na razumijevanju dok potvrđujemo pristup. Ako ste u načinu čitanja, molimo vas da izađete i prijavite se na svoj Times račun, ili se pretplatite za potpuni pristup The Timesu. Hvala vam na razumijevanju tijekom procesa verifikacije. Već ste pretplatnik?Prijavite se. Želite potpuni pristup The Timesu?Pretplatite se.

News source

Watch video about

Humanitina Posljednja Ispitivanja: Nova Izazov za Napredne AI Sustave

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Humanitina Posljednja Ispitivanja: Nova Izazov za Napredne AI Sustave

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Izvještaj o Cyber tjednu na Salesforceu 2025: prodaja od 336,6 milijardi dolara potaknuta umjetnom inteligencijom i mobilnom trgovinom

Stručnjaci upozoravaju na egzistencijalne rizike od umjetne inteligencije i pozivaju na hitnu regulaciju

Ulaganje u RAD Intel: marketinška platforma s AI-jem, s 127% godišnjim rastom i planovima za IPO na NASDAQ-u

The Best for your Business

Hot news

AI Pokreće rekordnu prodaju od 336,6 milijardi do…

Rizici izumiranja umjetne inteligencije: Musk i A…

Uđite prije Wall Streeta: Ova dionica AI marketin…

AlphaCode od Google DeepMind: AI natječe u progra…

Dobro poznati SEO objašnjava zašto će AI agenti d…

Peter Lington iz Salesforcea o pripremi obrambeni…

Strateška pozicija Sprout Social-a u mijenjajućem…

AI Company

Sales

Marketing

Humanitina Posljednja Ispitivanja: Nova Izazov za Napredne AI Sustave

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Izvještaj o Cyber tjednu na Salesforceu 2025: prodaja od 336,6 milijardi dolara potaknuta umjetnom inteligencijom i mobilnom trgovinom

Stručnjaci upozoravaju na egzistencijalne rizike od umjetne inteligencije i pozivaju na hitnu regulaciju

Ulaganje u RAD Intel: marketinška platforma s AI-jem, s 127% godišnjim rastom i planovima za IPO na NASDAQ-u

The Best for your Business

Hot news

AI Pokreće rekordnu prodaju od 336,6 milijardi do…

Rizici izumiranja umjetne inteligencije: Musk i A…

Uđite prije Wall Streeta: Ova dionica AI marketin…

AlphaCode od Google DeepMind: AI natječe u progra…

Dobro poznati SEO objašnjava zašto će AI agenti d…

Peter Lington iz Salesforcea o pripremi obrambeni…

Strateška pozicija Sprout Social-a u mijenjajućem…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?