News
>
Menneskehetens Siste Eksamen: En Ny Utfordring for Avanserte AI-Systemer

Jan. 26, 2025, 8:30 a.m.

2072

Menneskehetens Siste Eksamen: En Ny Utfordring for Avanserte AI-Systemer

Brief news summary

Etter hvert som kunstig intelligens (A.I.) evner reiser bekymringer, står eksperter overfor utfordringen med å lage tester som A.I. ikke lett kan bestå. Historisk sett har fremskritt innen A.I. blitt målt gjennom standardiserte vurderinger lik S.A.T., som vurderer ferdigheter i matematikk, naturvitenskap og logikk. Men etter hvert som A.I.-modeller har blitt bedre, har de utmerket seg på disse testene, noe som har ført til utviklingen av mer krevende vurderinger som minner om eksamener på høyere nivå. Nylige modeller fra selskaper som OpenAI, Google og Anthropic har prestert eksepsjonelt godt på disse avanserte testene, noe som fremhever utilstrekkeligheten av nåværende vurderingsmetoder. I lys av dette problemet, lanserer forskere fra Center for AI Safety og Scale AI "Humanity's Last Exam," beskrevet som den mest utfordrende testen for A.I.-systemer så langt. Dette initiativet, ledet av A.I.-sikkerhetsekspert Dan Hendrycks, søker å ta opp det presserende spørsmålet: Er A.I.-systemer nå for intelligente til at vi kan vurdere dem nøyaktig?

Hvis du leter etter en ny grunn til å føle deg urolig over kunstig intelligens, kan du vurdere dette: noen av de mest lysende hodene i verden har vanskeligheter med å lage tester som A. I. -systemer ikke kan bestå. I flere år har A. I. -systemer blitt evaluert ved hjelp av en rekke standardiserte benchmarktester. Mange av disse testene inneholdt utfordrende spørsmål på SAT-nivå innen fag som matematikk, naturvitenskap og logikk. Å spore resultatene til disse modellene over tid ga en grov indikasjon på fremskritt innen A. I. Imidlertid utmerket A. I. -systemene seg til slutt i disse vurderingene, noe som førte til utviklingen av mer krevende tester – ofte med spørsmål som doktorgradsstudenter kan møte på sine eksamener. Dessverre presterer ikke disse testene godt heller. Nye modeller fra selskaper som OpenAI, Google og Anthropic har oppnådd høye poengsummer på mange doktorgradsutfordringer, noe som reduserer testenes effektivitet og reiser et bekymringsfullt spørsmål: blir A. I. -systemer for intelligente til at vi kan evaluere dem? Denne uken er forskere ved Center for AI Safety og Scale AI klare til å gi et potensielt svar: en ny evaluering kalt "Menneskehetens siste eksamen, " som de hevder er den mest utfordrende testen som noensinne er gitt til A. I. -systemer. Menneskehetens siste eksamen ble konseptualisert av Dan Hendrycks, en bemerkelsesverdig A. I. -sikkerhetsforsker og direktør for Center for AI Safety.

(Testens opprinnelige tittel, "Menneskehetens siste stand", ble forkastet fordi den var for teatralsk. ) Takk for forståelsen mens vi bekrefter tilgang. Hvis du er i lesemodus, vennligst avslutt og logg inn på Times-kontoen din, eller abonner for full tilgang til The Times. Takk for din forståelse under bekreftelsesprosessen. Allerede abonnent?Logg inn. Vil du ha full tilgang til The Times?Abonner.

News source

Watch video about

Menneskehetens Siste Eksamen: En Ny Utfordring for Avanserte AI-Systemer

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Menneskehetens Siste Eksamen: En Ny Utfordring for Avanserte AI-Systemer

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Hvordan kunstig intelligens revolusjonerer personlig videemarkedsføring

1mind raising 30 millioner dollar i Series A for AI-drevet salgsagent Mindy som transformerer innkommende salg

AI vs. menneskelig ytelse i sosiale medier-markedsføring: omfattende gjennomgang avdekker viktige engasjementshull

The Best for your Business

Hot news

AI i videomarkedsføring: Skreddersy innhold for m…

Grunnleggeren av 6sense, Amanda Kahlow, samler in…

AI-generert innhold i markedsføring på sosiale me…

AI-drevet SEO: Fremtiden innen digital markedsfør…

Jeff Bezos vil lede en ny AI-startup med fokus på…

Anthropic kom med en enorm kunngjøring som kan om…

Kan BigBear.ai bli neste Palantir Technologies?

AI Company

Sales

Marketing

Menneskehetens Siste Eksamen: En Ny Utfordring for Avanserte AI-Systemer

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Hvordan kunstig intelligens revolusjonerer personlig videemarkedsføring

1mind raising 30 millioner dollar i Series A for AI-drevet salgsagent Mindy som transformerer innkommende salg

AI vs. menneskelig ytelse i sosiale medier-markedsføring: omfattende gjennomgang avdekker viktige engasjementshull

The Best for your Business

Hot news

AI i videomarkedsføring: Skreddersy innhold for m…

Grunnleggeren av 6sense, Amanda Kahlow, samler in…

AI-generert innhold i markedsføring på sosiale me…

AI-drevet SEO: Fremtiden innen digital markedsfør…

Jeff Bezos vil lede en ny AI-startup med fokus på…

Anthropic kom med en enorm kunngjøring som kan om…

Kan BigBear.ai bli neste Palantir Technologies?

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?