lang icon En
Jan. 26, 2025, 8:30 a.m.
2410

Menneskehedens Sidste Eksamen: En Ny Udfordring for Avancerede AI-Systemer

Brief news summary

Efterhånden som kapaciteterne inden for kunstig intelligens (A.I.) rejser bekymringer, står eksperter over for udfordringen med at skabe tests, som A.I. ikke nemt kan bestå. Historisk set blev fremskridt inden for A.I. målt gennem standardiserede vurderinger svarende til S.A.T., der vurderede færdigheder inden for matematik, videnskab og logik. Men efterhånden som A.I.-modellerne er blevet bedre, har de klaret sig fremragende på disse tests, hvilket har ført til udviklingen af mere vanskelige vurderinger, der minder om eksamener på kandidatniveau. Nye modeller fra virksomheder som OpenAI, Google og Anthropic har præsteret exceptionelt godt på disse avancerede tests, hvilket fremhæver utilstrækkeligheden af de nuværende evalueringsmetoder. I lyset af dette problem lancerer forskere fra Center for AI Safety og Scale AI "Humanity's Last Exam," der beskrives som den mest udfordrende test for A.I. systemer til dato. Denne initiativ, ledet af A.I. sikkerhedsekspert Dan Hendrycks, søger at tackle det presserende spørgsmål: Er A.I. systemer nu for intelligente til, at vi kan vurdere dem korrekt?

Hvis du leder efter en ny grund til at føle dig urolig over kunstig intelligens, så overvej dette: nogle af verdens lyseste sind har svært ved at skabe tests, som A. I. -systemer ikke kan bestå. I årevis er A. I. -systemer blevet vurderet ved hjælp af en række standardiserede benchmark-tests. Mange af disse tests har indeholdt udfordrende spørgsmål på SAT-niveau inden for emner som matematik, naturvidenskab og logik. At følge med i disse modelleres resultater over tid har givet en grov indikation af fremskrittene inden for A. I. Imidlertid har A. I. -systemer til sidst udmærket sig i disse vurderinger, hvilket har ført til udviklingen af sværere tests – ofte med spørgsmål, som kandidatstuderende kunne møde i deres eksamener. Desværre klarer disse tests sig heller ikke godt. Nye modeller fra virksomheder som OpenAI, Google og Anthropic har opnået høje scorer på mange Ph. D. -niveau udfordringer, hvilket mindsker testenes effektivitet og rejser et bekymrende spørgsmål: bliver A. I. -systemer for intelligente til, at vi kan vurdere dem? Denne uge er forskere fra Center for AI Safety og Scale AI klar til at tilbyde et potentielt svar: en ny evaluering kaldet “Humanity’s Last Exam, ” som de hævder er den mest udfordrende test, der nogensinde er givet til A. I. -systemer. Humanity’s Last Exam blev udtænkt af Dan Hendrycks, en anerkendt A. I. -sikkerhedsforsker og direktør for Center for AI Safety.

(Testens oprindelige titel, “Humanity’s Last Stand, ” blev opgivet, da den var for dramatisk. ) Tak for din forståelse, mens vi bekræfter adgangen. Hvis du er i læsetilstand, skal du forlade den og logge ind på din Times-konto, eller abonnere for at få fuld adgang til The Times. Tak for din forståelse under verifikationsprocessen. Er du allerede abonnent?Log ind. Vil du have fuld adgang til The Times?Tilmeld dig.


Watch video about

Menneskehedens Sidste Eksamen: En Ny Udfordring for Avancerede AI-Systemer

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 29, 2025, 1:34 p.m.

AI-videointelligens ændrer marketingstrategier

I dagens hastigt forandrende digitale marketingmiljø bliver kunstig intelligens (AI) stadig vigtigere, især gennem AI-videoanalyse.

Dec. 29, 2025, 1:21 p.m.

OpenAI og NVIDIA annoncerer partnerskab for at ud…

OpenAI og NVIDIA har annonceret et større partnerskab med fokus på at accelerere udviklingen og implementeringen af avancerede kunstig intelligens (AI) modeller og infrastruktur.

Dec. 29, 2025, 1:17 p.m.

At sænke tempoet bliver markedsførernes hemmelige…

Reklamebranchen tog enorme skridt fremad i 2025 med hurtig automationsudbredelse: LiveRamp lancerede agentisk orkestrering den 1.

Dec. 29, 2025, 1:15 p.m.

Stagwell lancerer NewVoices.ai for at revolutione…

Da Jeff Bezos forudsagde, at en banebrydende teknologi ville definere Amazons fremtid, blev endda topanalytikere på Wall Street overraskede.

Dec. 29, 2025, 1:13 p.m.

AI-forbedret SEO: Forbedring af søgeplaceringer o…

Kunstig intelligens (AI) er ved at transformere søgemaskineoptimering (SEO), hvilket giver virksomheder nye muligheder for at øge deres online synlighed og forbedre placeringer i søgeresultaterne.

Dec. 29, 2025, 9:33 a.m.

5 AI-reklame-sager, der skabte opsigt i år, fra M…

I 2025 blev chief marketing officers hos mange førende globale mærker enige om at gøre kunstig intelligens (AI) til en central del af deres strategier, men denne entusiasme førte sommetider til risikable resultater.

Dec. 29, 2025, 9:31 a.m.

AI RevOps er ved at omforme hele din omsætningsor…

Omsætningsteams har kæmpet i årevis på tværs af alle brancher og organisationsstørrelser, ofte med følelsen af konstant at forsøge at stopppe en utæt trakt uden varig succes.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today