lang icon En
Jan. 26, 2025, 8:30 a.m.
2367

L'Últim Examen de la Humanitat: Un Nou Repte per als Sistemes d'IA Avançada

Brief news summary

A mesura que les capacitats de la intel·ligència artificial (IA) susciten preocupacions, els experts s’enfronten al repte de crear proves que la IA no pugui superar fàcilment. Històricament, els avenços en IA es mesuraven mitjançant avaluacions estandarditzades similars al S.A.T., que avaluaven habilitats en matemàtiques, ciència i lògica. No obstant això, a mesura que els models de IA han millorat, han excel·lit en aquestes proves, cosa que ha portat al desenvolupament d’assignatures més difícils, semblants a els exàmens de nivell de postgrau. Models recents d’empreses com OpenAI, Google i Anthropic han obtingut resultats excepcionals en aquestes proves avançades, destacant així la inadequació dels mètodes d’avaluació actuals. A la llum d’aquest problema, investigadors del Center for AI Safety i Scale AI estan llançant "L’últim examen de la humanitat", descrit com la prova més desafiadora per als sistemes d’IA fins ara. Aquesta iniciativa, liderada per l’expert en seguretat de la IA Dan Hendrycks, busca abordar la pregunta urgent: Els sistemes d’IA són ara massa intel·ligents perquè puguem avaluar-los amb precisió?

Si esteu cercant una nova raó per sentir-vos incòmodes amb la intel·ligència artificial, considereu això: algunes de les ments més brillants del món tenen dificultats per crear proves que els sistemes d'IA no puguin superar. Durant anys, els sistemes d'IA han estat avaluats mitjançant una varietat de proves estàndard. Moltes d’aquestes proves presentaven preguntes difícils, al nivell del SAT, en matèries com matemàtiques, ciència i lògica. Seguiment dels resultats d’aquests models al llarg del temps proporcionava una indicació aproximada dels avenços en IA. Tanmateix, els sistemes d'IA eventualment van excel·lir en aquestes avaluacions, cosa que va provocar el desenvolupament de proves més difícils, que sovint presentaven preguntes que els estudiants de postgrau podrien enfrontar en els seus exàmens. Malauradament, aquestes proves tampoc no estan tenint un bon rendiment. Nous models de companyies com OpenAI, Google i Anthropic han obtingut puntuacions altes en molts desafiaments a nivell de doctorat, disminuint l'efectivitat de les proves i plantejant una preocupant pregunta: els sistemes d'IA s'estan tornant massa intel·ligents perquè puguem avaluar-los? Aquesta setmana, investigadors del Centre per a la Seguretat de la IA i Scale AI han d'oferir una possible resposta: una nova avaluació anomenada “L'últim examen de la humanitat”, que asseguren que és la prova més difícil que s'ha donat mai als sistemes d'IA. L'últim examen de la humanitat va ser concebut per Dan Hendrycks, un notable investigador en seguretat de la IA i el director del Centre per a la Seguretat de la IA.

(El títol inicial de la prova, “L'últim bastió de la humanitat”, es va abandonar per ser massa teatral. ) Gràcies per la vostra comprensió mentre confirmem l'accés. Si esteu en mode lector, si us plau, sortiu i inicieu sessió al vostre compte de Times, o subscriviu-vos per accedir completament a The Times. Gràcies per la vostra comprensió durant el procés de verificació. Ja sou subscriptor?Inicieu sessió. Voleu accés complet a The Times?Subscriviu-vos.


Watch video about

L'Últim Examen de la Humanitat: Un Nou Repte per als Sistemes d'IA Avançada

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 1:22 p.m.

AIMM: Objectiu de detecció basat en IA per a la m…

AIMM: Un marc innovador basat en Intel·ligència Artificial per detectar la manipulació del mercat borsari influïda per les xarxes socials En l’actual entorn de negociação de valors, en constant canvi, les xarxes socials s’han consolidat com una força clau que modela la dinàmica del mercat

Dec. 22, 2025, 1:16 p.m.

Exclusiu: Filevine adquereix Pincites, la company…

L’empresa de tecnologia jurídica Filevine ha adquirit Pincites, una companyia de redacció de contractes basada en Intel·ligència Artificial, millorant la seva presència en dret corporatiu i transaccional i avançant en la seva estratègia centrada en IA.

Dec. 22, 2025, 1:16 p.m.

L’impact de la IA en SEO: Transformant les pràcti…

La intel·ligència artificial (IA) està remodelant ràpidament el camp de l'optimització per a motors de cerca (SEO), oferint als professionals del màrqueting digital eines innovadores i noves oportunitats per millorar les seves estratègies i aconseguir resultats superiors.

Dec. 22, 2025, 1:15 p.m.

Avançaments en la detecció de Deepfake mitjançant…

Els avenços en la intel·ligència artificial han jugat un paper crucial en la lluita contra la desinformació, ja que permeten la creació d'algoritmes sofisticats dissenyats per detectar deepfakes—vídeos manipulats on el contingut original es modifica o substitueix per produir representacions falses pensades per enganyar els espectadors i difondre informació enganyosa.

Dec. 22, 2025, 1:14 p.m.

Els 5 millors sistemes de vendes amb IA que conve…

L’augment de la intel·ligència artificial ha transformat les vendes reemplaçant els circuits llarguíssims i el seguiment manual per sistemes automatitzats i ràpids que operen les 24 hores del dia, els 7 dies de la setmana.

Dec. 22, 2025, 1:12 p.m.

Últimes notícies de IA i Màrqueting: Resum setman…

En l´àmbit que evoluciona ràpidament de la intel·ligència artificial (IA) i el màrqueting, els últims desenvolupaments significatius estan configurant la indústria, introduint tant noves oportunitats com desafiaments.

Dec. 22, 2025, 9:22 a.m.

Segons un informe, OpenAI observa marges més comp…

La publicació afirmava que l’empresa ha millorat el seu «marge de càlcul», una mètrica interna que representa la porció de ingressos que queda després de cobrir els costos dels models operatius per als usuaris que paguen dels seus productes corporatius i de consum.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today