lang icon En
Jan. 26, 2025, 8:30 a.m.
2353

Provimi I Fundit të Njeriut: Një Sfidë e Re për Sistemet e Avancuara të AI-së

Brief news summary

Si aftësitë e inteligjencës artificiale (I.A.) po rrisin shqetësime, ekspertët përballen me sfidën e krijimit të testeve që I.A. nuk mund t'i kalojë lehtësisht. Historikisht, avancimet në I.A. janë matur përmes vlerësimeve të standardizuara, të ngjashme me S.A.T., që vlerësojnë aftësitë në matematikë, shkencë dhe logjikë. Megjithatë, ndërsa modelet e I.A. janë përmirësuar, ato kanë shkëlqyer në këto teste, duke çuar në zhvillimin e vlerësimeve më të vështira që ngjajnë me provimet në nivelin e diplomës. Modelet e fundit nga kompani si OpenAI, Google dhe Anthropic kanë performuar jashtëzakonisht mirë në këto teste të avancuara, duke theksuar papërshtatshmërinë e metodave aktuale të vlerësimit. Në dritën e këtij problemi, studiuesit nga Qendra për Sigurinë e I.A. dhe Scale AI po lansojnë "Provimin e Fundit të Humanitetit," i përshkruar si testi më sfidues për sistemet I.A. deri tani. Kjo iniciativë, e udhëhequr nga ekspertin e sigurisë së I.A., Dan Hendrycks, synon të trajtojë pyetjen urgjente: A janë sistemet I.A. tani shumë inteligjente që ne të vlerësojmë saktësisht?

Nëse po kërkoni një arsye të re për t'u ndjerë shqetësuar në lidhje me inteligjencën artificiale, merrni parasysh këtë: disa nga mendjet më të ndritura në botë po hasin vështirësi në krijimin e testeve që sistemet e A. I. nuk mund t'i kalojnë. Për vite me radhë, sistemet A. I. janë vlerësuar duke përdorur një larmi testesh standardizuese. Shumica e këtyre testeve kanë përfshirë pyetje të vështira në nivelin e SAT në lëndë si matematika, shkenca dhe logjika. Ndjekja e pikëve të këtyre modeleve gjatë kohës ka dhënë një tregues të përafërt të përparimeve në A. I. Megjithatë, sistemet A. I. përfundimisht u përmirësuan në këto vlerësime, duke nxitur zhvillimin e testeve më të vështira— shpesh me pyetje që studentët e diplomuar mund të përballen në provimet e tyre. Fatkeqësisht, ato teste nuk po performojnë mirë as. Modelet e reja nga kompani si OpenAI, Google dhe Anthropic kanë arritur pikë të larta në shumë sfida në nivelin e doktoraturës, duke ulur efektivitetin e testeve dhe duke ngritur një pyetje shqetësuese: a po bëhen sistemet A. I.

shumë inteligjente për t'u vlerësuar nga ne? Këtë javë, kërkuesit në Qendrën për Sigurinë e A. I. dhe Scale AI janë të vendosur të ofrojnë një përgjigje të mundshme: një vlerësim të ri të quajtur “Provimi i Fundit të Njerëzimit, ” të cilin ata e pretendojnë si testin më të vështirë ndonjëherë dhënë sistemeve A. I. Provimi i Fundit të Njerëzimit u konceptua nga Dan Hendrycks, një kërkues i njohur për sigurinë e A. I. dhe drejtori i Qendrës për Sigurinë e A. I. (Titulli fillestar i testit, “Qëndrimi Fundor i Njerëzimit, ” u braktis për shkak se ishte tepër dramatik. ) Faleminderit për mirëkuptimin tuaj ndërsa konfirmojmë aksesin. Nëse jeni në mënyrën e Lexuesit, ju lutemi dilni dhe logohuni në llogarinë tuaj të Times, ose abonohuni për një qasje të plotë në The Times. Faleminderit për mirëkuptimin tuaj gjatë procesit të verifikimit. A jeni tashmë një abonent?Logohuni. Doni akses të plotë në The Times?Abonohuni.


Watch video about

Provimi I Fundit të Njeriut: Një Sfidë e Re për Sistemet e Avancuara të AI-së

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 20, 2025, 1:24 p.m.

5 Atributet Kulturore Që Mund Të Bëjnë Apo Të Dën…

Përmbledhje dhe Rishëmtim i “The Gist” mbi Transformimin e Inteligjencës Artificiale dhe Kulturën Organizoale Transformimi me anë të Inteligjencës Artificiale përballet kryesisht me një sfidë kulturore sesa vetëm një sfidë teknologjike

Dec. 20, 2025, 1:22 p.m.

Ageni i Shitjes me Inteligjencë Artificiale: Top …

Qëllimi kryesor i bizneseve është zgjerimi i shitjeve, por konkurrenca e fortë mund ta pengojë këtë qëllim.

Dec. 20, 2025, 1:19 p.m.

AI dhe SEO: Një përshtatje e përkryer për përmirë…

Inkorporimi i inteligjencës artificiale (IA) në strategjitë e optimizimit të motorëve të kërkimit (SEO) po e transformon themeloressh mënyrën se si bizneset përmirësojnë dukshmërinë e tyre online dhe tërheqin trafikun organik.

Dec. 20, 2025, 1:15 p.m.

Hapat përpara të Teknologjisë Deepfake: Ndikimet …

Teknologjia e deepfake ka bërë përparime të rëndësishme kohët e fundit, duke prodhuar video të manipuluara shumë realiste që portretizojnë bindshëm individë duke bërë ose duke thënë gjëra që ata kurrë nuk i kanë bërë në realitet.

Dec. 20, 2025, 1:13 p.m.

Mbështetja e Nvidia për AI-në me burime të hapura…

Nvidia ka njoftuar një zgjerim të konsiderueshëm të iniciativave të saj burimore të hapura, duke treguar një angazhim strategjik për mbështetjen dhe avancimin e ekosistemit të burimit të hapur në llogaritjet me performancë të lartë (HPC) dhe inteligjencën artificiale (AI).

Dec. 20, 2025, 9:38 a.m.

Guvernatorja e Nju Jorkut, Kathy Hochul, nënshkru…

Më 19 dhjetor 2025, Guvernatorja e Nju Jorkut, Kathy Hochul, nënshkroiLigjin për Sigurinë dhe Etikën e Inteligjencës Artificiale të Përgjegjshme (RAISE), duke shënuar një etapë të rëndësishme në rregullimin e teknologjive të avancuara të AI-së në shtet.

Dec. 20, 2025, 9:36 a.m.

Stripe lançon Suite-n e Tregtisë Jetike për Shitj…

Stripe, kompania e shërbimeve financiare të programueshme, ka prezantuar Agentic Commerce Suite, një zgjidhje e re që synon të mundësojë bizneseve të shesin përmes shumë agjentëve të fuqizuar nga AI.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today