lang icon En
Jan. 26, 2025, 8:30 a.m.
2340

Ihmiskunnan viimeinen koe: Uusi haaste kehittyneille tekoälyjärjestelmille

Brief news summary

Kun tekoälyn (A.I.) kykyihin liittyvät huolet kasvavat, asiantuntijat kohtaavat haasteen luoda testejä, jotka A.I. ei voi helposti läpäistä. Historiallisesti tekoälyn edistysaskelia mitattiin standardoitujen arviointien, kuten S.A.T.:n, avulla, jotka arvioivat taitoja matematiikassa, tieteessä ja logiikassa. Kuitenkin, kun A.I. mallit ovat kehittyneet, ne ovat menestyneet erinomaisesti näissä testeissä, mikä on johtanut vaikeampien arviointien kehittämiseen, jotka muistuttavat jatkotutkintotason kokeita. Viimeisimmät mallit yrityksiltä, kuten OpenAI, Google ja Anthropic, ovat suoriutuneet erinomaisesti näistä vaativista testeistä, mikä korostaa nykyisten arviointimenetelmien riittämättömyyttä. Tämän asian valossa, Center for AI Safety ja Scale AI -tutkijat lanseeraavat "Ihmiskunnan viimeisen kokeen", jota kuvataan tähän mennessä haastavimmaksi testiksi A.I. järjestelmille. Tämä aloite, jota johtaa tekoälyturvallisuusasiantuntija Dan Hendrycks, pyrkii käsittelemään kiireellistä kysymystä: Ovatko A.I. järjestelmät nyt liian älykkäitä, jotta voimme arvioida niitä tarkasti?

Jos etsit uutta syytä tuntea olosi epämukavaksi tekoälyn suhteen, harkitse tätä: jotkut maailman kirkkaimmista mielistä kamppailevat luodakseen testejä, joista tekoälyjärjestelmät eivät voisi läpäistä. Vuosien ajan tekoälyjärjestelmiä on arvioitu monilla erilaisilla standardoiduilla vertailutesteillä. Monet näistä testeistä sisälsivät haastavia, SAT-tason kysymyksiä kuten matematiikasta, luonnontieteistä ja logiikasta. Näiden mallien pisteiden seuraaminen ajan myötä antoi karkean arvion tekoälyn edistysaskelista. Kuitenkin, tekoälyjärjestelmät lopulta menestyivät erinomaisesti näissä arvioissa, mikä johti vaikeampien testien kehittämiseen – jotka usein sisälsivät kysymyksiä, joita jatko-opiskelijat voisivat kohdata kokeissaan. Valitettavasti nämä testit eivät myöskään toimi hyvin. Uudet mallit yrityksiltä kuten OpenAI, Google ja Anthropic ovat saavuttaneet korkeita pisteitä monilla tohtoritason haasteilla, mikä heikentää arvioiden tehokkuutta ja herättää huolestuttavan kysymyksen: ovatko tekoälyjärjestelmät tulemassa liian älykkäiksi, jotta voisimme arvioida niitä? Tällä viikolla tutkijat AI-turvallisuuden keskuksesta ja Scale AI:sta aikovat tarjota mahdollisen vastauksen: uusi arviointi nimeltä "Ihmiskunnan viimeinen koe", jonka he väittävät olevan haastavin testi, joka on koskaan annettu tekoälyjärjestelmille. Ihmiskunnan viimeinen koe on suunniteltu Dan Hendrycksin, merkittävän tekoälyturvallisuuden tutkijan ja AI-turvallisuuden keskuksen johtajan toimesta.

(Testin alkuperäinen nimi, "Ihmiskunnan viimeinen puolustus", hylättiin sen olevan liian teatraalinen. ) Kiitos ymmärryksestäsi varmistaessamme pääsyä. Jos olet Lukija-tilassa, poistu ja kirjaudu sisään Times-tilillesi tai tilaa täydellinen pääsy The Timesiin. Kiitos ymmärryksestäsi vahvistusprosessin aikana. Oletko jo tilaaja?Kirjaudu sisään. Haluatko täydellisen pääsyn The Timesiin?Tilaa.


Watch video about

Ihmiskunnan viimeinen koe: Uusi haaste kehittyneille tekoälyjärjestelmille

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 18, 2025, 1:30 p.m.

Micron antaa positiivisen myyntinäkymän, kun teko…

Bloomberg Micron Technology Inc, Yhdysvaltojen suurin muistikampojen valmistaja, on antanut optimistisen ennusteensa nykyiselle neljännekselle, viitaten kasvavaan kysyntään ja tuotantokapasiteetin puutteeseen, jotka mahdollistavat korkeammat hinnat tuotteilleen

Dec. 18, 2025, 1:29 p.m.

Uutiset ja tiedot, jotka tarvitset luksuksesta

Mielen luottamus generatiiviseen tekoälyyn (AI) johtavien mainostajien keskuudessa on saavuttamassa ennennäkemättömiä tasoja, käy ilmi tuoreesta Boston Consulting Groupin (BCG) tutkimuksesta.

Dec. 18, 2025, 1:27 p.m.

Google DeepMindin AlphaCode saavuttaa ihmistason …

Google:n DeepMind on äskettäin esitellyt AlphaCode:n, uudenlaisen tekoälyjärjestelmän, joka on kehitetty kirjoittamaan tietokonekoodia ihmisohjelmoijien tasolle.

Dec. 18, 2025, 1:25 p.m.

Hakukoneoptimoinnin tulevaisuus: tekoälyn integro…

Kun digitaalinen maisema kehittyy nopeasti, tekoälyn (AI) integroiminen hakukoneoptimointiin (SEO) on tullut olennaiseksi osaksi verkkomenestystä.

Dec. 18, 2025, 1:17 p.m.

Eettinen keskustelu tekoälyn luomien mallien käyt…

Tekoälyn (AI:n) nousu muotiteollisuudessa on herättänyt kiivasta keskustelua kriitikoiden, luojien ja kuluttajien keskuudessa.

Dec. 18, 2025, 1:13 p.m.

Tekoälypohjaiset videokirjerityökalut avustavat u…

Nykyisessä nopeatempoisessa maailmassa, jossa yleisöt kokevat usein haastavaksi käyttää aikaa pitkien uutissisältöjen seuraamiseen, toimittajat ottavat yhä enemmän käyttöön innovatiivisia teknologioita tämän ongelman ratkaisemiseksi.

Dec. 18, 2025, 9:34 a.m.

Tekoälyvoimaiset videonmuokkaustyökalut mullistav…

Tekoälyteknologia mullistaa videon sisällöntuotantoa pääasiassa AI-tehostettujen videoeditointityökalujen nousun myötä.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today