Dirbtinio intelekto pažanga ir iššūkiai žmogaus lygio žaidimų intelekto įvaldyme
Brief news summary
Dirbtinis intelektas (DI) pasiekė reikšmingų etapų žaidimų srityje – pavyzdžiui, IBM Deep Blue įveikė Garį Kasparovą, o Google AlphaGo išmokė žaisti Go. Skatinamas stiprinamojo mokymosi, DI sėkmė išryškėjo Atari žaidimuose ir sudėtinguose strateginiuose žaidimuose, tokiuose kaip Dota 2 ir Starcraft II. Tačiau vis dar lieka iššūkių, susijusių su DI gebėjimu greitai prisitaikyti prie atvirų, mažiau struktūruotų žaidimų, kur svarbiausios yra žmogaus intuicija ir patirtis. Žmonės puikiai suvokia abstrakčius tikslus ir naujas mechanikas, kuriose DI vis dar turi sunkumų. Niujorko universiteto profesorius Julian Togelius pabrėžia, kad platesnis bendrasis žaidimų mokėjimas – gebėjimas laimėti įvairiuose žaidimuose be išankstinio intensyvaus mokymo – yra pagrindinis iššūkis. Naujovės, tokios kaip Google DeepMind SIMA 2, kuri sujungia stiprinamąjį mokymąsi su pažangiais kalbos modeliais, suteikia vilčių geriau suprasti įvairias žaidimų aplinkas. Pasiekti žmogaus lygio DI žaidimuose reikės proveržių kūrybiškumo, planavimo ir abstrakcijos srityse, ženklinant naują epoką žaidimų intelekte.Prenumeruokite populiariosios mokslų dienoraščio naujienlaiškį, kuriame kasdien, šešis kartus per savaitę, gausite naujienas apie proveržius, atradimus ir savarankiško mokymosi patarimus. Dirbtinio intelektas (DI) modelių pažanga dažnai iliustruojama jų žaidimų sugebėjimais. IBM Deep Blue 1997 metais nustebino pasaulį, įveikdamas šachmatų didmeistrį Garį Kasparovą, o beveik po dviejų dešimtmečių Google AlphaGo įveikė žmogaus čempioną žaidime Go — kartą laikytą neįmanomu. Nuo tada DI pažanga iš žaidimų lentos persikėlė į vaizdo žaidimus, naudojant stiprinimo mokymąsi (reinforcement learning), techniką, kuri yra svarbi ir mokant chatbots kaip ChatGPT, leidžiančioms mašinoms valdyti Atari žaidimus ir sudėtingus strateginius žaidimus, tokius kaip Dota 2 ir Starcraft II. Tačiau DI vis dar sunkiai įsisavina įvairius, atviresnius žaidimus — sritį, kurioje puikiai atrodo žmonės. Kartu susidūrę su nepažįstamu žaidimu, žmogiški žaidėjai greitai suvokia jo pagrindus, o DI modeliai dažnai nesugeba, kaip pabrėžiama neseniai publikuotame Niujorko universiteto informatikos profesorės Julian Togeliuso ir kolegų straipsnyje. Ši spraga atskleidžia esminį skirtumą tarp žmogaus intelekto ir dabartinių DI galimybių, rodydama, kad DI dar turi toli nueiti, kol pasieks ar pranoks tikrą žmogaus lygio protą. Žaidimai ilgą laiką buvo idealūs DI testavimo laukai dėl jų nuspėjamų taisyklių, aiškių tikslų ir mechanikų, kurie puikiai dera su stiprinimo mokymosi metodu: modeliai žaidžia žaidimus simuliacijose ir mokosi iš bandymų bei klaidų. Šis požiūris leido DeepMind 2015 metais įgyti valdžią Atari žaidimuose ir šiandien įtakoja didelius kalbos modelius, mokomus naudoti milžiniškus interneto duomenis. Tačiau šie modeliai puikiai veikia tik konkrečiose užduotyse su aiškiais apribojimais; nedidelis žaidimo dizaino pokytis gali sutrikdyti jų veikimą. Nors DI gali įgyti superžmogiškų įgūdžių tam tikrame žaidime, jis vis dar sunkiai įsisavina improvizaciją. Šis apribojimas tapo ryškesnis, kai šiuolaikinių žaidimų pasaulis tampa vis labiau atviresnis ir abstraktesnis. Skirtingai nuo šachmatų, tokie žaidimai kaip atviro pasaulio “Red Dead Redemption” pasižymi sudėtingais tikslais, susietais su moraliniu konfliktiškumu, o ne tiesioginiais tikslais.
Žmonės tokius niuansus suvokia intuityviai, o mašinos - ne. Net ir paprastesniuose “sandbox” žaidimuose, kaip “Minecraft”, DI gali atlikti bazinius veiksmus, pavyzdžiui, šokinėti, nesuprasdamos jų konteksto. Straipsnio autoriai akcentuoja, kad gerai suprojektuoti žaidimai glaudžiai atitinka žmogaus intuiciją, sveiką protą ir patirtį, kurią žmonės kaupia per ilgus realaus pasaulio sąveikos metus. Pavyzdžiui, kūdikiai pradeda atpažinti objektus maždaug 18-24 mėnesių amžiaus, tiesiog iš patirties, tuo tarpu mašinos reikalauja daug labiau vadovaujamos įvesties. Ši patirtinė nauda leidžia žmonėms greičiau mokytis naujų žaidimų. Tyrimai rodo, kad smalsumu grindžiami DI mokymosi metodai gali prireikti apie keturių milijonų svarbių paspaudimų — apie 37 valandų nuolatinio žaidimo — norint išmokti naują žaidimą, kai tuo tarpu įprasti žmonės dažnai supranta naują mechaniką per mažiau nei 10 valandų. Nepaisant to, DI tobulėja bendrajame žaidimų žaidime. 2023 metais Google DeepMind pristatė SIMA 2, modelį, jungiantį esamą DI su savo didžiojo kalbos modelio Gemini gebėjimais naudotis loginiais samprotavimais, leidžiančiais geriau suprasti ir sąveikauti su 3D žaidimais — net tais, kurie buvo neseniai nemokyti. Visgi Togeliuso ir kolegų nuomone, DI dar turi gerokai pasistūmėti, kad galėtų prilygti žmogaus adaptacijai. Jie siūlo veiklos matą, kai modelis galėtų žaisti ir laimėti top 100 žaidimų Steam arba iOS App Store be išankstinio mokymo jiems, ir padarytų tai maždaug per tiek pat laiko, kiek užtruktų žmogui. Tai lieka rimtas iššūkis, kurio dabartinės DI metodikos dar nėra įveikusios ar rimtai nesistengusios. Pasiekti tokią bendrojo įsivaizdavimo lygį reikštų, kad DI parodytų tikrą kūrybiškumą, tolesnį planavimą ir abstraktų mąstymą — savybes, kurias išskirtinai apibūdina žmogaus intelektas. Galutinis išbandymas, ar DI įgis “žmonių lygio intelektą”, gali būti ne kalbinėmis imitacijomis ar blankių romanų rašymu, bet jo gebėjimu įvaldyti įvairiausius žaidimus, mokytis jais ir suprasti juos kaip žmogus — sparčiai, intuityviai ir suvokiančiai.
Watch video about
Dirbtinio intelekto pažanga ir iššūkiai žmogaus lygio žaidimų intelekto įvaldyme
Try our premium solution and start getting clients — at no cost to you