ChatGPT-4 pokazuje sposobnosti teorije uma u napretku umjetne inteligencije
Brief news summary
Studija objavljena u *Proceedings of the National Academy of Sciences* ispituje performanse velikih jezičnih modela (LLM-ova), poput ChatGPT-4, na zadacima teorije uma, koji uključuju razumijevanje mentalnih stanja drugih. Studiju je proveo Michal Kosinski sa Univerziteta Stanford i otkriveno je da ChatGPT-4 ima stopu uspjeha od 75%, što je slično nivou razmišljanja šestogodišnjeg djeteta. LLM-ovi koriste transformatorske neuronske mreže za analizu velikih skupova podataka i predviđanje sekvenci riječi. Teorija uma je ključna za empatiju i komunikaciju jer uključuje razumijevanje uvjerenja, želja i emocija. Istraživanje je pokazalo da ChatGPT-4 uspješno završava 90% jednostavnih zadataka s lažnim uvjerenjima, ali se muči s kompleksnijim, postigavši samo 60% uspjeha. Ovo sugerira da, iako ChatGPT-4 donekle može shvatiti mentalna stanja, oslanja se na obrasce podataka, a ne na stvarno razumijevanje. Uprkos tome, njegove prilagodljive odgovore ukazuju na potencijal izvan prepoznavanja obrazaca, što izaziva rasprave o svijesti AI-a i potrebama za regulacijom. Kako AI sistemi sve više oponašaju ljudske kognitivne funkcije, raste interes za procjenom njihove inteligencije i razumijevanja kroz složenije zadatke. Ovo naglašava ulogu psihologije u proučavanju novih neljudskih psiholoških procesa kako AI evoluira. Očekuje se da će buduća istraživanja dodatno istražiti sposobnosti i implikacije AI-a, unapređujući naše razumijevanje kako umjetne tako i ljudske kognicije.Istraživanje objavljeno u *Proceedings of the National Academy of Sciences* otkriva da veliki jezički modeli (LLM) poput ChatGPT-4 pokazuju značajnu sposobnost u obavljanju zadataka koji procjenjuju "teoriju uma"—sposobnost razumijevanja uvjerenja i emocija drugih. ChatGPT-4 je uspješno izvršio 75% ovih zadataka, što odgovara nivou šestogodišnjeg djeteta, unapređujući AI-ove društveno relevantne vještine rezonovanja. LLM su sofisticirani AI sistemi koji generiraju tekst sličan ljudskom analizirajući obrasce jezika u opsežnim skupovima podataka. Ovi modeli koriste neuronske mreže, naročito transformatore, za razumijevanje odnosa između riječi i fraza. Nasuprot tome, "teorija uma" je ljudska kognitivna sposobnost ključna za socijalnu interakciju, omogućavajući razumijevanje i predviđanje tuđih mentalnih stanja. Michal Kosinski sa Stanforda procjenjivao je LLM koristeći "zadateke s lažnim uvjerenjima, " ocjenjujući modele u scenarijima poput "Zadatak neočekivanog sadržaja" i "Zadatak neočekivane transfera. " GPT-1 i GPT-2 nisu mogli riješiti ove zadatke, dok su napredni modeli, posebno ChatGPT-4, pokazali značajna poboljšanja, sa stopom uspjeha od 75% uporedivom sa šestogodišnjim djetetom. ChatGPT-4 je briljirao u jednostavnijim scenarijima s lažnim uvjerenjima, postigavši 90% uspjeha u predviđanju lažnih uvjerenja protagonista na osnovu zavaravajućih znakova. Međutim, njegov uspjeh je pao na 60% u složenijim zadacima koji uključuju dinamične scenarije.
Ipak, model je pokazao dosljednost, prilagođavajući predviđanja na osnovu promjena u naraciji, što ukazuje na više od pukog prepoznavanja obrazaca. Kosinski je koristio rigorozna testiranja kako bi izbjegao da modeli pređu na prepoznavanje obrazaca, otkrivajući ChatGPT-4-ovo nijansirano razumijevanje konteksta naracije. Ovi nalazi sugeriraju da LLM posjeduju emergentne sposobnosti za rezonovanje slično teoriji uma. Dok je ChatGPT-4 povremeno zakazao, što ističe određena ograničenja, njegov brzi razvoj sposobnosti postavlja pitanja o potencijalnoj AI svijesti i razvoju izvan ljudskog razumijevanja. Buduća istraživanja mogla bi se posvetiti AI-ovoj sposobnosti u složenijim scenarijima socijalnog rezonovanja i njihovim implikacijama na ljudsku kogniciju i sigurnost AI-a.
Watch video about
ChatGPT-4 pokazuje sposobnosti teorije uma u napretku umjetne inteligencije
Try our premium solution and start getting clients — at no cost to you