lang icon English
Jan. 14, 2025, 10:28 p.m.
1736

ChatGPT-4 Demonstrerer Teorien om Sinns Evner i AI Fremskritt

Brief news summary

En studie publisert i *Proceedings of the National Academy of Sciences* undersøker ytelsen til store språkmodeller (LLM-er), som ChatGPT-4, på oppgaver knyttet til "theory of mind," som handler om å forstå andres mentale tilstander. Gjennomført av Michal Kosinski ved Stanford University, viste studien at ChatGPT-4 hadde en suksessrate på 75 %, tilsvarende resonneringsnivået til et seks år gammelt barn. LLM-er bruker transformator-nevrale nettverk for å analysere store datasett og forutsi ordsekvenser. "Theory of mind" er avgjørende for empati og kommunikasjon, da det handler om å forstå tro, ønsker og følelser. Forskningsresultatene viste at ChatGPT-4 lyktes i 90 % av enkle oppgaver med falske forestillinger, men slet med mer komplekse oppgaver, og oppnådde bare en suksessrate på 60 %. Dette antyder at selv om ChatGPT-4 til en viss grad kan forstå mentale tilstander, stoler den på datapreg heller enn egentlig forståelse. Til tross for dette, antyder dens tilpasningsdyktige svar potensial utover mønstergjenkjenning, noe som vekker diskusjoner rundt AI-bevissthet og regulatoriske behov. Etter hvert som AI-systemer stadig mer imiterer menneskelige kognitive funksjoner, er det økende interesse for å evaluere deres intelligens og forståelse gjennom mer komplekse oppgaver. Dette fremhever psykologens rolle i å studere nye ikke-menneskelige psykologiske prosesser mens AI utvikler seg. Fremtidig forskning er forventet å ytterligere utforske AI's evner og implikasjoner, slik at vår forståelse av både kunstig og menneskelig kognisjon forbedres.

Forskning publisert i *Proceedings of the National Academy of Sciences* avdekker at store språkmodeller (LLMs) som ChatGPT-4 har en betydelig evne til å utføre oppgaver som vurderer "theory of mind"—evnen til å forstå andres tro og følelser. ChatGPT-4 mestret 75% av disse oppgavene, tilsvarende nivået til et seks år gammelt barn, og forbedrer AI's sosialt relevante resonneringsevner. LLMs er sofistikerte AI-systemer som genererer menneskelignende tekst ved å analysere språkets mønstre i omfattende datasett. Disse modellene bruker nevrale nettverk, spesielt transformere, for å forstå forhold mellom ord og fraser. Derimot er "theory of mind" en menneskelig kognitiv evne essensiell for sosial interaksjon, som gjør det mulig å forstå og forutsi andres mentale tilstander. Stanford's Michal Kosinski evaluerte LLMs ved bruk av "false-belief tasks, " og vurderte modellene mot scenarier som "Uventet Innhold-Oppgave" og "Uventet Overførings-Oppgave. " GPT-1 og GPT-2 klarte ikke å løse disse oppgavene, mens avanserte modeller, spesielt ChatGPT-4, viste markante forbedringer, med en suksessrate på 75% som er sammenlignbar med et seks år gammelt barn. ChatGPT-4 utmerket seg i enklere false-belief-scenarier, med en suksessrate på 90% i å forutsi en protagonists falske tro basert på villedende ledetråder.

Imidlertid falt suksessen til 60% i mer komplekse oppgaver som involverte dynamiske scenarier. Likevel viste modellen konsistens, tilpasset forutsigelser basert på endringer i fortellingen, noe som indikerer mer enn bare mønstergjenkjenning. Kosinskis forskning brukte strenge tester for å unngå at modeller standardiserte til mønstergjenkjenning, som avslørte ChatGPT-4s nyanserte forståelse av fortellingskonteksten. Disse funnene antyder at LLMs har fremvoksende evner for resonnering som ligner "theory of mind. " Selv om ChatGPT-4 av og til sviktet, noe som fremhever visse begrensninger, reiser den raske evneutviklingen spørsmål om AI's potensielle bevissthet og utvikling utover menneskelig forståelse. Fremtidig forskning kan utforske AIs kapasitet i mer komplekse sosiale resonneringsscenarier og dets implikasjoner for menneskelig kognisjon og AI-sikkerhet.


Watch video about

ChatGPT-4 Demonstrerer Teorien om Sinns Evner i AI Fremskritt

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 14, 2025, 1:26 p.m.

Anthropic oppdager AI-drevet hackingkampanje knyt…

Anthropic, et ledende AI-selskap, har avdekket en banebrytende og alarmerende utvikling innen cybersikkerhet: det første dokumenterte tilfellet der AI autonomt styrer en hackingkampanje.

Nov. 14, 2025, 1:25 p.m.

AI-genererte Sora-videoer av ICE-raids er ekstrem…

“Se deg for hvor du setter føttene, siré, fortsett å gå,” sier en politibetjent med vest merket ICE og en merkelapp som sier “POICE” til en latino-lignende mann iført en Walmart-ansattvest.

Nov. 14, 2025, 1:18 p.m.

Kevin Reilly utnevnt til administrerende direktør…

Kevin Reilly, en erfaren Hollywood-toppsjef kjent for sin sentrale rolle i lanseringen av banebrytende TV-serier som "The Sopranos", "The Office" og "Glee", har tatt på seg en ny utfordring som administrerende direktør i Kartel, en AI- kreativ rådgivning basert i Beverly Hills.

Nov. 14, 2025, 1:14 p.m.

Google står overfor EU-konkurranserettslig etterf…

Den europeiske union har startet en stor antitrust-undersøkelse av Googles spam-politikk etter bekymringer fra flere nyhetsutgivere i Europa.

Nov. 14, 2025, 1:12 p.m.

Dealism lanserer den første AI-selgagenten bygget…

SINGAPORE, 13.

Nov. 14, 2025, 9:31 a.m.

AI-drevet SEO: Neste frontlinje i digital markeds…

Kunstig intelligens (KI) blir raskt en transformerende kraft innen digital markedsføring, spesielt innen søkemotoroptimalisering (SEO).

Nov. 14, 2025, 9:22 a.m.

AI er en allierte, ikke fienden

Shelley E. Kohan ønsker Leigh Sevin velkommen, medgrundlegger av Endear, en CRM-løsning tilpasset moderne omni-kanal detaljhandel.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today