lang icon English
Nov. 8, 2024, 2:14 p.m.
2810

AI-debattmetode forbedrer dømmingsnøyaktighet i komplekse oppgaver.

Brief news summary

I februar 2023 oppstod bekymringer om nøyaktigheten til AI da Googles chatbot Bard gjorde en feil om James Webb-romteleskopet. En studie fra Purdue University indikerte også at over halvparten av ChatGPTs programmeringssvar var uriktige. Selv om slike feil er oppdagbare nå, er eksperter som Julian Michael ved NYU bekymret for at fremtidige AI-modeller kan generere komplekse, uverifiserbare svar som kan undergrave tilliten. En løsning innebærer å la AI-modeller debattere med hverandre, slik at en menneskelig eller AI-dommer kan avgjøre hva som er sant. Funn fra Anthropic og Google DeepMind antyder at trening av modeller gjennom debatter kan forbedre nøyaktigheten. Imidlertid finnes det utfordringer som skjevhet, pålitelighet på tvers av ulike oppgaver, og samsvar med menneskelige verdier. Til tross for disse problemene gir pågående eksperimenter med AI-debatter og overvåkingsmetoder håp for forbedret tillit til AI. Forskere er optimistiske med tanke på at AI-debatter kan bidra betydelig til fremtidig AI-sikkerhet og tilpasning.

I februar 2023 uttalte Googles AI-chatbot Bard feilaktig at James Webb-romteleskopet hadde tatt det første bildet av en eksoplanet. Denne feilen ligner på de som ble funnet i OpenAI's ChatGPT i en studie av Purdue University-forskere, hvor mer enn halvparten av over 500 programmeringsspørsmål ble besvart unøyaktig. Selv om disse feilene for øyeblikket er merkbare, uttrykker eksperter bekymring for at det vil bli stadig vanskeligere å skille sannhet fra feilinformasjon etter hvert som AI-modeller blir mer komplekse. Julian Michael fra NYU fremhever vanskeligheten med å overvåke AI-systemer i områder utenfor menneskelig kapasitet. En foreslått løsning er å la to store AI-modeller debattere, med en enklere modell eller et menneske som avgjør utfallet. Denne ideen dukket først opp for seks år siden, men nylige studier fra Anthropic og Google DeepMind gir initial empirisk bevis for at debatter mellom store språkmodeller (LLM) kan hjelpe med å skille sannhet fra løgn. Å etablere tillitsverdige AI-systemer er en del av justering, som sikrer at AI deler menneskelige verdier. Nåværende justering avhenger av menneskelig tilbakemelding, men en skalerbar overvåkning – som sikrer nøyaktigheten til AI utover menneskelig kapasitet – er nødvendig ettersom AI utvikler seg. Debatt, undersøkt siden 2018, anses som en måte å håndtere denne skalerbare overvåkningen på. Initially proposed by Geoffrey Irving at OpenAI, the technique involves two AI models disputing a question to convince an external judge of their correctness. Selv om grunnleggende tester i 2018 antydet at debatt kunne fungere, forble bekymringer om menneskers tilbøyelighet til subjektiv dømmekraft og forskjeller i vurderingsevne.

Forskere som Amanda Askell hevder at forståelse av menneskelig beslutningstaking er essensielt for å effektivt justere AI til menneskelige verdier. Til tross for blandede innledende funn, indikerer nye studier potensial. Anthropics studie viste at LLM-debatter økte ikke-ekspert dommeres nøyaktighet betydelig, til 76% fra 54%. Google DeepMinds lignende eksperimenter bekreftet at debatt førte til økt nøyaktighet på tvers av ulike oppgaver. Zachary Kenton sier at det å se begge sider gir mer informasjon til dommerne, noe som fremmer mer nøyaktige konklusjoner. Imidlertid gjenstår utfordringer, som innflytelsen av bagatellmessige debattfunksjoner og skjevheter som smisking, hvor AI feilaktig kan reflektere brukerens preferanser. Også det faste naturen av riktig eller galt svar i tester kan ikke oversettes til komplekse, nyanserte scenarier i virkeligheten. Å forstå AI-oppførsel og identifisere hvor AI-systemer overgår menneskelige dommere i kunnskap er avgjørende for den fortsatt utvikling og anvendelse av disse metodene, som påpekt av Irving. Til tross for disse hindringene representerer den empiriske suksessen til debatter et lovende fremskritt mot å forbedre AI pålitelighet og justering.


Watch video about

AI-debattmetode forbedrer dømmingsnøyaktighet i komplekse oppgaver.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 1, 2025, 2:28 p.m.

New Jersey AI-drevet markedsføring for oppstartss…

Startups i New Jersey har nå tilgang til avanserte AI-verktøy gjennom en integrert løsning utviklet av LeapEngine, et ledende lokalt digitalmarkedsføringsbyrå.

Nov. 1, 2025, 2:27 p.m.

Doola lanserer nytt AI-medgründersystem for å hje…

AI Business-in-a-Box™ hjelper nå over 15 000 gründere over hele verden med backoffice-oppgaver og vekst av netthandelsbutikker NEW YORK CITY, NEW YORK / ACCESS Newswire / 30

Nov. 1, 2025, 2:19 p.m.

Sony lanserer kameraintegrasjonsløsning for video…

Sony Electronics har kunngjort lanseringen av det de kaller bransjens første kamerautværdi-løsning som er kompatibel med video og i samsvar med C2PA-standarden (Coalition for Content Provenance and Authenticity).

Nov. 1, 2025, 2:17 p.m.

Lag merkevaretilpasset markedsføringsinnhold for …

Å skape effektivt, på merkevarenivå innhold krever ofte en betydelig investering av tid, budsjett og designkompetanse, noe som kan utgjøre en stor utfordring for små og mellomstore bedrifter (SMB-er).

Nov. 1, 2025, 2:12 p.m.

Nvidia vil investere opptil 1 milliard dollar i A…

Nvidia, et ledende teknologiselskap kjent for sine fremskritt innen grafikkprosesseringsenheter (GPU-er) og kunstig intelligens (AI), planlegger angivelig en større investering i AI-oppstartsselskapet Poolside, ifølge en nyhetsrapport fra Bloomberg.

Nov. 1, 2025, 2:10 p.m.

Google introduserer AI-oversikter, og endrer søke…

Google har nylig introdusert en ny funksjon kalt AI Oversikter, som gir AI-genererte sammendrag som er tydelig plassert øverst i søkeresultatene.

Nov. 1, 2025, 10:22 a.m.

dNOVO-gruppen undersøker: Kanadas beste AI-SEO-se…

Toronto, Ontario, 27.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today