lang icon En
Sept. 25, 2024, 7:19 a.m.
2379

Rannsókn opinberar að AI spjallmenni gefa oft rangar svör

Brief news summary

Rannsókn birt í *Nature* af José Hernández-Orallo frá Rannsóknarstofnun Valenciu fyrir gervigreind kannar frammistöðu þróaðra AI spjallmenna, þar á meðal OpenAI's GPT, Meta's LLaMA og BigScience's BLOOM. Rannsóknin bendir á stórt vandamál: yfir 60% af greindu svörunum voru röng eða á undankomuleiðum, sem vekur áhyggjur um skilning notenda á getu AI. Rannsóknin fól í sér umfangsmikla greiningu á þúsundum fyrirspurna og sýndi fram á að módel eins og GPT-4 víla oft fyrir sér að svara flóknum spurningum og auka þannig líkurnar á villum, sem leiðir notendur til að trúa þessar ranghugmyndir. Hernández-Orallo mælir með því að AI forritarar leggi áherslu á nákvæmni í einfaldara spurningum og þjálfi módelin til að forðast að svara of erfiðum spurningum. Þó að einhver AI módel viðurkenni oft óvissu með fullyrðingum eins og "Ég veit ekki," hafa þau oft inkassa í röng svör, sem getur valdið því að notendur ofmeta áreiðanleika AI kerfa.

Rannsókn á þróuðum útgáfum af þremur vinsælum AI spjallmennum sýnir að þær hafa tilhneigingu til að gefa rangar svör oftar en þær viðurkenna þegar þær vita ekki eitthvað. Rannsóknin, undir forystu José Hernández-Orallo frá Rannsóknarstofnun Valenciu fyrir gervigreind, greindi mistök stórra máltækni módel (LLM), og tók eftir að þótt nákvæmni batni með stærð og endurbót módelanna, þá hafi fjöldi rangra svara líka aukist. Í stað þess að velja að hafna erfiðum spurningum, bjóða þessi módel oft upp á svör, sem leiðir til aukningu í villandi svörum. Hernández-Orallo tekur eftir því að spjallmenni séu að verða færari í að herma eftir þekkingu án raunverulegrar skilnings, fyrirbæri sem lýst er sem "ultracrepidarianisme. " Þetta getur leitt til þess að notendur ofmeta geta spjallmenna, sem skapar áhættu. Liðið skoðaði módel eins og GPT frá OpenAI, LLaMA frá Meta og opna auðið BLOOM, og mettu nákvæmni þeirra yfir ýmsar spurningategundir.

Þeir fundu að jafnvel með bættum módelum voru yfir 60% af svörum þeirra röng eða óhæf. Að auki flokkuðu mannlegir sjálfboðaliðar oft röng svör sem rétt, sem sýndi skort á hæfni til að fylgjast með módelunum á áhrifaríkan hátt. Til að bæta notendaskilning leggur Hernández-Orallo til að forritarar ættu að bæta frammistöðu á einföldum spurningum og þjálfa spjallmenni til að hætta við að svara erfiðum. Þetta myndi hjálpa notendum að bera kennsl á hvar AI er áreiðanlegt og hvar það er það ekki. Þrátt fyrir að einhver spjallmenni geti viðurkennt skort á þekkingu, helst þrýstingurinn á að módelin glími við erfiðar spurningar, sérstaklega fyrir þau sem eru markaðssett sem almenn notkungs.


Watch video about

Rannsókn opinberar að AI spjallmenni gefa oft rangar svör

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 1:22 p.m.

AIMM: Tólgrunnur stjórnð af gervigreind til að gr…

AIMM: nýstárlegt ramma fyrir greiningu á stjórnvaldseftirlitsmarkaðsmiðaðri markaðsvikni með gervigreind Í hraðri breytingu á fjármálamarkaði dagsins í dag hefur samfélagsmiðla orðið að lykilafli sem mótar markaðsviðbrögð

Dec. 22, 2025, 1:16 p.m.

Einka: Filevine kaupir Pincites, AI-drifnað fyrir…

Lögfræðiviðskiptatæknifyrirtækið Filevine hefur keypt Pincites, gervigreindarstýrða samningaskrárútgáfufyrirtæki, sem styrkir stöðu þess í fyrirtækja- og viðskiptalögum og krefst áfram stefnu þess um gervigreind.

Dec. 22, 2025, 1:16 p.m.

Áhrif gervigreindar á leitarvélabækur: Útfærsla á…

Gervigreind (AI) er í hröðum vexti að endurhanna svið leitarvélabætingar (SEO), því að veita stafrænum markaðsfulltrúa nýstárleg tól og ný tækifæri til að betrumbæta strategíur sínar og ná betri árangri.

Dec. 22, 2025, 1:15 p.m.

Framfarir í djúpfake greiningu með AI myndbandsgr…

Framfarir í gervigreind hafa spilað lykilhlutverk í baráttunni gegn rangfærslum með því að gera kleift að búa til þróuðu reiknirit sem eru ætlað að greina djúpfög.

Dec. 22, 2025, 1:14 p.m.

5 bestu gervigreindarkerfi sölumála sem breyta án…

Sókn AI hefur umbreytt sölu með því að byggja af auðveldari ferla og handvirkar eftirfylgni með hraðvirkum, sjálfvirkum kerfum sem starfa 24/7.

Dec. 22, 2025, 1:12 p.m.

Nýjustu fregnir um gervigreind og markaðsfréttir:…

Í hratt þróunaraðstöðu hins gervigreinda (AI) og markaðssetningar eru nýlega mikilvæg atvik að móta iðnaðinn, skapa bæði nýjar tækifæri og áskoranir.

Dec. 22, 2025, 9:22 a.m.

OpenAI sér betri hagnaðarmörk í viðskiptum, segir…

útgáfan hélt því fram að fyrirtækið hefði aukið „útreikningsávöxtun“ sitt, sem er innra mælikvarði sem táknar hluta af tekjum sem eftir stendur eftir að hafa greitt fyrir rekstrarferla fyrir greiðandi viðskiptavini fyrirtækisins í fyrirtækja- og neytendavörum.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today