lang icon English
Sept. 25, 2024, 7:19 a.m.
1887

Rannsókn opinberar að AI spjallmenni gefa oft rangar svör

Brief news summary

Rannsókn birt í *Nature* af José Hernández-Orallo frá Rannsóknarstofnun Valenciu fyrir gervigreind kannar frammistöðu þróaðra AI spjallmenna, þar á meðal OpenAI's GPT, Meta's LLaMA og BigScience's BLOOM. Rannsóknin bendir á stórt vandamál: yfir 60% af greindu svörunum voru röng eða á undankomuleiðum, sem vekur áhyggjur um skilning notenda á getu AI. Rannsóknin fól í sér umfangsmikla greiningu á þúsundum fyrirspurna og sýndi fram á að módel eins og GPT-4 víla oft fyrir sér að svara flóknum spurningum og auka þannig líkurnar á villum, sem leiðir notendur til að trúa þessar ranghugmyndir. Hernández-Orallo mælir með því að AI forritarar leggi áherslu á nákvæmni í einfaldara spurningum og þjálfi módelin til að forðast að svara of erfiðum spurningum. Þó að einhver AI módel viðurkenni oft óvissu með fullyrðingum eins og "Ég veit ekki," hafa þau oft inkassa í röng svör, sem getur valdið því að notendur ofmeta áreiðanleika AI kerfa.

Rannsókn á þróuðum útgáfum af þremur vinsælum AI spjallmennum sýnir að þær hafa tilhneigingu til að gefa rangar svör oftar en þær viðurkenna þegar þær vita ekki eitthvað. Rannsóknin, undir forystu José Hernández-Orallo frá Rannsóknarstofnun Valenciu fyrir gervigreind, greindi mistök stórra máltækni módel (LLM), og tók eftir að þótt nákvæmni batni með stærð og endurbót módelanna, þá hafi fjöldi rangra svara líka aukist. Í stað þess að velja að hafna erfiðum spurningum, bjóða þessi módel oft upp á svör, sem leiðir til aukningu í villandi svörum. Hernández-Orallo tekur eftir því að spjallmenni séu að verða færari í að herma eftir þekkingu án raunverulegrar skilnings, fyrirbæri sem lýst er sem "ultracrepidarianisme. " Þetta getur leitt til þess að notendur ofmeta geta spjallmenna, sem skapar áhættu. Liðið skoðaði módel eins og GPT frá OpenAI, LLaMA frá Meta og opna auðið BLOOM, og mettu nákvæmni þeirra yfir ýmsar spurningategundir.

Þeir fundu að jafnvel með bættum módelum voru yfir 60% af svörum þeirra röng eða óhæf. Að auki flokkuðu mannlegir sjálfboðaliðar oft röng svör sem rétt, sem sýndi skort á hæfni til að fylgjast með módelunum á áhrifaríkan hátt. Til að bæta notendaskilning leggur Hernández-Orallo til að forritarar ættu að bæta frammistöðu á einföldum spurningum og þjálfa spjallmenni til að hætta við að svara erfiðum. Þetta myndi hjálpa notendum að bera kennsl á hvar AI er áreiðanlegt og hvar það er það ekki. Þrátt fyrir að einhver spjallmenni geti viðurkennt skort á þekkingu, helst þrýstingurinn á að módelin glími við erfiðar spurningar, sérstaklega fyrir þau sem eru markaðssett sem almenn notkungs.


Watch video about

Rannsókn opinberar að AI spjallmenni gefa oft rangar svör

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 4, 2025, 1:22 p.m.

Nvidia Gervigreindar Hugbúnaðar örgjörvi knýr nýj…

Nvidia hefur kynnt nýjasta gervigreindarhringrás sína, sem stefnt er að því að verða grundvallarhluti í nýjustu kynslóð spilaklefa.

Nov. 4, 2025, 1:18 p.m.

Nýji SkyReels hefst formlega

Skýrskoðun um aðgengi.

Nov. 4, 2025, 1:17 p.m.

Hva anywhere beinist við vöxt, AI sem leiðsögn þe…

Anywhere Real Estate lauknaði ári fullt af fréttum með stuttum þriðja ársfjórðungsrekstrarfréttum sem sýndu sterkann hröðunarbarn og þróun í gervigreind, þegar fyrirtækið undirbýr framtíðar samþættingu sína við Compass.

Nov. 4, 2025, 1:13 p.m.

endurskoðun á YouTube leitarvélabestun: árangursr…

Yfirlit um gervigreind er nýjasta vesen í SEO, þar sem vísað er til þeirra í samantektum á Google sem lykilmælikvarði á velgengni í SEO.

Nov. 4, 2025, 1:09 p.m.

Vista Social kynnti ChatGPT tækni og varð fyrsta …

Vista Social hefur kynnt til sögunnar verulega framfarir í stjórnun samfélagsmiðla með því að samþætta ChatGPT tækni inn í vettvang sinn, þar sem það er fyrsta tækið til að fela í sér háþróað samtalalíkan OpenAI.

Nov. 4, 2025, 1:09 p.m.

Þessi 4 gervigreindarfjárfestingar munu breyta ge…

Í dagverkinu mínum lýsi ég nýjustu þróun sem hafa áhrif á Astera Labs (ALAB 3,17%), Super Micro Computer (SMCI 4,93%) og ýmsar aðrar skráningar tengdar gervigreind.

Nov. 4, 2025, 9:30 a.m.

Palantir-kynningar um áhyggjur varðandi gildi AI,…

Palantir Technologies Inc.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today