News
>
Rannsókn opinberar að AI spjallmenni gefa oft rangar svör

Sept. 25, 2024, 7:19 a.m.

Rannsókn opinberar að AI spjallmenni gefa oft rangar svör

Brief news summary

Rannsókn birt í *Nature* af José Hernández-Orallo frá Rannsóknarstofnun Valenciu fyrir gervigreind kannar frammistöðu þróaðra AI spjallmenna, þar á meðal OpenAI's GPT, Meta's LLaMA og BigScience's BLOOM. Rannsóknin bendir á stórt vandamál: yfir 60% af greindu svörunum voru röng eða á undankomuleiðum, sem vekur áhyggjur um skilning notenda á getu AI. Rannsóknin fól í sér umfangsmikla greiningu á þúsundum fyrirspurna og sýndi fram á að módel eins og GPT-4 víla oft fyrir sér að svara flóknum spurningum og auka þannig líkurnar á villum, sem leiðir notendur til að trúa þessar ranghugmyndir. Hernández-Orallo mælir með því að AI forritarar leggi áherslu á nákvæmni í einfaldara spurningum og þjálfi módelin til að forðast að svara of erfiðum spurningum. Þó að einhver AI módel viðurkenni oft óvissu með fullyrðingum eins og "Ég veit ekki," hafa þau oft inkassa í röng svör, sem getur valdið því að notendur ofmeta áreiðanleika AI kerfa.

Rannsókn á þróuðum útgáfum af þremur vinsælum AI spjallmennum sýnir að þær hafa tilhneigingu til að gefa rangar svör oftar en þær viðurkenna þegar þær vita ekki eitthvað. Rannsóknin, undir forystu José Hernández-Orallo frá Rannsóknarstofnun Valenciu fyrir gervigreind, greindi mistök stórra máltækni módel (LLM), og tók eftir að þótt nákvæmni batni með stærð og endurbót módelanna, þá hafi fjöldi rangra svara líka aukist. Í stað þess að velja að hafna erfiðum spurningum, bjóða þessi módel oft upp á svör, sem leiðir til aukningu í villandi svörum. Hernández-Orallo tekur eftir því að spjallmenni séu að verða færari í að herma eftir þekkingu án raunverulegrar skilnings, fyrirbæri sem lýst er sem "ultracrepidarianisme. " Þetta getur leitt til þess að notendur ofmeta geta spjallmenna, sem skapar áhættu. Liðið skoðaði módel eins og GPT frá OpenAI, LLaMA frá Meta og opna auðið BLOOM, og mettu nákvæmni þeirra yfir ýmsar spurningategundir.

Þeir fundu að jafnvel með bættum módelum voru yfir 60% af svörum þeirra röng eða óhæf. Að auki flokkuðu mannlegir sjálfboðaliðar oft röng svör sem rétt, sem sýndi skort á hæfni til að fylgjast með módelunum á áhrifaríkan hátt. Til að bæta notendaskilning leggur Hernández-Orallo til að forritarar ættu að bæta frammistöðu á einföldum spurningum og þjálfa spjallmenni til að hætta við að svara erfiðum. Þetta myndi hjálpa notendum að bera kennsl á hvar AI er áreiðanlegt og hvar það er það ekki. Þrátt fyrir að einhver spjallmenni geti viðurkennt skort á þekkingu, helst þrýstingurinn á að módelin glími við erfiðar spurningar, sérstaklega fyrir þau sem eru markaðssett sem almenn notkungs.

News source

Watch video about

Rannsókn opinberar að AI spjallmenni gefa oft rangar svör

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 1:22 p.m.

AIMM: Tólgrunnur stjórnð af gervigreind til að gr…

AIMM: nýstárlegt ramma fyrir greiningu á stjórnvaldseftirlitsmarkaðsmiðaðri markaðsvikni með gervigreind Í hraðri breytingu á fjármálamarkaði dagsins í dag hefur samfélagsmiðla orðið að lykilafli sem mótar markaðsviðbrögð

Dec. 22, 2025, 1:16 p.m.

Einka: Filevine kaupir Pincites, AI-drifnað fyrir…

Lögfræðiviðskiptatæknifyrirtækið Filevine hefur keypt Pincites, gervigreindarstýrða samningaskrárútgáfufyrirtæki, sem styrkir stöðu þess í fyrirtækja- og viðskiptalögum og krefst áfram stefnu þess um gervigreind.

Dec. 22, 2025, 1:16 p.m.

Áhrif gervigreindar á leitarvélabækur: Útfærsla á…

Gervigreind (AI) er í hröðum vexti að endurhanna svið leitarvélabætingar (SEO), því að veita stafrænum markaðsfulltrúa nýstárleg tól og ný tækifæri til að betrumbæta strategíur sínar og ná betri árangri.

Dec. 22, 2025, 1:15 p.m.

Framfarir í djúpfake greiningu með AI myndbandsgr…

Framfarir í gervigreind hafa spilað lykilhlutverk í baráttunni gegn rangfærslum með því að gera kleift að búa til þróuðu reiknirit sem eru ætlað að greina djúpfög.

Dec. 22, 2025, 1:14 p.m.

5 bestu gervigreindarkerfi sölumála sem breyta án…

Sókn AI hefur umbreytt sölu með því að byggja af auðveldari ferla og handvirkar eftirfylgni með hraðvirkum, sjálfvirkum kerfum sem starfa 24/7.

Dec. 22, 2025, 1:12 p.m.

Nýjustu fregnir um gervigreind og markaðsfréttir:…

Í hratt þróunaraðstöðu hins gervigreinda (AI) og markaðssetningar eru nýlega mikilvæg atvik að móta iðnaðinn, skapa bæði nýjar tækifæri og áskoranir.

Dec. 22, 2025, 9:22 a.m.

OpenAI sér betri hagnaðarmörk í viðskiptum, segir…

útgáfan hélt því fram að fyrirtækið hefði aukið „útreikningsávöxtun“ sitt, sem er innra mælikvarði sem táknar hluta af tekjum sem eftir stendur eftir að hafa greitt fyrir rekstrarferla fyrir greiðandi viðskiptavini fyrirtækisins í fyrirtækja- og neytendavörum.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today

Rannsókn opinberar að AI spjallmenni gefa oft rangar svör

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

AIMM: Gervigreindarstýrt kerfi til að greina fjárfestingarmisnotkun á samfélagsmiðlum og í hlutabréfamarkaði

Filevine kaupir AI-stýrða samningaumbrotarfyrirtækið Pincites til að auka nánd sína á sviði lögniðnaðar.

Hvernig gervigreind er að bylta leitarvélabestunartækni fyrir stafræna sölumenn

The Best for your Business

Hot news

AIMM: Tólgrunnur stjórnð af gervigreind til að gr…

Einka: Filevine kaupir Pincites, AI-drifnað fyrir…

Áhrif gervigreindar á leitarvélabækur: Útfærsla á…

Framfarir í djúpfake greiningu með AI myndbandsgr…

5 bestu gervigreindarkerfi sölumála sem breyta án…

Nýjustu fregnir um gervigreind og markaðsfréttir:…

OpenAI sér betri hagnaðarmörk í viðskiptum, segir…

AI Company

Sales

Marketing

Rannsókn opinberar að AI spjallmenni gefa oft rangar svör

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

AIMM: Gervigreindarstýrt kerfi til að greina fjárfestingarmisnotkun á samfélagsmiðlum og í hlutabréfamarkaði

Filevine kaupir AI-stýrða samningaumbrotarfyrirtækið Pincites til að auka nánd sína á sviði lögniðnaðar.

Hvernig gervigreind er að bylta leitarvélabestunartækni fyrir stafræna sölumenn

The Best for your Business

Hot news

AIMM: Tólgrunnur stjórnð af gervigreind til að gr…

Einka: Filevine kaupir Pincites, AI-drifnað fyrir…

Áhrif gervigreindar á leitarvélabækur: Útfærsla á…

Framfarir í djúpfake greiningu með AI myndbandsgr…

5 bestu gervigreindarkerfi sölumála sem breyta án…

Nýjustu fregnir um gervigreind og markaðsfréttir:…

OpenAI sér betri hagnaðarmörk í viðskiptum, segir…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?