lang icon English
Sept. 25, 2024, 7:19 a.m.
1983

Estudi revela que els xatbots d'AI proporcionen freqüentment respostes incorrectes

Brief news summary

Un estudi publicat a *Nature* per José Hernández-Orallo de l'Institut de Recerca Valencià en Intel·ligència Artificial explora el rendiment de xatbots d'AI avançats, incloent-hi el GPT d'OpenAI, el LLaMA de Meta i el BLOOM de BigScience. La investigació destaca un problema significatiu: més del 60% de les respostes analitzades es van trobar incorrectes o evasives, cosa que genera preocupacions sobre la comprensió de les capacitats de l'AI per part dels usuaris. L'estudi va implicar una anàlisi extensa de milers de preguntes i va revelar que models com GPT-4 sovint intenten respondre preguntes complexes, augmentant la probabilitat d'errors i portant els usuaris a confiar erròniament en aquestes inexactituds. Hernández-Orallo recomana que els desenvolupadors d'AI prioritzin la precisió en preguntes més simples i entren els models per evitar respondre preguntes excessivament difícils. Tot i que alguns models d'AI expressen incertesa amb frases com "No ho sé", sovint proporcionen confiança en respostes incorrectes, cosa que pot provocar que els usuaris sobrevalorin la fiabilitat dels sistemes d'AI.

Un estudi sobre versions avançades de tres xatbots d'AI populars revela que tendeixen a generar respostes incorrectes amb més freqüència del que admeten quan no saben alguna cosa. La investigació, dirigida per José Hernández-Orallo de l'Institut de Recerca Valencià en Intel·ligència Artificial, va analitzar els errors dels grans models de llenguatge (LLM), observant que mentre la precisió millora amb la mida i el refinament del model, la taxa de respostes incorrectes també ha augmentat. En lloc d'optar per declinar preguntes difícils, aquests models sovint proporcionen respostes, cosa que porta a un augment de les respostes enganyoses. Hernández-Orallo observa que els xatbots són cada vegada més aptes per imitar coneixements sense una comprensió genuïna, un fenomen descrit com a "ultracrepidarianisme". Això pot portar els usuaris a sobreestimar les habilitats del xatbot, la qual cosa comporta riscos. L'equip va examinar models com el GPT d'OpenAI, el LLaMA de Meta i el BLOOM de codi obert, avaluant la seva precisió en diferents tipus de preguntes.

Van trobar que, fins i tot amb models millorats, més del 60% de les respostes eren incorrectes o inútils. A més, els voluntaris humans sovint classifiquen incorrectament les respostes incorrectes com a correctes, demostrant una falta de capacitat per supervisar els models de manera efectiva. Per millorar la comprensió dels usuaris, Hernández-Orallo suggereix que els desenvolupadors haurien de millorar el rendiment en preguntes senzilles i entrenar els xatbots per abstenir-se de respondre preguntes difícils. Això ajudaria els usuaris a identificar on l'AI és fiable i on no ho és. Tot i que alguns xatbots poden reconèixer la seva falta de coneixement, l'impuls perquè els models abordin preguntes difícils segueix sent prominent, especialment per a aquells comercialitzats com a tot terreny.


Watch video about

Estudi revela que els xatbots d'AI proporcionen freqüentment respostes incorrectes

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 13, 2025, 1:28 p.m.

Núvols foscos col·lectivament amenaçant sobre la …

Una gran venta de tecnología sacude Wall Street ja que la gran diferència entre les valoracions de les empreses d’IA i els seus ingressos subrendibles continua ampliant-se.

Nov. 13, 2025, 1:25 p.m.

Intel·ligència artificial generativa i productivi…

Un estudi recent i exhaustiu ha revelat els efectes transformadors de la Intel·ligència Artificial Generativa (GenAI) en la productivitat de les empreses, amb un focus en el comerç electrònic.

Nov. 13, 2025, 1:25 p.m.

Eines d'Intel·ligència Artificial per a la Modera…

En els últims anys, les plataformes de xarxes socials han confiat cada vegada més en la intel·ligència artificial (IA) per millorar la moderació de contingut, especialment pel que fa al material en vídeo.

Nov. 13, 2025, 1:25 p.m.

Còpia AI SEO i GEO en línia per abordar el futur …

La Cumbre en línia AI SEO & GEO, programada pel 9 de desembre de 2025, ofereix una oportunitat essencial per a empreses i marketing digital per mantenir-se a la avantguarda en un paisatge d’optimització per a motors de cerca que evoluciona ràpidament.

Nov. 13, 2025, 1:25 p.m.

Snap Inc. Inverteix 400 milions de dòlars en la i…

Snap Inc., la company matriz de Snapchat, ha anunciat una inversió important de 400 milions de dòlars per formar una associació estratègica amb Perplexity AI, una empresa líder en motors de cerca d'IA.

Nov. 13, 2025, 1:15 p.m.

Intel·ligència Artificial per al màrqueting: Eine…

El 17 de setembre de 2025, l’oficina del sud d’Ucraïna de l’Associació Europea de Negocis (EBA) va acollir una sessió en línia molt reveladora centrada en l’impacte transformador de la intel·ligència artificial (IA) en el màrqueting.

Nov. 13, 2025, 9:22 a.m.

El director de tecnologia d'OpenAI, Yann LeCun, c…

Yann LeCun, vicepresident de Meta i principal científic d'AI, una figura destacada en la intel·ligència artificial i pioner a l'empresa, preveu abandonar Meta per iniciar la seva pròpia startup centrada en la intel·ligència artificial.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today