News
>
A tanulmány kimutatja: Az AI chatbotok gyakran helytelen válaszokat adnak

Sept. 25, 2024, 7:19 a.m.

A tanulmány kimutatja: Az AI chatbotok gyakran helytelen válaszokat adnak

Brief news summary

José Hernández-Orallo által a Valenziai Mesterséges Intelligencia Kutatóintézetből a *Nature*-ben publikált tanulmány az OpenAI GPT-jét, a Meta LLaMA-ját és a BigScience BLOOM-ját is magában foglaló fejlett AI chatbotok teljesítményét vizsgálja. A kutatás komoly problémát emel ki: az elemzett válaszok több mint 60%-a helytelennek vagy kitérőnek bizonyult, ami aggodalmat kelt a felhasználók AI képességeinek megértésével kapcsolatban. A tanulmány több ezer utasítás kiterjedt elemzéséből állt, és kiderült, hogy az olyan modellek, mint a GPT-4 gyakran megpróbálják megválaszolni a bonyolult kérdéseket, növelve a hibák valószínűségét és arra vezetve a felhasználókat, hogy tévesen bízzanak ezekben a pontatlanságokban. Hernández-Orallo azt javasolja, hogy az AI fejlesztők elsődlegesen a pontosságot helyezzék előtérbe az egyszerűbb kérdéseknél, és tanítsák meg a modelleket, hogy kerüljék az túl nehéz kérdések megválaszolását. Bár egyes AI modellek kijelenthetik, hogy nem tudják, gyakran magabiztosan adnak helytelen válaszokat, ami a felhasználók számára az AI rendszerek megbízhatóságának túlértékeléséhez vezethet.

Egy tanulmány három népszerű AI chatbot fejlettebb verzióiról kimutatta, hogy hajlamosak gyakrabban helytelen válaszokat adni, mint beismerni, ha nem tudnak valamit. A kutatás, amelyet José Hernández-Orallo vezetett a Valenziai Mesterséges Intelligencia Kutatóintézetből, a nagyméretű nyelvi modellek (LLM-ek) hibáit elemezte, megjegyezve, hogy míg a pontosság javul a modell méretével és finomításával, a helytelen válaszok aránya is nőtt. Ahelyett, hogy elutasítanák a nehéz kérdéseket, ezek a modellek gyakran válaszokat adnak, ami félrevezető válaszok növekedéséhez vezet. Hernández-Orallo megfigyelte, hogy a chatbotok egyre ügyesebbek abban, hogy tudást utánozzanak valódi megértés nélkül, ezt a jelenséget "ultrakrepidarianizmusnak" nevezzük. Ez azt eredményezheti, hogy a felhasználók túlbecsülik a chatbotok képességeit, ami kockázatokat jelent. A csapat olyan modelleket vizsgált meg, mint az OpenAI GPT-je, a Meta LLaMA-ja és a nyílt forráskódú BLOOM, és értékelte azok pontosságát különböző kérdéstípusok esetében.

Megállapították, hogy még a javított modelleknél is a válaszok több mint 60%-a helytelen vagy alkalmatlan volt. Ráadásul az emberi önkéntesek gyakran helytelenül kategorizálták a helytelen válaszokat helyesként, ami a modellek hatékony felügyeleti képességének hiányát mutatja. A felhasználói megértés javítása érdekében Hernández-Orallo azt javasolja, hogy a fejlesztők javítsák a teljesítményt az egyszerű kérdéseknél, és tanítsák meg a chatbotokat, hogy ne válaszoljanak a nehéz kérdésekre. Ez segítene a felhasználóknak azonosítani, hogy hol megbízható az AI és hol nem. Habár egyes chatbotok elismerhetik a tudásuk hiányát, a modellek nehéz kérdések megválaszolására való nyomása továbbra is jelentős, különösen azoknál, amelyeket általános célokra szánnak.

News source

Watch video about

A tanulmány kimutatja: Az AI chatbotok gyakran helytelen válaszokat adnak

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 16, 2026, 1:26 p.m.

A ByteDance megígéri, hogy szigorítja új AI-alapú…

A ByteDance kevesebb mint egy héttel ezelőtt kiadta a Seedance 2.0-t, ami világszerte felháborodást váltott ki művészek körében egy vírusvideóval, amelyben Tom Cruise-t és Brad Pittet látjuk harcolni, és amelyet mesterséges intelligencia generált.

Feb. 16, 2026, 1:24 p.m.

Egy mesterséges intelligencia hangrögzítő, ami el…

Az irodai dolgozók ideális forgatókönyve az, hogy egyszerűen megnyomnak egy gombot egy eszközön, amely felveszi az értekezleteket, átírja a beszélgetéseket, és átalakítja azokat intézkedésre váró feladatokká.

Feb. 16, 2026, 1:21 p.m.

A Microsoft mesterséges intelligenciával vezérelt…

A Microsoft hivatalosan is beépítette az AI-alapú Copilot segédet széles körben használt Office Csomagjába, ami jelentős lépést jelent a felhasználói interakciókban a produktivitási szoftverekkel.

Feb. 16, 2026, 9:26 a.m.

Seedance 2.0

A Seedance 2.0 egy élvonalbeli kép-ről-videóra és szöveg-ről-videóra modell, amelyet a ByteDance technológiai vállalat hozott létre.

Feb. 16, 2026, 9:24 a.m.

Az IBM Watson Health partnerséget kötött a BioTec…

Az IBM Watson Health részlege stratégiai partnerséget alakított ki a BioTech Innovations-szel, egy vezető biotechnológiai céggel, hogy forradalmasítsák a gyógyszerkutatást fejlett mesterséges intelligencia (MI) technológiák alkalmazásával.

Feb. 16, 2026, 9:19 a.m.

Az Edge Marketing megerősíti az AI-alapú keresési…

Az Edge Marketing bejelentette, hogy nemzetközileg elismert, díjnyertes AI és SEO szakértőt, Luke Goshát, új Search & AI Strategy igazgatóként nevezi ki.

Feb. 16, 2026, 9:16 a.m.

Arról, amit a legtöbb AI értékesítési eszköz nem …

Éveken keresztül az értékesítési technológia azon a feltevésen alapult, hogy a gyorsabb jobb — gyorsabb válaszok, gyorsabb követések és gyorsabb lezárások.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today

A tanulmány kimutatja: Az AI chatbotok gyakran helytelen válaszokat adnak

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

A ByteDance jogi visszhangot vált ki az AI eszköz, a Seedance 2.0 kapcsán, amely Disney és Paramount karaktereket használ

Comulytic Note Pro értékelés: mesterséges intelligencia alapú hangfelvevő találkozó- és értékesítési elemzésekhez

A Microsoft beépíti az AI-alapú Copilotot az Office csomagba a termelékenység növelése érdekében

The Best for your Business

Hot news

A ByteDance megígéri, hogy szigorítja új AI-alapú…

Egy mesterséges intelligencia hangrögzítő, ami el…

A Microsoft mesterséges intelligenciával vezérelt…

Seedance 2.0

Az IBM Watson Health partnerséget kötött a BioTec…

Az Edge Marketing megerősíti az AI-alapú keresési…

Arról, amit a legtöbb AI értékesítési eszköz nem …

AI Company

Sales

Marketing

A tanulmány kimutatja: Az AI chatbotok gyakran helytelen válaszokat adnak

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

A ByteDance jogi visszhangot vált ki az AI eszköz, a Seedance 2.0 kapcsán, amely Disney és Paramount karaktereket használ

Comulytic Note Pro értékelés: mesterséges intelligencia alapú hangfelvevő találkozó- és értékesítési elemzésekhez

A Microsoft beépíti az AI-alapú Copilotot az Office csomagba a termelékenység növelése érdekében

The Best for your Business

Hot news

A ByteDance megígéri, hogy szigorítja új AI-alapú…

Egy mesterséges intelligencia hangrögzítő, ami el…

A Microsoft mesterséges intelligenciával vezérelt…

Seedance 2.0

Az IBM Watson Health partnerséget kötött a BioTec…

Az Edge Marketing megerősíti az AI-alapú keresési…

Arról, amit a legtöbb AI értékesítési eszköz nem …

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?