lang icon En
Sept. 25, 2024, 7:19 a.m.
2739

A tanulmány kimutatja: Az AI chatbotok gyakran helytelen válaszokat adnak

Brief news summary

José Hernández-Orallo által a Valenziai Mesterséges Intelligencia Kutatóintézetből a *Nature*-ben publikált tanulmány az OpenAI GPT-jét, a Meta LLaMA-ját és a BigScience BLOOM-ját is magában foglaló fejlett AI chatbotok teljesítményét vizsgálja. A kutatás komoly problémát emel ki: az elemzett válaszok több mint 60%-a helytelennek vagy kitérőnek bizonyult, ami aggodalmat kelt a felhasználók AI képességeinek megértésével kapcsolatban. A tanulmány több ezer utasítás kiterjedt elemzéséből állt, és kiderült, hogy az olyan modellek, mint a GPT-4 gyakran megpróbálják megválaszolni a bonyolult kérdéseket, növelve a hibák valószínűségét és arra vezetve a felhasználókat, hogy tévesen bízzanak ezekben a pontatlanságokban. Hernández-Orallo azt javasolja, hogy az AI fejlesztők elsődlegesen a pontosságot helyezzék előtérbe az egyszerűbb kérdéseknél, és tanítsák meg a modelleket, hogy kerüljék az túl nehéz kérdések megválaszolását. Bár egyes AI modellek kijelenthetik, hogy nem tudják, gyakran magabiztosan adnak helytelen válaszokat, ami a felhasználók számára az AI rendszerek megbízhatóságának túlértékeléséhez vezethet.

Egy tanulmány három népszerű AI chatbot fejlettebb verzióiról kimutatta, hogy hajlamosak gyakrabban helytelen válaszokat adni, mint beismerni, ha nem tudnak valamit. A kutatás, amelyet José Hernández-Orallo vezetett a Valenziai Mesterséges Intelligencia Kutatóintézetből, a nagyméretű nyelvi modellek (LLM-ek) hibáit elemezte, megjegyezve, hogy míg a pontosság javul a modell méretével és finomításával, a helytelen válaszok aránya is nőtt. Ahelyett, hogy elutasítanák a nehéz kérdéseket, ezek a modellek gyakran válaszokat adnak, ami félrevezető válaszok növekedéséhez vezet. Hernández-Orallo megfigyelte, hogy a chatbotok egyre ügyesebbek abban, hogy tudást utánozzanak valódi megértés nélkül, ezt a jelenséget "ultrakrepidarianizmusnak" nevezzük. Ez azt eredményezheti, hogy a felhasználók túlbecsülik a chatbotok képességeit, ami kockázatokat jelent. A csapat olyan modelleket vizsgált meg, mint az OpenAI GPT-je, a Meta LLaMA-ja és a nyílt forráskódú BLOOM, és értékelte azok pontosságát különböző kérdéstípusok esetében.

Megállapították, hogy még a javított modelleknél is a válaszok több mint 60%-a helytelen vagy alkalmatlan volt. Ráadásul az emberi önkéntesek gyakran helytelenül kategorizálták a helytelen válaszokat helyesként, ami a modellek hatékony felügyeleti képességének hiányát mutatja. A felhasználói megértés javítása érdekében Hernández-Orallo azt javasolja, hogy a fejlesztők javítsák a teljesítményt az egyszerű kérdéseknél, és tanítsák meg a chatbotokat, hogy ne válaszoljanak a nehéz kérdésekre. Ez segítene a felhasználóknak azonosítani, hogy hol megbízható az AI és hol nem. Habár egyes chatbotok elismerhetik a tudásuk hiányát, a modellek nehéz kérdések megválaszolására való nyomása továbbra is jelentős, különösen azoknál, amelyeket általános célokra szánnak.


Watch video about

A tanulmány kimutatja: Az AI chatbotok gyakran helytelen válaszokat adnak

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 16, 2026, 1:26 p.m.

A ByteDance megígéri, hogy szigorítja új AI-alapú…

A ByteDance kevesebb mint egy héttel ezelőtt kiadta a Seedance 2.0-t, ami világszerte felháborodást váltott ki művészek körében egy vírusvideóval, amelyben Tom Cruise-t és Brad Pittet látjuk harcolni, és amelyet mesterséges intelligencia generált.

Feb. 16, 2026, 1:24 p.m.

Egy mesterséges intelligencia hangrögzítő, ami el…

Az irodai dolgozók ideális forgatókönyve az, hogy egyszerűen megnyomnak egy gombot egy eszközön, amely felveszi az értekezleteket, átírja a beszélgetéseket, és átalakítja azokat intézkedésre váró feladatokká.

Feb. 16, 2026, 1:21 p.m.

A Microsoft mesterséges intelligenciával vezérelt…

A Microsoft hivatalosan is beépítette az AI-alapú Copilot segédet széles körben használt Office Csomagjába, ami jelentős lépést jelent a felhasználói interakciókban a produktivitási szoftverekkel.

Feb. 16, 2026, 9:26 a.m.

Seedance 2.0

A Seedance 2.0 egy élvonalbeli kép-ről-videóra és szöveg-ről-videóra modell, amelyet a ByteDance technológiai vállalat hozott létre.

Feb. 16, 2026, 9:24 a.m.

Az IBM Watson Health partnerséget kötött a BioTec…

Az IBM Watson Health részlege stratégiai partnerséget alakított ki a BioTech Innovations-szel, egy vezető biotechnológiai céggel, hogy forradalmasítsák a gyógyszerkutatást fejlett mesterséges intelligencia (MI) technológiák alkalmazásával.

Feb. 16, 2026, 9:19 a.m.

Az Edge Marketing megerősíti az AI-alapú keresési…

Az Edge Marketing bejelentette, hogy nemzetközileg elismert, díjnyertes AI és SEO szakértőt, Luke Goshát, új Search & AI Strategy igazgatóként nevezi ki.

Feb. 16, 2026, 9:16 a.m.

Arról, amit a legtöbb AI értékesítési eszköz nem …

Éveken keresztül az értékesítési technológia azon a feltevésen alapult, hogy a gyorsabb jobb — gyorsabb válaszok, gyorsabb követések és gyorsabb lezárások.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today