lang icon En
Nov. 8, 2024, 2:14 p.m.
3998

AI vita módszer javítja az ítélet pontosságát összetett feladatokban.

Brief news summary

2023 februárjában aggodalmak merültek fel az AI pontosságával kapcsolatban, amikor a Google AI chatbotja, Bard, hibát követett el a James Webb űrteleszkóppal kapcsolatban. A Purdue Egyetem tanulmánya azt is jelezte, hogy a ChatGPT programozási válaszainak több mint fele helytelen volt. Noha az ilyen hibák jelenleg észlelhetők, a szakértők, mint például Julian Michael az NYU-tól, aggódnak amiatt, hogy a jövőbeni AI modellek bonyolult, ellenőrizhetetlen válaszokat generálnak majd, amelyek alááshatják a bizalmat. Megoldás lehet, ha az AI modellek vitáznak egymással, segítve egy emberi vagy AI bírót az igazság megállapításában. Az Anthropic és a Google DeepMind kutatásai szerint a modellek viták általi képzése növelheti a pontosságot. Azonban továbbra is kihívások jelentkeznek, mint például az elfogultság, a megbízhatóság különböző feladatokban és az emberi értékekkel való összehangolás. E problémák ellenére az AI vitákkal és felügyeleti módszerekkel kapcsolatos kísérletek reményt adnak az AI megbízhatóságának javítására. A kutatók optimisták, hogy az AI viták jelentősen hozzájárulhatnak a jövőbeli AI biztonsághoz és összehangoláshoz.

2023 februárjában a Google AI csevegőrobotja, Bard, tévesen állította, hogy a James Webb Űrteleszkóp készítette az első képet egy exobolygóról, hasonló hibákat mutatva, mint amilyeneket az OpenAI ChatGPT-jében fedeztek fel a Purdue Egyetem kutatói egy tanulmány során, ahol több mint 500 programozási lekérdezés felére pontatlan válasz született. Bár ezek a hibák jelenleg észlelhetők, a szakértők aggodalmukat fejezik ki amiatt, hogy ahogy az AI modellek bonyolultabbá válnak, egyre nehezebb lesz megkülönböztetni az igazságot a félretájékoztatástól. Julian Michael, az NYU-tól, kiemeli az AI rendszerek felügyeletének nehézségeit az emberi kapacitást meghaladó területeken. Az egyik javasolt megoldás az, hogy két nagy AI-modell vitázzon egymással, egy egyszerűbb modell vagy ember pedig eldönti a pontosabb végeredményt. Az ötlet először hat évvel ezelőtt merült fel; azonban az Anthropic és a Google DeepMind legújabb tanulmányai kezdeti empirikus bizonyítékokat kínálnak arra, hogy az LLM viták segíthetnek az igazság megkülönböztetésében. A megbízható AI rendszerek létrehozása az igazodás része, amely biztosítja, hogy az AI osztozzon az emberi értékeken. Jelenlegi igazodás az emberi visszajelzéstől függ, de a skálázható felügyelet – amely biztosítja az AI pontosságát az emberi képességeken túl – szükséges, ahogy az AI fejlődik. A 2018 óta vizsgált vita ezt a skálázható felügyeletet kezeli. Az eredetileg az OpenAI-nál dolgozó Geoffrey Irving által javasolt technika magában foglalja, hogy két AI modell vitat meg egy kérdést, hogy meggyőzzön egy külső bírót azok helyességéről. Bár az 2018-as kezdetleges tesztek arra utaltak, hogy a vita működhet, az ember szubjektív megítélési hajlamának és az értékelési képességek eltérésének tudatossága továbbra is aggodalmat jelentett.

Olyan kutatók, mint Amanda Askell, az emberi döntéshozatal megértését érvelik elengedhetetlennek az AI emberi értékekhez való hatékony igazítása érdekében. Az ellentmondásos kezdeti eredmények ellenére az új tanulmányok potenciált jeleznek. Az Anthropic tanulmánya kimutatta, hogy az LLM viták jelentősen javították a nem szakértő bírók pontosságát, 54%-ról 76%-ra emelve azt. A Google DeepMind hasonló kísérletei megerősítették, hogy a vita növelte a pontosságot különféle feladatok során. Zachary Kenton szerint mindkét oldal megismerése több információt nyújt a bíróknak, ami pontosabb következtetéseket eredményez. Azonban továbbra is fennállnak kihívások, például a jelentéktelen vitaelemek hatása és az olyan elfogultságok, mint a hízelgés, ahol az AI pontatlanul visszhangozhatja a felhasználói preferenciákat. Emellett a tesztekben fixen megállapított jó vagy rossz válaszok nem biztos, hogy átválthatók a komplex, árnyalt valós helyzetekre. Az AI viselkedésének megértése és annak azonosítása, hogy az AI rendszerek hol lépik túl a bírók ismereteit, kulcsfontosságú az ezekhez a módszerekhez kapcsolódó fejlődéshez és alkalmazáshoz, amint azt Irving megjegyezte. Ezek ellenére a viták empirikus sikere ígéretes előrelépést jelent az AI megbízhatóságának és igazodásának javítása felé.


Watch video about

AI vita módszer javítja az ítélet pontosságát összetett feladatokban.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 17, 2026, 5:24 a.m.

A TechSmith 2024-es Videónéző Kutatása megállapít…

A TechSmith Corporation, a vezető vállalat a vizuális kommunikációban, kiadta a 2024-es Videónéző Kutatását, amely egy átfogó jelentés a globális nézői elkötelezettségről és preferenciákról oktató- és információs videók esetében.

Feb. 17, 2026, 5:16 a.m.

Mesterséges intelligencia a frontvonalon: az érté…

Syntrózis A mesterséges intelligencia (MI) átalakítja az értékesítési csapatokat Indiában, nemcsak a vezetőket, hanem az elsővonalbeli dolgozókat is fel empowerálva

Feb. 17, 2026, 5:15 a.m.

A Meta Platforms bejelentette, hogy 10 milliárd d…

2025 júniusában a Meta Platforms Inc.

Feb. 16, 2026, 1:26 p.m.

A ByteDance megígéri, hogy szigorítja új AI-alapú…

A ByteDance kevesebb mint egy héttel ezelőtt kiadta a Seedance 2.0-t, ami világszerte felháborodást váltott ki művészek körében egy vírusvideóval, amelyben Tom Cruise-t és Brad Pittet látjuk harcolni, és amelyet mesterséges intelligencia generált.

Feb. 16, 2026, 1:24 p.m.

Egy mesterséges intelligencia hangrögzítő, ami el…

Az irodai dolgozók ideális forgatókönyve az, hogy egyszerűen megnyomnak egy gombot egy eszközön, amely felveszi az értekezleteket, átírja a beszélgetéseket, és átalakítja azokat intézkedésre váró feladatokká.

Feb. 16, 2026, 1:21 p.m.

A Microsoft mesterséges intelligenciával vezérelt…

A Microsoft hivatalosan is beépítette az AI-alapú Copilot segédet széles körben használt Office Csomagjába, ami jelentős lépést jelent a felhasználói interakciókban a produktivitási szoftverekkel.

Feb. 16, 2026, 9:26 a.m.

Seedance 2.0

A Seedance 2.0 egy élvonalbeli kép-ről-videóra és szöveg-ről-videóra modell, amelyet a ByteDance technológiai vállalat hozott létre.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today