Új tanulmány szerint az MI nehezen boldogul az analóg órák olvasásával és a naptárbeli dátumok számításával

Új kutatás azonosított olyan feladatokat, amelyeket az emberek könnyedén elvégeznek, de a mesterséges intelligencia (MI) nehezen tud megbirkózni velük – különösen az analóg órák olvasásával és a hét napjának meghatározásával adott dátum esetén. Bár az MI képes kódokat, képeket, emberhez hasonló szövegeket generálni, sőt vizsgákat is sikeresen letesz különböző szinteken, gyakran tévesen értelmezi az órák mutatóinak helyzetét és alapvető naptárműveleteket is hibázik. Az 2025-ös Nemzetközi Tanulási Megjelenítések Konferenciáján (ICLR) bemutatott, az arXiv preprint szerveren publikált (még nem peer-reviewed) tanulmány kiemeli az MI képességeiben mutatkozó jelentős hiányosságokat, amelyek azokat a feladatokat érintik, amelyeket az emberek már fiatal korban magabiztosan elsajátítanak. Rohit Saxena, az Edinburghi Egyetem vezető szerzője hangsúlyozta, hogy ezeket a hiányosságokat fel kell tárni, hogy az MI hatékonyan alkalmazható legyen olyan időérzékeny és való életbeli kontextusokban, mint a tervezés, az automatizálás vagy az asszisztens technológiák. A kutatók különböző multimodális nagyméretű nyelvi modelleket (MLLM-eket) teszteltek – többek között a Meta Llama 3. 2-Vision, az Anthropic Claude-3. 5 Sonnet, a Google Gemini 2. 0 és az OpenAI GPT-4o modelleket – saját készítésű órás és naptárképekkel szemben. A modellek több mint fele nem tudta helyesen felismerni az óra időpontját vagy a hét napját a mintadátumokon, mindössze 38, 7%-os pontossággal a órák esetében és 26, 3%-kal a naptári feladatoknál. Saxena kiemelte, hogy az MI gyenge óraszámolási képességeinek hátterében az áll, hogy nem rendelkezik térbeli érvelési képességekkel – olyan feladatokkal, amelyek az átfedő mutatók és szögmérések észlelését, valamint a különböző óraformátumok, például római számok vagy stilizált számlapok felismerését igénylik. Egy kép óragyaként való felismerése könnyebb az MI számára, mint pontosan olvasni.
Hasonlóképpen, bár az aritmetika alapvető szerepet tölt be a számítástechnikában, a nagy nyelvi modellek nem algoritmusok segítségével végzik a számításokat; inkább a tanulási adatok mintázataiból próbálják megjósolni az eredményeket. Ez a megközelítés következetlen és nem szabályalapú érveléshez vezet, ami magas kudarcarányokat eredményez az időhöz kötött műveletek esetében. Ez a tanulmány tovább növeli azokat a bizonyítékokat, hogy az MI „értelmezése” alapvetően eltér az emberi kogníciótól. Az MI akkor performál jól, amikor sok példán keresztül tanult, de nehezebb vele az absztrakt érvelés és a generalizálás, különösen azokban a feladatokban, amelyek a percepciót és a precíz logikát ötvözik. Emellett a ritkább jelenségekről, például szökőévekről rendelkezésre álló korlátozott adatok miatt az MI gyengébben teljesít, mivel nem képes megfelelően összekapcsolni a fogalmakat. A megállapítások hangsúlyozzák, hogy szükség van gazdagabb, célzott adatkészletekre, illetve az MI képességeinek újraértékelésére, különösen a logikus és térbeli érvelés integrálásában, valamint arra is, hogy figyelmeztessenek az túlzott megbízás kockázataira az összetett feladatok végrehajtásában. Saxena kiemelte, hogy szigorú tesztekre, biztonsági mechanizmusokra és gyakran emberi felügyeletre van szükség, amikor az MI-t a percepciót és az abszolút logikai műveleteket együttesen kell alkalmazni.
Brief news summary
Az 2025-ös Nemzetközi Tanulási Kifejezésekről Szóló Konferencián bemutatott új kutatás kiemeli a jelenlegi AI-modellek, például a Meta Llama 3.2-Vision, az Anthropic Claude-3.5 Sonnet, a Google Gemini 2.0 és az OpenAI GPT-4o jelentős korlátait. A legújabb fejlesztések ellenére ezek a modellek nehezebben teljesítenek az olyan feladatokban, amelyek az emberek számára egyértelműek, például analóg órák olvasásában és a hét napjának megállapításában dátum alapján. A tanulmány szerint ezek a modellek csak 38,7%-ban értelmezték helyesen az időt az órán, és csak 26,3%-ban a naptári dátumokat, ami hangsúlyozza, hogy ezek inkább mintázatfelismerésen alapulnak, mint valódi érvelő képességeken. Rohit Saxena vezetésével az Edinburgh-i Egyetemről származó kutatás feltárja, hogy bár az AI-rendszerek pontossággal képesek azonosítani tárgyakat, jelentős kihívásokkal szembesülnek bonyolult térbeli és logikai érvelési feladatokban, különösen olyan ritka események esetén, mint a szökőévek. Az eredmények hangsúlyozzák az új tréningmódszerek szükségességét, amelyek magukban foglalják a logikai és térbeli érvelési készségek fejlesztését, valamint figyelmeztetnek arra, hogy ne legyünk túlságosan függőek az AI-tól olyan feladatokban, amelyekhez pontos számításokra van szükség. Végső soron a tanulmány rámutat az emberi gondolkodás és az AI mintázatfelismerése közötti alapvető különbségekre, hangsúlyozva a összetett értékelési és emberi felügyelet fontosságát a valós idejű, időérzékeny alkalmazásokban.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Az Nvidia AI-fejlesztéssel erősít, a Meta AI-akad…
A következő harctér az AI fegyverkezési versenyben nem Peking, hanem Rijád, legalábbis a Wedbush szerint.

A nyilvános internet szűk keresztmetszet a blokkl…
Austin Federa, a DoubleZero társalapítója és ügyvezető igazgatója—egy olyan projekt, amely magas sebességű optikai kommunikációs sínrendszerek kifejlesztésére fókuszál a blokkláncok számára—nyilvános internetes infrastruktúrát tartja a legfőbb sebességi és teljesítménybeli szűk keresztmetszetnek a nagy adatátviteli igényű blokklánc hálózatok esetében.

A Shoosmiths 1 millió fontos bónusszal ösztönzi a…
Az elmúlt hónap elején a Shoosmiths, egy brit jogi cég 1500 munkatárssal, bejelentett egy egymillió fontos bónusz alapot, amelyet a munkatársak között osztanak szét, amennyiben közösen alkalmazzák a Microsoft által fejlesztett AI eszközt, a Copilotot a munkafolyamataikban.

Az első tokenizált kincstári tranzakciót rendezi …
A JP Morgan befejezte első tranzakcióját egy nyilvános blokkláncon, jelezve a pénzügyi óriás növekvő elköteleződését a Web3 ökoszisztéma iránt.

Az AI-chipek az új "birodalmi érme", mivel megkön…
© 2025 Fortune Media IP Limited.

A központi bankok a blokkláncot vizsgálják a pénz…
A központi bankok elkezdték vizsgálni, hogy a programozható blokklánc-technológiák hogyan alakíthatják át a monetáris politika végrehajtását.

A CsillagokHáborúja mesterséges intelligencia kül…
Ha a Disney vezetése a saját útját követi, akkor folyamatosan Star Wars rebootok, folytatások és spinoffok özönében fogunk lubickolni, amíg a Nap végül fel nem robban.