Nová studie odhaluje, že umělá inteligence má potíže s čtením analogových hodin a výpočty dat v kalendáři

Nový výzkum identifikoval soubor úkolů, které lidé zvládají bez problémů, ale umělá inteligence (AI) má s jejich plněním potíže — konkrétně čtení analogových hodinek a určování dne v týdnu podle daného data. Ačkoli AI dokáže generovat kód, obrázky, text podobný lidskému a dokonce složit zkoušky v různé míře, často nesprávně interpretují polohy ručiček na hodinách a nezvládají základní aritmetiku kalendáře. Studie, která byla představena na Mezinárodní konferenci o reprezentacích učení (ICLR) v roce 2025 a publikována na preprintovém serveru arXiv (ještě nepodrobena recenznímu řízení), poukazuje na zásadní mezery v schopnostech AI vykonávat úkoly, jež lidé zvládají již v raném věku. Hlavní autor Rohit Saxena z University of Edinburgh zdůraznil, že tyto nedostatky je nutné řešit, aby bylo možné AI efektivně využívat v časově citlivých a reálných situacích, jako je plánování, automatizace nebo asistenční technologie. Výzkumníci otestovali různé multimodální velké jazykové modely (MLLM), včetně Meta’s Llama 3. 2-Vision, Anthropic’s Claude-3. 5 Sonnet, Google’s Gemini 2. 0 a OpenAI’s GPT-4o, pomocí vlastního souboru dat obsahujícího obrázky hodinek a kalendářů. Modely se ve více než polovině případů nepodařilo správně určit čas na hodinkách nebo určit den v týdnu podle vzorových dat, s úspěšností pouze 38, 7 % u hodin a 26, 3 % u kalendářních úkolů. Saxena vysvětlil, že špatné čtení hodin souvisí s nedostatkem prostorového uvažování u AI — úkoly vyžadující rozpoznání překrývajících se ručiček, měření úhlů a interpretaci různých typů hodinek, jako jsou římské číslice nebo stylizované ciferníky. Rozpoznání obrázku jako hodinek je pro AI jednodušší než jejich přesné čtení.
Podobně, i když je aritmetika základem informatiky, velké jazykové modely nevykonávají výpočty pomocí algoritmů; místo toho předpovídají výstupy na základě vzorů ve svém tréninkovém souboru dat. To způsobuje nesourodé a nereálně odvozené uvažování, což vysvětluje vysokou míru selhání při aritmetických úkolech souvisejících s daty. Tato studie přispívá k narůstajícím důkazům, že způsob „porozumění“ AI je zásadně odlišný od lidské kognice. AI vyniká ve chvílích, kdy má k dispozici bohaté tréninkové vzory, ale má problémy s abstraktním uvažováním a zobecněním, zvláště u úkolů, které kombinují vnímání s přesnou logikou. Navíc omezené množství tréninkových dat o méně běžných jevech, jako jsou přestupné roky, dále brzdí její výkon, protože AI nedokáže navázat potřebné konceptuální spojitosti. Zjištění zdůrazňují potřebu bohatších a cílenějších datových sad a přehodnocení schopností AI začlenit logické a prostorové uvažování, přičemž upozorňují na rizika nadměrného spoléhání se na výstupy AI u složitých úkolů. Saxena klade důraz na nutnost důkladného testování, záložních mechanismů a častého dohledu člověka, když je AI pověřena kombinací vnímání a přesného uvažování.
Brief news summary
Nový výzkum představený na Mezinárodní konferenci o představách učení v roce 2025 poukazuje na významná omezení současných modelů umělé inteligence, jako jsou Meta Llama 3.2-Vision, Anthropic Claude-3.5 Sonnet, Google Gemini 2.0 a OpenAI GPT-4o. Navzdory nedávnému pokroku mají tyto modely problémy s úkoly, které jsou pro člověka jednoduché, například čtení analogových hodin a určování dnů v týdnu z dat. Studie zjistila, že tyto modely správně interpretovaly čas na hodinách pouze u 38,7 % případů a datum v kalendáři jen u 26,3 %, což podtrhuje jejich závislost na rozpoznávání vzorů spíše než na skutečném uvažování. Výzkum vedený Rohitem Saxenou z University of Edinburgh odhaluje, že zatímco systémy AI dokážou přesně identifikovat objekty, mají výrazné potíže s náročnějšími úkoly složitého prostorového a logického uvažování, zejména při řešení méně běžných událostí, například přestupných roků. Zjištění zdůrazňují potřebu nových metod tréninku, které by integrovaly logické a prostorové schopnosti uvažování, a varují před přílišnou závislostí na AI při úkolech vyžadujících přesné výpočty. Nakonec studie poukazuje na základní rozdíly mezi lidskou kognicí a rozpoznáváním vzorů AI a na nutnost důkladného ověřování a lidského dohledu v časově citlivých reálných situacích.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia dostává podporu v oblasti umělé inteligenc…
Další bojiště v závodě ve zbraních AI není Peking — je jím Rijád, alespoň podle Wedbush.

Veřejný internet je pro blockchain závažnou brzdo…
Podle Austina Federy, spoluzakladatele a generálního ředitele DoubleZero – projektu zaměřeného na vývoj vysokorychlostních optických komunikací pro blockchainy – je veřejná internetová infrastruktura hlavní překážkou rychlosti a výkonu u blockchainových sítí s vysokým objemem dat.

Shoosmiths motivuje přijetí umělé inteligence bon…
Na začátku minulého měsíce oznámila společnost Shoosmiths, britská advokátní kancelář s 1500 zaměstnanci, že vytvoří bonusový fond ve výši 1 milion liber, který budou sdílet mezi pracovníky, pokud se kolektivně rozhodnou začlenit do své práce AI nástroj Microsoft Copilot.

JP Morgan uzavřel první tokenizovanou transakci s…
JP Morgan dokončila svou první transakci na veřejném blockchainu, čímž signalizovala rostoucí zapojení finančního giganta do ekosystému Web3.

AI čipy jsou novým „měnou světa“, protože usnadňu…
© 2025 Fortune Media IP Limited.

Hospodářské ústavy zkoumají blockchain pro modern…
Centrální banky začínají zkoumat, jak by mohly programovatelné blockchainové technologie transformovat implementaci měnové politiky.

Prehlídka speciálních efektů AI ve Star Wars byla…
Pokud má vedení Disney své way, budeme zahlcení nesčetnými rebooty, pokračováními a spin-offy Star Wars, dokud nakonec Slunce nevybuchne.