Nova studija otkriva da AI ima poteškoće s čitanjem analognih satova i računanjem datuma u kalendaru

Noveće istraživanje identificiralo je skup zadataka s kojima se ljudi lako snalaze, a s kojima se umjetna inteligencija (AI) muči — posebno čitanje analognog sata i određivanje dana u sedmici za dati datum. Iako AI može generirati kod, slike, tekst gotovo kao čovjek i prolaziti ispite u različitim stupnjevima, često pogrešno tumači pozicije kazaljki na satu i ne uspijeva u osnovnim računalnim zadacima na kalendaru. Studija je predstavljena na Međunarodnoj konferenciji o predstavama učenja (ICLR) 2025. godine i objavljena na preprint serveru arXiv (još nije prošla recenziju), te ističe značajne praznine u mogućnostima AI da izvršava zadatke kojima se ljudi vješto snalaze već u ranom životu. Glavni autor Rohit Saxena sa Univerziteta u Edinburgu naglasio je da je potrebno riješiti te nedostatke kako bi se AI mogao efikasno primijeniti u vremenski osjetljivim i realnim kontekstima poput rasporeda, automatizacije i pomoćnih tehnologija. Istraživači su testirali razne multimodalne velike jezičke modele (MLLM)—među kojima su Meta-ov Llama 3. 2-Vision, Anthropic-ov Claude-3. 5 Sonnet, Google-ov Gemini 2. 0 i OpenAI-jev GPT-4o—koristeći prilagođeni skup podataka s slikama satova i kalendara. Modeli nisu uspjeli tačno identificirati vrijeme na satu ili odrediti dane u sedmici za uzorke datuma više od pola vremena, s tačnošću od samo 38, 7% kod satova i 26, 3% kod zadataka s kalendarom. Saxena je objasnio da loša interpretacija sata od strane AI proizlazi iz nedostatka prostornog razmišljanja—zadataka koji zahtijevaju prepoznavanje preklapajućih kazaljki, mjerenje kutova i interpretaciju raznih dizajna satova, poput rimskih brojeva ili stiliziranih brojčanika. Prepoznavanje slike kao sata lakše je za AI nego njegovo točno čitanje.
Slično tome, iako je aritmetika osnovni dio računarstva, veliki jezični modeli ne izvode izračune putem algoritama; umjesto toga, predviđaju izlazne podatke na temelju uzoraka iz trening podataka. To dovodi do nekonzistentnog i nepravila vođenog razmišljanja, što objašnjava visoke stope neuspjeha kod računanja povezanih s datumima. Ova studija doprinosi rastućim dokazima da se način na koji AI “razumije” temelji na vrlo drugačijem načinu od ljudskog razmišljanja. AI je uspješan kada postoje obilje trening primjera, ali se muči s apstraktnim razmišljanjem i generalizacijom, posebno kod zadataka koji spajaju percepciju s preciznom logikom. Štaviše, ograničeni podaci za treniranje o rjeđim pojavama, poput prijestupnih godina, otežavaju performanse jer AI ne može uspostaviti potrebne konceptualne veze. Ovi nalazi ističu potrebu za bogatijim i ciljanim skupovima podataka te reevaluaciju AI-jevih sposobnosti da integriše logičko i prostorno razmišljanje, naglašavajući rizike od prevelikog oslanjanja na rezultate AI u složenim zadacima. Saxena je naglasio važnost rigoroznog testiranja, mehanizama za povratak u slučaju neuspjeha i često ljudskog nadzora kada je AI zadužen za kombinaciju percepcije i preciznog razmišljanja.
Brief news summary
Nove istraživanja predstavljena na Međunarodnoj konferenciji o predstavama učenja 2025. godine ističu značajna ograničenja sadašnjih modela umjetne inteligencije poput Meta-Llama 3.2-Vision, Anthropic-ovog Claude-3.5 Sonneta, Google-Gemini 2.0 i OpenAI GPT-4o. Uprkos nedavnim naprecima, ovi modeli se bore sa zadacima koji su jednostavni za ljude, poput čitanja analognih satova i odredjivanja dana u sedmici na osnovu datuma. Studija je pokazala da su ovi modeli točno interpretirali vrijeme na satu samo 38,7%, a datume na kalendaru tek 26,3%, čime se ističe njihova oslanjanja na prepoznavanje obrazaca umjesto na prava sposobnost razmišljanja. Vođeno od strane Rohita Saxene sa Univerziteta u Edinburgu, istraživanje otkriva da, iako sistemi AI mogu tačno identificirati objekte, suočavaju se s vidljivim izazovima u složenom prostornom i logičkom razmišljanju, posebno kada je riječ o rješenjima za rijetke događaje poput prestupnih godina. Ovi nalazi naglašavaju potrebu za novim pristupima obuci koji integrišu vještine logičkog i prostornog razmišljanja te upozoravaju na preveliku oslonjenost na AI za zadatke koji zahtijevaju precizne računice. Na kraju, studija ističe temeljne razlike između ljudskog kognitivnog procesa i prepoznavanja obrazaca u AI, zagovarajući široku validaciju i ljudski nadzor u stvarnim, vremenski osjetljivim aplikacijama.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia dobija poticaj u AI-ju, Meta nailazi na pr…
Sljedeće bojno polje u utrci naoružanja umjetnom inteligencijom nije Peking—već Rijad, barem prema Wedbushu.

Javni internet je usko grlo za blockchain — CEO D…
Prema Austinu Federi, suosnivaču i izvršnom direktorom DoubleZero-a—projekta fokusiranog na razvoj visokobrzinskih optičkih komunikacijskih linija za blokchaine—javni internet je glavni razlog usporenja i ograničenja performansi za blockchain mreže visokog prolaza.

Shoosmiths motivira usvajanje umjetne inteligenci…
Na početku prošlog mjeseca, kompanija Shoosmiths, britanska advokatska kancelarija s 1500 zaposlenika, najavila je bonus fond od miliona funti koji će biti podijeljen među zaposlenicima ako zajedno integrišu Microsoftov alat za umjetnu inteligenciju, Copilot, u svoje radne procese.

JP Morgan prvi put realizuje tokeniziranu državnu…
JP Morgan je završio svoju inauguralnu transakciju na javnom blockchainu, što ukazuje na rastuće zanimanje finansijskog giganta za Web3 ekosistem.

AI čipovi su novi 'novac kraljevstva' jer podmazu…
© 2025 Fortune Media IP Limited.

Centralne banke istražuju blockchain kako bi mode…
Centralne banke počinju istraživati kako programabilne tehnologije blockchaina mogu transformisati sprovođenje monetarne politike.

Izložba specijalnih efekata u Star Warsima sa umj…
Ako bude uprava Disney vodstva po svom, bićemo zatrpani beskonačnim remakeovima, nastavcima i spin-offovima iz Star Wars svemira sve dok Sunce ne eksplodira.