Novo istraživanje otkriva da umjetna inteligencija ima problema s čitanjem analognog sata i računanjem datuma na kalendaru

Nova istraživanja identificirala su skup zadataka s kojima se ljudi bez napora snalaze, ali se umjetna inteligencija (AI) s tim teškoćama suočava — konkretno čitanje analognih satova i određivanje dana u tjednu za zadani datum. Iako AI može generirati kod, slike, tekst sličan ljudskom, pa čak i prolaziti ispite u različitim stupnjevima, često krivo tumači položaj kazaljki na satu i ne uspijeva u osnovnim kalendarskim matematikama. Ova studija, predstavljena na Međunarodnoj konferenciji o reprezentacijama učenja 2025. godine (ICLR) i objavljena na serverskoj platformi arXiv (još nije recenzirana), ističe ozbiljne praznine u sposobnosti AI-a da obavlja zadatke kojima se ljudi već u ranoj dobi snalaze. Glavni autor Rohit Saxena s Filozofskog fakulteta u Edinburghu istaknuo je da je potrebno riješiti te nedostatke kako bi se AI učinkovito primjenjivao u vremenski osjetljivim i stvarnim kontekstima poput zakazivanja, automatizacije i asistivnih tehnologija. Istraživači su testirali razne multimodalne velike jezičke modele (MLLM) — uključujući Meta-in Llama 3. 2-Vision, Anthropic-ov Claude-3. 5 Sonnet, Google-ov Gemini 2. 0 te OpenAI-jev GPT-4o — koristeći prilagođeni skup podataka s slikama satova i kalendara. Ti su modeli u više od polovice slučajeva pogrešno prepoznali vrijeme na satu ili odredili dane u tjednu za uzorke datuma, s točnošću od samo 38, 7% za satove i 26, 3% za zadatke s kalendara. Saxena je objasnio da AI-loše čitanje satova proizlazi iz nedostatka prostornog razmišljanja — zadataka koji zahtijevaju prepoznavanje preklapajućih kazaljki, mjerenje kutova i interpretaciju različitih dizajna satova, poput rimskih brojeva ili stiliziranih brojčanika. Prepoznavanje slike kao sata lakše je za AI od točnog čitanja.
Slično tomu, iako je aritmetika temelj računanja, veliki jezički modeli ne vrše izračune putem algoritama; umjesto toga, predviđaju rezultate na temelju uzoraka u trening podacima. To dovodi do nesistematskog i nepoštujućeg razmišljanja, što objašnjava visoke stope neuspjeha kod date povezane matematike. Ova studija pridonosi rastućim dokazima da način na koji AI „razumije“ značajno differs od ljudske kognicije. AI odlično funkcionira kada postoji velik broj primjera za treniranje, ali ima poteškoća s apstraktnim razmišljanjem i generalizacijom, osobito kod zadataka koji kombiniraju percepciju s preciznom logikom. Nadalje, ograničeni skupovi podataka za rjeđe pojave poput prijestupnih godina otežavaju performanse, jer AI ne može uspostaviti potrebne konceptualne veze. Ovi nalazi ističu potrebu za bogatijim i ciljanim skupovima podataka te za preispitivanjem mogućnosti AI-a da integrira logičko i prostorno razmišljanje, naglašavajući rizike prevelikog oslanjanja na AI izlaze u složenim zadacima. Saxena je istaknuo da je nužno provođenje rigoroznih testova, uvođenje mehanizama za povrat, te redoviti nadzor ljudi u slučajevima kada AI mora kombinirati percepciju i točno razmišljanje.
Brief news summary
Nova istraživanja izložena na Međunarodnoj konferenciji o predstavama učenja 2025. godine ističu značajna ograničenja trenutnih modela umjetne inteligencije kao što su Meta Llama 3.2-Vision, Anthropic Claude-3.5 Sonnet, Google Gemini 2.0 i OpenAI GPT-4o. Unatoč nedavnim naprecima, ovi modeli se bore s zadacima koji su jednostavni za ljude, poput čitanja analognih satova i određivanja dana u tjednu prema datumima. Istraživanje je pokazalo da su ti modeli točno interpretirali vrijeme na satu samo 38,7% slučajeva, a datume u kalendaru tek 26,3%, što ističe njihovu ovisnost o prepoznavanju uzoraka, a ne o pravom zaključivanju. Vođeno od strane Rohita Saxene sa Sveučilišta u Edinburghu, istraživanje otkriva da, iako sustavi umjetne inteligencije mogu točno prepoznati predmete, suočavaju se s izazovima kod složenih zadataka prostornog i logičkog razmišljanja, posebno u vezi s rijetkim događajima poput prijestupnih godina. Nalazi naglašavaju potrebu za novim pristupima obučavanju koji integriraju vještine logičkog i prostornog razmišljanja i upozoravaju na pretjeranu ovisnost o umjetnoj inteligenciji kod zadataka koji zahtijevaju precizne račune. U konačnici, studija ističe temeljne razlike između ljudskog kognitivnog procesa i prepoznavanja uzoraka kod umjetne inteligencije, zagovarajući sveobuhvatnu validaciju i nadzor čovjeka u prakticiranju u stvarnom svijetu gdje je vrijeme ključno.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia dobiva poticaj u području umjetne intelige…
Sljedeće bojno područje u utrci naoružanja umjetnom inteligencijom nije Peking — već Rijad, barem prema Wedbushu.

Javni internet je usko grlo za blockchain — CEO D…
Prema Austinu Federi, suosnivaču i direktorici tvrtke DoubleZero – projektu usmjerenom na razvoj brza komunikacijskih vlakana za blockchain sustave – javna internetska infrastruktura je glavni uska grla brzine i performansi za mreže visokog propusnog opsega.

Shoosmiths potiče usvajanje umjetne inteligencije…
Na početku prošlog mjeseca, tvrtka Shoosmiths, britanski odvjetnički ured s 1500 zaposlenika, najavila je bonus fond od milijun funti koji će biti podijeljen među zaposlenicima ako oni kolektivno usvoje Microsoftov AI alat, Copilot, u svojim radnim procesima.

JP Morgan rješava prvu tokeniziranu trezorsku tra…
JP Morgan je završio svoju prvu transakciju na javnom blockchainu, što ukazuje na sve veće angažiranje financijskog giganta u Web3 ekosustavu.

AI čipovi su novi "kovanica kraljevstva" jer podm…
© 2025 Fortune Media IP Limited.

Središnje banke istražuju blockchain kako bi mode…
Središnje banke počinju istraživati kako bi programabilne tehnologije blockchaina mogle transformirati provođenje monetarne politike.

Prikaz AI specijalnih efekata u Ratovima zvijezda…
Ako vodstvo Disneya bude imalo svoju želju, bit ćemo preplavljeni bezbrojnim prepravkama, nastavcima i spinoffovima Ratova zvijezda sve dok Sunce ne eksplodira.