News
>
Nova študija razkriva, da umetna inteligenca težko prepoznava analogen čas in izračunava datume v koledarju

Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.

Nova študija razkriva, da umetna inteligenca težko prepoznava analogen čas in izračunava datume v koledarju

Nova raziskava je identificirala skupino nalog, s katerimi se ljudje brez težav spopadajo, umetna inteligenca (UI) pa se z njimi težko sooča—zlasti branje analognih ur in določanje dneva v tednu za dan, ki je dan. Čeprav lahko UI generira kodo, slike, besedila, podobna človeku, in opravlja izpite v različno visokem obsegu, pogosto napačno interpretira položaje kazalcev na uri in ne uspe pri osnovnih računskih opravilih s koledarjem. Raziskava, predstavljena na Mednarodni konferenci o predstavitvah učenja (ICLR) 2025 in objavljena na prednainformacijskem strežniku arXiv (še ni recenzirana), poudarja pomembne vrzeli v UI-jevi zmožnosti opravljanja nalog, s katerimi se ljudje srečujejo že zgodaj v življenju. Vodilni avtor Rohit Saxena z Univerze v Edinburghu je poudaril, da je treba te pomanjkljivosti odpraviti, da bi se UI lahko učinkovito uporabljala v časovno občutljivih in resničnih situacijah, kot so razporejanje, avtomatizacija in pomoč pri opravilih. Raziskovalci so preizkusili različne multimodalne velike jezikovne modele (MLLM)—med njimi Meta Llama 3. 2-Vision, Anthropic Claude-3. 5 Sonnet, Google Gemini 2. 0 in OpenAI GPT-4o—s pomočjo prilagojenega nabora podatkov slik ur in koledarjev. Modeli niso uspeli pravilno prepoznati časov na urah ali določiti dni v tednu za vzorčne datume v več kot polovici primerov, z natančnostjo le 38, 7 % pri urah in 26, 3 % pri nalogah s koledarjem. Saxena je pojasnil, da slabo branje ur pri UI izvira iz pomanjkanja prostorskega razmišljanja—nalog, ki zahtevajo prepoznavanje prekrivajočih se kazalcev, merjenje kotov in interpretacijo različnih oblik ur, kot so rimske številke ali stilizirani številčniki. Prepoznavanje slike kot ure je za UI lažje kot njeno natančno branje.

Podobno je, čeprav je aritmetika temeljna za računalništvo, velike jezikovne modele ne izvajajo izračunov preko algoritmov; namesto tega napovedujejo rezultate na podlagi vzorcev v trening podatkih. To vodi v nekonsistentno razmišljanje brez veljavnih pravil, kar pojasnjuje visoko stopnjo neuspehov pri datumskih računskih opravilih. Ta študija dodaja k naraščajočim dokazom, da se način "razumevanja" UI-jebartično bistveno razlikuje od človeškega spoznavanja. UI odlično deluje, kadar obstaja obilica učnih primerov, pa se sooča s težavami pri abstraktnem razmišljanju in sploščenju, še posebej pri nalogah, ki združujejo percepcijo s natančno logiko. Poleg tega omejeni podatki o redkejših pojavih, kot so prestopni leti, otežujejo zmogljivost, saj UI ne more vzpostaviti potrebnih konceptualnih povezav. Rezultati poudarjajo potrebo po bolj bogatih in ciljnih nizih podatkov ter ponovno oceno UI-jevih zmožnosti za integracijo logičnega in prostorskega razmišljanja, kar osvetljuje tveganja prevelikega zanašanja na rezultate UI pri kompleksnih nalogah. Saxena je poudaril, da je nujno izvajati strog testing, vzpostaviti mehanizme za vrnitev in vedno vključevati človeški nadzor pri nalogah, ki zahtevajo kombinacijo percepcije in natančnega razmišljanja.

News source

Brief news summary

Nove raziskave, predstavljene na Mednarodni konferenci o predstavitvah učenja 2025, poudarjajo pomembne omejitve trenutno obstoječih modelov umetne inteligence, kot so Meta Llama 3.2-Vision, Anthropic Claude-3.5 Sonnet, Google Gemini 2.0 in OpenAI GPT-4o. Kljub nedavnim napredkom se ti modeli teško spopadajo z nalogami, ki so za ljudi enostavne, kot so branje ananalognih ur in določanje dnevnikov v tednu iz datumov. Študija je odkrila, da ti modeli pravilno interpretirajo čas na uri le v 38,7 % primerov in datume v koledarju le v 26,3 %, kar poudarja njihovo odvisnost od prepoznavanja vzorcev namesto pravičnega razmišljanja. Raziskavo, ki jo vodi Rohit Saxena z Univerze v Edinburghu, razkriva, da imajo AI sistemi sicer natančno prepoznavanje objektov, vendar se soočajo z očitnimi težavami pri kompleksnih nalogah prostorske in logične razlage, posebej pri obravnavi neobičajnih dogodkov, kot so prestopni leti. Ugotovitve poudarjajo potrebo po novih načinih usposabljanja, ki vključujejo razvoj logičnih in prostorskih razlagalnih sposobnosti, ter opozarjajo na prekomerno zanašanje na umetno inteligenco pri opravilih, ki zahtevajo natančne izračune. Na koncu raziskava izpostavlja temeljne razlike med človeškim razmišljanjem in iskanjem vzorcev v AI ter zagovarja celostno preverjanje in človeški nadzor pri opravljanju nalog, povezanih z vašim časom in v realnem svetu.

Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia dobi zagon za umetno inteligenco, Meta nal…

Naslednje bojišče v areni tehnološke vojne umetne inteligence ni Peking – temveč Rijad, vsaj po Wedbushu.

May 18, 2025, 2:23 a.m.

Javni internet je oviranje za blockchain — direkt…

Po besedah Austina Federala, sou ustanovitelja in izvršnega direktorja podjetja DoubleZero—projekta, osredotočenega na razvoj visokohitlnih optičnih komunikacijskih tirnic zablockchaine—je javna internetna infrastruktura glavni ozka grloa za visoko zmogljive blockchain mreže.

May 18, 2025, 1:30 a.m.

Shoosmiths spodbuja uporabo umetne inteligence z …

Ob začetku prejšnjega meseca je britanska odvetniška družba Shoosmiths, s 1500 zaposlenimi, najavila 1 milijon britanskih funtov vredno bonitetno skladišče, ki naj bi ga razdelili med zaposlene, če bodo skupno uvedli Microsoftovo orodje za umetno inteligenco, Copilot, v svoje delovne procese.

May 18, 2025, 12:37 a.m.

JP Morgan zaključi prvo tokenizirano transakcijo …

JP Morgan je zaključil svojo prvo transakcijo na javnem blockchainu, kar kaže na vse večje angažiranje finančnega velikana v ekosistem Web3.

May 18, 2025, 12:13 a.m.

AI čipi so novi 'novčič na dvorišču', saj olajšuj…

May 17, 2025, 11:10 p.m.

Centralne banke raziskujejo blockchain za posodob…

Centralne banke začenjajo preučevati, kako bi lahko programabilne tehnologije veriženja blokov spremenile izvedbo denarne politike.

May 17, 2025, 10:51 p.m.

Vesoljski filmi» Pokažnica umetne inteligence za …

Če vodstvo Disneyja dobi svoj način, bomo nenehno naletavali na brezštevilne obnovitve, nadaljevanke in spinoffe Vojne zvezd, dokler Sonce ne eksplodira.

All news

Launch Your AI-Powered Business and get clients!

Nova študija razkriva, da umetna inteligenca težko prepoznava analogen čas in izračunava datume v koledarju

News source

Brief news summary

AI-powered Lead Generation in Social Media
and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

AI tekmovalni vojni premik v Riad s forumom ZDA-Švedska o tehnologiji in pomembnimi industrijskimi novicami

Direktor DoubleZero Austin Federa izpostavlja javni internet kot ozko grlo blokchain tehnologije

Odvetniška pisarna Shoosmiths spodbuja uporabo umetne inteligence z bonom v vrednosti 1 milijon funtov za integracijo Microsoft Copilot-a

The Best for your Business

Learn how AI can help your business.
Let’s talk!

Nvidia dobi zagon za umetno inteligenco, Meta nal…

Javni internet je oviranje za blockchain — direkt…

Shoosmiths spodbuja uporabo umetne inteligence z …

JP Morgan zaključi prvo tokenizirano transakcijo …

AI čipi so novi 'novčič na dvorišču', saj olajšuj…

Centralne banke raziskujejo blockchain za posodob…

Vesoljski filmi» Pokažnica umetne inteligence za …

Sales

Marketing

Customer Service

Launch Your AI-Powered Business and get clients!

Nova študija razkriva, da umetna inteligenca težko prepoznava analogen čas in izračunava datume v koledarju

News source

Brief news summary

AI-powered Lead Generation in Social Media and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

AI tekmovalni vojni premik v Riad s forumom ZDA-Švedska o tehnologiji in pomembnimi industrijskimi novicami

Direktor DoubleZero Austin Federa izpostavlja javni internet kot ozko grlo blokchain tehnologije

Odvetniška pisarna Shoosmiths spodbuja uporabo umetne inteligence z bonom v vrednosti 1 milijon funtov za integracijo Microsoft Copilot-a

The Best for your Business

Learn how AI can help your business. Let’s talk!

Nvidia dobi zagon za umetno inteligenco, Meta nal…

Javni internet je oviranje za blockchain — direkt…

Shoosmiths spodbuja uporabo umetne inteligence z …

JP Morgan zaključi prvo tokenizirano transakcijo …

AI čipi so novi 'novčič na dvorišču', saj olajšuj…

Centralne banke raziskujejo blockchain za posodob…

Vesoljski filmi» Pokažnica umetne inteligence za …

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Launch Your AI-Powered Business

Auto-Filling SEO Website as a Gift

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

AI-powered Lead Generation in Social Media
and Search Engines

Learn how AI can help your business.
Let’s talk!