lang icon Slovenian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
1

Nova študija razkriva, da umetna inteligenca težko prepoznava analogen čas in izračunava datume v koledarju

Nova raziskava je identificirala skupino nalog, s katerimi se ljudje brez težav spopadajo, umetna inteligenca (UI) pa se z njimi težko sooča—zlasti branje analognih ur in določanje dneva v tednu za dan, ki je dan. Čeprav lahko UI generira kodo, slike, besedila, podobna človeku, in opravlja izpite v različno visokem obsegu, pogosto napačno interpretira položaje kazalcev na uri in ne uspe pri osnovnih računskih opravilih s koledarjem. Raziskava, predstavljena na Mednarodni konferenci o predstavitvah učenja (ICLR) 2025 in objavljena na prednainformacijskem strežniku arXiv (še ni recenzirana), poudarja pomembne vrzeli v UI-jevi zmožnosti opravljanja nalog, s katerimi se ljudje srečujejo že zgodaj v življenju. Vodilni avtor Rohit Saxena z Univerze v Edinburghu je poudaril, da je treba te pomanjkljivosti odpraviti, da bi se UI lahko učinkovito uporabljala v časovno občutljivih in resničnih situacijah, kot so razporejanje, avtomatizacija in pomoč pri opravilih. Raziskovalci so preizkusili različne multimodalne velike jezikovne modele (MLLM)—med njimi Meta Llama 3. 2-Vision, Anthropic Claude-3. 5 Sonnet, Google Gemini 2. 0 in OpenAI GPT-4o—s pomočjo prilagojenega nabora podatkov slik ur in koledarjev. Modeli niso uspeli pravilno prepoznati časov na urah ali določiti dni v tednu za vzorčne datume v več kot polovici primerov, z natančnostjo le 38, 7 % pri urah in 26, 3 % pri nalogah s koledarjem. Saxena je pojasnil, da slabo branje ur pri UI izvira iz pomanjkanja prostorskega razmišljanja—nalog, ki zahtevajo prepoznavanje prekrivajočih se kazalcev, merjenje kotov in interpretacijo različnih oblik ur, kot so rimske številke ali stilizirani številčniki. Prepoznavanje slike kot ure je za UI lažje kot njeno natančno branje.

Podobno je, čeprav je aritmetika temeljna za računalništvo, velike jezikovne modele ne izvajajo izračunov preko algoritmov; namesto tega napovedujejo rezultate na podlagi vzorcev v trening podatkih. To vodi v nekonsistentno razmišljanje brez veljavnih pravil, kar pojasnjuje visoko stopnjo neuspehov pri datumskih računskih opravilih. Ta študija dodaja k naraščajočim dokazom, da se način "razumevanja" UI-jebartično bistveno razlikuje od človeškega spoznavanja. UI odlično deluje, kadar obstaja obilica učnih primerov, pa se sooča s težavami pri abstraktnem razmišljanju in sploščenju, še posebej pri nalogah, ki združujejo percepcijo s natančno logiko. Poleg tega omejeni podatki o redkejših pojavih, kot so prestopni leti, otežujejo zmogljivost, saj UI ne more vzpostaviti potrebnih konceptualnih povezav. Rezultati poudarjajo potrebo po bolj bogatih in ciljnih nizih podatkov ter ponovno oceno UI-jevih zmožnosti za integracijo logičnega in prostorskega razmišljanja, kar osvetljuje tveganja prevelikega zanašanja na rezultate UI pri kompleksnih nalogah. Saxena je poudaril, da je nujno izvajati strog testing, vzpostaviti mehanizme za vrnitev in vedno vključevati človeški nadzor pri nalogah, ki zahtevajo kombinacijo percepcije in natančnega razmišljanja.



Brief news summary

Nove raziskave, predstavljene na Mednarodni konferenci o predstavitvah učenja 2025, poudarjajo pomembne omejitve trenutno obstoječih modelov umetne inteligence, kot so Meta Llama 3.2-Vision, Anthropic Claude-3.5 Sonnet, Google Gemini 2.0 in OpenAI GPT-4o. Kljub nedavnim napredkom se ti modeli teško spopadajo z nalogami, ki so za ljudi enostavne, kot so branje ananalognih ur in določanje dnevnikov v tednu iz datumov. Študija je odkrila, da ti modeli pravilno interpretirajo čas na uri le v 38,7 % primerov in datume v koledarju le v 26,3 %, kar poudarja njihovo odvisnost od prepoznavanja vzorcev namesto pravičnega razmišljanja. Raziskavo, ki jo vodi Rohit Saxena z Univerze v Edinburghu, razkriva, da imajo AI sistemi sicer natančno prepoznavanje objektov, vendar se soočajo z očitnimi težavami pri kompleksnih nalogah prostorske in logične razlage, posebej pri obravnavi neobičajnih dogodkov, kot so prestopni leti. Ugotovitve poudarjajo potrebo po novih načinih usposabljanja, ki vključujejo razvoj logičnih in prostorskih razlagalnih sposobnosti, ter opozarjajo na prekomerno zanašanje na umetno inteligenco pri opravilih, ki zahtevajo natančne izračune. Na koncu raziskava izpostavlja temeljne razlike med človeškim razmišljanjem in iskanjem vzorcev v AI ter zagovarja celostno preverjanje in človeški nadzor pri opravljanju nalog, povezanih z vašim časom in v realnem svetu.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia dobi zagon za umetno inteligenco, Meta nal…

Naslednje bojišče v areni tehnološke vojne umetne inteligence ni Peking – temveč Rijad, vsaj po Wedbushu.

May 18, 2025, 2:23 a.m.

Javni internet je oviranje za blockchain — direkt…

Po besedah Austina Federala, sou ustanovitelja in izvršnega direktorja podjetja DoubleZero—projekta, osredotočenega na razvoj visokohitlnih optičnih komunikacijskih tirnic zablockchaine—je javna internetna infrastruktura glavni ozka grloa za visoko zmogljive blockchain mreže.

May 18, 2025, 1:30 a.m.

Shoosmiths spodbuja uporabo umetne inteligence z …

Ob začetku prejšnjega meseca je britanska odvetniška družba Shoosmiths, s 1500 zaposlenimi, najavila 1 milijon britanskih funtov vredno bonitetno skladišče, ki naj bi ga razdelili med zaposlene, če bodo skupno uvedli Microsoftovo orodje za umetno inteligenco, Copilot, v svoje delovne procese.

May 18, 2025, 12:37 a.m.

JP Morgan zaključi prvo tokenizirano transakcijo …

JP Morgan je zaključil svojo prvo transakcijo na javnem blockchainu, kar kaže na vse večje angažiranje finančnega velikana v ekosistem Web3.

May 18, 2025, 12:13 a.m.

AI čipi so novi 'novčič na dvorišču', saj olajšuj…

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

Centralne banke raziskujejo blockchain za posodob…

Centralne banke začenjajo preučevati, kako bi lahko programabilne tehnologije veriženja blokov spremenile izvedbo denarne politike.

May 17, 2025, 10:51 p.m.

Vesoljski filmi» Pokažnica umetne inteligence za …

Če vodstvo Disneyja dobi svoj na­čin, bomo nenehno naletavali na brezštevilne obnovitve, nadaljevanke in spinoffe Vojne zvezd, dokler Sonce ne eksplodira.

All news