lang icon En
May 17, 2025, 9:16 p.m.
3104

Naujas tyrimas atskleidžia, kad dirbtinis intelektas sunkiai susidoroja su analoginių laikrodžių skaitymu ir datų skaičiavimu kalendoriuje

Brief news summary

Naujausi tyrimai, pristatyti 2025 m. Tarptautinėje mokymosi atvaizdų reprezentacijų konferencijoje, pabrėžia reikšmingus dabartinių dirbtinio intelekto modelių, tokių kaip Meta Llama 3.2-Vision, Anthropic Claude-3.5 Sonnet, Google Gemini 2.0 ir OpenAI GPT-4o, apribojimus. Nepaisant nesenų pažangių pasiekimų, šie modeliai susiduria su užduotimis, kurios žmonėms yra labai paprastos, pavyzdžiui, skaityti analoginius laikrodžius ir nustatyti savaitės dieną pagal datą. Tyrimas parodė, kad šie modeliai teisingai interpretavo laikrodžio rodyklių laiką tik 38,7% atvejų, o kalendoriaus datą – tik 26,3%, kas paryškina jų priklausomybę nuo modelių atpažinimo, o ne nuo tikrojo loginio mąstymo gebėjimo. Vadovaujamas Rohito Saxenos iš Edinburgo universiteto, tyrimas atskleidžia, kad nors dirbtinio intelekto sistemos gali tiksliai atpažinti objektus, jos susiduria su ryškiais iššūkiais sprendžiant sudėtingas erdvines ir loginio mąstymo užduotis, ypač įtraukiant neįprastus įvykius, kaip keliamieji metai. Šie rezultatai pabrėžia poreikį naujoms mokymo metodikoms, kurių pagrindą sudarytų loginio ir erdvinio mąstymo įgūdžių integracija, ir perspėja apie per didelę priklausomybę nuo dirbtinio intelekto sprendžiant užduotis, reikalaujančias tikslinių apskaičiavimų. Galiausiai, šis tyrimas išryškina fundamentalias žmogaus pažinimo ir dirbtinio intelekto modelių atitikimo klaidas, skatindamas visapusišką vertinimą ir žmogaus priežiūrą gyvojoje aplinkoje, ypač laiku svarbiuose taikymuose.

Naujiems tyrimams pavyko nustatyti miškinį uždavinių rinkinį, kurį žmonės atlieka be jokių pastangų, tačiau dirbtinis intelektas (DI) su jais susiduria su sunkumais – būtent skaitant analoginius laikrodžius ir nustatant savaitės dieną konkrečia data. Nors DI gali generuoti kodą, vaizdus, žmogaus stiliaus tekstą ir netgi įveikti egzaminus įvairiais būdais, jis dažnai neteisingai interpretuoja laikrodžio rankų padėtį ir nesugeba atlikti pagrindinių kalendoriaus aritmetikos užduočių. Šis tyrimas, pristatytas 2025 metų Tarptautinėje Mokymosi Atvaizdų Konferencijoje (ICLR) ir paskelbtas preprint serveryje arXiv (dar ne peržiūrėtas), paryškina reikšmingas spragas DI gebėjime atlikti užduotis, kurias žmonės įvaldo anksti gyvenimo metais. Pagrindinis autoriaus Rohito Saxenos iš Edinburgo universiteto teigimu, šie trūkumai turi būti pašalinti, kad DI galėtų veiksmingai pritaikyti savo galimybes realiuoju laiku ir gyvenimo situacijose, tokiose kaip tvarkaraščių sudarymas, automatikos sprendimai ir pagalbinės technologijos. Mokslininkai išbandė įvairius daugialypius didelius kalbos modelius (MLLMs) – tarp jų Meta Llama 3. 2-Vision, Anthropic Claude-3. 5 Sonnet, Google Gemini 2. 0 ir OpenAI GPT-4o – naudojant specialiai sukurtą duomenų rinkinį su laikrodžių ir kalendorių vaizdais. Šie modeliai dažnai nesugebėjo tiksliai nustatyti laikrodžio laiko ar išsiaiškinti savaitės dienos pagal pavyzdines datas, tikslumo rodikliai siekė tik 38, 7% laikrodžių ir 26, 3% kalendoriaus užduočių. Saxena paaiškino, kad DI prastas laikrodžio skaitymas kyla iš jo trūkumo erdviniame mąstyme – tai užduotys, reikalaujančios atpažinti persidengiančias rankas, matuoti kampus ir interpretuoti įvairius laikrodžių dizainus, tokius kaip romėniški skaitmenys ar stilizuoti laikrodžių ciferiai. Laikrodžio atpažinimas kaip vaizdo iš esmės yra paprastesnis užtikrinamas DI nei tikslus jo skaitimas.

Panašiai, nors aritmetika yra pagrindinis informacinių technologijų komponentas, dideli kalbos modeliai nesugeba atlikti skaičiavimų naudodamiesi algoritmais; jie apskaičiuoja rezultatus remdamiesi mokymo duomenų modeliais. Tai lemia nuoseklumo stoką ir nesilaiko taisyklių, kas paaiškina aukštą nesėkmių dažnį sprendžiant datos aritmetikos užduotis. Šis tyrimas papildomai sustiprina faktą, kad DI „supratimas“ iš esmės skiriasi nuo žmogaus pažinimo. DI gerai veikia, kai yra gausybė mokymosi pavyzdžių, tačiau sunkiai sekasi abstraktinis mąstymas ir plačioji generalizacija, ypač užduotyse, kuriose susijungia perceptacija ir tiksli logika. Dar blogiau, kad dėl riboto mokymo duomenų kiekio apie retesnius reiškinius, pavyzdžiui, keliamuosius metus, būklė blogėja, nes DI nesugeba atlikti būtinų konceptualių jungčių. Rezultatai pabrėžia būtinybę turėti turtingesnius ir tikslingesnius duomenų rinkinius bei peržiūrėti DI gebėjimą integruoti loginius ir erdvinius mąstymo būdus, nurodydami riziką pernelyg pasikliauti DI rezultatais sudėtingose užduotyse. Saxena pabrėžė, kad būtina taikyti kruopštus testavimą, užsibrėžti atsarginius mechanizmus ir dažnai įsikišti žmogui stebint, kai DI šiai dienai yra patikimas sprendžiant užduotis, reikalaujančias tiek perceptacijos, tiek tiksliojo mąstymo.


Watch video about

Naujas tyrimas atskleidžia, kad dirbtinis intelektas sunkiai susidoroja su analoginių laikrodžių skaitymu ir datų skaičiavimu kalendoriuje

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 12, 2025, 1:42 p.m.

Disney siunčia raštą dėl sustabdymo ir nutraukimo…

Kultinė „Walt Disney“ kompanija pradėjo reikšmingą teisminį veiksmą prieš „Google“, išsiųsdama sustabdymo ir nevykdymo laišką, kaltindama technologijų gigantą pažeidus Disney autorių teisių saugomus turinius, rengiant ir kuriant generatyvius dirbtinio intelekto (DI) modelius be atlygio.

Dec. 12, 2025, 1:35 p.m.

Dirbtinis intelektas ir ateitis paieškos variklio…

Kadangi dirbtinis intelektas (DI) tobulėja ir vis aktyviau integruojasi į skaitmeninį marketingą, jo įtaka paieškos sistemų optimizavimui (SEO) tampa ženkli.

Dec. 12, 2025, 1:33 p.m.

Dirbtinis intelektas: MiniMax ir Zhipu AI planuoj…

MiniMax ir Zhipu AI, dvi lyderiaujančios dirbtinio intelekto įmonės, pranešama, rengiasi viešai būti listinguotos Honkongo akcijų biržoje jau kitų metų sausio mėnesį.

Dec. 12, 2025, 1:31 p.m.

OpenAI paskiria Slack generalinę direktorę Denise…

Denise Dresser, Slack vykdomoji direktorė, planuoja palikti savo pareigas ir tapti OpenAI, įmonės už ChatGPT, vyriausiajų pajamų vadove.

Dec. 12, 2025, 1:30 p.m.

Dirbtinio intelekto vaizdo sintezės technikos ger…

Filmo pramonė patiria didžiulę transformaciją, nes studijos vis dažniau įtraukia dirbtinio intelekto (DI) vaizdo sintezės technologijas, siekdamos pagerinti postprodukcinį darbo eigą.

Dec. 12, 2025, 1:24 p.m.

19 geriausių socialinių tinklų dirbtinio intelekt…

Dirbtinis intelektas revoliucionuoja socialinių tinklų rinkodarą siūlydamas įrankius, kurie supaprastina ir pagerina auditorijos įtraukimą.

Dec. 12, 2025, 9:42 a.m.

Dirbtinio intelekto influencerių socialiniuose ti…

Dirbtinio intelekto sukurtų influencerių atsiradimas socialiniuose tinkluose žymi reikšmingą pokytį skaitmeninėje aplinkoje, sukeldamas plačias diskusijas apie sąžiningumą internetinėse sąveikose ir etines problemas, susijusias su šiomis virtualiomis asmenybėmis.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today