Uusi tutkimus paljastaa, että tekoälyllä on vaikeuksia lukea analogisia kelloja ja laskea kalenteripäivämäärien välillä

Uusi tutkimus on tunnistanut joukon tehtäviä, joita ihmiset hoitavat vaivattomasti, mutta tekoäly (AI) kamppailee niiden kanssa—erityisesti analogisten kellojen lukemisessa ja viikonpäivän määrittämisessä tietylle päivämäärälle. Vaikka tekoäly pystyy tuottamaan koodia, kuvia, inhimillisen kaltaista tekstiä ja jopa suoriutumaan kokeista eri vaikutuksin, se tulkitsee usein väärin kellon osoituspisteitä ja epäonnistuu peruskalenterilaskuissa. Vuonna 2025 pidetyssä Kansainvälisessä esitysten oppimisesta (ICLR) -konferenssissa ja julkaistuna preprint-palvelu arXivissä (ei vielä vertaisarvioitu) esitetty tutkimus korostaa merkittäviä aukkoja tekoälyn kyvyssä suorittaa tehtäviä, jotka ihmiset osaavat hallita varhain elämässään. Pääkirjoittaja Rohit Saxena Edinburghin yliopistosta korosti, että näihin puutteisiin on puututtava, jotta tekoälyä voitaisiin käyttää tehokkaasti ajasta riippuvaisissa ja todellisissa sovelluksissa, kuten aikataulutuksessa, automaatiossa ja avustavissa teknologioissa. Tutkijat testasivat useita multimodaalisia suuria kielimalleja (MLLM)—mukaan lukien Meta:n Llama 3. 2-Vision, Anthropicin Claude-3. 5 Sonnet, Googlen Gemini 2. 0 ja OpenAI:n GPT-4o—käyttäen räätälöityä kuvadatana kello- ja kalenterikuvista. Mallit eivät onnistuneet tunnistamaan kellonaikoja tai määrittämään viikonpäiviä esimerkkipäivämäärien kohdalla yli puolessa tapauksista, saavuttaen vain 38. 7 % tarkkuuden kellojen osalta ja 26. 3 % kalenteritehtävissä. Saxena selitti, että AI:n huono kellonlukutaito johtuu sen puutteesta spatiaalisen päättelyn kyvyssä—tehtävissä, jotka vaativat provaamista käsien päällekkäisyyksien, kulmien mittaamisen ja erilaisten kellojen, kuten roomalaisten numeroiden tai tyyliteltyjen kellotaulujen, tulkintaa. Kuvan tunnistaminen kelloksi on AI:lle helpompaa kuin sen tarkka lukeminen. Samoin, vaikka laskenta on olennaista tietojenkäsittelyssä, suuret kielimallit eivät tee laskelmia algoritmien avulla; ne ennustavat sen sijaan tulokset koulutusdatan mallien perusteella.
Tämä johtaa epäjohdonmukaiseen ja sääntöjä vailla olevaan päättelyyn, mikä selittää korkeaa epäonnistumisprosenttia päivämääräperusteisissa laskutoimituksissa. Tämä tutkimus lisää kasvavaa todistusaineistoa siitä, että tekoälyn tapa "ymmärtää" poikkeaa perustavanlaatuisesti ihmisen kognitiosta. Tekoäly pärjää hyvin, kun laajoja koulutusmateriaaleja on saatavilla, mutta sillä on vaikeuksia abstraktissa päättelyssä ja yleistämisessä, erityisesti tehtävissä, joissa yhdistyvät havainnointi ja tarkka logiikka. Lisäksi harvinaisempien ilmiöiden, kuten karkausvuosien, rajallinen koulutusaineisto haittaa suorituskykyä, koska AI ei kykene muodostamaan vaadittavia käsitteellisiä yhteyksiä. Tulokset korostavat tarvetta rikkaammille, kohdennetummille datakoosteille ja AI:n kyvyn uudelleenarviointiin yhdistää loogista ja spatiaalista päättelyä. Lisäksi ne tuovat esiin riskin liiallisesta luottamuksesta AI:n tuottamiin tuloksiin monimutkaisissa tehtävissä. Saxena painotti tarvetta tiukalle testaukselle, varajärjestelmille ja usein ihmisen valvonnalle, kun AI:ta käytetään havainnoinnin ja tarkan päättelyn yhdistämisessä.
Brief news summary
Uuden tutkimuksen, joka esiteltiin vuoden 2025 Kansainvälisessä Oppimisen Esitysten Konferenssissa, nähdään merkittäviä rajoituksia nykyisissä tekoälymalleissa kuten Metan Llama 3.2-Vision, Anthropicin Claude-3.5 Sonnet, Google:n Gemini 2.0 ja OpenAI:n GPT-4o. Huolimatta viimeaikaisista edistysaskeleista nämä mallit kamppailevat tehtävissä, jotka ovat ihmisille yksinkertaisia, kuten anorakellojen lukeminen ja viikonpäivän määrittäminen päivämääristä. Tutkimuksen mukaan nämä mallit tulkitsivat kellonopeudet oikein vain 38,7 % ajasta, ja kalenteripäivät vain 26,3 %, mikä korostaa niiden taipumusta patternien tunnistamiseen eikä todelliseen päättelykykyyn. Rohit Saxenan johtama tutkimus, joka toteutettiin Edinburghin yliopistossa, paljastaa, että vaikka tekoälyjärjestelmät voivat tunnistaa esineitä tarkasti, ne kohtaavat merkittäviä haasteita monimutkaisissa spatialisissa ja loogisissa päättelytehtävissä, erityisesti harvinaisia tapahtumia, kuten karkausvuosia, koskevissa tehtävissä. Tulokset korostavat tarvetta uusille koulutusmenetelmille, jotka yhdistävät loogisen ja spatiaalisen päättelyn taidot, ja varoittavat liiallisesta riippuvuudesta tekoälyyn tehtävissä, jotka vaativat tarkkoja laskelmia. Lopulta tutkimus alleviivaakin perustavanlaatuisia eroja ihmisen kognitionin ja tekoälyn pattern matchingin välillä, ja ehdottaa kattavaa validointia sekä ihmisten valvontaa aikaan kriittisissä todellisen maailman sovelluksissa.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

NFT-trendi: tällä hetkellä suosituimmat kokoelmat…
NFT-markkinat kehittyvät jatkuvasti, ja joissakin kokoelmissa esiintyy lyhytaikaisia vaihteluja niiden arviomittareissa.

Nvidia saa tekoälytuen, Meta kohtaa tekoälyesteen…
Seuraava taistelukenttä tekoälykilpailussa ei ole Peking—vaan Riad, ainakin Wedbushin mukaan.

Julkinen internet on pullonkaula lohkoketjulle — …
Austin Federa, DoubleZero:n (lohkoketjujen nopeaa tiedonsiirtorajapolkia kehittävän hankkeen) perustaja ja toimitusjohtaja, mukaan julkinen internet-infrastruktuuri on pääasiallinen nopeus- ja suorituskyvyn pullonkaula korkeatahtisia lohkoketjuverkoja varten.

Shoosmiths kannustaa tekoälyn käyttöönottoon 1 mi…
Last month alussa Shoosmiths, brittiläinen lakitoimisto, jolla on 1500 työntekijää, ilmoitti jakavansa miljoonan punnan bonussumman henkilöstölleen, mikäli he ottavat yhteisesti käyttöön Microsoftin AI-työkalun, Copilotin, työssään.

JP Morgan ratkaisee ensimmäisen tokenisoidun valt…
JP Morgan on suorittanut ensimmäisen julkiseen lohkoketjuun tehdyn transaktionsa, mikä viestii finanssialan jättiläisen kasvavasta sitoutumisesta Web3-ekosysteemiin.

Tekoälypiisit ovat uusi "vallan kolikko", sillä n…
© 2025 Fortune Media IP Limited.

Keskuspankit tutkivat blokkchainia rahoituspoliti…
Keskuspankit alkavat tutkia, kuinka ohjelmoitavat blockchain-teknologiat voisivat muuttaa rahapolitiikan toteutusta.