lang icon Norwegian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
2

Ny studie viser at AI har vanskeligheter med å lese analoge klokker og beregne kalenderdatoer

Ny forskning har identifisert et sett oppgaver som mennesker håndterer uten problemer, men som kunstig intelligens (KI) sliter med — spesielt å lese analoge klokker og å fastslå ukedag for en gitt dato. Selv om KI kan generere kode, bilder, menneskelignende tekst, og til og med bestå eksamener i varierende grad, misforstår den ofte klokkeslett og feiler i grunnleggende kalenderregning. Studien, som ble presentert på den internasjonale konferansen for læringsrepresentasjoner (ICLR) i 2025 og publisert på preprint-serveren arXiv (enda ikke fagfellevurdert), peker på betydelige hull i KI sin evne til å utføre oppgaver mennesker mestrer tidlig i livet. Hovedforfatter Rohit Saxena ved University of Edinburgh understreket at disse manglene må adresseres for at KI skal kunne brukes effektivt i tidskritiske og virkelige situasjoner som planlegging, automatisering og assistive teknologier. Forskerne testet ulike multimodale store språkmodeller (MLLMs) — inkludert Metas Llama 3. 2-Vision, Anthropics Claude-3. 5 Sonnet, Googles Gemini 2. 0, og OpenAIs GPT-4o — ved hjelp av et tilpasset datasett med bilder av klokker og kalendere. Modellene klarte ikke å identifisere klokkeslett eller fastslå ukedager for utvalgte datoer mer enn halvparten av gangene, med nøyaktighetsgrader på bare 38, 7 % for klokker og 26, 3 % for kalenderoppgaver. Saxena forklarte at KI sin dårlige klokkelesing skyldes mangel på romlig resonnering — oppgaver som krever oppdaging av overlappende visere, måling av vinkler, og tolkning av ulike klokkoper, som romerske tall eller stiliserte skiver. Å gjenkjenne et bilde som en klokke er lettere for KI enn å lese den nøyaktig.

Tilsvarende, selv om aritmetikk er grunnleggende i databehandling, utfører ikke store språkmodeller utregninger gjennom algoritmer; i stedet forutser de utdata basert på mønstre i treningsdataene. Dette fører til inkonsekvent og ikke-regelstyrt resonnering, noe som forklarer høye feilrater på dato-relatert regning. Denne studien bidrar til økende bevis på at KI sin metode for "forståelse" skiller seg fundamentalt fra menneskelig kognisjon. KI er fremragende når det finnes rikelig med treningsdata, men sliter med abstrakt resonnering og generalisering, spesielt på oppgaver som blander persepsjon med presis logikk. Dessuten hemmer begrenset trening på sjeldnere fenomener, som skuddår, ytelsen, fordi KI ikke klarer å gjøre nødvendige konseptuelle koblinger. Funnene understreker behovet for rikere, målrettede datasett og en revurdering av KI sin evne til å integrere logisk og romlig resonnering, og belyser risikoen ved å overlenge tillitten til KI i komplekse oppgaver. Saxena påpekte nødvendigheten av grundige tester, fallback-mekanismer, og ofte menneskelig tilsyn når KI får i oppgave å kombinere persepsjon og nøyaktig resonnering.



Brief news summary

Ny forskning presentert på den internasjonale konferansen for læringsrepresentasjoner i 2025 peker på vesentlige begrensninger i dagens AI-modeller som Metas Llama 3.2-Vision, Anthropic’s Claude-3.5 Sonnet, Googles Gemini 2.0 og OpenAI’s GPT-4o. Til tross for nylige fremskritt sliter disse modellene med oppgaver som er enkle for mennesker, som å lese analoge klokker og finne ut ukedager ut fra datoer. Studien fant at disse modellene riktig tolket klokketider bare 38,7 % av gangene og kalenderdatoer kun 26,3 %, noe som understreker deres avhengighet av mønstergjenkjennelse heller enn ekte resonnementsevner. Ledet av Rohit Saxena fra University of Edinburgh viser forskningen at selv om AI-systemer kan identifisere objekter nøyaktig, står de overfor betydelige utfordringer med komplekse romlige og logiske resonnementoppgaver, spesielt når det gjelder sjeldne hendelser som skuddår. Funnene understreker behovet for nye treningsmetoder som integrerer logiske og romlige resonnementferdigheter, og advarer mot overavhengighet av AI for oppgaver som krever presise beregninger. Til syvende og sist fremhever studien de grunnleggende forskjellene mellom menneskets kognisjon og AI-mønstermatching, og argumenterer for omfattende validering og menneskelig kontroll i tidssensitive, virkelige applikasjoner.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia får et AI-tilskudd, Meta møter en AI-lete,…

Neste slagmark i AI-rushen er ikke Beijing—det er Riyadh, i hvert fall ifølge Wedbush.

May 18, 2025, 2:23 a.m.

Det offentlige internettet er en flaskehals for b…

Ifølge Austin Federa, medgrunnlegger og administrerende direktør i DoubleZero – et prosjekt som fokuserer på å utvikle høyhastighets fiberoptiske kommunikasjonslinjer for blokkjeder – er den offentlige internett-infrastrukturen den viktigste flaskehalsen for hastighet og ytelse i høythastighets blokkjedenettverk.

May 18, 2025, 1:30 a.m.

Shoosmiths oppmuntrer til AI-implementering med e…

På begynnelsen av forrige måned kunngjorde Shoosmiths, et britisk advokatfirma med 1500 ansatte, en bonuspott på 1 million pund som skulle deles blant de ansatte dersom de samlet sett tok i bruk Microsofts AI-verktøy, Copilot, i arbeidsprosessene sine.

May 18, 2025, 12:37 a.m.

JP Morgan gjør opp sin første tokeniserte statsob…

JP Morgan har fullført sin første transaksjon på en offentlig blokkjede, noe som signaliserer den finansielle gigants økende engasjement i Web3-økosystemet.

May 18, 2025, 12:13 a.m.

AI-brikker er det nye 'valutaen i riket' når de s…

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

Kjente sentralbanker utforsker blockchain for å m…

Sentralbanker begynner å undersøke hvordan programmerbare blokkjetteknologier kan forvandle implementeringen av pengepolitikken.

May 17, 2025, 10:51 p.m.

Star Wars' showcase av kunstig intelligens og spe…

Hvis Disney-ledelsen får som de vil, vil vi bli utslitt av endeløse remakes, oppfølgere og spin-offs av Star Wars til solen til slutt eksploderer.

All news