lang icon En
May 17, 2025, 9:16 p.m.
3107

Ny undersøgelse afslører, at AI kæmper med at læse analoge urepunkter og beregne kalenderdatoer

Brief news summary

Ny forskning præsenteret på den 2025 Internationale Konference om Lerningsrepræsentationer fremhæver væsentlige begrænsninger i nutidige AI-modeller som Meta’s Llama 3.2-Vision, Anthropic’s Claude-3.5 Sonnet, Google’s Gemini 2.0 og OpenAI’s GPT-4o. Trods nylige fremskridt har disse modeller svært ved opgaver, der er enkle for mennesker, som at aflæse analoge ure og fastlægge ugedage ud fra datoer. Undersøgelsen fandt, at disse modeller korrekt tolke urtimers visning kun 38,7% af tiden og kalenderdatoer blot 26,3%, hvilket understreger deres afhængighed af mønstergenkendelse fremfor ægte ræsonneringsfærdigheder. Ledet af Rohit Saxena fra University of Edinburgh viser forskningen, at selvom AI-systemer kan identificere genstande med præcision, har de signifikante udfordringer med komplekse rumlige og logiske ræsonneringsopgaver, især når det handler om usædvanlige begivenheder som skudår. Resultaterne understreger behovet for nye træningsmetoder, der integrerer logiske og rumlige ræsonneringskompetencer, og advarer mod overdreven afhængighed af AI til opgaver, der kræver præcise beregninger. Endelig fremhæver undersøgelsen de grundlæggende forskelle mellem menneskelig kognition og AI-mønstergenkendelse og går ind for omfattende validering og menneskelig overvågning i tidsfølsomme anvendelser i den virkelige verden.

Ny forskning har identificeret et sæt af opgaver, som mennesker håndterer uden besvær, men som kunstig intelligens (AI) har svært ved—specifikt at læse analoge ure og fastslå ugedagen for en given dato. Selvom AI kan generere kode, billeder, menneskelignende tekst og endda bestå prøver i varierende grad, fejlfortolker den ofte urets visere og fejler i grundlæggende kalenderaritmetik. Studiet, der blev præsenteret på den internationale konference for læringsrepræsentationer (ICLR) i 2025 og offentliggjort på preprint-serveren arXiv (endnu ikke peer-reviewed), fremhæver betydelige mangler i AI’s evne til at udføre opgaver, som mennesker mestrer tidligt i livet. Hovedforfatter Rohit Saxena fra University of Edinburgh understregede, at disse mangler skal adresseres, for at AI kan anvendes effektivt i tidsfølsomme og virkelige kontekster som planlægning, automation og assistiv teknologi. Forskerne testede forskellige multimodale store sprogmodeller (MLLM)—herunder Metas Llama 3. 2-Vision, Anthropic’s Claude-3. 5 Sonnet, Googles Gemini 2. 0 og OpenAI’s GPT-4o—ved hjælp af et speciallavet datasæt med billeder af ure og kalendere. Modellerne formåede ikke at identificere klokkeslæt korrekt eller bestemme ugedage for prøvedatoer over halvdelen af tiden, med nøjagtighedsgrader på blot 38, 7% for ure og 26, 3% for kalenderopgaver. Saxena forklarede, at AI’s dårlige evne til at læse ure skyldes mangel på rumlig ræsonnering—opgaver, der kræver påvisning af overlappende visere, vinkelmålinger og tolkning af forskellige urdesign, som romerske tal eller stiliserede urskiver. At genkende et billede som et ur er lettere for AI end at aflæse det præcist.

På samme måde, selvom aritmetik er grundlæggende for computing, gennemfører store sprogmodeller ikke beregninger via algoritmer; i stedet forudsiger de output baseret på træningsdata-mønstre. Dette fører til inkonsistent og ikke-regelbaseret ræsonnering, hvilket forklarer de høje fiasko rater ved dato-relateret aritmetik. Denne undersøgelse bidrager til den stigende bevidsthed om, at AI’s måde at “forstå” på adskiller sig fundamentalt fra menneskets kognition. AI klarer sig godt, når der findes mange træningseksempler, men har svært ved abstrakt ræsonnering og generalisering, især på opgaver, der blander perception med præcis logik. Endvidere hæmmes præstationen af begrænset træningsdata om sjældnere fænomener, såsom skudår, da AI fejler i at danne de nødvendige konceptuelle forbindelser. Resultaterne understreger behovet for mere målrettede og rigere datasæt samt en genovervejelse af AI’s evne til at integrere logisk og rummelig ræsonnering, og de påpeger risiciene ved at være overafhængig af AI’s output i komplekse opgaver. Saxena understregede behovet for grundige tests, fallback-mekanismer og ofte menneskeligt tilsyn, når AI tildeles opgaver, der kræver kombination af perception og præcis ræsonnering.


Watch video about

Ny undersøgelse afslører, at AI kæmper med at læse analoge urepunkter og beregne kalenderdatoer

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 12, 2025, 1:42 p.m.

Disney sender stop-skrivelse til Google over brug…

The Walt Disney Company har indledt en væsentlig retssag mod Google ved at afgive et stop- og indbringelsesbrev, hvor de anklager tech-giganten for at krænke Disneys ophavsretlige indhold under træning og udvikling af generative kunstig intelligens (AI)-modeller uden at tilbyde kompensation.

Dec. 12, 2025, 1:35 p.m.

AI og fremtiden for søgemaskineoptimering

Efterhånden som kunstig intelligens (AI) udvikler sig og integreres mere og mere i digital markedsføring, bliver dens indflydelse på søgemaskineoptimering (SEO) stadig mere betydningsfuld.

Dec. 12, 2025, 1:33 p.m.

Kunstig intelligens: MiniMax og Zhipu AI-plan for…

MiniMax og Zhipu AI, to førende virksomheder inden for kunstig intelligens, forbereder sig angiveligt på at børsnoteres på Hong Kong Stock Exchange allerede i januar næste år.

Dec. 12, 2025, 1:31 p.m.

OpenAI udpeger Slack-CEO Denise Dresser til Chief…

Denise Dresser, CEO for Slack, er klar til at forlade sin stilling for at blive Chief Revenue Officer hos OpenAI, virksomheden bag ChatGPT.

Dec. 12, 2025, 1:30 p.m.

AI-video synteseteknikker forbedrer filmproduktio…

Filmindustrien oplever en stor transformation, efterhånden som studieproduktionen i stigende grad inkorporerer kunstig intelligens (AI) video-synteseteknikker for at forbedre arbejdsprocesserne i postproduktionen.

Dec. 12, 2025, 1:24 p.m.

De 19 bedste AI-værktøjer til sociale medier til …

AI er revolutionerer markedsføring på sociale medier ved at tilbyde værktøjer, der forenkler og forbedrer Publikumengagement.

Dec. 12, 2025, 9:42 a.m.

AI-influencers på sociale medier: muligheder og e…

Fremkomsten af AI-genererede influencere på sociale medier markerer et væsentligt skift i det digitale miljø, hvilket har udløst brede debatter om ægtheden af online interaktioner og de etiske spørgsmål forbundet med disse virtuelle personer.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today