lang icon Icelandic
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
2

Ný rannsókn sýnir að gervigreind berst við að lesa analog klukku og reikna dagsetningar í dagatali

Ný rannsókn hefur greint frá safni verkefna sem menn ná að leysa án mikillar fyrirhafnar en gervigreind (AI) á í erfiðleikum með—sérstaklega að lesa stiklur og ákvarða dag vikunnar fyrir ákveðinn dagsetningu. Þó að AI geti framleitt kóða, myndir, mannlegt texta og jafnvel unnið próf á mismunandi stigum, villa hún oft heiminn um staðsetningu klukkuhjóla og tekst ekki á við einfaldar dagbókarreikningar. Rannsóknin, sem var kynnt á alþjóðlegri ráðstefnu um námsskýringar (ICLR) árið 2025 og birt á fyrirprófunarvefnum arXiv (ekki jafnóðum fengin til yfirlestrar), undirstrikar stórt bil í getu AI til að leysa verkefni sem menn kunna snemma í lífinu. Aðalhöfundur, Rohit Saxena, frá Háskólanum í Edinborg, lagði áherslu á að þessi göllum verði að menda áður en hægt er að nýta AI í kjölfar tímafrekum og raunverulegum samhengi eins og dagatal, sjálfvirkni og hjálpartækni. Rannsakendur prófuðu ýmsar margmiðlunarmyndaðar stórtungutölvur (MLLMs)—þar á meðal Meta’s Llama 3. 2-Vision, Anthropic’s Claude-3. 5 Sonnet, Google’s Gemini 2. 0 og OpenAI’s GPT-4o—með sérsniðnu safni af klukku- og dagatalssögum. Tölvurnar misstu oft af réttum tíma á klukkunni eða dagsetningar, með nákvæmnisstigum aðeins 38, 7% fyrir klukkuverkefni og 26, 3% fyrir dagatalsverkefni. Saxena útskýrði að lélegur lestur klukku stafi af skorti á rýmisrökum (spatial reasoning)—verkefnum sem fela í sér að greina yfirlappandi hendur, hornamælingar og túlka mismunandi útlit klukku, eins og Rómverskar tölur eða stílesskífur. Að þekkja mynd sem klukku er auðveldara fyrir AI en að lesa hana rétt.

Því aukar reikningi, sem er grunnur af reikniformúlum tölvu, þrátt fyrir að stórtungutölvur hafi ekki eigin reiknireglur heldur spá þær útkömum út frá mynstur í þjálfunargögnum. Þetta leiðir til ósamræmis og óaðfinnanlegrar hugsunar, sem skýrir háa mistökahlutfall í reikningum tengdum dagsetningum. Þessi rannsókn bætir við vaxandi sönnun um að "skilningur" AI er grundvallar munur á því sem menn gera og því sem tölvur geta. AI skorar vel þegar mikið af þjálfunargögnum er til staðar en glímir við óhlutbundna hugsun og almennan skilning, sérstaklega í verkefnum sem fela í sér samruna þekkingar og nákvæmrar rökhugsunar. Takmarkað gögn um sjaldgæf fyrirbæri eins og hléársýningar herma því um litla nákvæmni og færri fræðslu um þessi málefni. Niðurstöðurnar undirstrika nauðsyn þess að safna ríkari og markvissari gagnasöfnum og endurskoða getu AI til að samþætta rökhugsun og rýmisgreiningu, þar sem aukin áhersla á hættuna á ofalárás á afurðir AI í flóknum verkefnum. Saxena lagði áherslu á að nauðsynlegt sé að prófa AI í nákvæmari prófunum, hafa bakvörður og oft mannlegt eftirlit þegar AI er sett í hlutverk sem krefst bæði skynjunar og nákvæmrar röksemdar.



Brief news summary

Ný rannsókn sem kynnt var á alþjóðlegu ráðstefnunni um táknmyndir náms árið 2025 leggur áherslu á verulegar takmarkanir í núverandi gervigreindarmódelum eins og Meta’s Llama 3.2-Vision, Anthropic’s Claude-3.5 Sonnet, Google’s Gemini 2.0 og OpenAI’s GPT-4o. Þrátt fyrir nýlegar framfarir glímu þau við verkefni sem eru einföld fyrir menn, svo sem að lesa göng á klukku og ákveða daga frá dagsetningum. Rannsóknin sýndi að þessi módel túlkuðu klukkutíma rétt aðeins í 38,7% tilfella og dagsetningar í 26,3%, sem undirstrikar að þau treysta meira á mynsturþekkingu en raunverulega rökhugsun. Rannsóknin, sem var leiðir af Rohit Saxena frá Háskólanum í Edinborg, sýnir að þó að gervigreindarkerfin geti þekkt hluti nákvæmlega, eru þau mjög takmörkuð þegar kemur að flóknum rýmis- og rökhugmyndum, sérstaklega í tengslum við óvenjuleg atvik eins og fjölkvæmissumar. Niðurstöðurnar undirstrika þörfina á nýjum þjálfunaraðferðum sem samþætta rökhugsun og rýmisskilning og varpa ljósi á hættuna á ofáliti á gervigreind fyrir verkefni sem krefjast nákvæmra útreikninga. Að lokum benda rannsóknin á grundvallarmun á milli mannsins og gervigreindar þegar kemur að mynstragjöf og rökhugsun, og leggja áherslu á nauðsyn þess að framkvæma ítarlega staðfestingu og hafa mannlega eftirlit í tímaskyni við raunveruleg verkefni.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia fær AI kvikunar, Meta lendast á AI viðnámi…

Næsta vígvöllur í vopnavetri á gervigreindarsviðinu er ekki Peking—it er Ríadó, að minnsta kosti samkvæmt Wedbush.

May 18, 2025, 2:23 a.m.

Opinber internett er lokauppspretta fyrir blokkke…

Samkvæmt Austin Federa, meðstofnanda og forstjóra DoubleZero – verkefnis sem einbeitir sér að þróun á háhraða ljósleiðarasamskiptum fyrir blokkarit – er almennan internetið aðal hindrunin fyrir hraða og afköst fyrir blockchain-netkerfi með mikla umferð.

May 18, 2025, 1:30 a.m.

Shoosmiths hvetur til notkunar á gervigreind með …

Í upphafi síðasta mánaðar tilkynnti Shoosmiths, breskt lögfræðifyrirtæki með 1.500 starfsmenn, um 1 milljón punda bónusauðlind sem átti að deila meðal starfsfólks ef þau samþykktu sameiginlega að innleiða gervigreindartól Microsoft, Copilot, í vinnuferla sína.

May 18, 2025, 12:37 a.m.

JP Morgan semur fyrsta táknbundna fjárfestingavið…

JP Morgan hefur lokið fyrstu viðskiptum sínum á opinberum blokkkeðju, sem sýnir aukna þátttöku fjármálastofnunarinnar í Web3 efnahagskerfinu.

May 18, 2025, 12:13 a.m.

Gervigreindarflæðilitir eru nýja „mynt í ríkjunum…

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

Seðlabankar kanna blokkakeðju til að nýsköpun fjá…

Seðlabankar eru að byrja að rannsaka hvernig forritanleg tækni í blokkkeðjum gæti umbreytt framkvæmd peningamála.

May 17, 2025, 10:51 p.m.

Sjónræna sýningin á gervigreindartækni í Star War…

Ef Disney leiðtoga ætla sér að ráða, munum við vera óðum yfirbugaðir af endalausum endurútgáfum, framhaldsmyndum og viðbótum af Star Wars uns sólin til endanots springur.

All news