Utafiti Mpya Unaonyesha AI Inakumbwa na Changamoto za Kusoma Saa za Kiasa na Hesabu za Tarehe za Kalenda

Utafiti mpya umegundua seti ya kazi ambazo binadamu huzitekeleza kwa urahisi lakini akili bandia (AI) huishiwa nguvu nazo—hususani kusoma saa za analogi na kubaini siku ya wiki kwa tarehe fulani. Ingawa AI inaweza kuzalisha msimbo, picha, maandishi yanayofanana na ya binadamu, na hata kufaulu mitihani kwa viwango tofauti, mara nyingi huleta makosa katika kuelewa nafasi za mikono ya saa na kushindwa kufanya hesabu rahisi za kalenda. Utafiti huu uliwasilishwa kwenye Mkutano wa Kimataifa wa Mwaka wa 2025 wa Uwakilishi wa Kujifunza (ICLR) na kuchapishwa kwenye mtandao wa preprint arXiv (bado haujapitiwa na washauri wa muda), umeonyesha mapungufu makubwa katika uwezo wa AI wa kutekeleza kazi ambazo binadamu huzitumia kiurahisi mapema maishani. Mwandishi mkuu Rohit Saxena wa Chuo Kikuu cha Edinburgh alisisitiza kuwa hitilafu hizi ni lazima zitatuliwe ili AI iweze kutumika kwa ufanisi katika muktadha wa wakati wa dharura na wa dunia halisi kama ratiba, uendeshaji wa kiotomatiki, na teknolojia za kusaidia. Wachunguzi walijaribu mifano mbalimbali ya lugha kubwa ya bunifu (MLLMs)—ikiwemo Meta’s Llama 3. 2-Vision, Anthropic’s Claude-3. 5 Sonnet, Google’s Gemini 2. 0, na OpenAI’s GPT-4o—wakitumia dataset maalum la picha za saa na kalenda. Mifano hiyo ilianguka kushindwa kutambua vya usahihi wakati wa kugundua saa au kubaini siku za wiki kwa tarehe zilizochaguliwa zaidi ya nusu ya wakati, kwa viwango vya usahihi vya 38. 7% kwa saa na 26. 3% kwa kazi za kalenda. Saxena alielezea kwamba sababu ya AI kuwa na ugumu wa kusoma saa inatokana na ukosefu wa uwezo wa kufikiri kwa nafasi—kazi zinazohitaji kugundua mikono inayoshiriki, vipimo vya pembe, na tafsiri ya muundo tofauti wa saa, kama herufi za Kigiriki au mizani za kipekee. Kutambua picha kuwa saa ni rahisi kwa AI kuliko kuisoma kwa usahihi.
Vivyo hivyo, ingawa hesabu ni msingi wa kompyuta, mifano mikubwa ya lugha haitekelezi hesabu kwa kutumia algoritimu; badala yake, huchagua matokeo kwa kutegemea mibinafsi ya data ya mafunzo. Hii inaongoza kwa uwezo mdogo wa kufikiri kwa kanuni na kufanya maamuzi yasiyo na mfumo thabiti, na kuelezea kiwango kikubwa cha kushindwa kwenye hesabu zinazohusiana na tarehe. Utafiti huu ungeongeza ushahidi unaoonyesha kuwa njia AI inayoelewa vitu ni tofauti kabisa na fikra za binadamu. AI huzidiwa na wakati kuna mifano mingi ya mafunzo lakini huishiwa nguvu na mafikira za kielelezo na jumla, hasa kwenye kazi zinazochanganya utambuzi wa kuona na mantiki sahihi. Zaidi ya hayo, ukosefu wa data za mafunzo kuhusu hali zinazojirudia kama mwaka wa kubadilisha (leap years) huzuia utendaji wake, kwani AI huishindwa kufanya uunganisho wa dhahiri unaohitajika. Matokeo haya yanasisitiza umuhimu wa kuwa na seti za data zilizojaa zaidi na za kuelekeza, pamoja na tathmini upya ya uwezo wa AI kuunganisha fikira za mantiki na nafasi, na kuonyesha hatari za kutegemea sana matokeo ya AI kwenye kazi zilizo ngumu. Saxena alisisitiza umuhimu wa kufanya majaribio makali, uwepo wa mifumo ya kuangalia nyuma (fallback mechanisms), na uangalizi wa kibinadamu mara kwa mara wakati AI inahusishwa na kuunganishwa kwa utambuzi wa kuona na fikra sahihi.
Brief news summary
Utafiti mpya uliowasilishwa kwenye Kongamano la Kimataifa la Uchimbaji wa Mfano wa Kujifunza la 2025 unaonyesha mapungufu makubwa katika mifano ya sasa ya AI kama Meta’s Llama 3.2-Vision, Anthropic’s Claude-3.5 Sonnet, Google’s Gemini 2.0, na OpenAI’s GPT-4o. Licha ya maendeleo ya hivi karibuni, mifano hii inakumbwa na matatizo na kazi zinazowahusu wanadamu kwa urahisi, kama kusoma saa za mazingira na kubaini siku za wiki kutoka kwa tarehe. Utafiti ulibaini kuwa mifano hii ilikubaliana na wakati wa saa kwa usahihi mara tu asilimia 38.7 na tarehe za kalenda kwa asilimia 26.3, ikionyesha utegemezi wao kwa utambuzi wa mifumo badala ya uwezo wa kweli wa kufikiri. Utafiti uliongozwa na Rohit Saxena kutoka Chuo Kikuu cha Edinburgh na unaonyesha kuwa, ingawa mifumo ya AI inaweza kutambua vitu kwa usahihi, inakumbwa na changamoto kubwa na kazi za fikira tata za anga za nafasi na mantiki, hasa zinazohusisha matukio yasiyo ya kawaida kama miaka ya arubaini. Matokeo haya yanasisitiza haja ya mbinu mpya za mafunzo zinazojumuisha ujuzi wa fikira za mantiki na za nafasi, na kuonya dhidi ya utegemezi mkubwa kwa AI kwa kazi zinazohitaji hesabu sahihi. Kwa ujumla, utafiti huu unaonyesha tofauti msingi kati ya utambuzi wa binadamu na utambuzi wa mifumo ya AI wa utangamano wa mifumo, na kupendekeza uhakiki wa kina pamoja na uangalizi wa binadamu katika matumizi halisi yanayohitaji uharaka wa wakati.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia kupata msaada wa AI, Meta kukumbwa na kisa…
Hatua ijayo katika mashindano ya silaha za AI si Beijing—ni Riyadh, angalau kulingana na Wedbush.

Mtandao wa umma ni kikwazo kwa blockchain — Mkuru…
Kulingana na Austin Federa, mwanzilishi mwenza na mkurugenzi mkuu wa DoubleZero—mradi unaolenga kuendeleza reli za mawasiliano za nyuzi za fibre zenye kasi ya hali ya juu kwa ajili ya blockchains—miundombinu ya mtandao wa umma ndio kikwazo kikuu cha kasi na utendaji wa mitandao ya blockchain yenye uwezo mkubwa.

Shoosmiths Inahamasisha Utumiaji wa AI kwa Ziada …
mwanzoni mwa mwezi uliopita, Shoosmiths, kampuni ya sheria ya Uingereza iliyoajiri wafanyakazi 1,500, iliweka mfuko wa bonasi wa pauni milioni 1 ili kugawanywa kati ya wafanyakazi ikiwa wataungana kwa pamoja kutumia chombo cha AI cha Microsoft, Copilot, katika mchakato wao wa kazi.

JP Morgan Inalipa Malipo Ya Kwanza Ya Manunuzi Ya…
JP Morgan imemaliza shughuli yake ya kwanza kwenye blockchain ya umma, ikiwa ni ishara ya kuongezeka kwa ushiriki wa kampuni kubwa ya kifedha katika mfumo wa Web3.

Vijidudu vya AI ni dhamana mpya ya mamlaka ikizin…
© 2025 Fortune Media IP Limited.

Benki Kuu Zinatumia Teknolojia ya Blockchain Kubo…
Benki Kuu zinaanza kuchunguza jinsi teknolojia za blockchain zinazoweza kuandikwa kwa mpangilio zinaweza kubadilisha utekelezaji wa sera ya fedha.

Maonyesho ya Athari Maalum za AI za Star Wars Yal…
Ikiwa uongozi wa Disney utatoa uamuzi wake, tutazidiwa na kurejeshwa, masharti, na vichekesho vya Star Wars vitakavyokuwa na wingi hadi Jua litakapoongezeka.