Жаңа зерттеу жасанды интеллекттің әйнек сағаттар мен күнтізбелік даталарды есептеуде қиындық көретінін көрсетті

Жаңа зерттеу адамда оңай орындайтын, бірақ жасанды интеллектке (ЖИ) қиындық туғызатын тапсырмалар жиынтығын анықтады — әсіресе аналог сағаттарды оқып, берілген күнге сәйкес апта күнін анықтау. Ғалымдар код, сурет, адамге ұқсас мәтін жасай алатын ЖИ әртүрлі дәрежеде емтихандардан өтіп, әдетте сағаттың сағат тілі позицияларын дұрыс түсінбедіні және негізгі күнтізбе арифметикасын орындауда жиі қателесетіні белгілі болды. Бұл зерттеу 2025 жылы ұйымдастырылған Халықаралық оқыту ұсынулары конференциясы (ICLR) кезінде ұсынылды және preprint сервері arXiv-де жарияланды (әлі сараптамадан өтпеген). Зерттеу адамның өмірінің ерте кезеңдерінен үйренетін тапсырмаларды ЖИ орындау қабілетінің маңызды кемшіліктерін көрсетті. Эдинбург университетінің жетекші авторы Рохит Сахена бұл кемшіліктерді жою қажеттігін атап өтіп, дұрыс уақытта және нақты әлем жағдайында, мысалы, кестелеу, автоматтандыру және көмектесетін технологияларда ЖИ тиімді қолданылуы үшін бұл мәселелерді шешу маңызды деп атап өтті. Зерттеушілер бірнеше көпмодальды үлкен тілді модельдерді (MLLMs) сынап көрді — оның ішінде Meta компаниясының Llama 3. 2-Vision, Anthropic компаниясының Claude-3. 5 Sonnet, Google-дің Gemini 2. 0 және OpenAI-дің GPT-4o — арнайы жасаған датасет арқылы сағат және күнтізбе суреттерін пайдаланып. Мұндай моделдер тест кезінде сағат уақытын дұрыс анықтай немесе апта күнін дәл анықтай алмаған, олардың келісім деңгейі тек 38, 7% (сағаттарда) және 26, 3% (күнтізбе тапсырмаларында) ғана болды. Сахена түсіндіргендей, ЖИ-дің сағаттарды нашар оқуы оның кеңістік қатынасын түсінбеуінен туындайды — бұл тапсырмалар сағаттың барлық сағат тілі көрсеткіштерін анықтау, бұрыштарды есептеу және түрлі сағат безендірулерін, мысалы, рим сантар немесе стильді циферблаттар арқылы түсінуді талап етеді. Сағат суретін дұрыс тану — ЖИ үшін қиын емес, бірақ оны нақты оқу қиынырақ.
Сонымен қатар, арифметика компьютерлер үшін негізгі дағды болса да, үлкен тілді модельдер есептеулерді алгоритмдер арқылы емес, тренинг деректерінде байқалған үлгілер негізінде болжайды. Бұл олардың біркелкі емес, ережеге негізделмеген ойлауына әкеледі, оның нәтижесінде даталармен байланысты арифметикалық операцияларда қателіктер жиі кездеседі. Бұл зерттеу ЖИ-дің «түсіну» тәсілі адамның когнитивті функцияларынан түбегейлі өзгеше екенінің дәлелдерін күшейтеді. ЖИ көп тренинг мысалдары болған кезде жақсы жұмыс істесе де, абстрактілі ойлау мен жалпылауда, әсіресе қабылдау мен нақты логиканы біріктіретін тапсырмаларда қиналады. Сонымен қатар, сирек кездесетін құбылыстар — мысалы, секіріс жылдары — туралы деректердің жетіспеушілігі оның тиімділігін төмендетеді, себебі ЖИ қажетті концептуалды байланыстарды жасай алмайды. Зерттеулер көрсеткендей, байрақты әрі нақты деректер жиынтығын жасау және ЖИ-дің логика мен кеңістік қатынасын біріктіру мүмкіндігін қайта бағалау қажет. Бұл жасанды интеллектінің қабілетін асыра бағалау қаупін көрсетеді және күрделі тапсырмаларда ЖИ нәтижесіне сенуде сақ болу керек. Сахена мұндай тапсырмаларда «түсінуді» сынау үшін қатаң тестілеу, резервтік механизмдер және жиі адам қадағалауын қамтамасыз етудің маңыздылығын атап өтті.
Brief news summary
Жаңа зерттеу 2025 жылы Халықаралық білімділік көрсету конференциясында ұсынылды, ол қазіргі AI моделдерінің, мысалы, Meta-ның Llama 3.2-Vision, Anthropic-тың Claude-3.5 Sonnet, Google-дың Gemini 2.0 және OpenAI-дың GPT-4o сияқты, елеулі шектеулерін көрсетті. Соңғы жетістіктерге қарамастан, бұл модельдер үшін адам үшін қарапайым тапсырмалар — мысалы, аналогтық сағаттарды оқу және күннен аптаның күнін анықтау — қиынға соғады. Зерттеу нәтижесі бойынша, бұл модельдер сағат уақытын дұрыс түсіндірген кезде ғана 38.7%, ал күнтізбедегі күндер туралы — тек 26.3% жағдайда дұрыс жұмыс істейді, бұл олардың шынайы ойлау қабілеттерінен гөрі үлгілерді тануға негізделгенін көрсетеді. Эдинбург университетінен Рохит Саксена басқаратын бұл зерттеу көрсеткендей, жүйелер объектілерді дәл тануға қабілетті болғанымен, күрделі кеңістік және логикалық ойлау тапсырмаларында — әсіресе сирек кездесетін оқиғалар, мысалы, қосымша жылдың кезеңдері сияқты — айтарлықтай қиындықтарға тап болатынын дәлелдейді. Бұл тұжырымдар логикалық және кеңістік ойлау дағдыларын біріктіретін жаңа оқыту тәсілдерінің қажеттілігін көрсетеді және нақты есептеулерді талап ететін тапсырмаларда AI-ға шамадан тыс reliance жасаудың қауіптілігін ескертеді. Ақырында, бұл зерттеу адам танымының және AI үлгілерін сәйкестірудің негізгі айырмашылықтарын көрсетіп, уақытқа сезімтал нақты әлем тапсырмаларында кешенді тексерулер мен адам бақылауын қолдауға шақырады.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia жасанды интеллектті қолдауды күшейтеді, Me…
Келесі қару-жарақ аймағы жасанды интеллект күресінде Бейжің емес — Рияд, кем дегенде Wedbush бойынша солай деп отыр.

Қоғамдық интернет blockchain үшін негізгі кедергі…
Austin Federa, DoubleZero жобасының негізін қалаушы және бас директоры — блокчейндер үшін жоғары жууысфазалы оптикалық байланыс жолдарын әзірлеуге бағытталған жобаның — қоғамдық интернет инфрақұрылымы жоғары өткізу қабілеттілігін талап ететін блокчейн желілерінің негізгі жылдамдық пен өнімділік кептелісі екенін айтты.

Шуусмидс AI қолдануды ынталандырады, 1 миллион фу…
Өткен айдың басында, Ұлыбританиялық заң фирмасы Shoosmiths, ның 1 500 қызметкері бар, жұмыс процесінде Microsoft-тың AI құралы Copilot-ты бірлесіп қолданған жағдайда қызметкерлер арасында бөлінуге арналған 1 миллион фунт стерлингтік бонус қоры жариялады.

JP Morgan алғаш рет ашық блокчейнде, Chainlink жә…
JP Morgan алғашқы транзакциясын қоғамдық блокчейнде аяқтады, бұл қаржылық құбылмастың Web3 экожүйесіне деген қызығушылығының артып келе жатқанын көрсетеді.

AI чиптері жаңа «елдің ақшасы» болып табылады, ол…
© 2025 Fortune Media IP Limited.

Орталық банктер ақша-кредит саясатын жаңғырту үші…
Орталық банктер ақшалай саясатты жүзеге асыруда программаланатын блокчейн технологиялары қалай трансформациялау мүмкін екендігін зерттеуді бастап кетті.

"Жұлдызды соғыстар" кинотуындысында жасанды интел…
Егер Disney басшылығы өз қалауымен жүрсе, біз шексіз Жұлдыздар соғысы қайта көркемделулері, жалғастырмалары мен спинофтары арқылы толысып, ақыр соңында Күн жарылып тұрып қалуы ықтимал.