lang icon En
May 17, 2025, 9:16 p.m.
3106

Un nou studiu dezvăluie că AI-ul întâmpină dificultăți în citirea orelor analoge și în calcularea datelor din calendar

Brief news summary

O cercetare recentă prezentată la Conferința Internațională asupra Reprezentărilor de Învățare din 2025 evidențiază limitări semnificative ale modelelor AI actuale precum Llama 3.2-Vision de la Meta, Claude-3.5 Sonnet de la Anthropic, Gemini 2.0 de la Google și GPT-4o de la OpenAI. În ciuda progreselor recente, aceste modele întâmpină dificultăți în sarcini care pentru oameni sunt simple, cum ar fi citirea ceasurilor analogice și stabilirea zilei săptămânii din date. Studiul a constatat că aceste modele au interpretat corect timpii de pe ceas doar în 38,7% din cazuri și datele de pe calendar doar în 26,3%, subliniind dependența lor de recunoașterea pattern-urilor în loc de abilități autentice de raționament. Conduse de Rohit Saxena de la Universitatea din Edinburgh, cercetările relevă că, în timp ce sistemele AI pot identifica obiecte cu acuratețe, întâmpină provocări notabile în sarcini complexe de raționament spațial și logic, mai ales când este vorba de evenimente neobișnuite precum anii bisecți. Rezultatele subliniază nevoia pentru noi abordări de antrenament care să integreze abilități de raționament logic și spațial și avertizează împotriva dependenței excesive de AI pentru sarcini ce necesită calcule precise. În final, studiul evidențiază diferențele fundamentale dintre cogniția umană și potrivirea de modele AI, promovând validarea amănunțită și supravegherea umană în aplicațiile din lumea reală, sensibile la timp.

Cercetări recente au identificat un set de sarcini pe care oamenii le gestionează fără probleme, dar cu dificultate sunt confruntați artificial intelligence (AI) — în special citirea ceasurilor analogice și determinarea zilei săptămânii pentru o anumită dată. Deși AI poate genera cod, imagini, texte asemănătoare celor umane și chiar poate trece examene în diferite grade de dificultate, frecvent interpretează greșit pozițiile acelor de ceas și ratează aritmetica de bază a calendarului. Studiul, prezentat la Conferința Internațională pe reprezentări de învățare din 2025 (ICLR) și publicat pe serverul arXiv (care încă nu a fost supus revizuirii de către colegi), evidențiază lacune semnificative în capacitatea AI de a executa sarcini pe care oamenii le stăpânesc încă din copilărie. Autor principal, Rohit Saxena de la Universitatea din Edinburgh, a subliniat că aceste deficiențe trebuie accommodate pentru ca AI să poată fi aplicată eficient în contexte sensibile la timp și în situații reale, precum programarea, automatizarea și tehnologiile de asistare. Cercetătorii au testat diverse modele lingvistice multimodale de mari dimensiuni (MLLM) — inclusiv Llama 3. 2-Vision de la Meta, Claude-3. 5 Sonnet de la Anthropic, Gemini 2. 0 de la Google și GPT-4o de la OpenAI — utilizând un set de date personalizat cu imagini de ceasuri și calendare. Modelele au eșuat în identificarea corectă a orelor sau determinarea zilei săptămânii pentru datele de probă mai mult de jumătate din timp, cu rate de acuratețe de doar 38, 7% pentru ceasuri și 26, 3% pentru sarcinile legate de calendar. Saxena a explicat că interpretarea greșită a ceasurilor de către AI provine din lipsa de raționament spațial — sarcini ce implică detectarea suprapunerii acelor, măsurarea unghiurilor și interpretarea diverselor modele de ceasuri, precum numeralele romane sau cadrane stilizate. Recunoașterea unei imagini ca fiind un ceas este mai ușoară pentru AI decât citirea precisă a orelor.

În mod similar, deși aritmetica este fundamentală pentru calcul, modelele lingvistice mari nu efectuează calcule prin algoritmi, ci doar prezic rezultatele bazându-se pe modele din datele de antrenament. Acest lucru duce la raționamente inconsistente și fără reguli clare, explicând ratele mari de eșec în aritmetica legată de date. Acest studiu adaugă la corpul tot mai mare de dovezi că modul de „înțelegere” al AI este fundamental diferit de cogniția umană. AI excelează în contexte cu numeroase exemple de antrenament, dar are dificultăți cu raționamentul abstract și generalizarea, în special în sarcini care combină percepția cu logica precisă. În plus, lipsa datelor de antrenament despre fenomene mai rare, precum anii bisecți, limitează performanța, întrucât AI nu reușește să facă conexiuni conceptuale necesare. Rezultatele subliniază necesitatea unor seturi de date mai bogate și mai specifice și reevaluarea capabilităților AI de a integra raționamentul logic și spațial, evidențiind riscurile unei încrederi excesive în rezultatele AI în sarcini complexe. Saxena a subliniat necesitatea testării riguroase, a mecanismelor de fallback și a supravegherii umane frecvente atunci când AI este utilizată pentru a combina percepția cu raționamentul exact.


Watch video about

Un nou studiu dezvăluie că AI-ul întâmpină dificultăți în citirea orelor analoge și în calcularea datelor din calendar

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 12, 2025, 1:42 p.m.

Disney trimite o notificare de încetare și renunț…

Compania Walt Disney a inițiat o acțiune legală semnificativă împotriva Google, printr-o scrisoare de oprire și interzicere, acuzând gigantul tehnologic de încălcare a drepturilor de copyright asupra conținutului Disney în timpul antrenamentului și dezvoltării modelelor de inteligență artificială generativă (AI), fără a oferi compensații.

Dec. 12, 2025, 1:35 p.m.

Inteligența artificială și viitorul optimizării p…

Pe măsură ce inteligența artificială (IA) avansează și se integrează tot mai mult în marketingul digital, influența sa asupra optimizării pentru motoarele de căutare (SEO) devine semnificativă.

Dec. 12, 2025, 1:33 p.m.

Inteligență artificială: MiniMax și planul Zhipu …

MiniMax și Zhipu AI, două companii de top din domeniul inteligenței artificiale, se pregătesc să devină companii publice pe Bursa din Hong Kong încă din ianuarie anul viitor.

Dec. 12, 2025, 1:31 p.m.

OpenAI numește CEO-ul Slack, Denise Dresser, în f…

Denise Dresser, CEO al Slack, urmează să își părăsească poziția pentru a deveni Chief Revenue Officer la OpenAI, compania din spatele ChatGPT.

Dec. 12, 2025, 1:30 p.m.

Tehnici de sinteză video cu AI îmbunătățesc efici…

Industria filmului trece printr-o transformare majoră, pe măsură ce studiourile integrează tot mai mult tehnici de sinteză video bazate pe inteligența artificială (AI) pentru a îmbunătăți fluxurile de lucru din post-producție.

Dec. 12, 2025, 1:24 p.m.

Cele mai bune 19 instrumente AI pentru social med…

AI-ul revoluționează marketingul pe rețelele sociale prin oferirea de instrumente care simplifică și îmbunătățesc implicarea publicului.

Dec. 12, 2025, 9:42 a.m.

Influențatori AI pe rețelele sociale: Oportunităț…

Apariția influencerilor generați de Inteligența Artificială pe rețelele sociale reprezintă o schimbare majoră în mediul digital, stârnind dezbateri ample despre autenticitatea interacțiunilor online și despre problemele etice legate de aceste personaje virtuale.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today