lang icon Polish
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
2

Nowe badanie ujawnia, że sztuczna inteligencja ma trudności z odczytywaniem zegarów analogowych oraz z obliczaniem dat w kalendarzu

Nowe badania zidentyfikowały zestaw zadań, które ludzie wykonują bez wysiłku, podczas gdy sztuczna inteligencja (SI) z nimi ma trudności — w szczególności odczyt z zegara wskazówkowego oraz określenie dnia tygodnia dla podanej daty. Choć SI może generować kod, obrazy, tekst przypominający ludzki oraz zdawać egzaminy w różnym stopniu, często błędnie interpretuje pozycję wskazówek zegara i nie radzi sobie z podstawowymi działaniami kalendarzowymi. Przedstawione na Międzynarodowej Konferencji na temat Reprezentacji Uczenia się w 2025 roku (ICLR) oraz opublikowane na serwerze preprint arXiv (jeszcze nie poddane recenzji), badanie wskazuje na istotne braki w umiejętnościach SI w zakresie zadań, które ludzie opanowują we wczesnym dzieciństwie. Główny autor, Rohit Saxena z University of Edinburgh, podkreślił, że te niedoskonałości muszą zostać zaadresowane, aby sztuczna inteligencja mogła być skutecznie wykorzystywana w kontekstach czasowo wrażliwych i realnych, takich jak planowanie, automatyzacja czy technologie wspomagające. Badacze testowali różne multimodalne modele językowe dużej skali (MLLM), w tym Llama 3. 2-Vision od Meta, Claude-3. 5 Sonnet od Anthropic, Gemini 2. 0 od Google oraz GPT-4o od OpenAI, korzystając z własnego zestawu danych zawierającego obrazy zegarów i kalendarzy. Modele nie potrafiły poprawnie odczytać czasu na zegarze ani ustalić dnia tygodnia dla przykładowych dat w ponad połowie przypadków, osiągając wskaźniki dokładności jedynie 38, 7% dla zegarów i 26, 3% dla zadań kalendarzowych. Saxena wyjaśnił, że słaba zdolność odczytu zegarów przez SI wynika z braku rozumienia przestrzennego — zadań wymagających wykrywania nakładających się wskazówek, pomiaru kątów oraz interpretacji różnorodnych schematów tarcz, np. numerów rzymskich czy stylizowanych tarcz. Rozpoznanie obrazka jako zegara jest dla SI łatwiejsze niż jego dokładny odczyt.

Podobnie, choć arytmetyka jest podstawą obliczeń komputerowych, modele językowe dużej skali nie wykonują działań na podstawie algorytmów, lecz przewidują wyniki na podstawie wzorców danych treningowych. Prowadzi to do niekonsekwentnego i nieopartego na regułach rozumowania, co tłumaczy wysoką zawartość błędów w zadaniach związanych z datami i działaniami arytmetycznymi. Badanie to dołącza do rosnących dowodów, że sposób „rozumienia” sztucznej inteligencji różni się zasadniczo od ludzkiej kognicji. SI doskonale wypada przy dużej liczbie dostępnych przykładów treningowych, ale ma trudności z abstrakcyjnym rozumowaniem i generalizacją, szczególnie w zadaniach łączących percepcję z precyzyjną logiką. Co więcej, ograniczona ilość danych treningowych na temat rzadziej występujących zjawisk, takich jak lata przestępne, utrudnia jej poprawną interpretację, gdyż SI nie potrafi nawiązać odpowiednich połączeń koncepcyjnych. Wyniki te podkreślają konieczność tworzenia bardziej bogatych i ukierunkowanych zbiorów danych oraz ponownej oceny możliwości integracji rozumowania logicznego i przestrzennego w sztucznej inteligencji. Zaznaczają też, że zbytnie poleganie na wynikach SI w złożonych zadaniach wiąże się z ryzykiem błędów. Saxena podkreślił konieczność wprowadzenia rygorystycznych testów, mechanizmów awaryjnych oraz częstego nadzorowania działań SI przez człowieka, szczególnie gdy łączy percepcję z precyzyjnym rozumowaniem.



Brief news summary

Nowe badania przedstawione na Międzynarodowej Konferencji na Temat Reprezentacji Uczenia się w 2025 roku podkreślają poważne ograniczenia obecnych modeli SI, takich jak Llama 3.2-Vision od Meta, Claude-3.5 Sonnet od Anthropic, Gemini 2.0 od Google czy GPT-4o od OpenAI. Pomimo niedawnych postępów, te modele mają trudności z zadaniami, które dla ludzi są prostymi, takimi jak odczytywanie zegarów analogowych czy wyznaczanie dni tygodnia z dat. Badanie wykazało, że te modele poprawnie interpretowały godziny na zegarze tylko w 38,7% przypadków, a daty kalendarzowe jedynie w 26,3%, co podkreśla ich poleganie na rozpoznawaniu wzorców, a nie na prawdziwym rozumowaniu. Kierowane przez Rohita Saxenę z Uniwersytetu Edynburskiego, badanie ujawnia, że chociaż systemy SI mogą dokładnie identyfikować obiekty, napotykają znaczne trudności w złożonych zadaniach związanych z przestrzennym i logicznym rozumowaniem, zwłaszcza przy rzadkich zdarzeniach, takich jak rok przestępny. Wyniki podkreślają konieczność opracowania nowych metod szkoleniowych, które łączą umiejętności logicznego i przestrzennego rozumowania, oraz ostrzegają przed nadmiernym poleganiem na SI w zadaniach wymagających precyzyjnych obliczeń. Ostatecznie badanie pokazuje zasadnicze różnice między ludzkim poznaniem a dopasowywaniem wzorców przez SI, postulując konieczność kompleksowej weryfikacji i nadzoru człowieka w zastosowaniach czasuwrażliwych w realnym świecie.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia zyskuje na sztucznej inteligencji, Meta na…

Kolejna arena walki w wyścigu zbrojeń sztucznej inteligencji nie jest Pekinem — jest Rijadem, przynajmniej według Wedbush.

May 18, 2025, 2:23 a.m.

Publiczny internet jest wąskim gardłem dla blockc…

Według Austina Federy, współzałożyciela i CEO projektu DoubleZero — skupionego na rozwoju szybkich torów komunikacji światłowodowej dla blockchainów — infrastruktura publicznego internetu jest głównym wąskim gardłem w zakresie prędkości i wydajności dla sieci blockchain o wysokiej przepustowości.

May 18, 2025, 1:30 a.m.

Shoosmiths motywuje przyjęcie AI premią w wysokoś…

Na początku zeszłego miesiąca firma Shoosmiths, brytyjska kancelaria prawna zatrudniająca 1500 pracowników, ogłosiła pulę bonusów w wysokości miliona funtów, która miała zostać podzielona wśród pracowników, jeśli wspólnie wdrożą narzędzie AI firmy Microsoft, Copilot, do swoich procesów pracy.

May 18, 2025, 12:37 a.m.

JP Morgan rozlicza pierwszą tokenizowaną transakc…

JP Morgan zakończył swoją pierwszą transakcję na publicznym łańcuchu bloków, co sygnalizuje rosnące zaangażowanie tego giganta finansowego w ekosystem Web3.

May 18, 2025, 12:13 a.m.

Układy AI są nową "walutą rangi", ponieważ ułatwi…

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

Banki centralne badają blockchain w celu unowocze…

Banki centralne zaczynają badać, jak programowalne technologie blockchain mogą przemienić realizację polityki monetarnej.

May 17, 2025, 10:51 p.m.

Pokaz efektów specjalnych AI w Star Wars był całk…

Jeśli kierownictwo Disneya będzie miało swoje sposoby, zostaniemy zalani niekończącymi się remiksami, kontynuacjami i spin-offami z uniwersum Gwiezdnych Wojen, aż do momentu, gdy Słońce ostatecznie wybuchnie.

All news