News
>
Nowe badanie ujawnia, że sztuczna inteligencja ma trudności z odczytywaniem zegarów analogowych oraz z obliczaniem dat w kalendarzu

Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.

Nowe badanie ujawnia, że sztuczna inteligencja ma trudności z odczytywaniem zegarów analogowych oraz z obliczaniem dat w kalendarzu

Nowe badania zidentyfikowały zestaw zadań, które ludzie wykonują bez wysiłku, podczas gdy sztuczna inteligencja (SI) z nimi ma trudności — w szczególności odczyt z zegara wskazówkowego oraz określenie dnia tygodnia dla podanej daty. Choć SI może generować kod, obrazy, tekst przypominający ludzki oraz zdawać egzaminy w różnym stopniu, często błędnie interpretuje pozycję wskazówek zegara i nie radzi sobie z podstawowymi działaniami kalendarzowymi. Przedstawione na Międzynarodowej Konferencji na temat Reprezentacji Uczenia się w 2025 roku (ICLR) oraz opublikowane na serwerze preprint arXiv (jeszcze nie poddane recenzji), badanie wskazuje na istotne braki w umiejętnościach SI w zakresie zadań, które ludzie opanowują we wczesnym dzieciństwie. Główny autor, Rohit Saxena z University of Edinburgh, podkreślił, że te niedoskonałości muszą zostać zaadresowane, aby sztuczna inteligencja mogła być skutecznie wykorzystywana w kontekstach czasowo wrażliwych i realnych, takich jak planowanie, automatyzacja czy technologie wspomagające. Badacze testowali różne multimodalne modele językowe dużej skali (MLLM), w tym Llama 3. 2-Vision od Meta, Claude-3. 5 Sonnet od Anthropic, Gemini 2. 0 od Google oraz GPT-4o od OpenAI, korzystając z własnego zestawu danych zawierającego obrazy zegarów i kalendarzy. Modele nie potrafiły poprawnie odczytać czasu na zegarze ani ustalić dnia tygodnia dla przykładowych dat w ponad połowie przypadków, osiągając wskaźniki dokładności jedynie 38, 7% dla zegarów i 26, 3% dla zadań kalendarzowych. Saxena wyjaśnił, że słaba zdolność odczytu zegarów przez SI wynika z braku rozumienia przestrzennego — zadań wymagających wykrywania nakładających się wskazówek, pomiaru kątów oraz interpretacji różnorodnych schematów tarcz, np. numerów rzymskich czy stylizowanych tarcz. Rozpoznanie obrazka jako zegara jest dla SI łatwiejsze niż jego dokładny odczyt.

Podobnie, choć arytmetyka jest podstawą obliczeń komputerowych, modele językowe dużej skali nie wykonują działań na podstawie algorytmów, lecz przewidują wyniki na podstawie wzorców danych treningowych. Prowadzi to do niekonsekwentnego i nieopartego na regułach rozumowania, co tłumaczy wysoką zawartość błędów w zadaniach związanych z datami i działaniami arytmetycznymi. Badanie to dołącza do rosnących dowodów, że sposób „rozumienia” sztucznej inteligencji różni się zasadniczo od ludzkiej kognicji. SI doskonale wypada przy dużej liczbie dostępnych przykładów treningowych, ale ma trudności z abstrakcyjnym rozumowaniem i generalizacją, szczególnie w zadaniach łączących percepcję z precyzyjną logiką. Co więcej, ograniczona ilość danych treningowych na temat rzadziej występujących zjawisk, takich jak lata przestępne, utrudnia jej poprawną interpretację, gdyż SI nie potrafi nawiązać odpowiednich połączeń koncepcyjnych. Wyniki te podkreślają konieczność tworzenia bardziej bogatych i ukierunkowanych zbiorów danych oraz ponownej oceny możliwości integracji rozumowania logicznego i przestrzennego w sztucznej inteligencji. Zaznaczają też, że zbytnie poleganie na wynikach SI w złożonych zadaniach wiąże się z ryzykiem błędów. Saxena podkreślił konieczność wprowadzenia rygorystycznych testów, mechanizmów awaryjnych oraz częstego nadzorowania działań SI przez człowieka, szczególnie gdy łączy percepcję z precyzyjnym rozumowaniem.

News source

Brief news summary

Nowe badania przedstawione na Międzynarodowej Konferencji na Temat Reprezentacji Uczenia się w 2025 roku podkreślają poważne ograniczenia obecnych modeli SI, takich jak Llama 3.2-Vision od Meta, Claude-3.5 Sonnet od Anthropic, Gemini 2.0 od Google czy GPT-4o od OpenAI. Pomimo niedawnych postępów, te modele mają trudności z zadaniami, które dla ludzi są prostymi, takimi jak odczytywanie zegarów analogowych czy wyznaczanie dni tygodnia z dat. Badanie wykazało, że te modele poprawnie interpretowały godziny na zegarze tylko w 38,7% przypadków, a daty kalendarzowe jedynie w 26,3%, co podkreśla ich poleganie na rozpoznawaniu wzorców, a nie na prawdziwym rozumowaniu. Kierowane przez Rohita Saxenę z Uniwersytetu Edynburskiego, badanie ujawnia, że chociaż systemy SI mogą dokładnie identyfikować obiekty, napotykają znaczne trudności w złożonych zadaniach związanych z przestrzennym i logicznym rozumowaniem, zwłaszcza przy rzadkich zdarzeniach, takich jak rok przestępny. Wyniki podkreślają konieczność opracowania nowych metod szkoleniowych, które łączą umiejętności logicznego i przestrzennego rozumowania, oraz ostrzegają przed nadmiernym poleganiem na SI w zadaniach wymagających precyzyjnych obliczeń. Ostatecznie badanie pokazuje zasadnicze różnice między ludzkim poznaniem a dopasowywaniem wzorców przez SI, postulując konieczność kompleksowej weryfikacji i nadzoru człowieka w zastosowaniach czasuwrażliwych w realnym świecie.

Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia zyskuje na sztucznej inteligencji, Meta na…

Kolejna arena walki w wyścigu zbrojeń sztucznej inteligencji nie jest Pekinem — jest Rijadem, przynajmniej według Wedbush.

May 18, 2025, 2:23 a.m.

Publiczny internet jest wąskim gardłem dla blockc…

Według Austina Federy, współzałożyciela i CEO projektu DoubleZero — skupionego na rozwoju szybkich torów komunikacji światłowodowej dla blockchainów — infrastruktura publicznego internetu jest głównym wąskim gardłem w zakresie prędkości i wydajności dla sieci blockchain o wysokiej przepustowości.

May 18, 2025, 1:30 a.m.

Shoosmiths motywuje przyjęcie AI premią w wysokoś…

Na początku zeszłego miesiąca firma Shoosmiths, brytyjska kancelaria prawna zatrudniająca 1500 pracowników, ogłosiła pulę bonusów w wysokości miliona funtów, która miała zostać podzielona wśród pracowników, jeśli wspólnie wdrożą narzędzie AI firmy Microsoft, Copilot, do swoich procesów pracy.

May 18, 2025, 12:37 a.m.

JP Morgan rozlicza pierwszą tokenizowaną transakc…

JP Morgan zakończył swoją pierwszą transakcję na publicznym łańcuchu bloków, co sygnalizuje rosnące zaangażowanie tego giganta finansowego w ekosystem Web3.

May 18, 2025, 12:13 a.m.

Układy AI są nową "walutą rangi", ponieważ ułatwi…

May 17, 2025, 11:10 p.m.

Banki centralne badają blockchain w celu unowocze…

Banki centralne zaczynają badać, jak programowalne technologie blockchain mogą przemienić realizację polityki monetarnej.

May 17, 2025, 10:51 p.m.

Pokaz efektów specjalnych AI w Star Wars był całk…

Jeśli kierownictwo Disneya będzie miało swoje sposoby, zostaniemy zalani niekończącymi się remiksami, kontynuacjami i spin-offami z uniwersum Gwiezdnych Wojen, aż do momentu, gdy Słońce ostatecznie wybuchnie.

All news

Launch Your AI-Powered Business and get clients!

Nowe badanie ujawnia, że sztuczna inteligencja ma trudności z odczytywaniem zegarów analogowych oraz z obliczaniem dat w kalendarzu

News source

Brief news summary

AI-powered Lead Generation in Social Media
and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

Wojna wyścigu zbrojeń AI przenosi się do Rijadu dzięki Forum Technologicznemu USA-Saudi oraz ważnym aktualizacjom branżowym

Prezes DoubleZero Austin Federa podkreśla, że publiczny internet stanowi wąskie gardło dla blockchaina

Kancelaria prawna Shoosmiths Motywuje do wdrożenia AI, oferując premię w wysokości 1 miliona funtów za integrację Microsoft Copilot

The Best for your Business

Learn how AI can help your business.
Let’s talk!

Nvidia zyskuje na sztucznej inteligencji, Meta na…

Publiczny internet jest wąskim gardłem dla blockc…

Shoosmiths motywuje przyjęcie AI premią w wysokoś…

JP Morgan rozlicza pierwszą tokenizowaną transakc…

Układy AI są nową "walutą rangi", ponieważ ułatwi…

Banki centralne badają blockchain w celu unowocze…

Pokaz efektów specjalnych AI w Star Wars był całk…

Sales

Marketing

Customer Service

Launch Your AI-Powered Business and get clients!

Nowe badanie ujawnia, że sztuczna inteligencja ma trudności z odczytywaniem zegarów analogowych oraz z obliczaniem dat w kalendarzu

News source

Brief news summary

AI-powered Lead Generation in Social Media and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

Wojna wyścigu zbrojeń AI przenosi się do Rijadu dzięki Forum Technologicznemu USA-Saudi oraz ważnym aktualizacjom branżowym

Prezes DoubleZero Austin Federa podkreśla, że publiczny internet stanowi wąskie gardło dla blockchaina

Kancelaria prawna Shoosmiths Motywuje do wdrożenia AI, oferując premię w wysokości 1 miliona funtów za integrację Microsoft Copilot

The Best for your Business

Learn how AI can help your business. Let’s talk!

Nvidia zyskuje na sztucznej inteligencji, Meta na…

Publiczny internet jest wąskim gardłem dla blockc…

Shoosmiths motywuje przyjęcie AI premią w wysokoś…

JP Morgan rozlicza pierwszą tokenizowaną transakc…

Układy AI są nową "walutą rangi", ponieważ ułatwi…

Banki centralne badają blockchain w celu unowocze…

Pokaz efektów specjalnych AI w Star Wars był całk…

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Launch Your AI-Powered Business

Auto-Filling SEO Website as a Gift

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

AI-powered Lead Generation in Social Media
and Search Engines

Learn how AI can help your business.
Let’s talk!