News
>
Jauns pētījums atklāj, ka mākslīgais intelekts saskaras ar grūtībām lasot analogo pulksteņu un kalendāra datumu kalkulēšanā

Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.

Jauns pētījums atklāj, ka mākslīgais intelekts saskaras ar grūtībām lasot analogo pulksteņu un kalendāra datumu kalkulēšanā

Jaunāki pētījumi ir identificējuši virkni uzdevumu, ar kuriem cilvēki viegli tiek galā, bet mākslīgajai inteliģencei (MI) tas sagādā grūtības — īpaši lasīt analogo pulksteņu un noteikt nedēļas dienu pēc konkrēta datuma. Lai gan MI spēj ģenerēt kodu, attēlus, cilvēka stilā rakstītu tekstu un pat veiksmīgi izturēt pārbaudes ar dažādu pakāpi, tā bieži nepareizi interpretē pulksteņu rokas un neizpilda vienkāršus kalendārajuartēģijas uzdevumus. Šis pētījums, kas prezentēts 2025. gada Starptautiskajā mācīšanas reprezentāciju konferencē (ICLR) un publicēts preprint serverī arXiv (vēl nav pārskatīts kolēģu vērtējumā), uzsver būtiskas plaisas MI spējās veikt uzdevumus, kuri ar vieglumu pārvalda cilvēki jau agrīnā vecumā. Galvenais autore Rohit Saxena no Edinburgas universitātes uzsvēra, ka šos trūkumus ir jārisina, lai MI varētu efektīvi izmantot laika ziņā kritiskās un reālās pasaules jomās, piemēram, plānošanā, automatizācijā un palīgtehnoloģijās. Pētnieki pārbaudīja dažādus multimodālos plašās valodu modeļus (MLLM) — tostarp Meta Llama 3. 2-Vision, Anthropic Claude-3. 5 Sonnet, Google Gemini 2. 0 un OpenAI GPT-4o — izmantojot pielāgotu datu kopu ar pulksteņu un kalendāru attēliem. Modeļi vairāk nekā pusei gadījumu nepareizi identificēja pulksteņa laiku vai dienu pēc parauga datumiem, ar precizitātes rādītājiem tikai 38, 7% pulksteņiem un 26, 3% kalendāra uzdevumiem. Saxena skaidroja, ka MI sliktais pulksteņu lasīšanas spējas ir saistītas ar tās nespēju veikt telpisko domāšanu — uzdevumiem, kas prasa pārklājošo roku noteikšanu, leņķu mērījumus un dažādu pulksteņu dizainu interpretāciju, piemēram, romiešu ciparus vai stilizētus ciparnīcas rāmjus. Attēla atpazīšana kā pulksteņa ir vieglāka MI nekā tas pareizi nolasīt.

Līdzīgi, lai arī aritmētika ir pamatota datorzinātnē, plašās valodu modeļi neveic aprēķinus ar algoritmiem; tās drīzāk paredz iznākumu, balstoties uz apmācības datu modeļiem. Tas noved pie nevienmērīgas un noteikumiem nepamatotas reasoninga, skaidrojot augsto neveiksmju līmeni ar datumu saistītos aritmētikas uzdevumos. Šis pētījums pievienojas arvien pieaugošiem pierādījumiem, ka MI “sapratne” pēc būtības atšķiras no cilvēka domāšanas procesiem. MI izdevīgāk ir, kad ir daudz apmācības piemēru, bet tas cieš no abstraktās domāšanas un vispārīgas generalizācijas grūtībām, īpaši uzdevumos, kuros mijiedarbojas uztvere un precīza loģika. Turklāt ierobežots datu daudzums par retāk sastopamiem fenomēniem, piemēram, lieguma gadiem, ierobežo MI spēju atrast nepieciešamās konceptuālās saistības. Rezultāti uzsver nepieciešamību pēc pilnvērtīgākiem, mērķtiecīgākiem datu kopumiem un pārskatīt MI spējas integrēt loģisko un telpisko domāšanu, kā arī uzsver riskus, kas saistīti ar pārlieku lielu uzticēšanos MI iznākumiem sarežģītos uzdevumos. Saxena uzsvēra, ka ir būtiski veikt rūpīgu testēšanu, ieviest aizvietošanas mehānismus un bieži vien nodrošināt cilvēka uzraudzību, kad MI tiek uzdoti uzdevumi, kas prasa uztveres un precīzas loģikas kombināciju.

News source

Brief news summary

Jaunākie pētījumi, kas prezentēti 2025. gada Starptautiskajā Mācību Reprezentāciju Konferencē, uzsver būtiskas ierobežojumus esošajos AI modeļos, piemēram, Meta Llama 3.2-Vision, Anthropic Claude-3.5 Sonnet, Google Gemini 2.0 un OpenAI GPT-4o. Neskatoties uz nesenajiem uzlabojumiem, šie modeļi Straiti galā ar uzdevumiem, kas cilvēkiem ir vienkārši, piemēram, lasīt analoģiskās pulksteņu zilnes un noteikt nedēļas dienu pēc datuma. Pētījums atklāja, ka šie modeļi pareizi interpretēja pulksteņa laiku tikai 38,7% gadījumu un kalendāra datumus tikai 26,3%, akcentējot viņu atkarību no modeļu atpazīšanas nevis patiesas loģiskās domāšanas spējām. Pētījumu vadīja Rohits Sāksena no Edinburgas Universitātes, kurš atklāja, ka, lai gan AI sistēmas spēj precīzi identificēt objektus, tām ir ievērojamas grūtības veikt sarežģītu telpisku un loģisku domušanu, īpaši ar retāk sastopamiem notikumiem, piemēram, spriesta gadiem. Rezultāti uzsver nepieciešamību pēc jauniem apmācības paņēmieniem, kas integrē loģiskās un telpiskās domāšanas prasmes, kā arī brīdina par pārāk lielu atkarību no AI uzdevumos, kas prasa precīzas aprēķini. Galu galā, pētījums uzsvērtī fundamentālas atšķirības starp cilvēka domāšanu un AI modeļu signāla atpazīšanu, aicinot uz visaptverošu validāciju un cilvēka uzraudzību laikietilpīgās reālās pasaules lietojumprogrammās.

Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia iegūst AI stiprinājumu, Meta saskaras ar A…

Nākamā lauks pēcredzība AI ieroču sacīkstē nav Pekina — tās ir Rijāda, vismaz pēc Wedbush teiktā.

May 18, 2025, 2:23 a.m.

Publiskā interneta piekļuve ir šķērsli blokķēdēm …

Pēc Austina Federationa, DoubleZero līdzdibinātāja un izpilddirektora— projekta, kura mērķis ir izstrādāt augstspiediena optiskās šķiedras komunikācijas iecirkņus blokķēdēm— publiskais interneta infrastruktūra ir galvenais ātruma un veiktspējas traucēklis augstas caurlaidības blokķēžu tīklos.

May 18, 2025, 1:30 a.m.

Shoosmiths motivē AI ieviešanu ar 1 miljonu mārci…

Sākot pagājušā mēneša sākumā, Shoosmiths, Apvienotās Karalistes juridisko firmu ar 1500 darbiniekiem, paziņoja par 1 miljonu mārciņu lielu prēmiju fondu, kas tiks sadalīts starp darbiniekiem, ja viņi kopīgi ieviest savu darba plūsmās Microsoft AI rīku, Copilot.

May 18, 2025, 12:37 a.m.

JP Morgan veic pirmo tokenizēto valsts kasešu dar…

JP Morgan ir pabeiguši savu pirmo darījumu publiskā blokķēdē, kā norāda uz finanšu giganta pieaugošo iesaisti Web3 ekosistēmā.

May 18, 2025, 12:13 a.m.

AI mikroshēmas ir jauna "valūta valdījumā", jo tā…

May 17, 2025, 11:10 p.m.

Centrālās bankas izpēta blokķēdi, lai modernizētu…

Centrālās bankas sāk pētīt, kā programmējamas blokķēdes tehnoloģijas varētu pārveidot naudas politikas īstenošanu.

May 17, 2025, 10:51 p.m.

"Zvaigžņu Karu" izrāde ar īpašo mākslīgā intelekt…

Ja Disney vadība turpina savu ceļu, mēs būsim pārpludināti ar neskaitāmiem “Zvaigžņu kari” pārveidojumiem, turpinājumiem un spin-offiem, kamēr Saule pašaizliedzīgi eksplodēs.

All news

Launch Your AI-Powered Business and get clients!

Jauns pētījums atklāj, ka mākslīgais intelekts saskaras ar grūtībām lasot analogo pulksteņu un kalendāra datumu kalkulēšanā

News source

Brief news summary

AI-powered Lead Generation in Social Media
and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

AI ieroču sacensības pāriet uz Rijādu ar ASV-Saudijas tehnoloģiju forumu un nozīmīgiem nozares attīstības jauninājumiem

DoubleZero līdzdibinātājs un vadītājs Austins Feders uzsver, ka publiskais internets ir blokķēdes šķērslis

Shoosmiths juristu birojs motivē AI ieviešanu ar 1 miljonu sterliņu mārciņu bonusu Microsoft Copilot integrācijai

The Best for your Business

Learn how AI can help your business.
Let’s talk!

Nvidia iegūst AI stiprinājumu, Meta saskaras ar A…

Publiskā interneta piekļuve ir šķērsli blokķēdēm …

Shoosmiths motivē AI ieviešanu ar 1 miljonu mārci…

JP Morgan veic pirmo tokenizēto valsts kasešu dar…

AI mikroshēmas ir jauna "valūta valdījumā", jo tā…

Centrālās bankas izpēta blokķēdi, lai modernizētu…

"Zvaigžņu Karu" izrāde ar īpašo mākslīgā intelekt…

Sales

Marketing

Customer Service

Launch Your AI-Powered Business and get clients!

Jauns pētījums atklāj, ka mākslīgais intelekts saskaras ar grūtībām lasot analogo pulksteņu un kalendāra datumu kalkulēšanā

News source

Brief news summary

AI-powered Lead Generation in Social Media and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

AI ieroču sacensības pāriet uz Rijādu ar ASV-Saudijas tehnoloģiju forumu un nozīmīgiem nozares attīstības jauninājumiem

DoubleZero līdzdibinātājs un vadītājs Austins Feders uzsver, ka publiskais internets ir blokķēdes šķērslis

Shoosmiths juristu birojs motivē AI ieviešanu ar 1 miljonu sterliņu mārciņu bonusu Microsoft Copilot integrācijai

The Best for your Business

Learn how AI can help your business. Let’s talk!

Nvidia iegūst AI stiprinājumu, Meta saskaras ar A…

Publiskā interneta piekļuve ir šķērsli blokķēdēm …

Shoosmiths motivē AI ieviešanu ar 1 miljonu mārci…

JP Morgan veic pirmo tokenizēto valsts kasešu dar…

AI mikroshēmas ir jauna "valūta valdījumā", jo tā…

Centrālās bankas izpēta blokķēdi, lai modernizētu…

"Zvaigžņu Karu" izrāde ar īpašo mākslīgā intelekt…

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Launch Your AI-Powered Business

Auto-Filling SEO Website as a Gift

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

AI-powered Lead Generation in Social Media
and Search Engines

Learn how AI can help your business.
Let’s talk!