lang icon Latvian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
3

Jauns pētījums atklāj, ka mākslīgais intelekts saskaras ar grūtībām lasot analogo pulksteņu un kalendāra datumu kalkulēšanā

Jaunāki pētījumi ir identificējuši virkni uzdevumu, ar kuriem cilvēki viegli tiek galā, bet mākslīgajai inteliģencei (MI) tas sagādā grūtības — īpaši lasīt analogo pulksteņu un noteikt nedēļas dienu pēc konkrēta datuma. Lai gan MI spēj ģenerēt kodu, attēlus, cilvēka stilā rakstītu tekstu un pat veiksmīgi izturēt pārbaudes ar dažādu pakāpi, tā bieži nepareizi interpretē pulksteņu rokas un neizpilda vienkāršus kalendārajuartēģijas uzdevumus. Šis pētījums, kas prezentēts 2025. gada Starptautiskajā mācīšanas reprezentāciju konferencē (ICLR) un publicēts preprint serverī arXiv (vēl nav pārskatīts kolēģu vērtējumā), uzsver būtiskas plaisas MI spējās veikt uzdevumus, kuri ar vieglumu pārvalda cilvēki jau agrīnā vecumā. Galvenais autore Rohit Saxena no Edinburgas universitātes uzsvēra, ka šos trūkumus ir jārisina, lai MI varētu efektīvi izmantot laika ziņā kritiskās un reālās pasaules jomās, piemēram, plānošanā, automatizācijā un palīgtehnoloģijās. Pētnieki pārbaudīja dažādus multimodālos plašās valodu modeļus (MLLM) — tostarp Meta Llama 3. 2-Vision, Anthropic Claude-3. 5 Sonnet, Google Gemini 2. 0 un OpenAI GPT-4o — izmantojot pielāgotu datu kopu ar pulksteņu un kalendāru attēliem. Modeļi vairāk nekā pusei gadījumu nepareizi identificēja pulksteņa laiku vai dienu pēc parauga datumiem, ar precizitātes rādītājiem tikai 38, 7% pulksteņiem un 26, 3% kalendāra uzdevumiem. Saxena skaidroja, ka MI sliktais pulksteņu lasīšanas spējas ir saistītas ar tās nespēju veikt telpisko domāšanu — uzdevumiem, kas prasa pārklājošo roku noteikšanu, leņķu mērījumus un dažādu pulksteņu dizainu interpretāciju, piemēram, romiešu ciparus vai stilizētus ciparnīcas rāmjus. Attēla atpazīšana kā pulksteņa ir vieglāka MI nekā tas pareizi nolasīt.

Līdzīgi, lai arī aritmētika ir pamatota datorzinātnē, plašās valodu modeļi neveic aprēķinus ar algoritmiem; tās drīzāk paredz iznākumu, balstoties uz apmācības datu modeļiem. Tas noved pie nevienmērīgas un noteikumiem nepamatotas reasoninga, skaidrojot augsto neveiksmju līmeni ar datumu saistītos aritmētikas uzdevumos. Šis pētījums pievienojas arvien pieaugošiem pierādījumiem, ka MI “sapratne” pēc būtības atšķiras no cilvēka domāšanas procesiem. MI izdevīgāk ir, kad ir daudz apmācības piemēru, bet tas cieš no abstraktās domāšanas un vispārīgas generalizācijas grūtībām, īpaši uzdevumos, kuros mijiedarbojas uztvere un precīza loģika. Turklāt ierobežots datu daudzums par retāk sastopamiem fenomēniem, piemēram, lieguma gadiem, ierobežo MI spēju atrast nepieciešamās konceptuālās saistības. Rezultāti uzsver nepieciešamību pēc pilnvērtīgākiem, mērķtiecīgākiem datu kopumiem un pārskatīt MI spējas integrēt loģisko un telpisko domāšanu, kā arī uzsver riskus, kas saistīti ar pārlieku lielu uzticēšanos MI iznākumiem sarežģītos uzdevumos. Saxena uzsvēra, ka ir būtiski veikt rūpīgu testēšanu, ieviest aizvietošanas mehānismus un bieži vien nodrošināt cilvēka uzraudzību, kad MI tiek uzdoti uzdevumi, kas prasa uztveres un precīzas loģikas kombināciju.



Brief news summary

Jaunākie pētījumi, kas prezentēti 2025. gada Starptautiskajā Mācību Reprezentāciju Konferencē, uzsver būtiskas ierobežojumus esošajos AI modeļos, piemēram, Meta Llama 3.2-Vision, Anthropic Claude-3.5 Sonnet, Google Gemini 2.0 un OpenAI GPT-4o. Neskatoties uz nesenajiem uzlabojumiem, šie modeļi Straiti galā ar uzdevumiem, kas cilvēkiem ir vienkārši, piemēram, lasīt analoģiskās pulksteņu zilnes un noteikt nedēļas dienu pēc datuma. Pētījums atklāja, ka šie modeļi pareizi interpretēja pulksteņa laiku tikai 38,7% gadījumu un kalendāra datumus tikai 26,3%, akcentējot viņu atkarību no modeļu atpazīšanas nevis patiesas loģiskās domāšanas spējām. Pētījumu vadīja Rohits Sāksena no Edinburgas Universitātes, kurš atklāja, ka, lai gan AI sistēmas spēj precīzi identificēt objektus, tām ir ievērojamas grūtības veikt sarežģītu telpisku un loģisku domušanu, īpaši ar retāk sastopamiem notikumiem, piemēram, spriesta gadiem. Rezultāti uzsver nepieciešamību pēc jauniem apmācības paņēmieniem, kas integrē loģiskās un telpiskās domāšanas prasmes, kā arī brīdina par pārāk lielu atkarību no AI uzdevumos, kas prasa precīzas aprēķini. Galu galā, pētījums uzsvērtī fundamentālas atšķirības starp cilvēka domāšanu un AI modeļu signāla atpazīšanu, aicinot uz visaptverošu validāciju un cilvēka uzraudzību laikietilpīgās reālās pasaules lietojumprogrammās.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia iegūst AI stiprinājumu, Meta saskaras ar A…

Nākamā lauks pēcredzība AI ieroču sacīkstē nav Pekina — tās ir Rijāda, vismaz pēc Wedbush teiktā.

May 18, 2025, 2:23 a.m.

Publiskā interneta piekļuve ir šķērsli blokķēdēm …

Pēc Austina Federationa, DoubleZero līdzdibinātāja un izpilddirektora— projekta, kura mērķis ir izstrādāt augstspiediena optiskās šķiedras komunikācijas iecirkņus blokķēdēm— publiskais interneta infrastruktūra ir galvenais ātruma un veiktspējas traucēklis augstas caurlaidības blokķēžu tīklos.

May 18, 2025, 1:30 a.m.

Shoosmiths motivē AI ieviešanu ar 1 miljonu mārci…

Sākot pagājušā mēneša sākumā, Shoosmiths, Apvienotās Karalistes juridisko firmu ar 1500 darbiniekiem, paziņoja par 1 miljonu mārciņu lielu prēmiju fondu, kas tiks sadalīts starp darbiniekiem, ja viņi kopīgi ieviest savu darba plūsmās Microsoft AI rīku, Copilot.

May 18, 2025, 12:37 a.m.

JP Morgan veic pirmo tokenizēto valsts kasešu dar…

JP Morgan ir pabeiguši savu pirmo darījumu publiskā blokķēdē, kā norāda uz finanšu giganta pieaugošo iesaisti Web3 ekosistēmā.

May 18, 2025, 12:13 a.m.

AI mikroshēmas ir jauna "valūta valdījumā", jo tā…

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

Centrālās bankas izpēta blokķēdi, lai modernizētu…

Centrālās bankas sāk pētīt, kā programmējamas blokķēdes tehnoloģijas varētu pārveidot naudas politikas īstenošanu.

May 17, 2025, 10:51 p.m.

"Zvaigžņu Karu" izrāde ar īpašo mākslīgā intelekt…

Ja Disney vadība turpina savu ceļu, mēs būsim pārpludināti ar neskaitāmiem “Zvaigžņu kari” pārveidojumiem, turpinājumiem un spin-offiem, kamēr Saule pašaizliedzīgi eksplodēs.

All news