ახალი კვლევა აჩვენებს, რომ ხელოვნური ინტელექტი უძლური არის ანალოგური საათების წაკითხვასა და კალენდრის თარიღების გამოსახულების გამოთვლაში

ახალი კვლევამ გამოავლინა შეკ CLOCK-ისა და კვირის დღის განსაზღვრის მსგავსი სამუშაოების სია, რომლებიც ადამიანს ადვილად ახერხებს, მაგრამ ხელოვნურმა ინტელექტმა (AI) რთულდება — კერძოდ, ანალოგური საათის კითხვასა და კონკრეტული თარიღისთვის კვირის დღის დადგენაში. მიუხედავად იმისა, რომ AI-ი შეუძლია კოდის, სურათების, ადამიანის მსგავსი ტექსტის გენერირება და ზოგჯერ გამოცდით გავლა, ის ხშირად ციტქობს საათის მეხსიერების მდგომარეობას და ვერ სწორად გამოითვლის კალენდრის ისეთ გართულებებს, როგორებიც არის ძირითადი კalendarის გამოთვლები. გამოქვეყნებულია 2025 წლის საერთაშორისო სწავლების შერეული კონფერენციის (ICLR) ფარგლებში და გამოქვეყნებული პრეიპრინტ სერვერ arXiv-ზე (ჯერ არ არის თვითმხილველური განხილვის ქვეშ), ეს კვლევა ხაზგასმით აჩვენებს მნიშვნელოვან ნაკლოვანებებს AI-ის შესაძლებლობაში შესრულდეს „ადამიანის მიერ მარტივად შესრულებად“ სამუშაოები. დიზაინერ ლიდერ რუდიტ სახენამ უნივერსიტეტის ედინბურგიდან აღნიშნა, რომ ეს ნაკლოვანებები უნდა ამოიწუროს, რათა AI-ი ამწუთიერ, რეალურ გარემოზე მორგებული და სასარგებლო იყოს ყოველდღიური ცხოვრების ფუნქციებში, როგორებიც არის გრაფიკის დაგეგმვა, ავტომატიზაცია და დახმარების ტექნოლოგიები. კვლევით ექსპერიმენტები ჩატარდა სხვადასხვა დიდი მოდულის (MLLMs) — მათ შორის Meta-ის ლლამა 3. 2-ვიზია, Anthropic-ის კლოდ-3. 5 სონეტი, Google-ის ჯემინி 2. 0 და OpenAI-ის GPT-4o — გამოყენებით, სადაც გამოიყენეს საკონსტრუქციო მონაცემთა კრება საათებისა და კალენდრის სურათებით. მოდელებმა ვერ შეძლეს სწორად დაადგინონ საათის დრო ან კვირის დღე საილუსტრაციოდ, მტკიცებულებების თანახმად, ზუსადობის მაჩვენებელი სულ მხოლოდ 38. 7%-ია საათებისთვის და 26. 3% კალენდრის დავალებებისთვის. სახენას განმარტა, რომ AI-ის ცუდი საათის კითხვას ძირი უჭირავს სივრცულ გამოთვლას — მათ შორის, რესპუბლიკური საათის ხელების გადაკვეთილობის გაუგებრობა, კუთხის პარამეტრების გამოცნობა და სხვადასხვა საათის სტილის გააზრება, როგორიცაა რომაული რიცხვები ან სტილიზებული დისკები. სურათის საათის სახით აღქმა უფრო ადვილია AI-ისთვის, ვიდრე ზუსტად კითხვის. ერთნაირად, მიუხედავად იმისა, რომ მიმოხილვა და გამოთვლები ბაზის ნაწილია, დიდი მოდლები არ ახდენენ გამოთვლებს ალგორითმებით, არამედ პროგნოზირებენ პასუხებს ნათლობის მოდელის მიხედვით.
ეს გამოიწვიოს დაუზუსტებელი და წესების გარეშე გამოთვლებს, რაც ხსნის მაღალი წარუმატებლობის დონეს თარიღთან დაკავშირებულ გამოთვლებში. ეს კვლევა ამტკიცებს, რომ AI-ის „გაგება“ უპირატესად განსხვავდება ადამიანური გონებისგან. AI უკეთ აღწევს, თუ მას აქვს ბევრი მაგალითი ტრენინგი, მაგრამ გაუჭირდა აბსტრაქტული ლოგიკისა და ზოგადი წარმომავლობის შექმნა, განსაკუთრებით ისეთი დავალებებით, სადაც ერთმანეთშია გაბმული აღქმა და ზუსტი ლოგიკა. ასევე, რარიმის მექანიზმის ამოცანის შეზღუდული მონაცემებით ტრენინგი აფერხებს მას ეფექტიანობას, რადგან AI ვერ ახერხებს საჭირო საკამათო კავშირების გაკეთებას. ფართო ნაყოფი ადასტურებს, რომ AI-ის „გაგება“ ძირითადი რჩება ადამიანური, და მნიშვნელოვანია, დამატებითი მონაცემების და სპეციალიზებული სეგმენტის შექმნა, რომ გაუმჯობესდეს მისი ლოგიკური და სივრცითი გამოთვლების უნარი. ეს ასევე ხაზს უსვამს რისკებს, როდესაც მომხმარებელი მავნე მომენტში依赖ს AI-ის პროდუქტებზე, განსაკუთრებით, სირთულისმიერი დავალებების შესრულებისთვის. სახენა ხაზგასმით აცხადებს, რომ საჭიროა გამჭვირვალე ტესტირება, ალტერნატიული გზები და ხშირად ადამიანი იქნას ჩართული, როცა AI-ის გამოყენება საჭიროებს აღქმის და ზუსტი გამოთვლების კომბინაციას.
Brief news summary
ახალი კვლევა, რომელიც წარმოდგენილია 2025 წლის ინტერაქციული სწავლების წარმოდგენილობის კონფერენციაზე, ხაზს უსვამს მნიშვნელოვან შეზღუდვებს ამჟამინდელ AI მოდელებს, მათ შორის Meta-ს Llama 3.2-Vision, Anthropic-ის Claude-3.5 Sonnet, Google-ის Gemini 2.0 და OpenAI-ის GPT-4o. მიუხედავად ბოლო დროს მიღწეული პროგრესებისა, ეს მოდელები უჭირთ მარტივ დავალებებთან, როგორიცაა ანალოგური საათის წაკითხვა და კვირის დღეთა განსაზღვრა თარიღებიდან. კვლევამ აჩვენა, რომ ეს მოდელები სწორად იკითხავდნენ საათის დრო მხოლოდ 38.7%-ს, კალენდრის თარიღებს კი სულ 26.3%-ს, რაც ადასტურებს მათ სანდოობას pattern-ის ამოცნობაზე, სავსებით არა რეალურ ზუსტ მიზნობრივ აზროვნებაზე. როჰიტ სატჩენას ხელმძღვანელობით, ეპკალნმა გამოკვეთა, რომ ზოგადად AI-ს შეუძლია ობიექტების სწორად ამოცნობა, თუმცა მას პრობლემები აქვს კომპლექსური სივრცობრივი და ლოგიკური აზროვნების დავალებებში, განსაკუთრებით უჩვეულო მოვლენებთან, როგორიცაა ლეპი წლის საკითხი. შედეგები ხაზს უსვამს აუცილებლობას ახალი სწავლების მეთოდების შემუშავების, რომლებიც გაერთიანებული იქნება ლოგიკური და სივრცობრივი აზროვნების უნარების გამოყენება, ასევე იმას, რომ არ უნდა დავეყრდნოთ AI-ზე ზუსტ გამოთვლებში საჭირო დავალებებში. საბოლოოდ, კვლევა გვიჩვენებს ძირითადი განსხვავებას ადამიანურ ცნობიერებას და AI-ის pattern-ის ამოცნობას შორის, და მოწოდება აქტიურად დაიცვას ჯანსაღი მეთოდები და ადამიანის კონტროლი დროის კრიტიკულ შემთხვევებში.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

ნავიდა იღებს AI-ს ბენეფიტს, მეტა აღწევს AI-ის ბლო…
შემდეგი ბრძოლა AI-ის იარაღის რბოლაში არ არის বეიჯინგი — ეს რიიადიაო, მინიმუმვეედბუშის თქმით.

პუბლიური ინტერნეტი ბლოკჩეინისთვის ბლოკადა წარმოად…
როგორც აუქსტინი ფედერა, დபლოზერო კომპანიას ეთადავს, რომელიც მიკროსკოპიული ულტრათანამედროვე სარკინიგზო კავშირის ღია ქსელის მარკეტინგზეა ორიენტირებული, საჯარო ინტერნეტ ინფრასტრუქტურა არის ძირითადი შეფერხება მაღალი გადახრის ნდობის ბლოკჩეინქსნეტვენტებში.

შூსიმითს იწვევენ მიზნობრივად AI-ის დანერგვას 1 მი…
შუაღამე თვის დასაწყისში, ბრიტანული იურიდიული კომპანია Shoosmiths-მა, რომელსაც აქვს 1500 თანამშრომელი, გამოაცხადა 1 მილიონი ფუნტის ბონუსის ფონდზე, რომელიც ნაწილდება თანამშრომლებს შორის, თუ მათ ერთობლივად გამოიყენებენ Microsoft-ის AI სააგენტო, Copilot, სამუშაო პროცესებში.

ჯეი پي מורგანმა პირველი ტოკენიზებული ბიუჯეტის ტრა…
JP Morgan-მა სავალ عمومی ბლოკჩეინზე თავისი პირველი ტრანზაქცია განახორციელა, რაც ფინანსური ფირმის მზარდი ჩართულობის ნიშნია Web3 ეკოსისტემაში.

მწავლი ჩიპები ახალი „მშვენიერი ვალუტაა“, რადგან ი…
© 2025 Fortune Media IP Limited.

მთელბანკები იყენებენ ბლოკჩეინს მონეტარული პოლიტიკ…
Merrill მდებარე ცენტრალურმა ბანკებმა დაიწყეს კვლევა იმის შესახებ, თუ როგორ შეიძლება პროგრამული ბლოკჩეინის ტექნოლოგიები შეცვალოს მორიგი პოლიტიკის განხორციელება.

„ვარსკვლავური ომების“ სპეციალური ეფექტების გამოჩე…
თუ დისნეის ლიდერობა ამის სურვილს გაუჩნდება, ჩვენ Endless Star Wars-ის რებუტებს, სিকვეალებს და სპინოფებს დავისვებით, სანამ საბოლოოდ მზე აოხრდება.