Yeni Çalışma, Yapay Zekanın Analog Saatleri Okuma ve Takvim Tarihi Hesaplamalarında Zorluklar Yaşadığını Gösteriyor

Yeni araştırmalar, insanların zahmetsizce hallettiği ancak yapay zekanın (AI) zorlandığı belirli görevleri ortaya koydu—özellikle analoj saatleri okuma ve verilen bir tarihin haftanın gününü belirleme. AI kod, görüntü, insan benzeri metin üretebildiği ve çeşitli sınavları geçebildiği halde, sık sık saat ibresi pozisyonlarını yanlış yorumlamakta ve temel takvim aritmetiğinde başarısız olmaktadır. 2025 Uluslararası Öğrenme Temsilleri Konferansı'nda (ICLR) sunulan ve ön baskı platformu arXiv’de yayımlanan (henüz hakemli değildir) çalışmada, AI’nin insanların erken yaşta ustalaştığı görevleri yerine getirme konusundaki önemli boşluklarına dikkat çekildi. Edinburgh Üniversitesi’nden baş yazar Rohit Saxena, bu eksikliklerin zaman açısından kritik ve gerçek dünya uygulamalarında—takvimlendirme, otomasyon ve destek teknolojileri gibi—AI’nin etkin kullanımı için giderilmesi gerektiğini vurguladı. Araştırmacılar, Meta’nın Llama 3. 2-Vision, Anthropic’ın Claude-3. 5 Sonnet, Google’ın Gemini 2. 0 ve OpenAI’nin GPT-4o gibi çeşitli çok modlu büyük dil modellerini (MLLM’ler) ve saat ile takvim görüntülerinden oluşan özel bir veri kümesi kullanarak test ettiler. Modeller, örnek saatleri doğru okuma veya haftanın gününü belirleme konusunda, yarısından fazlasında başarısız oldu; saat görevi için doğruluk oranı sadece %38, 7 iken takvim görevlerinde bu oran %26, 3’e düştü. Saxena, AI’nin saat okuma başarısızlığının, mekânsal akıl yürütme eksikliğinden kaynaklandığını açıkladı—bu, üst üste binmiş ibreleri tespit etme, açı ölçümü ve Roma rakamları veya stilize saat kadranları gibi çeşitli saat tasarımlarını yorumlama gibi görevleri içerir. Bir görüntüyü saat olarak tanımak AI için daha kolaydır ancak onu doğru okuma zorluğu taşır. Benzer şekilde, hesaplama bilgisayar biliminin temel taşlarından olmasına rağmen, büyük dil modelleri işlemleri algoritmalarla değil, eğitim verisi desenlerine dayanarak çıktı tahmin eder.
Bu durum, tutarsız ve kurallara dayalı olmayan akıl yürütmeye yol açar; bu da tarih ile ilgili aritmetikte yüksek başarısızlık oranlarının nedenidir. Bu çalışma, AI’nin “anlama” biçiminin, insan bilişinden temelde farklı olduğunu gösteren kanıtları artırıyor. AI, bol eğitim verisi bulunduğunda başarılı olurken, soyut akıl yürütme ve genelleme konusunda zorlanmakta; özellikle algılama ile kesin mantığın karıştığı görevlerde bu sorun belirgindir. Ayrıca, artık yıllar gibi daha nadir olaylarla ilgili sınırlı veri, performansı engeller çünkü AI, gerekli kavramsal bağlantıları kurmakta zorlanır. Bulgu, daha zengin ve hedeflenmiş veri kümelerinin oluşturulması ve AI’nin mantıksal ile mekânsal akıl yürütmeyi bütünleştirme yeteneğinin yeniden değerlendirilmesi ihtiyacını vurgulamaktadır. Ayrıca, karmaşık görevlerde yapay zekaya aşırı güvenmenin risklerini ortaya koyar. Saxena, AI’nin algı ve kesin mantık birleşimini görevlendirilirken titiz testler, geri dönüş mekanizmaları ve sık sık insan gözetiminin önemine dikkat çekti.
Brief news summary
2025 Uluslararası Öğrenme Temsileleri Konferansı'nda sunulan yeni araştırma, Meta’nın Llama 3.2-Vision, Anthropic’nin Claude-3.5 Sonnet, Google’ın Gemini 2.0 ve OpenAI’nin GPT-4o gibi mevcut yapay zeka modellerinde önemli sınırlamaları ortaya koyuyor. Son gelişmelere rağmen, bu modeller insanlara göre basit görevlerde zorlanıyor; örneğin analog saatleri okumakta ve takvimden haftanın gününü belirlemede zorluklar yaşıyorlar. Çalışma, bu modellerin saatleri yalnızca %38.7 oranında doğru şekilde yorumladığını ve takvim tarihlerini sadece %26.3 oranında doğru tespit ettiğini buldu; bu da onların gerçek akıl yürütme yetenekleri yerine desen tanıma ve kalıp eşleştirmeye dayandığını gösteriyor. Edinburgh Üniversitesi’nden Rohit Saxena liderliğinde yapılan araştırma, yapay zeka sistemlerinin nesneleri doğru şekilde tanıyabildiğini ancak, özellikle artık yıl gibi nadir olaylarla ilgili karmaşık uzamsal ve mantıksal akıl yürütme görevlerinde önemli zorluklar yaşadıklarını ortaya koyuyor. Bulgular, mantıksal ve uzamsal akıl yürütme becerilerini bütünleştiren yeni eğitim yaklaşımlarına ihtiyaç olduğunu vurguluyor ve kesin hesaplamalar gerektiren görevlerde yapay zeka kullanımına aşırı bağımlılığın sakıncalarına dikkat çekiyor. Sonuç olarak, çalışma insan bilişi ile yapay zekanın desen eşleştirme arasındaki temel farkları ortaya koyuyor ve zaman açısından kritik gerçek dünyası uygulamalarda kapsamlı doğrulama ve insan denetiminin önemine işaret ediyor.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia yapay zeka konusunda güçleniyor, Meta yapa…
Bir sonraki yapay zeka silah yarışında savaş alanı Pekin değil—En azından Wedbush’a göre Riyad.

Halk interneti, blokzinciri için bir tıkanıklık —…
Austin Federa'ya göre, DoubleZero adlı proje ile yüksek hızlı fiber optik iletişim rayları geliştirmeye odaklanan kurucu ve CEO, kamu internet altyapısının yüksek hacimli blokzincir ağları için başlıca hız ve performans darboğazı olduğunu belirtti.

Shoosmiths, Yapay Zeka Kullanımını Teşvik Ediyor,…
Geçen ayın başında, 1.500 çalışanı olan Britanya hukuk firması Shoosmiths, çalışanlar arasında Microsoft’un yapay zeka aracı Copilot’u iş akışlarına entegre etmeleri karşılığında paylaşılmak üzere 1 milyon sterlinlik bir bonus havuzu açıkladı.

JP Morgan, Chainlink ve Ondo Finance kullanarak h…
JP Morgan, halka açık bir blokzinciri üzerinde ilk işlem tamamladı ve böylece finans devinin Web3 ekosistemine olan ilgisinin arttığını gösterdi.

BofA'ya göre, Yapay Zeka çipleri yeni 'dünya para…
© 2025 Fortune Media IP Limited.

Merkez Bankaları Para Politikasını Güncellemek İç…
Merkez bankaları, programlanabilir blokzincir teknolojilerinin para politikası uygulamalarını nasıl dönüştürebileceğini araştırmaya başladı.

Star Wars'un Yapay Zeka Özel Efektleri Gösterisi …
Eğer Disney liderliği istediği gibi yaparsa, Sonun sonunda Patlayana kadar sürekli Star Wars yeniden yapımları, devam filmleri ve yan hikayelerle karşılaşacağız.