lang icon Indonesian
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
2

Studi Baru Menunjukkan AI Mengalami Kesulitan Membaca Jam Analog dan Menghitung Tanggal Kalender

Penelitian terbaru telah mengidentifikasi serangkaian tugas yang dapat dilakukan manusia dengan mudah tetapi sulit bagi kecerdasan buatan (AI)—khususnya membaca jam analog dan menentukan hari dalam seminggu untuk tanggal tertentu. Meski AI mampu menghasilkan kode, gambar, teks yang menyerupai manusia, dan bahkan lulus ujian dengan tingkat keberhasilan yang bervariasi, alat ini sering kali salah menafsirkan posisi jarum jam dan gagal melakukan operasi dasar kalender. Studi ini dipresentasikan pada International Conference on Learning Representations (ICLR) 2025 dan dipublikasi di server preprint arXiv (belum melalui proses peer review). Temuan ini menyoroti kesenjangan signifikan dalam kemampuan AI untuk menyelesaikan tugas yang dikuasai manusia sejak usia dini. Rohit Saxena dari University of Edinburgh, sebagai penulis utama, menegaskan bahwa kekurangan ini harus diperbaiki agar AI dapat diterapkan secara efektif dalam konteks yang sensitif waktu dan dunia nyata seperti penjadwalan, otomasi, dan teknologi asistif. Para peneliti menguji berbagai model bahasa besar multimodal (MLLM)—termasuk Llama 3. 2-Vision dari Meta, Claude-3. 5 Sonnet dari Anthropic, Gemini 2. 0 dari Google, dan GPT-4o dari OpenAI—menggunakan dataset khusus berisi gambar jam dan kalender. Model-model tersebut gagal mengenali waktu pada jam atau menentukan hari dalam seminggu untuk tanggal sampel lebih dari setengah waktu, dengan tingkat akurasi hanya 38, 7% untuk jam dan 26, 3% untuk tugas kalender. Saxena menjelaskan bahwa ketidakmampuan AI dalam membaca jam berasal dari kurangnya penalaran spasial—tugas yang memerlukan deteksi jarum yang saling tumpang tindih, pengukuran sudut, dan interpretasi berbagai desain jam, seperti angka Romawi atau dial yang bergaya. Mengenali sebuah gambar sebagai jam lebih mudah bagi AI daripada membacanya secara akurat.

Begitu pula, meskipun aritmatika merupakan dasar komputasi, model bahasa besar tidak melakukan perhitungan menggunakan algoritma; sebaliknya, mereka memprediksi output berdasarkan pola data latihan. Hal ini menyebabkan penalaran yang tidak konsisten dan tidak berdasarkan aturan, menjelaskan tingkat kegagalan yang tinggi dalam operasi aritmatika terkait tanggal. Studi ini menambah bukti yang semakin banyak bahwa cara AI “memahami” dunia berbeda secara fundamental dari kognisi manusia. AI unggul ketika tersedia banyak contoh latihan, tetapi mengalami kesulitan dengan penalaran abstrak dan generalisasi, terutama pada tugas yang memadukan persepsi dan logika yang tepat. Selain itu, terbatasnya data latihan mengenai fenomena yang jarang terjadi, seperti tahun kabisat, menghambat kinerjanya, karena AI gagal membuat koneksi konseptual yang diperlukan. Temuan ini menegaskan perlunya dataset yang lebih kaya dan terarah serta evaluasi kembali kemampuan AI untuk mengintegrasikan penalaran logis dan spasial, serta memperingatkan risiko terlalu bergantung pada output AI dalam tugas-tugas kompleks. Saxena menekankan pentingnya pengujian yang ketat, mekanisme cadangan, dan pengawasan manusia secara rutin ketika AI ditugaskan menggabungkan persepsi dan penalaran yang tepat.



Brief news summary

Penelitian terbaru yang dipresentasikan di Konferensi Internasional tentang Representasi Pembelajaran 2025 menyoroti keterbatasan signifikan pada model AI saat ini seperti Llama 3.2-Vision dari Meta, Claude-3.5 Sonnet dari Anthropic, Gemini 2.0 dari Google, dan GPT-4o dari OpenAI. Meskipun telah ada kemajuan baru-baru ini, model-model ini mengalami kesulitan dengan tugas-tugas yang mudah dilakukan manusia, seperti membaca jam analog dan menentukan hari dalam minggu dari tanggal. Studi tersebut menemukan bahwa model-model ini benar menafsirkan waktu pada jam hanya 38,7% dari waktu dan tanggal kalender hanya 26,3%, menunjukkan ketergantungan mereka pada pengenalan pola daripada kemampuan penalaran yang sejati. Dipimpin oleh Rohit Saxena dari University of Edinburgh, penelitian ini mengungkapkan bahwa meskipun sistem AI dapat mengenali objek dengan akurat, mereka menghadapi tantangan signifikan dalam tugas penalaran spasial dan logika yang kompleks, terutama yang melibatkan peristiwa langka seperti tahun kabisat. Temuan ini menegaskan perlunya pendekatan pelatihan baru yang mengintegrasikan keterampilan penalaran logis dan spasial dan memperingatkan terhadap ketergantungan berlebihan pada AI untuk tugas-tugas yang memerlukan perhitungan yang tepat. Pada akhirnya, studi ini menyoroti perbedaan mendasar antara kognisi manusia dan pencocokan pola AI, serta mendorong perlunya validasi menyeluruh dan pengawasan manusia dalam aplikasi dunia nyata yang sensitif terhadap waktu.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia mendapatkan dorongan AI, Meta menghadapi h…

Pertempuran berikutnya dalam perlombaan senjata kecerdasan buatan bukanlah Beijing—melainkan Riyadh, setidaknya menurut Wedbush.

May 18, 2025, 2:23 a.m.

Internet publik adalah hambatan bagi blockchain —…

Menurut Austin Federa, co-founder dan CEO DoubleZero—sebuah proyek yang berfokus pada pengembangan jalur komunikasi serat optik berkecepatan tinggi untuk blockchain—infrastruktur internet publik adalah hambatan utama dalam kecepatan dan kinerja jaringan blockchain berper throughput tinggi.

May 18, 2025, 1:30 a.m.

Shoosmiths Berikan Insentif Adopsi AI dengan Bonu…

Pada awal bulan lalu, Shoosmiths, sebuah firma hukum Inggris dengan 1.500 karyawan, mengumumkan sebuah dana bonus sebesar £1 juta yang akan dibagikan kepada staf jika mereka secara kolektif mengadopsi alat AI milik Microsoft, Copilot, dalam alur kerja mereka.

May 18, 2025, 12:37 a.m.

JP Morgan Menyelesaikan Transaksi Perbendaharaan …

JP Morgan telah menyelesaikan transaksi perdananya di blockchain publik, menandakan meningkatnya keterlibatan raksasa keuangan tersebut dengan ekosistem Web3.

May 18, 2025, 12:13 a.m.

Chip AI adalah "mata uang" baru di dunia karena m…

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

Bank Sentral Jelajahi Blockchain untuk Modernisas…

Bank sentral mulai menyelidiki bagaimana teknologi blockchain yang dapat diprogram dapat mengubah pelaksanaan kebijakan moneter.

May 17, 2025, 10:51 p.m.

Pertunjukan Efek Khusus AI di Star Wars adalah In…

Jika pihak kepemimpinan Disney memiliki keinginan, kita akan dibanjiri dengan reboot, sekuel, dan spinoff Star Wars yang tak berujung hingga Matahari akhirnya meledak.

All news