lang icon Vietnamese
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
2

Nghiên cứu mới cho thấy trí tuệ nhân tạo gặp khó khăn trong việc đọc đồng hồ cũ và tính toán ngày trên lịch

Nghiên cứu mới đây đã xác định một bộ nhiệm vụ mà con người dễ dàng thực hiện nhưng trí tuệ nhân tạo (AI) lại gặp khó khăn—cụ thể là đọc đồng hồ kim và xác định ngày trong tuần dựa trên một ngày cho trước. Dù AI có thể tạo mã, hình ảnh, văn bản giống như con người và thậm chí vượt qua các kỳ thi ở mức độ khác nhau, nó thường xuyên hiểu sai vị trí của kim đồng hồ và gặp khó trong những phép tính lịch cơ bản. Nghiên cứu này, trình bày tại Hội nghị quốc tế về Đặc trưng Học tập (ICLR) năm 2025 và được đăng tải trên máy chủ bản nháp arXiv (chưa qua đánh giá ngang hàng), nhấn mạnh những khoảng trống đáng kể trong khả năng của AI thực hiện các nhiệm vụ mà con người thành thạo từ khi còn nhỏ. Tác giả chính Rohit Saxena của Đại học Edinburgh nhấn mạnh rằng những hạn chế này cần được khắc phục để AI có thể ứng dụng hiệu quả trong các bối cảnh nhạy cảm về thời gian và thực tế như lập lịch trình, tự động hóa và công nghệ hỗ trợ. Các nhà nghiên cứu đã thử nghiệm nhiều mô hình ngôn ngữ đa phương thức lớn (MLLMs)—bao gồm Llama 3. 2-Vision của Meta, Claude-3. 5 Sonnet của Anthropic, Gemini 2. 0 của Google, và GPT-4o của OpenAI—sử dụng một bộ dữ liệu tùy chỉnh gồm hình ảnh đồng hồ và lịch. Các mô hình đã thất bại trong việc xác định chính xác thời gian trên đồng hồ hoặc nhận biết ngày trong tuần cho các ngày mẫu hơn một nửa thời gian, với tỷ lệ chính xác chỉ 38, 7% đối với đồng hồ và 26, 3% đối với nhiệm vụ lịch. Saxena giải thích rằng khả năng đọc sai giờ của AI bắt nguồn từ việc thiếu khả năng lý luận không gian—các nhiệm vụ yêu cầu phát hiện kim đồng hồ chồng chéo, đo góc và hiểu các thiết kế đồng hồ đa dạng như số La Mã hoặc mặt số cách điệu. Nhận diện một hình ảnh như đồng hồ dễ hơn đối với AI so với việc đọc chính xác.

Tương tự, mặc dù phép tính là nền tảng của công nghệ thông tin, các mô hình ngôn ngữ lớn không thực hiện các phép tính qua thuật toán; thay vào đó, chúng dự đoán kết quả dựa trên các mẫu trong dữ liệu huấn luyện. Điều này gây ra lý luận không nhất quán và không dựa trên quy tắc, giải thích tỷ lệ thất bại cao trong các phép tính liên quan đến ngày tháng. Nghiên cứu này góp phần vào bằng chứng ngày càng lấy rõ rằng cách AI “hiểu” thế giới khác biệt căn bản so với nhận thức của con người. AI hoạt động tốt khi có nhiều ví dụ huấn luyện nhưng gặp khó trong lý luận trừu tượng và khả năng tổng quát hóa, đặc biệt với các nhiệm vụ đòi hỏi kết hợp cảm nhận và lý luận chính xác. Thêm vào đó, dữ liệu huấn luyện hạn chế về các hiện tượng hiếm gặp như năm nhuận cũng làm giảm hiệu suất, khi AI không thể liên kết các khái niệm cần thiết. Những phát hiện này nhấn mạnh cần có bộ dữ liệu phong phú, mục tiêu hơn và đánh giá lại khả năng tích hợp lý luận và nhận thức không gian của AI, đồng thời làm rõ những rủi ro khi dựa quá nhiều vào kết quả của AI trong các nhiệm vụ phức tạp. Saxena nhấn mạnh nhu cầu kiểm tra nghiêm ngặt, các cơ chế dự phòng và sự giám sát của con người khi AI đảm nhiệm các nhiệm vụ yêu cầu kết hợp cảm nhận và lý luận chính xác.



Brief news summary

Nghiên cứu mới được trình bày tại Hội nghị Quốc tế về Trình diễn Học tập năm 2025 nhấn mạnh những hạn chế đáng kể của các mô hình AI hiện tại như Llama 3.2-Vision của Meta, Claude-3.5 Sonnet của Anthropic, Gemini 2.0 của Google và GPT-4o của OpenAI. Mặc dù đã có những tiến bộ gần đây, các mô hình này vẫn gặp khó khăn với những nhiệm vụ dễ dàng đối với con người, chẳng hạn như đọc đồng hồ kim và xác định ngày trong tuần từ ngày tháng. Nghiên cứu nhận thấy các mô hình này chỉ chính xác trong việc đọc giờ đồng hồ 38,7% lần và ngày lịch chỉ 26,3%, làm nổi bật sự dựa vào nhận dạng mẫu thay vì khả năng lý luận chân chính. Dẫn dắt bởi Rohit Saxena từ Đại học Edinburgh, nghiên cứu cho thấy trong khi các hệ thống AI có thể nhận diện vật thể chính xác, chúng gặp nhiều thách thức rõ rệt trong các nhiệm vụ suy luận không gian và logic phức tạp, đặc biệt là liên quan đến các sự kiện hiếm gặp như năm nhuận. Những phát hiện này nhấn mạnh sự cần thiết của các phương pháp đào tạo mới tích hợp kỹ năng suy luận logic và không gian, đồng thời cảnh báo về việc quá phụ thuộc vào AI cho các nhiệm vụ yêu cầu tính toán chính xác. Cuối cùng, nghiên cứu làm rõ sự khác biệt căn bản giữa nhận thức của con người và khả năng phân biệt mẫu của AI, thúc đẩy việc xác minh toàn diện và giám sát của con người trong các ứng dụng thực tế yêu cầu độ chính xác cao và kịp thời.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

Nvidia tăng cường AI, Meta gặp khó khăn trong AI,…

Trận đấu tiếp theo trong cuộc đua vũ trang AI không phải ở Bắc Kinh — mà là ở Riyadh, ít nhất theo nhận định của Wedbush.

May 18, 2025, 2:23 a.m.

Internet công cộng là điểm nghẽn đối với blockcha…

Theo Austin Federa, đồng sáng lập kiêm CEO của DoubleZero—một dự án tập trung phát triển hệ thống truyền thông cáp quang tốc độ cao dành cho blockchain—hạ tầng internet công cộng là nguyên nhân chính gây tắc nghẽn về tốc độ và hiệu suất cho các mạng blockchain có xử lý cao.

May 18, 2025, 1:30 a.m.

Shoosmiths thúc đẩy việc sử dụng AI bằng khoản th…

Vào đầu tháng trước, công ty luật Shoosmiths của Anh, với 1.500 nhân viên, đã công bố một quỹ thưởng trị giá 1 triệu bảng Anh sẽ được chia sẻ cho nhân viên nếu họ cùng nhau tích hợp công cụ AI của Microsoft, Copilot, vào quy trình làm việc của mình.

May 18, 2025, 12:37 a.m.

JP Morgan Thỏa thuận Giao dịch Khoản Tiết Kiệm Đầ…

JP Morgan đã hoàn tất giao dịch đầu tiên trên một blockchain công khai, báo hiệu sự tham gia ngày càng sâu rộng của gã khổng lồ tài chính này vào hệ sinh thái Web3.

May 18, 2025, 12:13 a.m.

Vi xử lý AI trở thành "đồng tiền của vương quốc" …

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

Các Ngân hàng Trung ương Khám phá Blockchain để C…

Ngân hàng trung ương bắt đầu nghiên cứu cách các công nghệ blockchain có thể lập trình có thể chuyển đổi việc thực hiện chính sách tiền tệ.

May 17, 2025, 10:51 p.m.

Màn trình diễn Hiệu ứng đặc biệt của Star Wars về…

Nếu ban lãnh đạo của Disney có ý định như vậy, chúng ta sẽ bị ngập tràn trong những đợt làm mới, phần tiếp theo và spin-off của Star Wars cứ thế kéo dài cho đến khi Mặt Trời cuối cùng phát nổ.

All news