lang icon Korean
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 17, 2025, 9:16 p.m.
3

새 연구 결과, AI가 아날로그 시계 읽기와 달력 날짜 계산에 어려움을 겪는다

새로운 연구에 따르면, 인간은 아무 힘들이지 않고 수행하는 특정 작업들이 있는데, 인공지능(AI)은 이에 어려움을 겪고 있다—구체적으로는 아날로그 시계를 읽거나 특정 날짜의 요일을 판단하는 것이다. AI는 코드, 이미지, 인간과 유사한 텍스트를 생성하거나 시험에 합격하는 등 다양한 능력을 보여주지만, 시계 바늘의 위치를 오해하거나 기본 달력 계산을 실패하는 일이 자주 발생한다. 이 연구는 2025년 국제 학습 표현 회의(ICLR)에서 발표되었으며, 사전 인쇄 서버인 arXiv에 게재되었으나 아직 동료 검토를 받지 않았다. 연구는 인간이 어릴 때 자연스럽게 습득하는 임무들에 비해 AI의 수행 능력에 큰 차이가 있음을 강조한다. 에딘버러 대학의 로힛 쌕스나(저자 대표)는 이러한 부족한 점들을 해결하는 것이 AI를 일정 관리, 자동화, 보조 기술 등 시간에 민감한 실제 상황에 효과적으로 활용하기 위해 반드시 필요하다고 말했다. 연구팀은 Meta의 라마 3. 2 비전(Llama 3. 2-Vision), Anthropic의 클로드 3. 5 소네트(Claude-3. 5 Sonnet), 구글의 제미니 2. 0(Gemini 2. 0), OpenAI의 GPT-4o 등 다양한 다중모달 대형 언어 모델(MLLMs)을, 시계와 달력 이미지로 구성된 맞춤 데이터를 사용하여 테스트했다. 그 결과, 모델들은 샘플 시계 시간이나 날짜의 요일을 정확히 판단하지 못했으며, 시계 인식 정확률은 38. 7%, 달력 작업은 26. 3%에 그쳤다. 쌕스나는 AI의 시계 읽기 성능이 낮은 이유로 공간적 추론 능력의 부족을 꼽았다—이 작업은 겹치는 시침, 각도 측정, 로마숫자 또는 양식화된 다이얼 등 다양한 시계 설계를 해석하는 능력을 필요로 한다. AI가 이미지를 시계로 인식하는 것은 쉽지만, 정확히 읽는 것은 어렵다.

이와 유사하게, 계산 자체는 기본적이지만, 대형 언어 모델은 알고리즘 방식으로 계산하는 것이 아니라 학습 데이터 패턴을 기반으로 결과를 예측하기 때문에, 일관적이지 않고 규칙이 없는 추론을 하게 된다. 이로 인해 날짜 관련 산술 계산에서는 높은 실패율이 발생한다. 이 연구는 AI의 “이해” 방식이 인간의 인지와 근본적으로 다르다는 점을 보여주는 증거를 계속해서 더하고 있다. AI는 충분한 학습 예시가 존재할 때 뛰어나지만, 추상적 추론과 일반화 면에서는 어려움을 겪으며, 특히 인식과 논리적 연산이 결합된 작업에서는 더욱 그렇다. 또한, 윤년과 같은 희귀 현상에 대한 제한된 학습 데이터는 성능을 저해하며, 개념적 연결이 부족한 것도 문제로 작용한다. 이 결과들은 더 풍부하고 타겟팅된 데이터셋의 필요성, 논리적 및 공간적 추론 능력 통합에 대한 재평가의 중요성을 강조한다. 아울러, 복잡한 작업에서 AI의 출력에 지나치게 의존하는 위험성을 경고하며, 쌕스나는 AI가 인식과 정밀한 추론을 결합하는 업무를 수행할 때 엄격한 테스트, 예비 대책, 그리고 인간의 감독이 반드시 필요하다고 강조했다.



Brief news summary

2025년 국제 학습 표현 컨퍼런스(ICLR)에서 발표된 새로운 연구는 Meta의 Llama 3.2-Vision, Anthropic의 Claude-3.5 Sonnet, Google의 Gemini 2.0, OpenAI의 GPT-4o와 같은 현재 AI 모델들의 심각한 한계를 강조하고 있다. 최근의 발전에도 불구하고 이 모델들은 아날로그 시계를 읽거나 날짜로 요일을 판단하는 등 인간에게는 간단한 작업에서 어려움을 겪고 있다. 연구 결과 이 모델들은 시계 시간을 38.7%의 정확도로 해석했고, 달력 날짜는 겨우 26.3%의 정확도로 이해하는 것으로 나타나, 패턴 인식에 의존할 뿐 진정한 추론 능력에는 한계가 있음을 보여준다. 에딘버러 대학의 로힛 색세나가 이끄는 이 연구는 AI 시스템이 사물을 정확히 식별할 수는 있지만, 특히 윤년과 같은 흔치 않은 사건을 포함하는 복잡한 공간 및 논리적 추론 작업에는 상당한 어려움이 있음을 밝혀냈다. 이 연구는 논리적·공간적 추론 능력을 통합한 새로운 학습 방법의 필요성을 강조하며, 정밀한 계산이 요구되는 작업에 대해 AI에 과도하게 의존할 경우 위험성을 경고한다. 궁극적으로 이 연구는 인간 인지와 AI의 패턴 매칭 사이의 근본적인 차이를 드러내며, 시간에 민감한 실제 응용 분야에서 포괄적인 검증과 인간의 감독이 필수적임을 주장한다.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 18, 2025, 2:59 a.m.

엔비디아, AI 성과 급증…메타는 AI 진전에 난관, 애플은 혹독한 한 해: 기술 뉴스 …

다음 AI 군비 경쟁의 전장은 베이징이 아니라 적어도 웨드부시의 의견에 따르면 리야드이다.

May 18, 2025, 2:23 a.m.

공개 인터넷은 블록체인에 있어 병목 현상이다 — 더블제로 CEO

오스틴 페드레아( Austin Federa)에 따르면, 더블제로( DoubleZero)의 공동 창립자이자 CEO는 고속 광섬유 통신 레일 구축에 집중하는 프로젝트로, 공공 인터넷 인프라가 고처리량 블록체인 네트워크의 주요 속도 및 성능 병목현상이라고 지적했습니다.

May 18, 2025, 1:30 a.m.

슈솜이즈, AI 도입 촉진 위해 100만 파운드 보너스 제공

지난달 초, 영국 로펌인 Shoosmiths는 1,500명의 직원들이 Microsoft의 AI 도구인 Copilot을 업무에 함께 도입할 경우, 직원들 간에 공유할 수 있는 100만파운드의 보너스 풀을 발표했습니다.

May 18, 2025, 12:37 a.m.

JP 모건, 체인링크와 온도 파이낸스 이용하여 최초의 토큰화 재무 거래 공공 블록체인에서…

JP 모건은 공개 블록체인상에서 최초 거래를 완료하며 금융 대기업의 Web3 생태계 참여가 점차 확대되고 있음을 보여주고 있습니다.

May 18, 2025, 12:13 a.m.

뇌파 칩이 새로운 '국가 화폐'로 부상하며 지정학적 협상의 원활한 진행에 핵심 역할을 한…

© 2025 Fortune Media IP Limited.

May 17, 2025, 11:10 p.m.

중앙은행들이 금융 정책 현대화를 위해 블록체인 기술을 탐구하다

중앙은행들은 프로그래머블 블록체인 기술이 금융통화정책의 실행 방식을 어떻게 변화시킬 수 있을지 조사하기 시작했습니다.

May 17, 2025, 10:51 p.m.

스타워즈의 인공지능 특수효과 전시, 완전한 참사

디즈니 경영진이 원하는 대로라면, 우리는 결국 태양이 폭발할 때까지 끝없이 스타워즈 리부트, 속편, 스핀오프에 휩쓸리게 될 것입니다.

All news