이유 모델 발전에도 불구하고 AI 환각 현상 악화 — 산업의 도전 과제 설명

인공지능 모델은 오랫동안 환각(hallucination) 문제에 직면해 왔는데, 이는 산업계에서 대형 언어 모델이 종종 사실이 아닌 정보를 사실인 것처럼 내놓는 것을 은유적으로 이르는 말입니다. 최근 구글과 오픈AI 같은 기업들이 문제를 해결하기 위해 개발한 "추론" 모델들이 문제 해결을 위해 생각하는 방식을 택함에 따라, 이 문제가 개선되지 않고 오히려 악화되고 있다는 징후가 보입니다. 뉴욕타임스에 따르면, 인공지능 모델이 강력해질수록 환각 발생률이 오히려 증가하는 것으로 나타났습니다. 이는 사용자가 오픈AI의 채팅봇인 ChatGPT와 같은 인공지능 기반 대화체를 더 많이 활용하면서 다양한 작업에 적용하는 가운데 일어나고 있는 현실입니다. 채팅봇이 의심스러운 또는 잘못된 정보를 생성할 경우, 사용자들은 곤란을 겪거나 더 심각한 결과를 맞이할 위험이 있습니다. 더욱 문제인 점은, AI 기업들이 왜 지금 더 많은 오류를 만들어내는지 그 원인을 찾는 데 어려움을 겪고 있다는 것입니다. 이는 AI를 만든 사람들조차 그 기술이 어떻게 작동하는지 완전히 이해하지 못하는 상황을 드러내고 있습니다. 이 충격적인 현상은 업계 안의 일반적인 믿음—즉, AI 모델을 확장하면 자연스럽게 더 신뢰할 수 있고 능력도 향상된다는 생각—에 도전이 되고 있습니다. 위기감은 매우 큽니다. 기업들이 점점 더 크고 강력한 "추론" 모델을 구축하기 위해 수십억 달러에 달하는 투자를 계속하는 상황에서 말입니다. 일부 전문가들은 환각 현상이 본질적인 기술 특성일 수 있다고 믿으며, 이 문제를 완전히 해결하는 것은 거의 불가능할 것이라고 지적합니다. “최선을 다해도, 그들은 언제나 환각을 일으킬 것이다, ”라고 AI 스타트업 벡타라( vectara)의 CEO 암르 아와달레드(Amr Awadallah)는 뉴욕타임스에 말했다.
“이 문제는 절대 사라지지 않을 것이다. ” 이 문제의 심각성을 반영하듯, 환각 문제를 해결하거나 완화하는 데 특화된 기업들도 등장하고 있습니다. “이 오류들을 제대로 처리하지 않으면, AI 시스템의 가치는 거의 없어지고 만다, ”라고 NYT와 인터뷰한 AI 컨설팅업체 오카후(Okahu)의 공동창업자 프라틱 베르마(Pratik Verma)는 말했습니다. 그는 AI를 보다 효과적으로 활용하는 방법을 돕는 역할을 하고 있습니다. 이와 관련하여, 지난달 말 공개된 오픈AI의 최신 추론 모델인 o3와 o4-mini는 이전 버전보다 환각 빈도가 더 높았던 것으로 밝혀졌습니다. 오픈AI 내부 정확도 평가 기준에서, o4-mini 모델은 48%의 확률로 환각을 일으켰으며, 이는 신뢰도가 낮음을 보여줍니다. o3 모델 역시 환각률이 33%로, 회사의 이전 추론 모델보다 두 배 가까이 높았습니다. 뉴욕타임스는 이와 유사하게 구글과 딥시크와 같은 경쟁업체들도 같은 문제에 직면해 있어, 이는 업계 전반의 도전 과제임을 시사한다고 전했습니다. 전문가들은, 인공지능 모델이 커질수록 새롭게 출시되는 모델이 이전 모델보다 갖는 개선 효과는 점점 줄어들고 있다고 경고합니다. 기업들이 급히 훈련 데이터를 모두 소진하면서 가짜이거나 AI가 생성하는 데이터(synthetic data)를 활용하는 경우도 늘어나고 있는데, 이는 잠재적으로 재앙적 결과를 초래할 수 있습니다. 요약하자면, 지속적인 노력에도 불구하고 환각 현상은 그 어느 때보다 만연하며, 현재로서는 이 기술이 성과를 내기 시작했다는 징후를 보이지 않고 있습니다. 더 자세한 AI 환각 문제에 대해 알고 싶다면, “You Can’t Lick a Badger Twice”: Google's AI Is Making Up Explanations for Nonexistent Folksy Sayings(구글의 AI가 존재하지 않는 구수한 속담에 대해 설명을 만들어내고 있다)를 참고하시기 바랍니다.
Brief news summary
인공지능 모델은 점점 더 많은 ‘환각(hallucinations)’이라는 잘못된 정보 생성을 일으키고 있는데, 이는 이들이 사실이 아닌 정보를 제공하는 현상입니다. 이러한 문제는 논리력 향상에도 불구하고 발생하며, OpenAI의 ChatGPT와 같은 널리 사용되는 AI 도구들에 큰 영향을 미치고 있습니다. 놀랍게도, 더 크고 발전된 모델일수록 환각 현상이 더 자주 발생하는 경향이 있어, 큰 모델이 항상 더 신뢰받는다는 믿음을 흔들고 있습니다. 전문가들은 현재 AI 기술의 본질적 한계로서 환각을 보고 있으며, AI에 대한 투자 증가에도 불구하고 이 문제는 해결되지 않고 있습니다. 이에 대해 기업들은 환각을 감지하고 관리하는 서비스를 출시하며, 무시하면 AI의 가치를 떨어뜨릴 것이라는 인식을 갖고 있습니다. 연구에 따르면, OpenAI의 최신 모델은 약 48%의 확률로 환각을 일으키며, 구글의 모델들도 유사한 문제를 보여 산업 전반에 걸친 난제임을 드러냅니다. 합성 훈련 데이터와 모델 크기 확대와 같은 요인들이 환각률을 악화시킬 수 있습니다. 결론적으로, AI의 환각 문제는 여전히 해결책이 뚜렷하지 않은 매우 심각하고 증가하는 문제로 남아있습니다.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

블록체인 생태계가 40억 축구 팬들이 웹3를 수용할 수 있는 무대를 마련하다
0xFútbol은 블록체인 기술을 통합하여 전 세계 축구 커뮤니티를 하나로 묶고자 합니다.

커튼 뒤에서: 위대한 융합
미국 정부와 선도 기술 기업들이 지속적으로 결합하는 모습은 인공지능(AI)과 우주기술에서 혁신적인 변화를 예고하고 있다.

왜 블록체인에서 프라이버시가 오픈 소스부터 시작되어야 하는가
전통적으로 신뢰는 은행, 결제 네트워크, 청산소와 같은 중앙집중식 기관에 의존했으며, 이는 외부 감사, 정부 규제, 오랜 준수 기록 등을 통해 안전하다고 느끼는 폐쇄 시스템이었습니다.

자율주행 차량의 인공지능: 앞으로의 길을 안내하다
인공지능(AI)은 빠르게 발전하는 자율주행차 산업의 핵심으로서, 차량이 어떻게 작동하고 환경과 상호작용하는지에 큰 변화를 이끌고 있습니다.

버겐 카운티, 토지 기록 현대화 및 보안 강화 위한 블록체인 파일럿 프로젝트 시작 - R…
버겐 카운티는 블록체인 스타트업 발코니와 5년간 파트너십을 맺고 37만 건의 부동산 등기서를 디지털화하고 보안을 강화하는 프로젝트를 진행하고 있으며, 이는 약 2,400억 달러의 부동산 가치에 해당합니다.

의료 분야의 AI: 진단 정확도 향상과 환자 결과 개선
인공지능(AI)은 의료 분야를 점점 더 혁신하며 의료 전문가들이 다양한 질환을 진단하고 치료하며 관리하는 방식을 향상시키고 있습니다.

이 플랫폼은 구식 급여 시스템에 대한 블록체인 솔루션을 제공합니다.
Circle, Coinbase, Solana Ventures와 같은 주요 투자자들의 지지를 받는 Zebec Network는 스트리밍 급여, 암호화폐 카드, 기업용 도구를 통해 Web2와 Web3를 연결하며 실물 금융 인프라를 구축하는 것을 목표로 하고 있습니다.