이유 모델 발전에도 불구하고 AI 환각 현상 악화 — 산업의 도전 과제 설명

인공지능 모델은 오랫동안 환각(hallucination) 문제에 직면해 왔는데, 이는 산업계에서 대형 언어 모델이 종종 사실이 아닌 정보를 사실인 것처럼 내놓는 것을 은유적으로 이르는 말입니다. 최근 구글과 오픈AI 같은 기업들이 문제를 해결하기 위해 개발한 "추론" 모델들이 문제 해결을 위해 생각하는 방식을 택함에 따라, 이 문제가 개선되지 않고 오히려 악화되고 있다는 징후가 보입니다. 뉴욕타임스에 따르면, 인공지능 모델이 강력해질수록 환각 발생률이 오히려 증가하는 것으로 나타났습니다. 이는 사용자가 오픈AI의 채팅봇인 ChatGPT와 같은 인공지능 기반 대화체를 더 많이 활용하면서 다양한 작업에 적용하는 가운데 일어나고 있는 현실입니다. 채팅봇이 의심스러운 또는 잘못된 정보를 생성할 경우, 사용자들은 곤란을 겪거나 더 심각한 결과를 맞이할 위험이 있습니다. 더욱 문제인 점은, AI 기업들이 왜 지금 더 많은 오류를 만들어내는지 그 원인을 찾는 데 어려움을 겪고 있다는 것입니다. 이는 AI를 만든 사람들조차 그 기술이 어떻게 작동하는지 완전히 이해하지 못하는 상황을 드러내고 있습니다. 이 충격적인 현상은 업계 안의 일반적인 믿음—즉, AI 모델을 확장하면 자연스럽게 더 신뢰할 수 있고 능력도 향상된다는 생각—에 도전이 되고 있습니다. 위기감은 매우 큽니다. 기업들이 점점 더 크고 강력한 "추론" 모델을 구축하기 위해 수십억 달러에 달하는 투자를 계속하는 상황에서 말입니다. 일부 전문가들은 환각 현상이 본질적인 기술 특성일 수 있다고 믿으며, 이 문제를 완전히 해결하는 것은 거의 불가능할 것이라고 지적합니다. “최선을 다해도, 그들은 언제나 환각을 일으킬 것이다, ”라고 AI 스타트업 벡타라( vectara)의 CEO 암르 아와달레드(Amr Awadallah)는 뉴욕타임스에 말했다.
“이 문제는 절대 사라지지 않을 것이다. ” 이 문제의 심각성을 반영하듯, 환각 문제를 해결하거나 완화하는 데 특화된 기업들도 등장하고 있습니다. “이 오류들을 제대로 처리하지 않으면, AI 시스템의 가치는 거의 없어지고 만다, ”라고 NYT와 인터뷰한 AI 컨설팅업체 오카후(Okahu)의 공동창업자 프라틱 베르마(Pratik Verma)는 말했습니다. 그는 AI를 보다 효과적으로 활용하는 방법을 돕는 역할을 하고 있습니다. 이와 관련하여, 지난달 말 공개된 오픈AI의 최신 추론 모델인 o3와 o4-mini는 이전 버전보다 환각 빈도가 더 높았던 것으로 밝혀졌습니다. 오픈AI 내부 정확도 평가 기준에서, o4-mini 모델은 48%의 확률로 환각을 일으켰으며, 이는 신뢰도가 낮음을 보여줍니다. o3 모델 역시 환각률이 33%로, 회사의 이전 추론 모델보다 두 배 가까이 높았습니다. 뉴욕타임스는 이와 유사하게 구글과 딥시크와 같은 경쟁업체들도 같은 문제에 직면해 있어, 이는 업계 전반의 도전 과제임을 시사한다고 전했습니다. 전문가들은, 인공지능 모델이 커질수록 새롭게 출시되는 모델이 이전 모델보다 갖는 개선 효과는 점점 줄어들고 있다고 경고합니다. 기업들이 급히 훈련 데이터를 모두 소진하면서 가짜이거나 AI가 생성하는 데이터(synthetic data)를 활용하는 경우도 늘어나고 있는데, 이는 잠재적으로 재앙적 결과를 초래할 수 있습니다. 요약하자면, 지속적인 노력에도 불구하고 환각 현상은 그 어느 때보다 만연하며, 현재로서는 이 기술이 성과를 내기 시작했다는 징후를 보이지 않고 있습니다. 더 자세한 AI 환각 문제에 대해 알고 싶다면, “You Can’t Lick a Badger Twice”: Google's AI Is Making Up Explanations for Nonexistent Folksy Sayings(구글의 AI가 존재하지 않는 구수한 속담에 대해 설명을 만들어내고 있다)를 참고하시기 바랍니다.
Brief news summary
인공지능 모델은 점점 더 많은 ‘환각(hallucinations)’이라는 잘못된 정보 생성을 일으키고 있는데, 이는 이들이 사실이 아닌 정보를 제공하는 현상입니다. 이러한 문제는 논리력 향상에도 불구하고 발생하며, OpenAI의 ChatGPT와 같은 널리 사용되는 AI 도구들에 큰 영향을 미치고 있습니다. 놀랍게도, 더 크고 발전된 모델일수록 환각 현상이 더 자주 발생하는 경향이 있어, 큰 모델이 항상 더 신뢰받는다는 믿음을 흔들고 있습니다. 전문가들은 현재 AI 기술의 본질적 한계로서 환각을 보고 있으며, AI에 대한 투자 증가에도 불구하고 이 문제는 해결되지 않고 있습니다. 이에 대해 기업들은 환각을 감지하고 관리하는 서비스를 출시하며, 무시하면 AI의 가치를 떨어뜨릴 것이라는 인식을 갖고 있습니다. 연구에 따르면, OpenAI의 최신 모델은 약 48%의 확률로 환각을 일으키며, 구글의 모델들도 유사한 문제를 보여 산업 전반에 걸친 난제임을 드러냅니다. 합성 훈련 데이터와 모델 크기 확대와 같은 요인들이 환각률을 악화시킬 수 있습니다. 결론적으로, AI의 환각 문제는 여전히 해결책이 뚜렷하지 않은 매우 심각하고 증가하는 문제로 남아있습니다.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

암호화폐의 과감한 시도: 블록체인으로 주식시장 재건하기
포트폴리오에 접속하려면 로그인하세요 로그인

메타, 인공지능 데이터 센터를 위해 사모대출 회사들로부터 290억 달러 조달 추진
메타 플랫폼스는 현재 아폴로 글로벌 매니지먼트, KKR, 브룩필드, 칼라일, PIMCO 등 여러 유명 투자 회사들과 고도 협상을 진행 중이며, 미국 전역의 인공지능 중심 데이터 센터 설립을 지원하기 위해 290억 달러의 상당한 자금을 모금하는 것을 목표로 하고 있습니다.

디지털 자산, 캐번 네트워크 블록체인 강화를 위해 1억 3500만 달러 모금
화요일(6월 24일) 발표된 이번 투자 라운드는 DRW 벤처 캐피털과 Tradeweb Markets가 주도했으며, 골드만삭스 등 다수의 투자자가 참여하여 블록체인 구축에 중요한 역할을 했습니다.

인공지능 부활의 부상: 윤리적 및 심리적 함의
인공지능의 발전은 “디지털 부활”이라는 복잡한 현상을 도입했으며, 이는 기술이 사망한 이들의 모습, 목소리, 행동을 재현하는 것을 의미합니다.

첫 번째로 공개된 SpaceX 주식, 이제 블록체인을 통해 거래 가능
한때 나는 우주비행사가 되는 꿈을 꾸었다.

트럼프, 중국 경쟁 속 AI 성장 가속화를 위한 행정 명령 추진 계획
트럼프 행정부는 미국 전역에 걸쳐 인공지능(AI) 기술의 확장을 가속화하기 위한 일련의 행정 조치를 적극적으로 준비하고 있으며, 이는 주로 국가의 기술 발전에서 중국보다 경쟁 우위를 확보하려는 목표에서 비롯된 것이다.

천재법안 상원 통과, 스테이블코인 법안 거의 마무리
상원은 초당적 GENIUS 법안("신흥 혁신을 위한 공정하고 안전하며 안정적인 스테이블코인 준비")에 대한 토론을 마감하며, 이는 스테이블코인에 대한 포괄적인 규제 체계 수립을 향한 중요한 단계입니다.