'인텔, 가우디 3 AI 가속기 출시: 경쟁력 있는 가격과 향상된 기능'

인텔은 오늘 AI 워크로드를 겨냥한 '가우디 3' 가속기를 공식적으로 출시했습니다. 새로운 프로세서들은 AI 및 HPC 애플리케이션을 위한 엔비디아의 널리 사용되는 H100 및 H200 GPU보다 느리지만, 인텔은 가우디 3의 경쟁력 있는 가격과 낮은 총 소유 비용(TCO)을 성공의 동력으로 삼고 있습니다. 가우디 3 프로세서는 64개의 텐서 프로세서 코어(TPC—FP32 축적기와 함께 256x256 MAC 구조 사용)를 포함한 두 개의 칩렛과 여덟 개의 행렬 곱셈 엔진(MME—256비트 벡터 프로세서)을 특징으로 하며, 인상적인 19. 2 TB/s 대역폭을 가진 96MB 온다이 SRAM 캐시를 갖추고 있습니다. 또한, 가우디 3는 24개의 200 GbE 네트워킹 인터페이스와 H. 265, H. 264, JPEG 및 VP9을 처리할 수 있는 14개의 미디어 엔진을 장착하여 비전 관련 작업을 지원합니다. 이 장치는 8개의 메모리 스택에 걸쳐 128GB의 HBM2E 메모리와 함께 제공되며, 3. 67 TB/s의 대역폭을 제공합니다. 전작인 가우디 2와 비교했을 때, 가우디 2는 24개의 TPC, 두 개의 MME 및 96GB의 HBM2E 메모리를 포함하고 있으며, 가우디 3는 상당한 업그레이드를 나타냅니다. 그러나 인텔은 가우디 3 프로세서가 이제 FP8 매트릭스 연산 및 BFloat16 매트릭스 및 벡터 연산만 지원하고 FP32, TF32 및 FP16 지원을 제거하면서 아키텍처를 단순화한 것 같습니다. 성능 측면에서 인텔은 가우디 3가 최대 1856 BF16/FP8 매트릭스 TFLOPS와 28. 7 BF16 벡터 TFLOPS를 달성할 수 있다고 주장하며, 이는 약 600W TDP에서 작동합니다. 문서상으로는 엔비디아의 H100에 비해 가우디 3는 약간 낮은 BF16 매트릭스 성능(1, 856 대 1, 979 TFLOPS), 절반의 FP8 매트릭스 성능(1, 856 대 3, 958 TFLOPS) 및 크게 감소된 BF16 벡터 성능(28. 7 대 1, 979 TFLOPS)을 보입니다. 그러나 기술 사양을 넘어 가우디 3의 실제 실질적인 성능이 중요할 것입니다.
이는 AMD의 Instinct MI300 시리즈와 엔비디아의 H100 및 B100/B200 프로세서와 경쟁해야 합니다. 이 경쟁은 소프트웨어 성능과 아직 완전히 평가되지 않은 기타 변수에 크게 좌우됩니다. 현재 인텔은 가우디 3가 엔비디아의 H100에 비해 상당한 가격 대비 성능 이점을 제공할 수 있다는 슬라이드를 공유했습니다. 올해 초 인텔은 하나의 기반 보드에 8개의 가우디 3 프로세서를 포함한 완전한 가속기 키트가 $125, 000에 가격을 책정할 것이라고 발표했으며, 프로세서 당 약 $15, 625입니다. 이에 비해 엔비디아 H100 카드는 약 $30, 678에 판매되고 있으며, 이는 인텔의 경쟁사를 향한 상당한 가격 우위를 보여줍니다. 그럼에도 불구하고, 엔비디아의 Blackwell 기반 B100/B200 GPU가 상당한 성능 이점을 제공할 가능성이 있어 인텔이 경쟁 우위를 유지할 수 있을지는 아직 불확실합니다.
Brief news summary
인텔은 비용 효율적인 AI 애플리케이션을 위해 설계된 '가우디 3' 가속기를 소개했습니다. 비록 성능 면에서 엔비디아 H100 및 H200 GPU를 따라잡지 못하지만, 64개의 텐서 프로세서 코어(TPC)와 고급 256x256 MAC 아키텍처를 특징으로 하는 두 개의 칩렛을 자랑합니다. 설계에는 여덟 개의 행렬 곱셈 엔진(MME) 및 96MB의 SRAM 캐시가 포함되어 있으며 인상적인 19.2 TB/s의 대역폭을 제공합니다. 주요 기능으로는 24개의 200 GbE 인터페이스, 비전 처리를 위한 14개의 미디어 엔진, 3.67 TB/s의 처리량을 자랑하는 128GB의 HBM2E 메모리가 있습니다. 전작인 가우디 2와 비교했을 때, 가우디 2는 24개의 TPC와 96GB의 메모리를 포함하였으며, 가우디 3는 상당한 향상을 보입니다. 그러나 행렬 연산은 FP8 및 BFloat16으로 제한되며, FP32 지원은 없다는 제한 사항이 있습니다. 가속기는 약 600W TDP에서 1856 BF16/FP8 매트릭스 TFLOPS 및 28.7 BF16 벡터 TFLOPS를 기록하면서도 여전히 엔비디아 제품보다 뒤쳐집니다. 여덟 개의 유닛 번들이 $125,000에 가격이 책정된 가우디 3는 $30,678의 엔비디아 H100보다 저렴합니다. 그러나 인텔은 엔비디아의 시장 지배력과 자사 사용자를 위한 강력한 소프트웨어 지원 보장과 같은 상당한 도전을 이겨내야 합니다.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

애플의 AI 임원, 메타의 슈퍼인텔리전스 팀 합류
애플의 선임 임원인 루오밍 팡(Ruoming Pang)은 회사의 인공지능 기초 모델 팀을 이끄는 인물로, 블룸버그 뉴스 보도에 따르면, 이 대기업을 떠나 메타 플랫폼스로 합류한다.

리플, 암호화폐 산업 성장 속 미국 은행 라이선스 신청
리플은 최근 신설된 신탁회사인 Standard Custody를 통해 연방준비제도 이사회의 마스터 계좌 신청서를 제출했습니다.

자율주행차와 인공지능: 안전 문제 극복하기
엔지니어와 개발자들은 AI 기반 자율주행 차량의 안전 문제 해결을 위해 집중적으로 노력하고 있으며, 특히 최근 사건들이 이 기술의 신뢰성과 안전성에 대한 광범위한 논쟁을 촉발하면서 더욱 긴장하고 있습니다.

SAP, ESG 보고를 위한 블록체인 기술을 ERP 시스템에 통합
SAP는 글로벌 기업용 소프트웨어 리더로서, 기업 자원 계획(ERP) 시스템에 블록체인 기반의 환경, 사회 및 지배구조(ESG) 보고 도구를 통합하는 중요한 업그레이드를 발표했습니다.

AI 도입이 늘어남에 따라 중간 관리자 수가 감소하다
인공지능(AI)이 빠르게 발전함에 따라 조직 구조, 특히 중간 관리의 역할에 미치는 영향이 점점 더 뚜렷해지고 있다.

블록체인 그룹, 1250만 달러 상당의 비트코인 확보로 비트코인 보유량 강화
블록체인 그룹, 1250만 달러 규모의 BTC 구매로 비트코인 보유량 강화 유럽의 비트코인 재무 회사, 상당한 수익 확보 후 1,904 BTC 기록 달성 2025년 7월 7일 오후 3:55 업데이트, 2025년 7월 7일 오전 7:53 발행

키넥시스, 탄소시장 블록체인 토큰화 출시
J.P. 모건의 대표 블록체인 사업 부서인 Kinexys는 멀티자산 토큰화 플랫폼인 Kinexys Digital Assets를 기반으로 글로벌 탄소 크레딧을 등록 수준에서 토큰화하는 혁신적인 블록체인 애플리케이션을 개발하고 있습니다.