None
Brief news summary
Etched, une start-up spécialisée dans les puces axées sur les transformateurs, a introduit Sohu, un circuit intégré spécifique à une application (ASIC) qui prétend surpasser le modèle H100 de Nvidia en termes d'inférence AI LLM. Un seul serveur Sohu 8x prétend offrir les performances équivalentes à 160 GPU H100, ce qui pourrait réduire les coûts des centres de traitement des données. Les accélérateurs AI actuels sont conçus pour prendre en charge différentes architectures AI, ce qui entraîne une grande partie de la puissance de calcul allouée à la programmabilité. Cependant, la popularité de l'architecture AI transformer a incité Etched à développer Sohu spécifiquement pour les modèles de transformateur. Ce mouvement pourrait constituer une menace pour la domination de Nvidia dans le domaine de l'AI. De plus, la conception spécialisée de Sohu pourrait contribuer à résoudre les problèmes de consommation d'énergie associés aux centres de données AI.La startup Etched a dévoilé un nouveau circuit intégré spécifique à une application (ASIC) appelé Sohu, qui prétend surpasser le H100 de Nvidia dans l'inférence de modèles de langage d'IA. Cette puce est spécifiquement conçue pour les modèles de transformer, ce qui lui permet d'allouer plus de transistors pour les calculs d'IA.
Le lancement de Sohu pose une menace potentielle à la domination de Nvidia dans le domaine de l'IA, car les entreprises qui utilisent exclusivement des modèles de transformer pourraient migrer vers Sohu en raison de son efficacité et de son coût abordable. En réduisant la consommation d'énergie, l'approche d'Etched pourrait également résoudre les problèmes liés à l'impact environnemental des infrastructures d'IA gourmandes en énergie.
Watch video about
None
Try our premium solution and start getting clients — at no cost to you