У серпні 2024 року компанія Cerebras Systems досягла важливого етапу в галузі штучного інтелекту, запустивши те, що вона стверджує як найшвидший у світі сервіс для інференції штучного інтелекту. Новий сервіс забезпечує продуктивність у двадцять разів вищу, ніж системи на базі GPU Nvidia H100 «Hopper», які є галузевим стандартом для обчислювальної потужності AI. Відома своїм інноваційним апаратним забезпеченням, розробленим для прискорення роботи штучного інтелекту, Cerebras усвідомила потребу у цьому передовому сервісі для задоволення зростаючих вимог щодо розгортання моделей AI у різних сферах. Сервіс пропонує надзвичайно швидкий оброблювальний швидкодія, що дозволяє швидше приймати рішення та покращувати ефективність для бізнесів і дослідників, що працюють із масштабними моделями AI. Інференція AI — це етап обробки даних через навчальні моделі для генерації прогнозів — є критично важливою в застосунках, що вимагають відповіді у режимі реального часу, таких як автономні транспортні засоби, медична діагностика, обробка природної мови та системи рекомендацій. Покращена продуктивність inference від Cerebras очікувано матиме значний вплив у цих галузях та за їх межами. Після перевищення продуктивності відомого GPU Nvidia H100 у двадцять разів, Cerebras встановлює нові стандарти швидкості та ефективності в обчисленнях штучного інтелекту. Хоча GPU Nvidia H100 на базі архітектури Hopper широко використовується для навчання та inference AI, прорив Cerebras може прискорити впровадження технологій у сфері штучного інтелекту у різних галузях. Цей прорив зосереджений на власному апаратному забезпеченні та системній архітектурі Cerebras. На відміну від універсальних та оптимізованих GPU Nvidia, Cerebras застосовує енергетичні елементи розміром із пластину, які інтегрують велику кількість процесорних ядер з високошвидкісною пам’яттю та міжз’єднаннями на одному кремнієвому клоскні. Ця уніфікована структура забезпечує вражаючу обчислювальну пропускну здатність та мінімальне затримання. Сервіс створений для підтримки розгортання все більш великих моделей AI — деякі з них мають сотні мільярдів або трильйони параметрів, що підвищує вимоги до обчислювальної потужності для inference. Традиційні GPU, хоча й потужні, обмежені у масштабуванні через архітектурні обмеження. Cerebras вирішує ці проблеми, пропонуючи платформу, спеціально оптимізовану для таких масштабних моделей, що дозволяє підприємствам і дослідникам ефективніше запускати застосунки AI. Це особливо важливо в епоху розвитку AI у сфері обробки великих обсягів даних, таких як глибоке розуміння природної мови, складне комп’ютерне бачення та моделювання у реальному часі. Запуск підкреслює ширшу тенденцію індустрії до створення спеціалізованого апаратного забезпечення, що виходить за межі звичайних GPU.
Хоча GPU залишаються основою для AI, зростання попиту на швидші, енергоефективні та масштабовані обчислювальні системи стимулює інновації у розробці чипів та системній інтеграції. Заснована з метою революціонізувати апаратне забезпечення AI, Cerebras втілює цю ідею у своїх енергетичних ядрах — одному з найбільших інтегральних схем у світі — що забезпечує масивний паралелізм та низьку затримку всередині архітектури. Практично, цей прогрес має значні наслідки для галузей медицини, фінансів, автономних систем та хмарних обчислень. Швидша inference означає коротший час отримання результатів, покращення користувацького досвіду та потенційно нижчі операційні витрати через кращу енергоефективність і менше апаратного забезпечення. Крім того, цей прорив прискорює інноваційний цикл у галузі AI, дозволяючи швидше тестувати та впроваджувати нові моделі, що особливо важливо в умовах зростання складності і спрямованості моделей. Хоча технічні показники залишаються засекреченими, Cerebras повідомила, що її сервіс базується на щільній мережі тисяч процесорних ядер, з’єднаних високошвидкісними шляхами. Такий дизайн забезпечує високий пропуск і зменшує обсяг обробки даних порівняно з традиційними системами на основі GPU. Оголошення також стимулило дискусії щодо конкуренції на ринку апаратного забезпечення для AI. Впродовж тривалого часу Nvidia домінувала, але поява спеціалізованих AI-ускорювачів від компаній, таких як Cerebras і Graphcore, свідчить про диверсифікацію ринку з метою оптимізації різних аспектів AI-обчислень. Аналітики вважають, що прорив Cerebras може сприяти широкому впровадженню wafer-scale та інших нових архітектур, адже зростаючі вимоги AI стимулюють безперервні інновації в апаратному забезпеченні та системах. Крім того, сервіс inference від Cerebras підтримує перехід до концепції AI як послуги (AIaaS), коли хмарні платформи пропонують можливості AI за запитом. Завдяки неймовірною швидкості inference, Cerebras позиціонує себе як ключовий гравець, що забезпечує потужний AI без необхідності утримання складних апаратних інфраструктур. Підсумовуючи, запуск сервісу inference компанії Cerebras Systems є значним кроком у технологічному прогресі апаратного забезпечення AI. Випереджаючи технології GPU в двадцять разів, цей прорив обіцяє підвищити ефективність розгортання AI, сприяти розвитку великих і складних моделей, а також прискорити прогрес у галузях, залежних від AI. У міру розвитку екосистеми AI такі прориви у апаратних розробках стануть ключовими для відкриття нових можливостей, надання конкурентних переваг бізнесу та формування майбутнього глобальних застосувань штучного інтелекту.
Cerebras Systems запускає найшвидшу службу для AI-інференції, що в 20 разів перевищує Nvidia H100
Вашингтон знову глибоко розділений щодо ШІ.
Microsoft опублікувала детальний шестнадцятисторінковий посібник із оптимізації контенту для пошуку та чат-інтерфейсів на базі штучного інтелекту.
Artisan AI, новатор у галузі штучного інтелекту, залучила 25 мільйонів доларів на раунді фінансування Серії A, що стало значущою віхою у просуванні автономних агентів ШІ, спрямованих на трансформацію бізнес-операцій у різних галузях.
Штучний інтелект (ШІ) у відеоаналізі став трансформативним інструментом у сфері забезпечення безпеки, революціонізуючи виявлення та управління загрозами у режимі реального часу.
Конгрессе наближається до отримання повноважень щодо контролю за продажем штучного інтелектуальних чипів до Китаю, що ймовірно спричинить конфлікт з адміністрацією Трампа щодо її планів дозволити Nvidia Corp.
За останні роки штучний інтелект (ШІ) став необхідним інструментом для організацій, керуючих своєю присутністю у соціальних мережах.
Останніми роками міські території по всьому світу все активніше впроваджують системи відеоспостереження на основі штучного інтелекту (ШІ) як ключовий елемент стратегій громадської безпеки.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today