В августе 2024 года Cerebras Systems достигла важного этапа в области искусственного интеллекта, запустив сервис, который заявляется как самый быстрый в мире для проведения AI-инференций. Этот новый сервис обеспечивает производительность до двадцати раз выше, чем системы, использующие GPU Nvidia H100 «Hopper», которые долгое время служили отраслевым стандартом мощности для вычислений в AI. Известная своим инновационным аппаратным обеспечением, предназначенным для ускорения AI-нагрузок, Cerebras внедрила этот передовой сервис, чтобы удовлетворить растущие потребности в развертывании моделей ИИ в различных секторах. Сервис предоставляет чрезвычайно быстрые скорости обработки, что позволяет принимать решения быстрее и повышать эффективность бизнеса и научных исследований при работе с крупномасштабными моделями ИИ. Инференция в области ИИ — это этап, на котором данные обрабатываются с помощью обученных моделей для генерации прогнозов. Она имеет решающее значение в приложениях, требующих ответов в реальном времени, таких как автономные транспортные средства, медицинская диагностика, обработка естественного языка и системы рекомендаций. Повышенная производительность инференции от Cerebras, как ожидается, окажет значительное влияние во многих областях и за их пределами. Победив по скорости до двадцати раз в сравнении с известным GPU Nvidia H100, основанным на архитектуре Hopper, Cerebras устанавливает новые стандарты в скорости и эффективности вычислений в области ИИ. В то время как GPU Nvidia H100 широко используется для обучения и инференции моделей ИИ, прорыв Cerebras может способствовать более быстрому внедрению технологий ИИ в различных отраслях. Этот прогресс связан с уникальной аппаратной архитектурой Cerebras. В отличие от универсальных и оптимизированных GPU Nvidia, Cerebras использует ядра масштаба пластины кремния — ваферные движки — которые объединяют огромное количество вычислительных ядер, высокоскоростную память и межсоединения на одном куске кремния. Эта единая структура обеспечивает исключительную пропускную способность и минимальную задержку. Сервис предназначен для поддержки развертывания всё более крупных моделей ИИ — некоторых с сотнями миллиардов или триллионов параметров — что вызывает рост требований к вычислительным ресурсам для инференции. Традиционные GPU, хотя и мощные, сталкиваются с ограничениями масштабируемости из-за архитектурных особенностей. Cerebras решает эти проблемы, предлагая платформу, специально оптимизированную для таких крупных моделей, позволяя предприятиям и ученым более эффективно запускать приложения на базе ИИ.
Это особенно важно по мере развития ИИ в области обработки больших объемов данных, в сложных задачах обработки естественного языка, компьютерного зрения и симуляциях, требующих обработки огромных потоков данных в реальном времени. Запуск служит подтверждением общего тренда в индустрии — создание специализированного аппаратного обеспечения, выходящего за рамки обычных GPU. Несмотря на важность графических процессоров для AI, растущая потребность в более быстром, энергоэффективном и масштабируемом оборудовании способствует инновациям в дизайне чипов и системной интеграции. Компания Cerebras, созданная для революции в области аппаратного обеспечения для ИИ, воплощает эту концепцию в своем ваферном движке — одном из крупнейших интегральных схем в истории, обеспечивающем массивный параллелизм и низкую задержку внутри своей архитектуры. Практически это развитие имеет важные последствия для таких отраслей, как здравоохранение, финансы, автономные системы и облачные вычисления. Быстрый инференс позволяет сократить время получения AI-выводов, улучшить пользовательский опыт и потенциально снизить операционные издержки за счет большей энергоэффективности и меньших требований к оборудованию. Кроме того, такой скачок скорости может ускорить циклы инноваций в области ИИ, позволяя быстрее тестировать и внедрять модели, что особенно важно по мере усложнения и специализации AI-моделей. Хотя точные технические показатели остаются засекреченными, Cerebras заявила, что их сервис использует плотную сетку тысяч вычислительных ядер, соединенных по высокоскоростным каналам внутри ваферного движка. Эта конструкция обеспечивает значительно больший пропускной способность и сокращение объема передачи данных по сравнению с традиционными GPU-системами. Данное заявление вызвало обсуждение о конкуренции на рынке аппаратного обеспечения для ИИ. Nvidia долгое время доминировала в этой сфере благодаря своим GPU, однако появление специальных ускорителей ИИ от компаний Cerebras и Graphcore свидетельствует о диверсификации рынка с целью оптимизации различных аспектов вычислений ИИ. Аналитики считают, что прорыв Cerebras может стимулировать более широкое внедрение ваферных и других новых архитектур, поскольку растущие требования к ИИ ускоряют развитие аппаратных и системных решений. Кроме того, сервис инференции Cerebras поддерживает тенденцию к переходу к предоставлению AI в качестве услуги (AI-as-a-Service), когда облачные платформы предоставляют возможности ИИ по запросу. Обеспечивая беспрецедентные скорости инференции, Cerebras позиционирует себя как ключевую платформу для организаций, нуждающихся в мощных вычислительных ресурсах без необходимости содержать сложную инфраструктуру. В целом, запуск сервиса инференции Cerebras Systems знаменует собой значительный шаг вперёд в инновациях в области аппаратного обеспечения для ИИ. Превзойдя существующие технологии GPU в двадцать раз, он обещает повысить эффективность развертывания AI, способствовать созданию более крупных и сложных моделей и ускорить прогресс в областях, зависящих от ИИ. По мере развития экологической системы ИИ такие технологические прорывы станут ключевыми для открытия новых возможностей, предоставляя бизнесам конкурентные преимущества и формируя будущее глобальных приложений ИИ.
Cerebras Systems запускает самый быстрый сервис ИИ-инференции, превосходящий Nvidia H100 в 20 раз
Вашингтон снова остается глубоко разделен по поводу искусственного интеллекта.
Microsoft выпустила подробное шестнадцатистраничное руководство по оптимизации контента для поиска и общения с ИИ.
Artisan AI, новатор в сфере искусственного интеллекта, привлекла 25 миллионов долларов во время раунда финансирования серии А, что стало важной вехой на пути развития автономных ИИ-агентов, предназначенных для трансформирования бизнес-процессов в различных отраслях.
Видеоаналитика на базе искусственного интеллекта (ИИ) стала трансформирующим инструментом в области охранных систем, революционизируя обнаружение и управление угрозами в реальном времени.
Кабинет министров все ближе к получению полномочий по надзору за продажами чипов искусственного интеллекта в Китай, что, вероятно, вызовет конфликт с администрацией Трампа по поводу её плана разрешить компании Nvidia Corp.
В последние годы искусственный интеллект (ИИ) стал незаменимым для организаций, управляющих своим присутствием в социальных медиа.
В последние годы городские территории по всему миру всё активнее внедряют системы видеонаблюдения на базе искусственного интеллекта (ИИ) в качестве ключевого элемента стратегий обеспечения общественной безопасности.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today