lang icon En
June 26, 2024, 3:01 a.m.
2088

None

Brief news summary

Исследователи из UC Santa Cruz разработали метод запуска больших языковых моделей (LLM) на низком энергопотреблении. Они достигли этого, используя специальное аппаратное обеспечение на основе FGPA и удалив умножение матриц из процессов обучения и вывода LLM. Команда конвертировала числовую систему в «троичную» систему и ввела вычисления на основе времени, что привело к улучшению производительности и эффективности. Исследователи сфокусировались на модели LLaMa LLM от Meta и черпали вдохновение из статьи Microsoft о троичных числах в нейронных сетях. Подход имеет потенциал изменить область искусственного интеллекта, значительно снизив потребление энергии. Этот прорыв может решить растущие требования к энергопотреблению у компаний, занимающихся искусственным интеллектом, и приблизить нас к достижению функциональности на уровне человека в ИИ.

Научная статья и сопровождающий текст от UC Santa Cruz обсуждают достижение исследователей в области искусственного интеллекта, которые успешно реализовали современные модели языка (LLM) с масштабом до миллиарда параметров, используя всего 13 ватт энергии. Энергопотребление на этом уровне сравнимо с 100-ваттным светодиодным эквивалентом, но заметно более эффективно, чем 700 ватт, требуемые для графических процессоров центров обработки данных, таких как Nvidia H100 и H200, не говоря уже о предстоящем Blackwell B200, который может потреблять до 1200 ватт на графический процессор. Исследователи использовали специальное программное обеспечение на базе FPGA для своей работы, но они подчеркивают, что большую часть эффективности можно достичь с помощью программного обеспечения с открытым исходным кодом и настройками существующих систем. Основной выигрыш связан с устранением умножения матриц (MatMul) как в процессе обучения, так и в процессе вывода LLM. Для удаления MatMul из нейронной сети, сохраняя при этом производительность и точность, исследователи использовали два метода. Во-первых, они преобразовали числовую систему в "троичную" систему, кодируя числа как -1, 0 и 1. Это позволило вычислениям осуществляться путем сложения, а не традиционного умножения. Кроме того, введение временного вычисления обеспечило сети эффективную "память", позволяющую ей функционировать быстрее с меньшим количеством операций. Исследователи использовали модель LLaMa LLM от Meta в качестве основной модели для сравнения. Эта работа была вдохновлена статьей Microsoft о применении троичных чисел в нейронных сетях, однако исследователи из UC Santa Cruz пошли дальше, устраняя умножение матриц и делая свою модель доступной с открытым исходным кодом. В конечном счете, это достижение сводится к проблеме оптимизации.

Руй-Джи Чжу, один из причастных к проекту аспирантов, объясняет: "Мы заменили дорогостоящую операцию более дешевыми операциями". Все еще предстоит увидеть, насколько универсально это подходит для ИИ и решений LLM, но это имеет потенциал существенно повлиять на область искусственного интеллекта. Недавние разработки в индустрии искусственного интеллекта показали высокий спрос на энергию. Это исследование предполагает, что большая часть этого спроса была обусловлена гонкой за первенство в применении неэффективных методов обработки. Уважаемые фигуры, такие как генеральный директор Arm, выразили опасения, что текущая тенденция к увеличению потребности в энергии в области искусственного интеллекта к 2030 году может потреблять четверть энергии Соединенных Штатов. Снижение энергопотребления до 1/50 от текущего значения представляло бы существенное улучшение. Надежда заключается в том, что крупные игроки в индустрии искусственного интеллекта, такие как Meta, OpenAI, Google и Nvidia, найдут способы использовать это открытие с открытым исходным кодом. Более быстрая и эффективная обработка нагрузки работы ИИ приблизила бы нас к достижению уровней функциональности, сравнимых с человеческим мозгом, который, по некоторым оценкам, работает примерно на 0, 3 кВтч в день, то есть в 56 раз меньше энергии, требуемой Nvidia H100. Однако важно отметить, что многие модели LLM требуют десятки тысяч таких графических процессоров и месяцев тренировки, что означает, что наша собственная серая материя пока еще непобеждаема.


Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 5:21 a.m.

„AI SMM”, новое обучение от Hallakate – Узнайте, …

В эпоху, когда технологии меняют способы создания контента и управления социальными сетями, Hallakate представляет новое обучение, ориентированное на новую эру: AI SMM.

Dec. 22, 2025, 5:19 a.m.

Рынок продаж кластеров GPU для обучения искусстве…

Обзор рынка Мировой рынок продаж GPU-кластеров для обучения искусственного интеллекта (ИИ) прогнозируется достичь примерно 87,5 млрд долларов США к 2035 году, увеличившись с 18,2 млрд долларов в 2025 году, при среднем ежегодном росте (CAGR) 17,0% в период с 2026 по 2035 год

Dec. 22, 2025, 5:14 a.m.

Мультиформатный рынок ИИ 2025-2032: Обзор роста, …

Обзор рынка мультимодального искусственного интеллекта Coherent Market Insights (CMI) опубликовала всесторонний исследовательский отчет о глобальном рынке мультимодального искусственного интеллекта, прогнозируя тенденции, динамику роста и перспективы до 2032 года

Dec. 22, 2025, 5:12 a.m.

Будущее SEO: как искусственный интеллект влияет н…

Искусственный интеллект (ИИ) кардинально изменяет алгоритмы поисковых систем, фундаментально меняя способы индексирования, оценки и предоставления информации пользователям.

Dec. 22, 2025, 5:11 a.m.

Платформы для видеоконференций с использованием и…

В последние годы удаленная работа кардинально преобразилась, в основном благодаря технологическому прогрессу — особенно росту платформ видеоконференций, оснащенных искусственным интеллектом.

Dec. 21, 2025, 1:44 p.m.

Инструменты автоматической модерации видео-контен…

Платформы социальных сетей всё активнее используют искусственный интеллект (ИИ) для улучшения модерации видеоконтента, реагируя на рост количества видео как доминирующей формы онлайн-общения.

Dec. 21, 2025, 1:38 p.m.

США снова рассматривают ограничения на экспорт чи…

КОНТРКОРРЕКЦИЯ ПОЛИТИКИ: После многолетних ужесточений ограничений решение разрешить продажу чипов Nvidia H200 в Китай вызвало возражения со стороны некоторых республиканцев.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today