lang icon English
July 30, 2023, 9:22 a.m.
566

None

Выбор языка для большой языковой модели( LLM) оказывает существенное влияние на его стоимость и распределение между носителями английского языка и остальным миром. Например, стоимость упрощенного китайского языка в два раза выше, испанского- в 1, 5 раза, а шанского- в 15 раз. Исследование, проведенное Оксфордским университетом, показало, что обработка текста на английском языке с помощью LLM обходится в 198 токенов, а на английском- в 17 токенов. Это означает, что доступ к сервису с помощьюAPI обходится в 11 раз дороже для текста на английском языке по сравнению с текстом на английском. Модель токенизации, используемая компаниямиAI, преобразует пользовательский ввод в вычислительные затраты, что делает модели, доступные за пределами английского языка, более дорогостоящими в плане доступа и обучения. Например, при использовании токенизатора GPT3 компании OpenAI можно увидеть, что фраза" youraffection" будет содержать всего два токена на английском языке и всего два токена на упрощенном китайском языке. Несмотря на то, что английская фраза длиннее( 14 символов) по сравнению с упрощенной китайской( 4 символа), более высокое соотношение токенов к символам делает внедрениеAPI для языков, отличных от английского, более дорогостоящим.

Экономическая эффективность английского языка в расходах, связанных сAI, не имеет аналогов, причем китайский язык обходится в два раза дороже английского с точки зрения требуемой производительности по токенам. Однако исследования показывают, что при многократном обучении синтетическим данным сети AInetworks становятся неустойчивыми. Различные способы количественной оценки затрат, такие как подсчет символов, по- прежнему сталкиваются с аналогичными проблемами, связанными с токенизацией, и не могут превзойти практичность и более низкую стоимость английского языка. Разница в стоимости обусловлена тем, что компании, внедряющие крупноязычные модели, в основном базируются в Америке, поскольку для этой страны характерны более низкие затраты на обслуживание и большая доступность качественных данных. Неравенство в затратах побудило многие страны, в том числе Китай и Индию, разработать собственные инициативы по обучению и внедрению LLM- моделей на родном языке с учетом пространства инноваций, созданного англоязычными сетями. Важно действовать осторожно, учитывая далеко идущие последствия каждого предпринимаемого шага.



Brief news summary

None

Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Oct. 14, 2025, 10:31 a.m.

CoreWeave привлек $650 миллионов кредитных ресурс…

CoreWeave, ведущий поставщик облачных вычислений, специализирующийся на задачах искусственного интеллекта, получил существенный кредит в размере 650 миллионов долларов для ускорения своего роста в сфере облачных AI-компьютингов.

Oct. 14, 2025, 10:28 a.m.

Эксклюзив: ИИ-письмо пока не захватило сеть

Недавний отчёт, выпущенный компанией Graphite, предоставил новые идеи по текущему вопросу о распространённости контента, созданного при помощи искусственного интеллекта, в интернете.

Oct. 14, 2025, 10:20 a.m.

Salesforce вложит 15 миллиардов долларов в Сан-Фр…

Компания Salesforce, ведущая фирма в области облачных вычислений, в понедельник объявила о намерении инвестировать значительную сумму в 15 миллиардов долларов в Сан-Франциско в течение ближайших пяти лет.

Oct. 14, 2025, 10:15 a.m.

Искусственный интеллект в видеопотехнологиях усил…

Магазины розничной торговли по всему миру все активнее внедряют системы видеонаблюдения на основе искусственного интеллекта (ИИ) в качестве важной части своей системы безопасности.

Oct. 14, 2025, 10:14 a.m.

Dreamdata завершает серию B в размере 55 миллионо…

НОВЫЙ ЯР̆КИЙ, 14 октября 2025 г.

Oct. 14, 2025, 10:12 a.m.

Аутрич в эпоху ИИ: Разговор с Джулианом Пропстом

ПРЕСС-РЕЛИЗ Опубликовано 18 сентября 2025 года Венский предприниматель Юлиан Пропст уже несколько лет активно работает на стыке технологий, гостеприимства и креативных секторов

Oct. 14, 2025, 6:43 a.m.

OpenAI привлекает Broadcom для создания своего пе…

OpenAI объявила о крупном партнерстве с Broadcom для создания собственных пользовательских процессоров искусственного интеллекта, целью которого является удовлетворение растущего спроса на высокопроизводительные вычислительные мощности, необходимые для развития технологий ИИ.

All news

AI team for your Business

Automate Marketing, Sales, SMM & SEO

and get clients on autopilot — from social media and search engines. No ads needed

and get clients today