Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

March 13, 2025, 9:41 p.m.
107

Sesame запускает модель CSM-1B для продвинутого голосового помощника Maya.

Компания Sesame представила базовую модель, на основе которой работает Мая, впечатляющий голосовой ассистент с реалистичным звучанием. Эта модель, состоящая из 1 миллиарда параметров (где "параметры" обозначают различные компоненты модели), выпущена под лицензией Apache 2. 0, что позволяет использовать ее в коммерческих целях с минимальными ограничениями. Под названием CSM-1B модель генерирует "RVQ аудиокоды" из текстовых и аудиовходов, согласно описанию Sesame на платформе разработки ИИ Hugging Face. RVQ расшифровывается как "остаточная векторная квантизация", метод, используемый для кодирования аудио в дискретные токены, известные как коды. Эта техника применяется в различных современных аудиотехнологиях ИИ, включая SoundStream от Google и Encodec от Meta. CSM-1B построена на модели из семейства Llama от Meta и включает в себя компонент "декодера" аудио. Согласно Sesame, для Маи используется доработанная версия CSM. В репозиториях CSM-1B на Hugging Face и GitHub компания Sesame указывает: "Открытая здесь модель является базовой моделью генерации. Она может производить различные голоса, но не была доработана под какой-либо конкретный голос.

[…] Модель обладает некоторыми возможностями для неанглийских языков благодаря загрязнению данных в обучающем наборе, но ее производительность ожидается не оптимальной. " Неясно, какие данные использовала компания Sesame для тренировки CSM-1B, так как эта информация не была раскрыта. Важно отметить, что у модели отсутствуют серьезные защитные механизмы. Sesame полагается на принцип доверия, призывая разработчиков и пользователей воздерживаться от использования модели для имитации чьего-либо голоса без разрешения, создания вводящего в заблуждение материала, такого как ложные новости, или участия в вредной или злонамеренной деятельности. Я протестировал демонстрацию на Hugging Face, и имитация моего голоса заняла менее минуты. После этого генерация речи на различные темы, включая спорные, такие как выборы и российская пропаганда, была простой. Издание Consumer Reports недавно предостерегло, что многие популярные инструменты клонирования голоса на базе ИИ, доступные сегодня, не имеют "значительных" защитных механизмов против мошенничества или неправомерного использования. Компания Sesame, соучредителем которой является один из создателей Oculus Брендан Ирибе, привлекла значительное внимание в конце февраля к своей технологии ассистента, которая почти преодолевает зону ужаса. Мая и другой ассистент Sesame, Майлз, демонстрируют дыхание, отступления в речи и могут быть прерваны во время разговора, аналогично Voice Mode от OpenAI. Компания получила неопубликованное инвестирование от Andreessen Horowitz, Spark Capital и Matrix Partners. Помимо разработки технологии голосовых ассистентов, Sesame разрабатывает прототипы AI-очков "предназначенных для ношения в течение всего дня", которые будут использовать ее собственные модели.



Brief news summary

Sesame, соучредителем которого является Брендан Ириб из Oculus, представила свою модель голосового ассистента на основе ИИ, CSM-1B. Эта модель обладает 1 миллиардом параметров и лицензирована по Apache 2.0 для коммерческих приложений, имея ограниченные ограничения. CSM-1B использует остаточную векторную квантизацию (RVQ) для кодирования аудио, что ставит ее в ряд ведущих аудиотехнологий ИИ, таких как SoundStream от Google. Разработанная на базе фреймворка Llama от Meta, модель демонстрирует аудиодекодер, который генерирует разнообразные голоса, хотя она не предназначена для воспроизведения голосов. Ее производительность на неанглийских языках может быть ограничена из-за объема обучающих данных. Кроме того, модель имеет минимальные защиты от злоупотреблений, полагаясь в основном на кодекс чести, чтобы склонять пользователей к отказу от вредоносных практик, включая несанкционированное клонирование голосов. Голосовые ассистенты Sesame, Майя и Майлз, известны своими естественными речевыми характеристиками. Поддерживаемая инвесторами, такими как Andreessen Horowitz, компания также изучает возможность разработки очков с ИИ, которые будут включать ее голосовые технологии. Тем не менее, возникли опасения по поводу потенциального мошенничества и злоупотребления клонированием голосов на основе ИИ, как подчеркивают недавние отчеты потребителей.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Learn how AI can help your business.
Let’s talk!

Hot news

July 7, 2025, 2:18 p.m.

Кинексис запускает токенизацию блокчейн-рынка угл…

Kinexys от J.P. Morgan, ведущий подразделение по блокчейн-технологиям в компании, разрабатывает инновационное блокчейн-приложение на платформе Kinexys Digital Assets — многоактивной платформе токенизации активов, предназначенной для токенизации глобальных углеродных кредитов на уровне реестра.

July 7, 2025, 2:15 p.m.

Генеральный директор Ford Джим Фарли предупреждае…

Генеральный директор Ford Джим Фарли недавно подчеркнул важнейшую роль «незаменимой экономики» и профессиональных рабочих специальностей, прогнозируя, что искусственный интеллект сократит в США число офисных работников вдвое.

July 7, 2025, 10:27 a.m.

Потери от кражи криптовалют достигли рекордного у…

В первом квартале 2025 года криптоиндустрия зафиксировала резкий рост потерь от краж, достигших беспрецедентной суммы в 1,63 миллиарда долларов.

July 7, 2025, 10:15 a.m.

Искусственный интеллект в образовании: персонализ…

В последние годы сектор образования переживает заметные изменения в сторону интеграции искусственного интеллекта (ИИ) для повышения качества обучения.

July 7, 2025, 6:46 a.m.

Новый импульс к внедрению национальных правил по …

Недавние попытки ввести мораторий на регулирование искусственного интеллекта (ИИ) на уровне штатов на десять лет через республиканский проект бюджета, возглавляемый сенатором Тедом Крузом и поддерживаемый отраслевыми группами, столкнулись с важными препятствиями, выявив все усложняющуюся ситуацию в управлении ИИ в США.

July 7, 2025, 6:27 a.m.

Инвесторы вкладываются в токенизированные казначе…

Криптовалютные компании и инвесторы все активнее направляют средства в токенизированные версии взаимных фондов денежного рынка и казначейских облигаций в качестве альтернативы стейблкоинам для размещения избыточных наличных и получения дохода.

July 6, 2025, 2:15 p.m.

Что такое блокчейн? Разгадка реестра, который мож…

Известная как технология, лежащая в основе Биткойна, блокчейн проявляется как доверия не требующая, защита от вмешательства система с потенциалом революционизировать отрасли от финансов до здравоохранения.

All news