lang icon En
March 13, 2025, 9:41 p.m.
3379

A Sesame bemutatja a CSM-1B modellt az Advanced Voice Assistant Maya számára.

Brief news summary

A Sesame, amelyet az Oculus társalapítója, Brendan Iribe alapított, bemutatta AI hangasszisztens modelljét, a CSM-1B-t. Ez a modell 1 milliárd paraméterrel rendelkezik, és az Apache 2.0 alatt van engedélyezve kereskedelmi alkalmazásokhoz, korlátozott megszorításokkal. A CSM-1B a hangkódoláshoz reziduális vektorkvantálást (RVQ) használ, így a vezető AI audio technológiák, például a Google SoundStream közé sorolható. A Meta Llama keretrendszerén kifejlesztett modell egy audio dekódert mutat be, amely különféle hangokat generál, bár nem arra tervezték, hogy hangokat reprodukáljon. Teljesítménye a nem angol nyelveken korlátozott lehet a képzési adatai terjedelme miatt. Továbbá, minimális védelmet nyújt a visszaélések ellen, elsősorban egy tisztességi kódexre támaszkodva az ártalmas gyakorlatok, például a jogosulatlan hangklónozás elkerülésére. A Sesame hangasszisztensei, Maya és Miles, természetes beszédtulajdonságaikról ismertek. Az Andreessen Horowitzhez hasonló befektetők támogatásával a cég AI szemüvegek fejlesztését is vizsgálja, amelyek magukban foglalják hangtechnológiáját. Mindazonáltal aggodalmak merültek fel az AI hangklónozásával kapcsolatos csalás és visszaélés lehetősége miatt, ahogyan azt a közelmúlt fogyasztói jelentései is hangsúlyozták.

Az AI cég, a Sesame bemutatta azt az alapmodellt, amely a Maya impresszíven élethű hangasszisztensét működteti. Ez a modell, amely 1 milliárd paraméterből áll (ahol a "paraméterek" a modell különböző összetevőit jelentik), Apache 2. 0 licenc alatt kerül kiadásra, lehetővé téve a kereskedelmi használatot minimális korlátozásokkal. CSM-1B névre keresztelt modellt a Sesame a Hugging Face AI fejlesztési platformján úgy írja le, hogy "RVQ audio kódokat" állít elő szöveges és audió bemenetekből. Az RVQ a "reziduális vektor kvantálás" rövidítése, amely egy módszer az audió kódolt diszkrét tokenek, azaz kódok előállítására. Ezt a technikát különböző kortárs AI audió technológiákban alkalmazzák, beleértve a Google SoundStream-jét és a Meta Encodec-jét. A CSM-1B a Meta Llama családjából származó modellre épül, és tartalmaz egy audió "dekóder" komponenst. A Sesame szerint a CSM finomhangolt változata működteti Mayát. A CSM-1B Hugging Face és GitHub adattárában a Sesame azt állítja: "A modellen itt nyílt forráskódú alapgeneráló modell. Különböző hangokat képes előállítani, de nem lett finomhangolva egy adott hangra.

[. . . ] A modell bizonyos képességekkel bír a nem angol nyelvek terén, mivel a tréningkészletben adatszennyezés történt, de teljesítményének várhatóan nem optimálisnak kell lennie. " Nem világos, hogy a Sesame milyen adatokkal képezte a CSM-1B-t, mivel a cég ezt az információt nem hozta nyilvánosságra. Fontos megjegyezni, hogy a modellből hiányoznak a lényeges védelmi mechanizmusok. A Sesame egy becsületi rendszerre támaszkodik, és arra bátorítja a fejlesztőket és felhasználókat, hogy ne használják a modellt mások hangjának utánzására engedély nélkül, ne hozzanak létre megtévesztő anyagokat, például hamis híreket, és ne vegyenek részt káros vagy rosszindulatú tevékenységekben. Én kipróbáltam a demót a Hugging Face-en, és a hangom utánzása kevesebb mint egy percet vett igénybe. Ezt követően az olyan témákban, mint a választások és az orosz propagandával kapcsolatos vitatott kérdések, a beszédgenerálás nagyon egyszerű volt. A Consumer Reports nemrégiben figyelmeztette, hogy sok népszerű AI-alapú hangklónozó eszköz, amely ma elérhető, "jelentős" védelmet nélkülöz a csalások vagy a visszaélések ellen. A Sesame-t az Oculus társalapítója, Brendan Iribe alapította, és jelentős figyelmet kapott február végén a hangasszisztens technológiája miatt, amely majdnem átlépi a "kellemetlenségek völgyét". Maya és a Sesame másik asszisztense, Miles, lélegzik, beszédzavarokat mutat be, és megszakíthatók, miközben beszélnek, hasonlóan az OpenAI Voice Mode-jához. A cég egy nyilvánosságra nem hozott befektetést biztosított az Andreessen Horowitz, a Spark Capital és a Matrix Partners részéről. A hangasszisztens technológia fejlesztésén túl a Sesame prototípust készít AI szemüvegekhez, amelyeket "napközbeni viseletre szánnak", és amelyek saját modelljeiket fogják használni.


Watch video about

A Sesame bemutatja a CSM-1B modellt az Advanced Voice Assistant Maya számára.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 1:29 p.m.

SaaStr AI alkalmazás a héten: Kintsugi — az AI, a…

Minden héten kiemelünk egy AI-alapú alkalmazást, amely valódi problémákat old meg B2B és felhőalapú cégek számára.

Dec. 16, 2025, 1:24 p.m.

Az AI szerepe a helyi SEO stratégiákban

A mesterséges intelligencia (MI) egyre nagyobb mértékben befolyásolja a helyi keresőoptimalizálási (SEO) stratégiákat.

Dec. 16, 2025, 1:22 p.m.

IND Technology 33 millió dolláros finanszírozást …

Az IND Technology, egy ausztrál cég, amely az infrastruktúra felügyeletével foglalkozik közművállalatok számára, 33 millió dolláros növekedési finanszírozást kapott, hogy erősítse mesterséges intelligencia-alapú erőfeszítéseit a tűzvészek és áramszünetek megelőzésében.

Dec. 16, 2025, 1:21 p.m.

Az AI-bevezetések bonyolulttá válhatnak a kiadók …

Az utóbbi hetekben egyre több kiadó és márka szembesült jelentős visszhanggal, miközben kísérleteznek a mesterséges intelligencia (MI) alkalmazásával tartalom-előállítási folyamataikban.

Dec. 16, 2025, 1:17 p.m.

A Google Labs és a DeepMind bemutatja a Pomelli-t…

A Google Labs, a Google DeepMind-del együttműködésben, bemutatta a Pomelli-t, egy mesterséges intelligencia alapú kísérletet, amelyet kis- és középvállalkozások márkázott marketingkampányaik fejlesztésére terveztek.

Dec. 16, 2025, 1:15 p.m.

A mesterséges intelligencia videófelismerése javí…

A mai gyorsan bővülő digitális világban a közösségi média cégek egyre inkább áttérnek a fejlett technológiák alkalmazására a online közösségeik védelme érdekében.

Dec. 16, 2025, 9:37 a.m.

Miért lehet 2026 az év az anti-AI marketing számá…

Egy változat ebből a történetből megjelent a CNN Business Nightcap hírlevelében.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today