A Sesame bemutatja a CSM-1B modellt az Advanced Voice Assistant Maya számára.

Az AI cég, a Sesame bemutatta azt az alapmodellt, amely a Maya impresszíven élethű hangasszisztensét működteti. Ez a modell, amely 1 milliárd paraméterből áll (ahol a "paraméterek" a modell különböző összetevőit jelentik), Apache 2. 0 licenc alatt kerül kiadásra, lehetővé téve a kereskedelmi használatot minimális korlátozásokkal. CSM-1B névre keresztelt modellt a Sesame a Hugging Face AI fejlesztési platformján úgy írja le, hogy "RVQ audio kódokat" állít elő szöveges és audió bemenetekből. Az RVQ a "reziduális vektor kvantálás" rövidítése, amely egy módszer az audió kódolt diszkrét tokenek, azaz kódok előállítására. Ezt a technikát különböző kortárs AI audió technológiákban alkalmazzák, beleértve a Google SoundStream-jét és a Meta Encodec-jét. A CSM-1B a Meta Llama családjából származó modellre épül, és tartalmaz egy audió "dekóder" komponenst. A Sesame szerint a CSM finomhangolt változata működteti Mayát. A CSM-1B Hugging Face és GitHub adattárában a Sesame azt állítja: "A modellen itt nyílt forráskódú alapgeneráló modell. Különböző hangokat képes előállítani, de nem lett finomhangolva egy adott hangra.
[. . . ] A modell bizonyos képességekkel bír a nem angol nyelvek terén, mivel a tréningkészletben adatszennyezés történt, de teljesítményének várhatóan nem optimálisnak kell lennie. " Nem világos, hogy a Sesame milyen adatokkal képezte a CSM-1B-t, mivel a cég ezt az információt nem hozta nyilvánosságra. Fontos megjegyezni, hogy a modellből hiányoznak a lényeges védelmi mechanizmusok. A Sesame egy becsületi rendszerre támaszkodik, és arra bátorítja a fejlesztőket és felhasználókat, hogy ne használják a modellt mások hangjának utánzására engedély nélkül, ne hozzanak létre megtévesztő anyagokat, például hamis híreket, és ne vegyenek részt káros vagy rosszindulatú tevékenységekben. Én kipróbáltam a demót a Hugging Face-en, és a hangom utánzása kevesebb mint egy percet vett igénybe. Ezt követően az olyan témákban, mint a választások és az orosz propagandával kapcsolatos vitatott kérdések, a beszédgenerálás nagyon egyszerű volt. A Consumer Reports nemrégiben figyelmeztette, hogy sok népszerű AI-alapú hangklónozó eszköz, amely ma elérhető, "jelentős" védelmet nélkülöz a csalások vagy a visszaélések ellen. A Sesame-t az Oculus társalapítója, Brendan Iribe alapította, és jelentős figyelmet kapott február végén a hangasszisztens technológiája miatt, amely majdnem átlépi a "kellemetlenségek völgyét". Maya és a Sesame másik asszisztense, Miles, lélegzik, beszédzavarokat mutat be, és megszakíthatók, miközben beszélnek, hasonlóan az OpenAI Voice Mode-jához. A cég egy nyilvánosságra nem hozott befektetést biztosított az Andreessen Horowitz, a Spark Capital és a Matrix Partners részéről. A hangasszisztens technológia fejlesztésén túl a Sesame prototípust készít AI szemüvegekhez, amelyeket "napközbeni viseletre szánnak", és amelyek saját modelljeiket fogják használni.
Brief news summary
A Sesame, amelyet az Oculus társalapítója, Brendan Iribe alapított, bemutatta AI hangasszisztens modelljét, a CSM-1B-t. Ez a modell 1 milliárd paraméterrel rendelkezik, és az Apache 2.0 alatt van engedélyezve kereskedelmi alkalmazásokhoz, korlátozott megszorításokkal. A CSM-1B a hangkódoláshoz reziduális vektorkvantálást (RVQ) használ, így a vezető AI audio technológiák, például a Google SoundStream közé sorolható. A Meta Llama keretrendszerén kifejlesztett modell egy audio dekódert mutat be, amely különféle hangokat generál, bár nem arra tervezték, hogy hangokat reprodukáljon. Teljesítménye a nem angol nyelveken korlátozott lehet a képzési adatai terjedelme miatt. Továbbá, minimális védelmet nyújt a visszaélések ellen, elsősorban egy tisztességi kódexre támaszkodva az ártalmas gyakorlatok, például a jogosulatlan hangklónozás elkerülésére. A Sesame hangasszisztensei, Maya és Miles, természetes beszédtulajdonságaikról ismertek. Az Andreessen Horowitzhez hasonló befektetők támogatásával a cég AI szemüvegek fejlesztését is vizsgálja, amelyek magukban foglalják hangtechnológiáját. Mindazonáltal aggodalmak merültek fel az AI hangklónozásával kapcsolatos csalás és visszaélés lehetősége miatt, ahogyan azt a közelmúlt fogyasztói jelentései is hangsúlyozták.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

A 'Fortnite' játékosok már AI Darth Vader-t csúny…
Pénteken az Epic Games bejelentette Darth Vader visszatérését a Fortnite-ba, ezúttal mint játékon belüli főellenség, akit most beszélgető AI’s képességekkel láttak el, lehetővé téve a játékosoknak, hogy beszélgessenek vele.

Miniszter Samuel George az MI-t és a blokkláncot …
A kommunikációért, digitális technológiáért és innovációért felelős miniszter, Hon.

A Microsoft szerint AI-t biztosított az izraeli h…
A Microsoft megerősítette, hogy korszerű mesterséges intelligencia (MI) és felhőalapú szolgáltatásokat, köztük az Azure platformját, szállít az izraeli hadseregnek a jelenlegi gázai konfliktus közepette.

Solv az Avalanche blokkláncra viszi a RWA-val tám…
A Solv Protocol bemutatta a hozammal működő Bitcoin tokent az Avalanche blokkláncon, ezáltal növelve a strukturális befektetők hozzáférését a való életbeli eszközök (RWAs) által támogatott hozamlehetőségekhez.

Olaszország és az Egyesült Arab Emírségek bejelen…
Olaszország és az Egyesült Arab Emírségek partnerségben létesítenek egy úttörő mesterséges intelligencia (MI) központot Olaszországban, amely jelentős lépést jelent Európa MI-piacán.

A kriptobányászati óriás DMG Blockchain Solutions…
A DMG Blockchain Solutions Inc.

Az EU 200 milliárd eurót szán az MI fejlesztésére…
Az Európai Unió 200 milliárd eurót szentelt a mesterséges intelligencia innovációjának fejlesztésére, ezzel is bizonyítva törekvését arra, hogy globális AI vezetővé váljon, és hangsúlyozva olyan prioritásokat, mint a technológiai fejlődés, a gazdasági növekedés és a digitális szuverenitás.