March 13, 2025, 9:41 p.m.
3363

Sesame uvádza model CSM-1B pre pokročilého hlasového asistenta Mayu.

Brief news summary

Sesame, ktorú spoluzaložil Brendan Iribe z Oculus, predstavila svoj model AI hlasového asistenta, CSM-1B. Tento model má 1 miliardu parametrov a je licencovaný pod Apache 2.0 pre komerčné aplikácie, pričom obsahuje obmedzené reštrikcie. CSM-1B využíva reziduálnu vektorovú kvantizáciu (RVQ) pre kódovanie zvuku, čím sa zaradil medzi popredné AI audio technológie, ako je Google SoundStream. Model, vyvinutý na frameworku Meta Llama, sa pýši audio dekompresorom, ktorý generuje rôzne hlasy, hoci nie je navrhnutý na replikáciu hlasu. Jeho výkon v neanglických jazykoch môže byť obmedzený kvôli rozsahu tréningových dát. Okrem toho má minimálne ochrany proti zneužitiu, spoliehajúc sa predovšetkým na čestný kód, ktorý odrádza od škodlivých praktík, vrátane neoprávnenej replikácie hlasu. Hlasoví asistenti Sesame, Maya a Miles, sú známi svojimi prirodzenými rečovými vlastnosťami. S podporou investorov ako Andreessen Horowitz sa spoločnosť tiež zaoberá vývojom AI okuliarov, ktoré integrujú jej hlasovú technológiu. Napriek tomu sa objavili obavy týkajúce sa potenciálu podvodu a zneužitia AI hlasovej replikácie, čo podčiarkujú nedávne spotrebiteľské správy.

AI spoločnosť Sesame predstavila základný model, ktorý poháňa Mayu, pôsobivo realistického hlasového asistenta. Tento model, pozostávajúci z 1 miliardy parametrov (kde „parametre“ odkazujú na jednotlivé súčasti modelu), bol vydaný pod licenciou Apache 2. 0, čo umožňuje komerčné využitie s minimálnymi obmedzeniami. Model s názvom CSM-1B produkuje „RVQ audio kódy“ z textových a audio vstupov, podľa popisu Sesamu na platforme pre vývoj AI Hugging Face. RVQ znamená „reziduálna vektorová kvantizácia“, metódu, ktorá sa používa na kódovanie audia do diskrétnych tokenov známych ako kódy. Táto technika sa využíva v rôznych súčasných AI audio technológiách, vrátane Google SoundStream a Meta Encodec. CSM-1B je postavený na modeli z rodiny Meta Llama a obsahuje komponent „dekodér“ audia. Podľa Sesamu, jemne vyladená verzia CSM poháňa Mayu. V repozitároch CSM-1B na Hugging Face a GitHub Sesam uvádza: „Model, ktorý je tu open-sourced, je model pre základnú generáciu. Môže produkovať rôzne hlasy, ale nebol jemne doladený pre žiadny konkrétny hlas.

[. . . ] Model má niektoré schopnosti pre neanglické jazyky kvôli kontaminácii dát v tréningovom súbore, ale jeho výkon sa očakáva ako suboptimálny. “ Nie je jasné, aké dáta Sesame využil na tréning CSM-1B, pretože spoločnosť túto informáciu nezverejnila. Je dôležité poznamenať, že model postráda podstatné bezpečnostné opatrenia. Sesame sa spolieha na čestný systém, ktorý povzbudzuje vývojárov a používateľov, aby sa vyhýbali používaniu modelu na napodobňovanie niekoho hlasu bez povolenia, vytváraniu zavádzajúceho materiálu ako falošné správy alebo zapájaniu sa do škodlivých či zlomyseľných aktivít. Testoval som demo na Hugging Face a napodobniť môj hlas trvalo menej ako minútu. Potom bolo jednoduché generovať reč na rôzne témy, vrátane kontroverzných ako voľby a ruská propaganda. Consumer Reports nedávno varoval, že mnohé populárne nástroje na klonovanie hlasu, založené na AI, dostupné dnes postrádajú „významné“ ochrany proti podvodu alebo zneužitiu. Sesame, ktorú spoluzaložil spolutvorca Oculus Brendan Iribe, získala výraznú pozornosť koncom februára za svoju asistentnú technológiu, ktorá takmer prekonáva uncanny valley. Maya a ďalší asistent Sesamu, Miles, dýchajú, vykazujú rečové dysfluencie a môžu byť prerušené počas hovorenia, podobne ako Voice Mode od OpenAI. Spoločnosť získala nezverejnenú investíciu od Andreessen Horowitz, Spark Capital a Matrix Partners. Okrem vývoja technológie hlasového asistenta Sesame prototypuje AI okuliare „určené na celodenné nosenie“, ktoré budú využívať jej proprietárne modely.


Watch video about

Sesame uvádza model CSM-1B pre pokročilého hlasového asistenta Mayu.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 15, 2025, 1:26 p.m.

AI poháňa rekordný predaj v Cyber Week za 336,6 m…

Analýza spoločnosti Salesforce o nákupnom období Cyber Week 2025 odhalila rekordný globálny maloobchodný predaj vo výške 336,6 miliardy dolárov, čo predstavuje 7 % nárast v porovnaní s predchádzajúcim rokom.

Dec. 15, 2025, 1:24 p.m.

Riziká vymretia AI: Musk a Amodei varujú pred 10-…

Rýchly pokrok v oblasti umelnej inteligencie (UI) vyvolal významnú diskusiu a obavy medzi odborníkmi, najmä čo sa týka jej dlhodobého dopadu na ľudstvo.

Dec. 15, 2025, 1:21 p.m.

Vstúpte skôr, než to urobí Wall Street: Táto akci…

Toto je sponzorovaný obsah; Barchart nevyjadruje podporu uvedeným webovým stránkam alebo produktom.

Dec. 15, 2025, 1:16 p.m.

AlphaCode od Google DeepMind: Umelá inteligencia …

Nedávno spoločnosť Google DeepMind predstavila inovatívny systém umelej inteligencie s názvom AlphaCode, ktorý znamená veľký prelom v oblasti umelej inteligencie a vývoja softvéru.

Dec. 15, 2025, 1:15 p.m.

Dobrý známy SEO vysvetľuje, prečo na vás útočia A…

Pr closely sledujem vznik agentového SEO, presvedčený, že s postupom schopností v priebehu nasledujúcich rokov budú agenti významne ovplyvňovať odvetvie.

Dec. 15, 2025, 1:10 p.m.

Peter Lington zo Salesforce o príprave obranných …

Peter Lington, viceprezident pre región v oddelení Vojny spoločnosti Salesforce, zdôrazňuje transformačné účinky, ktoré budú mať pokročilé technológie na oddelenie Vojny v priebehu najbližších troch až piatich rokov.

Dec. 15, 2025, 9:35 a.m.

Strategická pozícia Sprout Social v meniacom sa p…

Sprout Social si pevne vybudovalo pozíciu popredného hráča v odvetví správy sociálnych médií tým, že prijalo pokročilú AI technológiu a vytvorilo strategické partnerstvá, ktoré podporujú inovácie a zlepšujú ponuku služieb.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today