lang icon En
March 13, 2025, 9:41 p.m.
3417

Sesame lansseerib CSM-1B mudeli täiustatud hääleassistent Maya jaoks.

Brief news summary

Sesame, mille asutajaks on Brendan Iribe Oculusest, on tutvustanud oma tehisintellekti hääleassistentide mudelit CSM-1B. Sellel mudelil on 1 miljard parameetrit ja see on litsentseeritud Apache 2.0 alusel kommertslikuks kasutamiseks, sisaldades piiratud piiranguid. CSM-1B kasutab helikoodimiseks jääkvektorite kvantimist (RVQ), asetades selle juhtivate tehisintellekti helitehnoloogiate, nagu Google'i SoundStream, hulka. Meta Llama raamistiku baasil välja töötatud mudel demonstreerib helide dekooderit, mis genereerib mitmekesist häälete valikut, kuigi see ei ole mõeldud hääle replikatsiooniks. Selle jõudlus mitte-ingliskeelsetes keeltes võib olla piiratud koolitusandmete ulatuse tõttu. Lisaks on sellel minimaalsed kaitsed vale kasutamise vastu, tuginedes peamiselt auhinnakoodile, et tõkestada kahjulikke praktikaid, sealhulgas volitamata hääle kloonimist. Sesame'i hääleassistendid, Maya ja Miles, on tuntud oma loomulike kõnevõimetega. Investorite, nagu Andreessen Horowitz, toetusel uurib ettevõte ka tehisintellekti prillide arendamist, mis sisaldavad nende hääletehnoloogiat. Sellegipoolest on tekkinud mured pettuste ja tehisintellekti häälekloonimise vale kasutamise võimaluste üle, nagu on rõhutanud viimased tarbijaraportid.

AI ettevõte Sesame on tutvustanud alusmudelit, mis juhib Maya't, uskumatult elujõulist häälassistenti. See mudel, mis sisaldab 1 miljardit parameetrit (kus "parameetrid" viitavad mudeli erinevatele komponentidele), on välja antud Apache 2. 0 litsentsi alusel, mis võimaldab kaubanduslikku kasutamist minimaalsete piirangutega. CSM-1B nime kandev mudel loob "RVQ audikoodid" nii tekstist kui ka heli vangistustest, nagu on kirjeldatud Sesame'i AI arenduse platvormil Hugging Face. RVQ tähistab "restitutsioonvektori kvantiseerimist", meetod, mida kasutatakse heli kodeerimiseks eraldi tokeniteks, mida tuntakse koodidena. Seda tehnikat kasutatakse erinevates tänapäevastes AI helitehnoloogiates, sealhulgas Google'i SoundStreamis ja Meta Encodecis. CSM-1B on üles ehitatud Meta Llama perekonna mudelile ja sisaldab helide "dekoodri" komponenti. Sesame'i sõnul võimaldab peenhäälestatud versioon CSM-ist Maya toimimist. CSM-1B Hugging Face ja GitHubi hoidlates teatab Sesame: "Siin avatud lähtekoodiga mudel on põhigeneratsiooni mudel. See suudab genereerida erinevaid hääli, kuid ei ole justkui peenhäälestatud mistahes konkreetseks hääleks.

[…] Mudelil on teatud võimekus mitte-ingliskeelsete keelte jaoks, kuna treeningkomplektis oli andmete saaste, kuid selle jõudlus tõenäoliselt ei ole optimaalne. " Püsib ebaselge, milliseid andmeid Sesame kasutas CSM-1B treenimiseks, kuna ettevõte ei ole seda teavet avaldanud. Oluline on märkida, et mudel ei oma olulisi kaitsemeetmeid. Sesame toetub aukohusüsteemile, julgustades arendajaid ja kasutajaid mitte kasutama mudelit kellegi häälest jäljendamiseks ilma loata, valeinfo nagu valeuudiste loomiseks või kahjulike või pahatahtlike tegevuste tegemiseks. Katsetasin demot Hugging Face'is ja oma hääle jäljendamine võttis vähem kui minuti. Pärast seda oli erinevatel teemadel, sealhulgas vulgaarsetel nagu valimised ja Venemaa propaganda, kõne genereerimine lihtne. Consumer Reports hoiatab hiljuti, et paljud populaarsed AI-põhised hääle kloonimise tööriistad, mis on täna saadaval, puuduvad "mõtestatud" kaitsemeetmed pettuste või väärkasutuse vastu. Sesame, mille kaasasutajad on Oculus'i kaas-looja Brendan Iribe, tõmbas märkimisväärset tähelepanu veebruari lõpus oma assistendi tehnoloogia jaoks, mis peaaegu navigeerib kummitava oru. Maya ja Sesame'i teine abi, Miles, hingavad, näitavad kõne nõrkusi ja neid saab katkestada rääkides, sarnaselt OpenAI hääle režiimile. Ettevõte on saanud teadmata investeeringu Andreessen Horowitzilt, Spark Capitalilt ja Matrix Partnersilt. Lisaks hääle assistentide tehnoloogia arendamisele prototüüpib Sesame AI prille, "mis on mõeldud päevaseks kandmiseks", mis kasutavad selle patenteeritud mudeleid.


Watch video about

Sesame lansseerib CSM-1B mudeli täiustatud hääleassistent Maya jaoks.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 9:34 a.m.

Salesforce'i andmed näitavad, et tehisintellekt j…

Salesforce on avaldanud põhjaliku aruande seoses 2025.

Dec. 21, 2025, 9:28 a.m.

Tehisintellekti mõju digitaalse reklaamikampaania…

Tehisintellekti (AI) tehnoloogiad on muutunud keskseks jõuks digitaalse reklaami maastiku muutmisel.

Dec. 21, 2025, 9:25 a.m.

See vaikne tehisintellekti ettevõte võib olla jär…

Draamaatilise tehnoloogiainvestorite rikkaks muutnud kahe aasta jooksul on paljusid osanikke õnnistanud ning kui viimast õnnestumist tähistada ettevõtete nagu Nvidia, Alphabet ja Palantir Technologies'ga, on oluline otsida järgmine suur võimalus.

Dec. 21, 2025, 9:24 a.m.

Tehisintellekti videovalvesüsteemid parandavad av…

Viimastel aastatel on linnad üle kogu maailma kasvatanud tehisintellekti (TI) kasutamist videovalvesüsteemides, et parandada avalike ruumide jälgimist.

Dec. 21, 2025, 9:14 a.m.

Generatiivse Kmaste Optimeerimine (GEO): Kuidas S…

Otsing on arenenud kaugemale sinistest linkidest ja märksõnalistest loenditest; nüüd esitavad inimesed küsimusi otse tehisintellekti tööriistadele nagu Google SGE, Bing AI ja ChatGPT.

Dec. 21, 2025, 5:27 a.m.

Iseseisvad ettevõtted: Kas teie veebimüüki on mõj…

Sooviksime rohkem teada saada, kuidas viimased muudatused otsingukäitumises internetis, mille taga on tehisintellekti tõus, on teie äritegevust mõjutanud.

Dec. 21, 2025, 5:23 a.m.

Google ütleb, mida öelda klientidele, kes tahavad…

Google'i Danny Sullivan pakkus juhiseid SEO-dele, kes tegelevad klientidega, kes on innukad saadma uuendusi tehisintellekti (TI) SEO strateegiate kohta.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today