lang icon En
March 13, 2025, 9:41 p.m.
3433

Sesame kringir CSM-1B módelið fyrir háþróaða raddaðstoðann Maya.

Brief news summary

Sesame, stofnað af Brendan Iribe frá Oculus, hefur kynnt AI raddaðstoðarmódel sitt, CSM-1B. Þetta módel hefur 1 milljarð breyta og er leyft undir Apache 2.0 fyrir atvinnuumsóknir, með takmörkuðum takmörkunum. CSM-1B notar afgangsvektora kvötun (RVQ) til hljóðkóðunar, sem gerir það að leiðandi AI hljóðtækni líkt og SoundStream frá Google. Módelið var þróað á Llama ramma Meta og býður upp á hljóðkóðara sem skapar fjölbreytt úrval hljóða, þó að það sé ekki hannað til að endurgera raddir. Frammistaða þess á öðrum tungumálum en ensku gæti verið takmörkuð vegna umfjöllunar þjálfunargagna. Enn fremur hefur það lítil viðurkenning á misnotkun, sem treystir aðallega á heiðurssamning til að draga úr skaðlegum venjum, þar á meðal óheimildum raddklóningu. Raddaðstoðarmenn Sesame, Maya og Miles, eru þekktir fyrir náttúrulegar taleiginleika. Með stuðningi frá fjárfestum eins og Andreessen Horowitz, er fyrirtækið einnig að skoða þróun AI gleraugna sem sameina raddtækni sína. Hins vegar hafa áhyggjur um möguleika á svikum og misnotkun á AI raddklóningu komið fram, eins og nýlegar skýrslur neytenda hafa bent á.

AI fyrirtækið Sesame hefur kynnt grunnmódelið sem drífur Maya, heillandi talgervil. Þetta módelið, sem samanstendur af 1 milljarði para (þar sem „pör“ vísa til einstaka liða módelins), er gefið út undir Apache 2. 0 leyfi, sem gerir það kleift að nota í atvinnuskyni með lágum takmörkunum. Módelinu er gefið nafnið CSM-1B og framleiðir „RVQ hljóðkóðar“ úr bæði texta og hljóðinputum, samkvæmt lýsingu Sesame á AI þróunarvefnum Hugging Face. RVQ stendur fyrir „afgangs vektor kvantun“, aðferð sem notuð er til að kóða hljóð í aðskilda tákn þekkt sem kóðar. Þessi tækni er notuð í ýmsum nútíma AI hljóðtækni, þar á meðal Google’s SoundStream og Encodec Meta. CSM-1B er byggt á módel frá Llama fjölskyldu Meta og felur í sér hljóð „afkóðunartæki“. Samkvæmt Sesame knýr fínstillt útgáfa af CSM Maya. Í Hugging Face og GitHub geymslum CSM-1B segir Sesame: „Módelið sem hér er gefið út er grunnsamskipta módelið. Það getur framleitt margvísleg raddir en hefur ekki verið fínstillt fyrir neina sérstaka rödd.

[…] Módelið hefur einhverja getu fyrir ekki-ensk tungumál vegna gagnakennslusmita í þjálfunarsettinu, en frammistaða þess er fyrirfram ætluð að vera ekki fullkomin. “ Það er óljóst hvaða gögn Sesame notaði til að þjálfa CSM-1B, þar sem fyrirtækið hefur ekki afhjúpað þessar upplýsingar. Mikilvægt er að taka fram að módelið skortir verulega öryggisráðstafanir. Sesame treystir á heiðarleikakerfi, sem hvetur þróunaraðila og notendur til að forðast að nota módel til að líkja eftir rödd annarra án leyfis, búa til villandi efni eins og falskar fréttir eða taka þátt í skaðlegum eða illgjarnum aðgerðum. Ég prófaði sýnikennsluna á Hugging Face, og að líkja eftir rödd minni tók minna en eina mínútu. Eftir það var auðvelt að framleiða ræðu um ýmis málefni, þar með talið deilumál eins og kosningar og rússneska áróður. Consumer Reports hefur nýlega varað við því að mörg vinsæl AI-tengd raddkalla verkfæri sem í boði eru í dag skorti „merkingarlegar“ vernd gegn svik eða misnotkun. Sesame, sem var meðstofnandi af Brendan Iribe, einum af skapendum Oculus, fékk mikla athygli í lok febrúar fyrir aðstoðartækni sína, sem nánast fer um skrítinn dalinn. Maya og aðstoðar Sesame, Miles, anda, sýna taltruflanir, og má trufla meðan á talinu stendur, á svipaðan hátt og Voice Mode OpenAI. Fyrirtækið hefur tryggt ótilgreinda fjárfestingu frá Andreessen Horowitz, Spark Capital, og Matrix Partners. Að öðru leyti en að þróa talgervilatækni, er Sesame að prófa AI gleraugu „íhugð að vera notuð allan daginn“ sem munu nýta eigin módel.


Watch video about

Sesame kringir CSM-1B módelið fyrir háþróaða raddaðstoðann Maya.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 9:30 a.m.

Google’s Danny Sullivan og John Mueller um leitar…

John Mueller frá Google hélt Danny Sullivan, einnig frá Google, á Search Off the Record podcasti til að ræða „Hugmyndir um SEO og SEO fyrir Gervigreind

Dec. 23, 2025, 9:26 a.m.

Lexus prófar generatíva gervigreind í nýju skemmt…

Yfirlit: Lexus hefur sett fram jólajarbók Viðskiptamerki sem byggir á gervigreind, samkvæmt fréttatilkynningu

Dec. 23, 2025, 9:16 a.m.

2025 var árið sem gervigreindarmyndbönd fylltu sa…

Árið 2025 varð byltingarkennt tímamót í samfélagsmiðlum þegar gervigreindarhúsuð myndbönd byrjuðu að ráða ríkjum á vettvangi eins og YouTube, TikTok, Instagram og Facebook.

Dec. 23, 2025, 9:15 a.m.

Gervigreind er að skapa öryggisvanda sem flestar …

Fyrirtæki kunna að hafa öryggisdeildir í gangi, en mörg eru enn óundirbúin fyrir hvernig gervigreindarkerfi raunverulega bregðast við, að því er fram kemur í tölvuöryggisrannsakanda AI.

Dec. 23, 2025, 9:07 a.m.

FirstFT: Skuldabóltur vegna gervigreindar ýtir un…

Grundvallarhluti þessarar vefsíðu tókst ekki að hlaðast inn.

Dec. 23, 2025, 5:21 a.m.

Ferill breyting í 2026? Meðal auðveldustu störf t…

Mynd eftir Paulina Ochoa, Digital Journal Þegar margir sækjast eftir ferlum sem nýta tækni AI, hversu aðgengileg eru þessi störf? Ný rannsókn frá tækninámsvettvangi EIT Campus greinir frá þeim AI störfum sem eru auðveldastir að komast inn í á Evrópu árið 2026, og sýnir að sum störf krefjast aðeins 3-6 mánaða þjálfun án þess að nauðsynlegt sé að hafa tölvunarfræðipróf

Dec. 23, 2025, 5:20 a.m.

Gervigreind í tölvuleikjum: Að auka sannleika og …

Vöðvandi leikjageirans gjörbreytist hratt með samþættingu gervigreindar (AI) tækni, sem grundvallar breytingar á því hvernig leikurinn er þróaður og upplifaður af leikmönnum.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today