lang icon En
March 13, 2025, 9:41 p.m.
3427

Sesame lancerer CSM-1B modellen til den avancerede stemmeassistent Maya.

Brief news summary

Sesame, der er medstiftet af Brendan Iribe fra Oculus, har introduceret sin AI stemmeassistentmodel, CSM-1B. Denne model har 1 milliard parametre og er licenseret under Apache 2.0 til kommercielle applikationer med begrænsede restriktioner. CSM-1B anvender residual vektor kvantisering (RVQ) til lydkodning, hvilket placerer den blandt førende AI lydteknologier som Googles SoundStream. Udviklet på Metas Llama-platform, fremviser modellen en audio dekoder, der genererer et bredt spektrum af stemmer, selvom den ikke er designet til stemmereplikation. Dens præstation på ikke-engelske sprog kan være begrænset på grund af omfanget af dens træningsdata. Desuden har den minimale beskyttelser mod misbrug og er i høj grad afhængig af en æreskodeks til at afskrække skadelige praksisser, herunder uautoriseret stemmekloning. Sesames stemmeassistenter, Maya og Miles, er kendt for deres naturlige taleegenskaber. Støttet af investorer som Andreessen Horowitz undersøger virksomheden også udviklingen af AI-briller, der integrerer sin stemmeteknologi. Ikke desto mindre er der opstået bekymringer omkring potentialet for svindel og misbrug af AI stemmekloning, som det fremhæves af nylige forbrugerundersøgelser.

AI-virksomheden Sesame har introduceret den grundlæggende model, der driver Maya, en imponerende livagtig stemmeassistent. Denne model, som omfatter 1 milliard parametre (hvor "parametre" henviser til de forskellige komponenter i modellen), frigives under en Apache 2. 0-licens, hvilket muliggør kommerciel brug med minimale begrænsninger. Den hedder CSM-1B, og modellen producerer "RVQ audio codes" fra både tekst- og audioinput, ifølge Sesames beskrivelse på AI-udviklingsplatformen Hugging Face. RVQ står for "residual vector quantization", en metode, der bruges til at kode lyd til diskrete tokens kendt som koder. Denne teknik anvendes i forskellige moderne AI-lydteknologier, herunder Googles SoundStream og Metas Encodec. CSM-1B er bygget på en model fra Metas Llama-familie og inkluderer en audio "decoder"-komponent. Ifølge Sesame driver en finjusteret version af CSM Maya. I CSM-1B's Hugging Face- og GitHub-repositorier siger Sesame: "Den model, der open-source her, er en basismodelleringsmodel. Den kan producere forskellige stemmer, men er ikke blevet finjusteret til nogen specifik stemme.

[…] Modellen har en vis evne til ikke-engelske sprog på grund af datakontamination i træningssættet, men dens præstation forventes at være suboptimal. " Det er uklart, hvilke data Sesame har brugt til at træne CSM-1B, da virksomheden ikke har offentliggjort denne information. Det er vigtigt at bemærke, at modellen mangler betydelige sikkerhedsforanstaltninger. Sesame stole på et æresystem, der opfordrer udviklere og brugere til at undgå at bruge modellen til at efterligne nogens stemme uden tilladelse, skabe vildledende materiale som falske nyheder, eller deltage i skadelige eller ondsindede aktiviteter. Jeg testede demoen på Hugging Face, og at efterligne min stemme tog mindre end et minut. Efter det var det enkelt at generere tale om forskellige emner, herunder kontroversielle emner som valg og russisk propaganda. Consumer Reports advarede for nylig om, at mange populære AI-drevne stemmekloningsværktøjer, der er tilgængelige i dag, mangler "betydelige" beskyttelser mod svindel eller misbrug. Sesame, som blev co-fundet af Oculus medskaber Brendan Iribe, fik betydelig opmærksomhed i slutningen af februar for sin assistentteknologi, som næsten navigerer i det uncanny valley. Maya og Sesames anden assistent, Miles, ånder, udviser taleusikkerheder og kan blive afbrudt, mens de taler, ligesom OpenAI's Voice Mode. Virksomheden har sikret sig en uoplyst investering fra Andreessen Horowitz, Spark Capital og Matrix Partners. Udover at udvikle stemmeassistentteknologi prototype Sesame AI-briller, "beregnet til hel dags brug", som vil anvende deres propritære modeller.


Watch video about

Sesame lancerer CSM-1B modellen til den avancerede stemmeassistent Maya.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 1:22 p.m.

AIMM: AI-drevet ramme til at opdage social media-…

AIMM: Et innovativt AI-drevet framework til at opdage social-media-influeret markedsmanipulation I dagens hurtigt skiftende aktiemarked har sociale medier vist sig som en vigtig kraft, der former markedsdynamikken

Dec. 22, 2025, 1:16 p.m.

Eksklusivt: Filevine køber Pincites, AI-drevet vi…

Juridisk teknologivirksomheden Filevine har opkøbt Pincites, et AI-drevet kontraktredigeringsfirma, hvilket styrker sin tilstedeværelse inden for virksomhedsjura og transaktionel jura samt fremmer sin AI-fokuserede strategi.

Dec. 22, 2025, 1:16 p.m.

AI's indvirkning på SEO: Transformation af praksi…

Kunstig intelligens (AI) er i hastig udvikling og ændrer hurtigt feltet for søgemaskineoptimering (SEO), hvilket giver digitale marketingfolk nye værktøjer og muligheder for at finjustere deres strategier og opnå bedre resultater.

Dec. 22, 2025, 1:15 p.m.

Fremgang inden for dybfake-detektion med AI-video…

Fremskridt inden for kunstig intelligens har spillet en afgørende rolle i bekæmpelsen af misinformation ved at muliggøre oprettelsen af avancerede algoritmer designet til at opdage deepfakes—manipulerede videoer, hvor originalt indhold er ændret eller erstattet for at skabe falske repræsentationer med det formål at forvirre seere og sprede vildledende information.

Dec. 22, 2025, 1:14 p.m.

De 5 bedste AI-salgsystemer, som konverterer uden…

AI's stigende betydning har revolutioneret salg ved at erstatte lange salgscyklusser og manuelle opfølgninger med hurtige, automatiserede systemer, der arbejder 24/7.

Dec. 22, 2025, 1:12 p.m.

Seneste AI- og marketingnyheder: Ugeopgørelse (1.…

I det hurtigt udviklende område inden for kunstig intelligens (AI) og marketing former nylige betydningsfulde fremskridt industrien, hvilket bringer både nye muligheder og udfordringer.

Dec. 22, 2025, 9:22 a.m.

OpenAI ser bedre marginer på erhvervssalg, siger …

Publikationen sagde, at virksomheden forbedrede sin "beregningsmargen," en intern måling, der repræsenterer den del af omsætningen, der er tilbage efter dækning af omkostningerne ved driftsmodeller for betalende brugere af dens virksomhed- og forbrugerprodukter.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today