lang icon En
March 13, 2025, 9:41 p.m.
3377

Sesame lanseeraa CSM-1B-mallin edistyksellistä ääniavustajaa Maya varten.

Brief news summary

Sesame, jonka perustivat Brendan Iribe Oculusista, on esitellyt AI-ääniohjainmallinsa, CSM-1B. Tässä mallissa on 1 miljardi parametria ja se on lisensoitu Apache 2.0 -lisenssin alla kaupallisiin sovelluksiin rajoitetuin ehdoin. CSM-1B hyödyntää residual vector quantizationia (RVQ) äänenkoodauksessa, asettaen sen johtavien AI-ääniteknologioiden, kuten Googlen SoundStreamin, joukkoon. Mallia on kehitetty Metan Llama-kehyksellä, ja se sisältää äänidekooderin, joka tuottaa monipuolisen valikoiman ääniä, vaikka se ei ole suunniteltu äänen jäljittelyyn. Sen suorituskyky ei-englanninkielisissä kielissä saattaa olla rajoitettua sen koulutusdatasta johtuen. Lisäksi sillä on minimisuojauksia väärinkäyttöä vastaan, ja se perustuu pääasiassa kunniakoodiin vahingollisten käytäntöjen, kuten valtuuttamattoman äänen kloonaamisen, estämiseksi. Sesamen ääniohjaimet, Maya ja Miles, tunnetaan luonnollisista puheominaisuuksistaan. Andreessen Horowitzin kaltaisten sijoittajien tuella yritys tutkii myös AI-lasien kehittämistä, jotkaottavat käyttöön sen ääniteknologian. Huolestuttavaa on kuitenkin, että AI-äänen kloonaamisen mahdollinen väärinkäyttö on herättänyt huolta, kuten tuoreimmat kuluttajaraportit osoittavat.

AI-yritys Sesame on esitellyt perustavan mallin, joka ohjaa Maya-nimistä, vaikuttavan elävänoloista ääniavustajaa. Tämä malli, joka sisältää 1 miljardin parametrin (missä “parametrit” viittaavat mallin eri komponentteihin), on julkaistu Apache 2. 0 -lisenssillä, mikä mahdollistaa kaupallisen käytön vähäisin rajoituksin. Nimeltään CSM-1B, tämä malli tuottaa “RVQ-äänikoodit” sekä tekstistä että ääniinputista, kuten Sesame kuvailee AI-kehitysalustalla Hugging Facessa. RVQ tarkoittaa “jäänteisen vektorin kvantisaatiota”, menetelmää, jota käytetään äänen koodamiseen erillisiin tokeneihin, joita kutsutaan koodeiksi. Tätä tekniikkaa käytetään monissa nykyaikaisissa AI-ääniteknologioissa, mukaan lukien Googlen SoundStream ja Meta:n Encodec. CSM-1B perustuu Meta:n Llama-perheeseen ja sisältää äänen “dekooderi”-komponentin. Sesamen mukaan hienosäädetty versio CSM:stä voimanlähteenä Maya. CSM-1B:n Hugging Face- ja GitHub-repositorioissa Sesame toteaa: “Tämä avointa lähdekoodia oleva malli on perusmalli. Se voi tuottaa erilaisia ääniä, mutta sitä ei ole hienosäädetty minkään tietyn äänen mukaan.

[…] Mallilla on jonkin verran kykyä ei-englanninkielisiin kieliin, johtuen datan häiriöstä koulutussetissä, mutta sen suorituskyvyn odotetaan olevan alle optimaalisen. ” On epäselvää, mitä tietoja Sesame käytti CSM-1B:n kouluttamiseen, sillä yritys ei ole paljastanut tätä tietoa. On tärkeää huomata, että mallilta puuttuu merkittäviä turvatoimia. Sesame luottaa kunnianhimoiseen järjestelmään, kannustaen kehittäjiä ja käyttäjiä pidättäytymään mallin käytöstä jonkun äänen jäljittelemiseen ilman lupaa, harhaanjohtavan materiaalin, kuten valeuutisten, luomiseen tai haitallisiin tai ilkeisiin toimintoihin ryhtymiseen. Kävin demoa läpi Hugging Facessa, ja oman äänen jäljitteleminen kesti alle minuutin. Tämän jälkeen puheen tuottaminen eri aiheista, mukaan lukien kiistanalaisista aiheista kuten vaaleista ja Venäjän propagandasta, oli vaivatonta. Consumer Reports varoitti äskettäin, että monet suositut AI-pohjaiset äänen kloonaustyökalut, joita on saatavilla tänään, eivät sisällä “merkittäviä” suojatoimia petoksia tai väärinkäytöksiä vastaan. Sesame, jonka yksi perustajista on Oculusin toinen luoja Brendan Iribe, sai suurta huomiota helmikuun lopulla avustajateknologiansa ansiosta, joka lähes navigoi outojen laaksojen rajamailla. Maya ja Sesamen toinen avustaja, Miles, hengittävät, osoittavat puhesujuvuuden häiriöitä ja niitä voidaan keskeyttää puhuessaan, aivan kuten OpenAI:n Voice Mode. Yritys on saanut ilmoittamatonta investointia Andreessen Horowitzilta, Spark Capitalilta ja Matrix Partnersilta. Ääniavustajateknologian kehittämisen ohella Sesame prototyypittää AI-laseja, “jotka on tarkoitettu koko päivän käyttöön” ja jotka hyödyntävät sen omia malleja.


Watch video about

Sesame lanseeraa CSM-1B-mallin edistyksellistä ääniavustajaa Maya varten.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 1:29 p.m.

SaaStr AI-sovellusviikko: Kintsugi — tekoäly, jok…

Joka viikko esitämme tekoälypohjaisen sovelluksen, joka ratkaisee todellisia ongelmia B2B- ja pilviyrityksille.

Dec. 16, 2025, 1:24 p.m.

tekoälyn rooli paikallisen SEO-strategioiden kehi…

Tekoäly (AI) vaikuttaa yhä enemmän paikalliseen hakukoneoptimointiin (SEO).

Dec. 16, 2025, 1:22 p.m.

IND Technology saa 33 miljoonaa dollaria ehkäistä…

IND Technology, australialainen yritys, joka erikoistuu infrastruktuurin valvontaan utilities-alalla, on saanut 33 miljoonan dollarin kasvurahoituksen vahvistaakseen tekoälypohjaista toimintaansa maastopalojen ja sähkökatkosten ehkäisemiseksi.

Dec. 16, 2025, 1:21 p.m.

Tekoälyn käyttöönotto käy sekavaksi julkaisijoill…

Viime viikkoina yhä useammat julkaisijat ja brändit ovat kohdanneet merkittävää kritiikkiä kokeillessaan tekoälyä (AI) sisällöntuotantoprosesseissaan.

Dec. 16, 2025, 1:17 p.m.

Google Labs ja DeepMind lanseeraavat Pomelli:n: t…

Google Labs, yhteistyössä Google DeepMindin kanssa, on esitellyt Pomelli-nimisen tekoälypohjaisen kokeilun, jonka tavoitteena on auttaa pieniä ja keskisuuria yrityksiä kehittämään brändin mukaisia markkinointikampanjoita.

Dec. 16, 2025, 1:15 p.m.

Tekoälypohjainen videon tunnistus parantaa sisäll…

Nykyisen nopeasti laajenevan digitaalisen maiseman myötä sosiaalisen median yritykset omaksuvat yhä enemmän kehittyneitä teknologioita suojellakseen verkkoyhteisöjään.

Dec. 16, 2025, 9:37 a.m.

Miksi vuosi 2026 voisi olla tekoälyvastaisen mark…

Versio tästä tarinasta julkaistiin CNN Businessin Nightcap-uutiskirjeessä.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today