AI kompanija Sesame je predstavila osnovni model koji pokreće Mayu, izuzetno realnu glasovnu asistenticu. Ovaj model, koji se sastoji od 1 milijarde parametara (gdje "parametri" označavaju različite komponente modela), objavljen je pod Apache 2. 0 licencom, što omogućava komercijalnu upotrebu s minimalnim ograničenjima. Nazvan CSM-1B, model proizvodi "RVQ audio kodove" iz tekstualnih i audio ulaza, prema opisu Sesame na platformi za razvoj AI-a Hugging Face. RVQ označava "rezidualnu vektorsku kvantizaciju", metodu koja se koristi za kodiranje zvuka u diskretne tokena poznate kao kodovi. Ova tehnika se koristi u raznim savremenim AI audio tehnologijama, uključujući Googleov SoundStream i Metin Encodec. CSM-1B je izgrađen na modelu iz Meta-ine Llama porodice i uključuje komponentu audio "dekoder". Prema Sesame, fino podešena verzija CSM-a pokreće Mayu. U Hugging Face i GitHub repozitorijima CSM-1B, Sesame navodi: "Model koji je ovdje otvoren je osnovni generacijski model. Može proizvesti razne glasove, ali nije fino podešen za nijedan specifičan glas.
[. . . ] Model ima neku sposobnost za jezike koji nisu engleski zbog kontaminacije podacima u skupu za obuku, ali se očekuje da će njegov učinak biti suboptimalan. " Još uvijek nije jasno koje je podatke Sesame koristio za obuku CSM-1B, jer kompanija nije otkrila te informacije. Važno je napomenuti da model nema značajne sigurnosne mjere. Sesame se oslanja na čestitu praksu, potičući programere i korisnike da se suzdrže od korištenja modela za imitaciju nečijeg glasa bez odobrenja, stvaranje obmanjujućih materijala poput lažnih vijesti, ili uključivanje u štetne ili zlonamjerne aktivnosti. Testirao sam demo na Hugging Face-u, a oponašanje mog glasa trajalo je manje od minute. Nakon toga, generisanje govora o različitim temama, uključujući sporne kao što su izbori i ruska propaganda, bilo je jednostavno. Consumer Reports nedavno su upozorili da mnogi popularni alati za kloniranje glasa na bazi AI-a dostupni danas nemaju "smislenih" zaštita protiv prevare ili zloupotrebe. Sesame, koju su osnovali co-kreator Oculus-a Brendan Iribe, dobila je značajnu pažnju krajem februara zbog svoje tehnologije asistenta, koja gotovo navigira neobičnu dolinu. Maya i drugi Sesame-ov asistent, Miles, dišu, pokazuju govorne disfluencije i mogu biti prekinuti dok govore, slično OpenAI-ovom režimu glasa. Kompanija je osigurala neotkrivenu investiciju od Andreessen Horowitz, Spark Capital i Matrix Partners. Pored razvoja tehnologije glasovnog asistenta, Sesame prototipira AI naočale "namijenjene za cjelodnevno nošenje" koje će koristiti svoje vlasničke modele.
Sesame lansira model CSM-1B za naprednog glasovnog asistenta Mayu.
U današnjem brzo mijenjajućem svijetu digitalnog marketinga, umjetna inteligencija (AI) postaje sve važnija, posebno putem AI analize video sadržaja.
OpenAI i NVIDIA objavili su veliko partnerstvo usmjereno na ubrzanje razvoja i implementacije naprednih modela i infrastrukture umjetne inteligencije (AI).
Industrija oglašavanja je 2025.
Kada je Jeff Bezos predvidio da će neka revoluciona tehnologija odrediti budućnost Amazona, čak su i vrhunski analitičari sa Wall Streeta bili iznenađeni.
Veštačka inteligencija (VI) transformiše optimizaciju za pretraživače (SEO), pružajući preduzećima nove prilike za povećanje njihove vidljivosti na internetu i poboljšanje rangiranja na pretraživačima.
U 2025.
Prihodi timova godinama se bore u svim industrijama i veličinama organizacija, često osjećajući da neprestano popunjavaju propuštenu cijev bez trajnog uspjeha.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today