AI spoločnosť Sesame predstavila základný model, ktorý poháňa Mayu, pôsobivo realistického hlasového asistenta. Tento model, pozostávajúci z 1 miliardy parametrov (kde „parametre“ odkazujú na jednotlivé súčasti modelu), bol vydaný pod licenciou Apache 2. 0, čo umožňuje komerčné využitie s minimálnymi obmedzeniami. Model s názvom CSM-1B produkuje „RVQ audio kódy“ z textových a audio vstupov, podľa popisu Sesamu na platforme pre vývoj AI Hugging Face. RVQ znamená „reziduálna vektorová kvantizácia“, metódu, ktorá sa používa na kódovanie audia do diskrétnych tokenov známych ako kódy. Táto technika sa využíva v rôznych súčasných AI audio technológiách, vrátane Google SoundStream a Meta Encodec. CSM-1B je postavený na modeli z rodiny Meta Llama a obsahuje komponent „dekodér“ audia. Podľa Sesamu, jemne vyladená verzia CSM poháňa Mayu. V repozitároch CSM-1B na Hugging Face a GitHub Sesam uvádza: „Model, ktorý je tu open-sourced, je model pre základnú generáciu. Môže produkovať rôzne hlasy, ale nebol jemne doladený pre žiadny konkrétny hlas.
[. . . ] Model má niektoré schopnosti pre neanglické jazyky kvôli kontaminácii dát v tréningovom súbore, ale jeho výkon sa očakáva ako suboptimálny. “ Nie je jasné, aké dáta Sesame využil na tréning CSM-1B, pretože spoločnosť túto informáciu nezverejnila. Je dôležité poznamenať, že model postráda podstatné bezpečnostné opatrenia. Sesame sa spolieha na čestný systém, ktorý povzbudzuje vývojárov a používateľov, aby sa vyhýbali používaniu modelu na napodobňovanie niekoho hlasu bez povolenia, vytváraniu zavádzajúceho materiálu ako falošné správy alebo zapájaniu sa do škodlivých či zlomyseľných aktivít. Testoval som demo na Hugging Face a napodobniť môj hlas trvalo menej ako minútu. Potom bolo jednoduché generovať reč na rôzne témy, vrátane kontroverzných ako voľby a ruská propaganda. Consumer Reports nedávno varoval, že mnohé populárne nástroje na klonovanie hlasu, založené na AI, dostupné dnes postrádajú „významné“ ochrany proti podvodu alebo zneužitiu. Sesame, ktorú spoluzaložil spolutvorca Oculus Brendan Iribe, získala výraznú pozornosť koncom februára za svoju asistentnú technológiu, ktorá takmer prekonáva uncanny valley. Maya a ďalší asistent Sesamu, Miles, dýchajú, vykazujú rečové dysfluencie a môžu byť prerušené počas hovorenia, podobne ako Voice Mode od OpenAI. Spoločnosť získala nezverejnenú investíciu od Andreessen Horowitz, Spark Capital a Matrix Partners. Okrem vývoja technológie hlasového asistenta Sesame prototypuje AI okuliare „určené na celodenné nosenie“, ktoré budú využívať jej proprietárne modely.
Sesame uvádza model CSM-1B pre pokročilého hlasového asistenta Mayu.
Analýza spoločnosti Salesforce o nákupnom období Cyber Week 2025 odhalila rekordný globálny maloobchodný predaj vo výške 336,6 miliardy dolárov, čo predstavuje 7 % nárast v porovnaní s predchádzajúcim rokom.
Rýchly pokrok v oblasti umelnej inteligencie (UI) vyvolal významnú diskusiu a obavy medzi odborníkmi, najmä čo sa týka jej dlhodobého dopadu na ľudstvo.
Toto je sponzorovaný obsah; Barchart nevyjadruje podporu uvedeným webovým stránkam alebo produktom.
Nedávno spoločnosť Google DeepMind predstavila inovatívny systém umelej inteligencie s názvom AlphaCode, ktorý znamená veľký prelom v oblasti umelej inteligencie a vývoja softvéru.
Pr closely sledujem vznik agentového SEO, presvedčený, že s postupom schopností v priebehu nasledujúcich rokov budú agenti významne ovplyvňovať odvetvie.
Peter Lington, viceprezident pre región v oddelení Vojny spoločnosti Salesforce, zdôrazňuje transformačné účinky, ktoré budú mať pokročilé technológie na oddelenie Vojny v priebehu najbližších troch až piatich rokov.
Sprout Social si pevne vybudovalo pozíciu popredného hráča v odvetví správy sociálnych médií tým, že prijalo pokročilú AI technológiu a vytvorilo strategické partnerstvá, ktoré podporujú inovácie a zlepšujú ponuku služieb.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today