AI fyrirtækið Sesame hefur kynnt grunnmódelið sem drífur Maya, heillandi talgervil. Þetta módelið, sem samanstendur af 1 milljarði para (þar sem „pör“ vísa til einstaka liða módelins), er gefið út undir Apache 2. 0 leyfi, sem gerir það kleift að nota í atvinnuskyni með lágum takmörkunum. Módelinu er gefið nafnið CSM-1B og framleiðir „RVQ hljóðkóðar“ úr bæði texta og hljóðinputum, samkvæmt lýsingu Sesame á AI þróunarvefnum Hugging Face. RVQ stendur fyrir „afgangs vektor kvantun“, aðferð sem notuð er til að kóða hljóð í aðskilda tákn þekkt sem kóðar. Þessi tækni er notuð í ýmsum nútíma AI hljóðtækni, þar á meðal Google’s SoundStream og Encodec Meta. CSM-1B er byggt á módel frá Llama fjölskyldu Meta og felur í sér hljóð „afkóðunartæki“. Samkvæmt Sesame knýr fínstillt útgáfa af CSM Maya. Í Hugging Face og GitHub geymslum CSM-1B segir Sesame: „Módelið sem hér er gefið út er grunnsamskipta módelið. Það getur framleitt margvísleg raddir en hefur ekki verið fínstillt fyrir neina sérstaka rödd.
[…] Módelið hefur einhverja getu fyrir ekki-ensk tungumál vegna gagnakennslusmita í þjálfunarsettinu, en frammistaða þess er fyrirfram ætluð að vera ekki fullkomin. “ Það er óljóst hvaða gögn Sesame notaði til að þjálfa CSM-1B, þar sem fyrirtækið hefur ekki afhjúpað þessar upplýsingar. Mikilvægt er að taka fram að módelið skortir verulega öryggisráðstafanir. Sesame treystir á heiðarleikakerfi, sem hvetur þróunaraðila og notendur til að forðast að nota módel til að líkja eftir rödd annarra án leyfis, búa til villandi efni eins og falskar fréttir eða taka þátt í skaðlegum eða illgjarnum aðgerðum. Ég prófaði sýnikennsluna á Hugging Face, og að líkja eftir rödd minni tók minna en eina mínútu. Eftir það var auðvelt að framleiða ræðu um ýmis málefni, þar með talið deilumál eins og kosningar og rússneska áróður. Consumer Reports hefur nýlega varað við því að mörg vinsæl AI-tengd raddkalla verkfæri sem í boði eru í dag skorti „merkingarlegar“ vernd gegn svik eða misnotkun. Sesame, sem var meðstofnandi af Brendan Iribe, einum af skapendum Oculus, fékk mikla athygli í lok febrúar fyrir aðstoðartækni sína, sem nánast fer um skrítinn dalinn. Maya og aðstoðar Sesame, Miles, anda, sýna taltruflanir, og má trufla meðan á talinu stendur, á svipaðan hátt og Voice Mode OpenAI. Fyrirtækið hefur tryggt ótilgreinda fjárfestingu frá Andreessen Horowitz, Spark Capital, og Matrix Partners. Að öðru leyti en að þróa talgervilatækni, er Sesame að prófa AI gleraugu „íhugð að vera notuð allan daginn“ sem munu nýta eigin módel.
Sesame kringir CSM-1B módelið fyrir háþróaða raddaðstoðann Maya.
John Mueller frá Google hélt Danny Sullivan, einnig frá Google, á Search Off the Record podcasti til að ræða „Hugmyndir um SEO og SEO fyrir Gervigreind
Yfirlit: Lexus hefur sett fram jólajarbók Viðskiptamerki sem byggir á gervigreind, samkvæmt fréttatilkynningu
Árið 2025 varð byltingarkennt tímamót í samfélagsmiðlum þegar gervigreindarhúsuð myndbönd byrjuðu að ráða ríkjum á vettvangi eins og YouTube, TikTok, Instagram og Facebook.
Fyrirtæki kunna að hafa öryggisdeildir í gangi, en mörg eru enn óundirbúin fyrir hvernig gervigreindarkerfi raunverulega bregðast við, að því er fram kemur í tölvuöryggisrannsakanda AI.
Grundvallarhluti þessarar vefsíðu tókst ekki að hlaðast inn.
Mynd eftir Paulina Ochoa, Digital Journal Þegar margir sækjast eftir ferlum sem nýta tækni AI, hversu aðgengileg eru þessi störf? Ný rannsókn frá tækninámsvettvangi EIT Campus greinir frá þeim AI störfum sem eru auðveldastir að komast inn í á Evrópu árið 2026, og sýnir að sum störf krefjast aðeins 3-6 mánaða þjálfun án þess að nauðsynlegt sé að hafa tölvunarfræðipróf
Vöðvandi leikjageirans gjörbreytist hratt með samþættingu gervigreindar (AI) tækni, sem grundvallar breytingar á því hvernig leikurinn er þróaður og upplifaður af leikmönnum.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today