lang icon En
March 13, 2025, 9:41 p.m.
3419

सेसामेने प्रगत व्हॉइस असिस्टंट माया साठी CSM-1B मॉडेल लाँच केले.

Brief news summary

सेसमी, ज्याची स्थापना Oculus च्या ब्रेंडन इरिबने केली,ने त्याचा AI वॉइस असिस्टंट मॉडेल, CSM-1B, सादर केला आहे. या मॉडेलमध्ये 1 अब्ज पॅरामीटर्स आहेत आणि हे वाणिज्यिक अनुप्रयोगांसाठी Apache 2.0 अंतर्गत परवानाधारित आहे, ज्यामध्ये सीमित निर्बंध आहेत. CSM-1B ऑडिओ कोडिंगसाठी अवशिष्ट व्हेक्टर क्वांटायझेशन (RVQ) वापरते, ज्यामुळे ते Google च्या SoundStream सारख्या आघाडीच्या AI ऑडिओ तंत्रज्ञानांमध्ये स्थान मिळवते. मेटाच्या लामा फ्रेमवर्कवर विकसित केलेले, हे मॉडेल एक ऑडिओ डीकोडर प्रदर्शित करते जो विविध प्रकारच्या आवाजांची निर्मिती करतो, तरीही हे आवाजाची पुनरुत्पत्ती करण्यासाठी डिझाइन केलेले नाही. इंग्रजी बाहीर भाषांमध्ये याची कामगिरी त्याच्या प्रशिक्षण डेटा च्या श्रेणीनुसार मर्यादित असू शकते. याशिवाय, त्यात misuse विरुद्ध कमी संरक्षण आहे, मुख्यतः हानिकारक प्रथांचे प्रतिबंध करण्यासाठी एक मानवीय आचारसंहिता अवलंबतो, ज्यामध्ये अधिकृत वॉइस क्लोनिंग समाविष्ट आहे. सेसमीचे वॉइस असिस्टंट, माया आणि माइल्स, नैसर्गिक भाषणाच्या वैशिष्ट्यांसाठी ओळखले जातात. अँड्रीसेन होरॉविट्झ सारख्या गुंतवणूकदारांच्या समर्थनाने, कंपनी तिच्या आवाज तंत्रज्ञानासह AI चष्मे विकसित करण्याचा विचार करत आहे. तरीही, AI वॉइस क्लोनिंगच्या संभाव्य फसवणूक आणि दुरुपयोगाबद्दल चिंता व्यक्त केल्या जातात, जसे की अलीकडील ग्राहक अहवालांमध्ये नमूद केले आहे.

AI कंपनी Sesame ने Maya या दृष्टीने वास्तववादी आवाज सहाय्यकाला चालविणाऱ्या मौलिक मॉडेलची ओळख करुन दिली आहे. हा मॉडेल, जो 1 अब्ज पॅरामीटर्समध्ये समाविष्ट आहे (जिथे "पॅरामीटर्स" म्हणजे मॉडेलच्या विशिष्ट घटकांचे प्रतिनिधित्व करते), Apache 2. 0 परवाण्या अंतर्गत जारी केला आहे, कमी मर्यादांसह व्यावसायिक वापरासाठी परवानगी देत आहे. CSM-1B असे नाव असलेला हा मॉडेल "RVQ ऑडिओ कोड" बनवतो, जो मजकूर आणि ऑडिओ इनपुटवर आधारित असतो, असे Sesame च्या AI विकास प्लॅटफॉर्म Hugging Face वरील वर्णनानुसार. RVQ म्हणजे "उरलेला व्हेक्टर क्वाँटायझेशन, " एक पद्धत जी ऑडिओला वेगळ्या टोकनमध्ये युज करते ज्यांना कोड म्हणून ओळखले जाते. ही तंत्रज्ञान अनेक आधुनिक AI ऑडिओ तंत्रज्ञानात उपयोगात आहे, जसे की Google चा SoundStream आणि Meta चा Encodec. CSM-1B हा Meta च्या Llama कुटुंबातून बनवलेला आहे आणि त्यात एक ऑडिओ "डिकोडर" घटक समाविष्ट आहे. Sesame च्या मते, CSM चा एक सुक्ष्म समाविष्ट आवृत्ती Maya ला चालवते. CSM-1B च्या Hugging Face आणि GitHub रेपोमध्ये, Sesame सांगते, "येथील ओपन-सोर्स केलेला मॉडेल एक आधारभूत उत्पादन मॉडेल आहे. हे विविध आवाज निर्माण करू शकते परंतु कोणत्याही विशिष्ट आवाजासाठी ते सुक्ष्म रूपाने त्यातच समायोजित केलेले नाही.

[…] प्रशिक्षण सेटमध्ये डेटा चूकांमुळे या मॉडेलमध्ये काही गैर-इंग्रजी भाषांसाठी क्षमता आहे, परंतु त्याचा प्रदर्शन कमी दर्जाचा राहील, असे अपेक्षित आहे. " CSM-1B ला प्रशिक्षित करण्यासाठी Sesame ने कोणता डेटा वापरला हे स्पष्ट नाही, कारण कंपनीने या माहितीला उघड केलेले नाही. या मॉडेलमध्ये महत्त्वाची सुरक्षितता नाही याचे लक्षात घेणे महत्त्वाचे आहे. Sesame एक सन्मान प्रणालीवर अवलंबून आहे, जे विकसकांना आणि वापरकर्त्यांना परवानगी शिवाय कोणाच्या आवाजाचा अनुकरण करण्यासाठी, खोट्या बातम्यासारखे दिशाभूल करणारे सामग्री तयार करण्यासाठी, किंवा हानिकारक किंवा घातक क्रियाकलापांमध्ये संलग्न होण्यास टाळण्यास प्रोत्साहित करते. मी Hugging Face वर डेमो चाचणी केली, आणि माझ्या आवाजाचे अनुकरण करणे एक मिनिटापेक्षा कमी वेळात झाले. त्यानंतर, निवडक विषयांवर, जसे की निवडणुका आणि रशियन प्रचार, भाषण निर्माण करणे सोपे झाले. Consumer Reports ने अलीकडेच इशारा दिला की आज उपलब्ध असलेल्या अनेक लोकप्रिय AI-संचालित आवाज क्लोनिंग साधनांमध्ये फसवणूक किंवा गैरवापराच्या विरोधात "अर्थपूर्ण" सुरक्षेचा अभाव आहे. Oculus सह-निर्माता Brendan Iribe द्वारे सह-स्थापित केलेली Sesame, शेवटी फेब्रुवारीत तिच्या सहाय्यक तंत्रज्ञानासाठी महत्वपूर्ण लक्ष आकर्षित करत आहे, ज्यामुळे अविश्वसनीय घाटातून जवळजवळ मार्गक्रमण केले जाते. Maya आणि Sesame चा इतर सहाय्यक Miles, श्वास घेतात, भाषणातील असामान्यतेचे प्रदर्शन करतात, आणि बोलत असताना त्यांच्या बोलण्यात व्यत्यय आणला जाऊ शकतो, ज्याप्रमाणे OpenAI च्या Voice Mode सारखेच आहे. कंपनीने Andreessen Horowitz, Spark Capital, आणि Matrix Partners कडून गूढ गुंतवणूक प्राप्त केली आहे. आवाज सहाय्यक तंत्रज्ञानाच्या विकासाबाहेर, Sesame “संपूर्ण दिवस घालण्यासाठी” डिझाइन केलेल्या AI चष्मांचा प्रोटोटाइप तयार करीत आहे जे त्यांच्या अद्वितीय मॉडेल्सचा उपयोग करेल.


Watch video about

सेसामेने प्रगत व्हॉइस असिस्टंट माया साठी CSM-1B मॉडेल लाँच केले.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

एआय व्हिडिओ सामग्री नियंत्रण उपकरणे ऑनलाइन द्वेषपूर्ण …

सोशल मीडिया प्लॅटफॉर्म्स आता कृत्रिम बुद्धिमत्ता (AI) चा उपयोग अधिकाधिक करीत आहेत त्यांच्या व्हिडीओ सामग्रीच्या वर्गीकरणासाठी, ऑनलाइन संवादाचं मुख्य माध्यम व्हिडीओंच्या वाढत्या संख्येचं पारायण करताना.

Dec. 21, 2025, 1:38 p.m.

यूएसने आपल्या एआय चिप्सवर आयातीवर मर्यादा पुन्हा पाहि…

धोरण बदलणं: वर्षांच्या कपाळलेल्या बंदी योजनेनंतर, नॅव्हीडियाच्या H200 चिप्सची चीनला विक्री करण्याचा निर्णय काही रिपब्लिकन लोकांमध्ये आक्षेप उभा करतो.

Dec. 21, 2025, 1:38 p.m.

एआय २०२५ मध्ये ५०,००० हून अधिक नोकऱ्या कपातील होती …

आर्टिफिशियल इंटेलिजेंसच्या प्रेरणेने झालेले layoffs २०२५ च्या नोकरी बाजारात दिसून आले आहेत, ज्यामध्ये मोठ्या कंपन्यांनी AI प्रगतीच्या नावावर हजारो नोकऱ्या कापल्या आहेत.

Dec. 21, 2025, 1:36 p.m.

पर्प्लेक्सिटी एसईओ सेवा सुरू – नवीनमीडिया.कॉम ही आघा…

RankOS™ ब्रँडची दृश्यमानता आणि कोटेशन Perplexity AI आणि इतर उत्तर-इंजिन शोध प्लॅटफॉर्मवर वाढवते Perplexity SEO एजन्सी सेवा न्यूयॉर्क, NY, 19 डिसेंबर, 2025 (GLOBE NEWSWIRE) — NEWMEDIA

Dec. 21, 2025, 1:22 p.m.

एरिक श्मिटचे कौटुंबिक कार्यालय 22 एआय स्टार्टअप्समध्ये …

या लेखाचा मूळ आवृत्ती CNBCच्या इनसाइड वेल्थ न्यूजलेटरमध्ये दिसली असून, ती रॉबर्ट फ्रँक यांनी लिहिली आहे, जी उच्च net worth गुंतवणूकदारां आणि ग्राहकांसाठी साप्ताहिक संसाधन म्हणून कार्यरत आहे.

Dec. 21, 2025, 1:21 p.m.

भविष्याची विपणन अवलंबना: केवळ योग्यच आहे का? हीच जे…

हेडलाइनने डिज्नीच्या बिलियन डॉलरच्या गुंतवणूकीवर लक्ष केंद्रित केले आहे आणि त्याने OpenAI कोणासाठी निवडले यावरून चर्चा झाली आहे, विशेषतः Googleवरून ज्यावर तो कॉपीराइट भंगाची मिৄचिका दाखवत आहे.

Dec. 21, 2025, 9:34 a.m.

सेल्सफोर्स डेटाने दर्शविले की, एआय आणि एजंट्स यांनी व…

सेल्सफोर्सने 2025 च्या सायबर वीक खरेदी कार्यक्रमावर सखोल अहवाल जाहीर केला आहे, ज्यामध्ये जागतिक केवळ 1.5 बिलियनपेक्षा अधिक खरेदीदारांकडून मिळालेल्या डेटाचा विश्लेषण करण्यात आले आहे.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today