lang icon En
March 13, 2025, 9:41 p.m.
3423

ساسمی مدل CSM-1B را برای دستیار صوتی پیشرفته مایا معرفی کرد.

Brief news summary

سسامی، که توسط برندان ایریبه از اوکولوس تأسیس شده، مدل دستیار صوتی هوش مصنوعی خود به نام CSM-1B را معرفی کرده است. این مدل دارای ۱ میلیارد پارامتر بوده و تحت مجوز Apache 2.0 برای برنامه‌های تجاری عرضه می‌شود و محدودیت‌های کمی دارد. CSM-1B از کمی‌سازی وکتور باقی‌مانده (RVQ) برای کدگذاری صوتی استفاده می‌کند و در کنار فناوری‌های پیشرفته صوتی هوش مصنوعی مانند SoundStream گوگل قرار دارد. این مدل بر پایه‌ی فریم‌ورک Llama متا توسعه یافته و یک دیکودر صوتی را به نمایش می‌گذارد که دامنه وسیعی از صداها را تولید می‌کند، هرچند که برای تکثیر صدا طراحی نشده است. عملکرد آن در زبان‌های غیرانگلیسی ممکن است به دلیل محدوده داده‌های آموزشی‌اش محدود باشد. علاوه بر این، حفاظت‌های کمی در برابر سوءاستفاده دارد و عمدتاً بر اساس یک کد اخلاقی برای جلوگیری از رفتارهای مضر، از جمله کلونینگ صدای غیرمجاز، تکیه دارد. دستیاران صوتی سسامی، مایا و مایلز، به خاطر ویژگی‌های گفتار طبیعی‌شان شناخته شده‌اند. این شرکت با حمایت سرمایه‌گذارانی مانند آندریسن هورویتز، در حال بررسی توسعه عینک‌های هوش مصنوعی است که فناوری صوتی‌اش را در بر می‌گیرد. با این حال، نگرانی‌هایی درباره قابلیت‌های کلاهبرداری و سوءاستفاده از کلونینگ صدای هوش مصنوعی پدید آمده است که توسط گزارش‌های اخیر مصرف‌کنندگان مورد تأکید قرار گرفته است.

شرکت هوش مصنوعی سسام مدل بنیادی را معرفی کرده است که موتور محرک مایا، یک دستیار صوتی به طرز چشمگیری طبیعی است. این مدل که شامل یک میلیارد پارامتر است (که در اینجا «پارامترها» به اجزای متمایز مدل اشاره دارد)، تحت مجوز آپاچی ۲. ۰ منتشر شده است که به استفاده تجاری با حداقل محدودیت‌ها اجازه می‌دهد. مدل CSM-1B، "کدهای صوتی RVQ" را از ورودی‌های متنی و صوتی تولید می‌کند، به گفته سسام در پلتفرم توسعه هوش مصنوعی هاجینگ فیس. RVQ به معنای "کوانتایزاسیون وکتور باقی‌مانده" است، روشی که برای کدگذاری صدا به توکن‌های گسسته‌ای به نام کدها استفاده می‌شود. این تکنیک در فناوری‌های صوتی هوش مصنوعی معاصر مختلف، از جمله SoundStream گوگل و Encodec متا استفاده می‌شود. CSM-1B بر اساس مدلی از خانواده لامای متا ساخته شده و شامل یک مؤلفه "رمزگشا" صوتی است. به گفته سسام، نسخه‌ای که به‌طور دقیق تنظیم شده، CSM را برای توانمندسازی مایا به کار می‌برد. در مخازن هاجینگ فیس و گیت‌هاب CSM-1B، سسام بیان می‌کند: "مدل منبع باز شده در اینجا یک مدل تولید پایه است. این مدل می‌تواند انواع صداها را تولید کند، اما برای هیچ صدای خاصی به‌طور دقیق تنظیم نشده است.

[. . . ] این مدل به دلیل آلودگی داده‌ها در مجموعه آموزشی، برخی قابلیت‌ها برای زبان‌های غیرانگلیسی دارد، اما عملکرد آن انتظار می‌رود که بهینه نباشد. " هنوز مشخص نیست که سسام از چه داده‌هایی برای آموزش CSM-1B استفاده کرده است، زیرا این شرکت این اطلاعات را فاش نکرده است. قابل ذکر است که این مدل دارای تدابیر محافظتی کافی نیست. سسام به یک سیستم اعتماد متکی است و توسعه‌دهندگان و کاربران را تشویق می‌کند تا از استفاده از مدل برای تقلید از صدای کسی بدون اجازه، تولید محتوای گمراه‌کننده مانند اخبار کذب، یا مشارکت در فعالیت‌های مضر یا بدخواهانه خودداری کنند. من دمو را در هاجینگ فیس آزمایش کردم و تقلید از صدای من کمتر از یک دقیقه طول کشید. پس از آن، تولید گفتار در موضوعات مختلف، از جمله موضوعات بحث‌انگیز مانند انتخابات و پروپاگاندای روسی، آسان بود. Consumer Reports به تازگی هشدار داده است که بسیاری از ابزارهای محبوب کلاهبرداری صوتی که امروز در دسترس هستند، از حفاظت‌های "معنی‌دار" در برابر تقلب یا سوءاستفاده برخوردار نیستند. ساسام، که توسط برندان ایریب، یکی از خالقان اوکولوس، تأسیس شده است، در اواخر فوریه توجه زیادی را به فناوری دستیار خود جلب کرد که تقریباً به دره عجیب و غریب نزدیک می‌شود. مایا و دستیار دیگر سسام، مایلز، نفس می‌کشند، ناپیوستگی‌های گفتاری را نشان می‌دهند و می‌توانند هنگام صحبت قطع شوند، مشابه حالت صوتی OpenAI. این شرکت سرمایه‌گذاری نامشخصی از Andreessen Horowitz، Spark Capital و Matrix Partners جذب کرده است. فراتر از توسعه فناوری دستیار صوتی، سسام در حال ساخت نمونه‌های اولیه عینک‌های هوش مصنوعی "مخصوص استفاده تمام‌روزه" است که از مدل‌های اختصاصی خود بهره می‌برد.


Watch video about

ساسمی مدل CSM-1B را برای دستیار صوتی پیشرفته مایا معرفی کرد.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

ابزارهای مدیریت محتوای ویدیویی هوش مصنوعی مقابله …

پلتفرم‌های شبکه‌های اجتماعی به طور فزاینده‌ای از هوش مصنوعی (AI) برای بهبود نظارت بر محتوای ویدیویی خود بهره می‌برند و این اقدام باعث مقابله با افزایش حجم ویدیوها به عنوان شکل غالب ارتباطات آنلاین شده است.

Dec. 21, 2025, 1:38 p.m.

ایالات متحده مجدداً محدودیت‌های صادراتی خود بر روی…

بازگشت سیاست: پس از سال‌ها محدودیت‌زدایی، تصمیم به اجازه فروش تراشه‌های H200 ساخت انویدیا به چین، اعتراضاتی از سوی برخی جمهوری‌خواهان به همراه داشته است.

Dec. 21, 2025, 1:38 p.m.

هوش مصنوعی در سال ۲۰۲۵ بیش از ۵۰ هزار نفر را اخرا…

اخراج نیروی کار بر اثر هوش مصنوعی در بازار کار سال ۲۰۲۵ موجی از کاهش نیرو را رقم زده است، به طوری که شرکت‌های بزرگ اعلام کردند هزاران شغل به دلیل پیشرفت‌های هوش مصنوعی حذف شده است.

Dec. 21, 2025, 1:36 p.m.

خدمات سئو پرپلیسیتی راه‌اندازی شد – NEWMEDIA.COM،…

رتک‌او‌اس™ قابلیت دید برند و ارجاعات را در پلتفرم‌های جستجوگر پاسخ‌گو مانند پرسپلکتکس AI و سایر موتورهای پاسخ‌دهی تقویت می‌کند خدمات آژانس سئو پرسپلکتکس نیویورک، NY، ۱۹ دسامبر ۲۰۲۵ (GLOBE NEWSWIRE) — امروز، نیو مدیا دات کام رویدادی رونمایی کرد به نام رتک‌او‌اس™، که چارچوبی اختصاصی است و هدف آن افزایش دیده‌شدن سازمان‌ها در پرسپلکتکس AI و سایر پلتفرم‌های پاسخ‌دهی نوظهور است که از بازیابی اطلاعات در لحظه و سنتز مولد بهره می‌برند

Dec. 21, 2025, 1:22 p.m.

دفتر خانوادگیِ اریک اشمیت در ۲۲ استارتاپ هوش مصنوع…

نسخه اصلی این مقاله در خبرنامه Inside Wealth شرکت CNBC، نوشته رابرت فرانک منتشر شده است که به عنوان منبع هفتگی برای سرمایه‌گذاران و مصرف‌کنندگانی با ثروت بالا خدمت می‌کند.

Dec. 21, 2025, 1:21 p.m.

مروری بر آینده بازاریابی: چرا «فقط کافی بودن» بزر…

عناوین بر تمرکز بر سرمایه‌گذاری میلیارد دلاری دیزنی در OpenAI تأکید دارند و فرضیه‌هایی درباره چرایی ترجیح دیزنی OpenAI به جای گوگل، که در حال حاضر درباره نقض ادعایی حق نشر با آن در دادگاه است، مطرح می‌کنند.

Dec. 21, 2025, 9:34 a.m.

داده‌های Salesforce نشان می‌دهد هوش مصنوعی و عوام…

شرکت Salesforce گزارشی جامع در مورد رویداد خرید در هفته سایبر ۲۰۲۵ منتشر کرده است که داده‌های بیش از ۱.۵ میلیارد خریدار جهانی را تحلیل می‌کند.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today