lang icon En
March 13, 2025, 9:41 p.m.
3462

Sesame Melancarkan Model CSM-1B untuk Pembantu Suara Lanjutan Maya

Brief news summary

Sesame, yang diasaskan bersama oleh Brendan Iribe dari Oculus, telah memperkenalkan model pembantu suara AI, CSM-1B. Model ini mempunyai 1 bilion parameter dan dilisensikan di bawah Apache 2.0 untuk aplikasi komersial, dengan sekatan yang terhad. CSM-1B menggunakan kuantisasi vektor residual (RVQ) untuk pengekodan audio, meletakkannya di antara teknologi audio AI terkemuka seperti SoundStream dari Google. Dikembangkan berdasarkan rangka kerja Llama Meta, model ini menampilkan pengekod audio yang menghasilkan pelbagai suara, walaupun ia tidak direka untuk replikasi suara. Prestasinya dalam bahasa bukan Inggeris mungkin terhad disebabkan oleh skop data latihannya. Selain itu, ia mempunyai perlindungan minimum terhadap penyalahgunaan, bergantung terutamanya pada kod kehormatan untuk menghalang amalan berbahaya, termasuk penyalinan suara tanpa kebenaran. Pembantu suara Sesame, Maya dan Miles, dikenali kerana ciri-ciri pertuturan semula jadi mereka. Disokong oleh pelabur seperti Andreessen Horowitz, syarikat ini juga sedang meneroka pembangunan cermin mata AI yang menggabungkan teknologi suara mereka. Namun, kebimbangan mengenai potensi penipuan dan penyalahgunaan penyalinan suara AI telah muncul, seperti yang disoroti oleh laporan pengguna terkini.

Syarikat AI Sesame telah memperkenalkan model asas yang memacu Maya, satu pembantu suara yang sangat mirip kehidupan. Model ini, yang terdiri daripada 1 bilion parameter (di mana “parameter” merujuk kepada komponen berbeza dalam model), dikeluarkan di bawah lesen Apache 2. 0, membenarkan penggunaan komersial dengan sekatan yang minimum. Dinamakan CSM-1B, model ini menghasilkan “kod audio RVQ” daripada input teks dan audio, mengikut penerangan Sesame di platform perkembangan AI, Hugging Face. RVQ adalah singkatan kepada “kuantisasi vektor residual, ” satu kaedah yang digunakan untuk menyandi audio ke dalam token diskret yang dikenali sebagai kod. Teknik ini digunakan dalam pelbagai teknologi audio AI kontemporari, termasuk SoundStream Google dan Encodec Meta. CSM-1B dibina berdasarkan model dari keluarga Llama milik Meta dan menggabungkan komponen “penyahsandi” audio. Menurut Sesame, versi yang telah disempurnakan CSM memacu Maya. Dalam repositori Hugging Face dan GitHub CSM-1B, Sesame menyatakan, “Model yang sumber terbuka di sini adalah model generasi asas. Ia boleh menghasilkan pelbagai suara tetapi belum disempurnakan untuk mana-mana suara tertentu.

[…] Model ini mempunyai sedikit kemampuan untuk bahasa bukan Inggeris kerana pencemaran data dalam set latihan, tetapi prestasinya dijangka kurang optimal. ” Masih belum jelas data apa yang digunakan Sesame untuk melatih CSM-1B, kerana syarikat itu belum mendedahkan maklumat ini. Penting untuk diperhatikan bahawa model ini tidak mempunyai perlindungan yang substansial. Sesame bergantung kepada sistem kehormatan, menggalakkan pemaju dan pengguna untuk tidak menggunakan model tersebut untuk meniru suara seseorang tanpa kebenaran, mencipta bahan yang mengelirukan seperti berita palsu, atau terlibat dalam aktiviti berbahaya atau berniat jahat. Saya menguji demo di Hugging Face, dan meniru suara saya mengambil masa kurang dari satu minit. Selepas itu, menghasilkan ucapan mengenai pelbagai topik, termasuk yang kontroversi seperti pilihan raya dan propaganda Rusia, adalah sangat mudah. Consumer Reports baru-baru ini memberi amaran bahawa banyak alat pengklonan suara yang dipacu AI yang popular hari ini kekurangan perlindungan “bermakna” terhadap penipuan atau penyalahgunaan. Sesame, yang ditubuhkan oleh pencipta Oculus, Brendan Iribe, menarik perhatian yang signifikan pada akhir Februari untuk teknologi pembantunya, yang hampir mengatasi lembah yang menakutkan. Maya dan pembantu lain Sesame, Miles, bernafas, menunjukkan kelancaran pertuturan, dan boleh disela semasa bercakap, sama seperti Mod Suara OpenAI. Syarikat ini telah mendapatkan pelaburan yang tidak didedahkan daripada Andreessen Horowitz, Spark Capital, dan Matrix Partners. Selain mengembangkan teknologi pembantu suara, Sesame sedang memprototipkan cermin mata AI “yang dimaksudkan untuk dipakai sepanjang hari” yang akan menggunakan model proprietarinya.


Watch video about

Sesame Melancarkan Model CSM-1B untuk Pembantu Suara Lanjutan Maya

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 25, 2025, 1:36 p.m.

Demokrat memberi amaran bahawa memberi kebenaran …

Demokrat Kongres menyuarakan kebimbangan serius berhubung kemungkinan bahawa AS tidak lama lagi akan mula menjual cip canggih kepada salah satu pesaing geopolitik utamanya.

Dec. 25, 2025, 1:33 p.m.

Pegawai Kemerdekaan Semangat Untuk Projek Pusat D…

Tod Palmer, seorang wartawan KSHB 41 yang meliputi bidang perniagaan sukan dan daerah Jackson County timur, mengetahui tentang projek penting ini melalui liputannya mengenai Majlis Perbandaran Independence.

Dec. 25, 2025, 1:31 p.m.

Pengawasan Video AI Menimbulkan Kebimbangan Priva…

Penyebaran kecerdasan buatan (AI) dalam pengawasan video telah menjadi topik penting di kalangan pembuat dasar, pakar teknologi, aktivis hak asasi manusia, dan masyarakat umum.

Dec. 25, 2025, 1:25 p.m.

Incention adalah usaha putus asa untuk mencipta I…

Anda mungkin tidak perlu mengingati nama Incention untuk jangka masa yang panjang, kerana tidak mungkin teringat lagi selepas ini.

Dec. 25, 2025, 1:23 p.m.

5 Kisah Pemasaran Terbaik Tahun 2025: Tarif, AI, …

Tahun 2025 terbukti menjadi tahun yang bergelora bagi para pengiklan, kerana perubahan makroekonomi, kemajuan teknologi, dan pengaruh budaya secara dramatik mengubah industri ini.

Dec. 25, 2025, 1:17 p.m.

Syarikat SEO Berkuasa AI untuk Mendapatkan Kepent…

Syarikat SEO berkuasa AI dijangka menjadi lebih penting pada tahun 2026, meningkatkan kadar penglibatan dan penukaran yang lebih baik.

Dec. 25, 2025, 9:43 a.m.

Teknik Pemampatan Video AI Meningkatkan Kualiti P…

Kemajuan dalam kecerdasan buatan sedang mengubah cara kandungan video dipampatkan dan dihantar secara strim, memberikan peningkatan ketara dalam kualiti video dan meningkatkan pengalaman penonton.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today