Sesame Melancarkan Model CSM-1B untuk Pembantu Suara Lanjutan Maya

Syarikat AI Sesame telah memperkenalkan model asas yang memacu Maya, satu pembantu suara yang sangat mirip kehidupan. Model ini, yang terdiri daripada 1 bilion parameter (di mana “parameter” merujuk kepada komponen berbeza dalam model), dikeluarkan di bawah lesen Apache 2. 0, membenarkan penggunaan komersial dengan sekatan yang minimum. Dinamakan CSM-1B, model ini menghasilkan “kod audio RVQ” daripada input teks dan audio, mengikut penerangan Sesame di platform perkembangan AI, Hugging Face. RVQ adalah singkatan kepada “kuantisasi vektor residual, ” satu kaedah yang digunakan untuk menyandi audio ke dalam token diskret yang dikenali sebagai kod. Teknik ini digunakan dalam pelbagai teknologi audio AI kontemporari, termasuk SoundStream Google dan Encodec Meta. CSM-1B dibina berdasarkan model dari keluarga Llama milik Meta dan menggabungkan komponen “penyahsandi” audio. Menurut Sesame, versi yang telah disempurnakan CSM memacu Maya. Dalam repositori Hugging Face dan GitHub CSM-1B, Sesame menyatakan, “Model yang sumber terbuka di sini adalah model generasi asas. Ia boleh menghasilkan pelbagai suara tetapi belum disempurnakan untuk mana-mana suara tertentu.
[…] Model ini mempunyai sedikit kemampuan untuk bahasa bukan Inggeris kerana pencemaran data dalam set latihan, tetapi prestasinya dijangka kurang optimal. ” Masih belum jelas data apa yang digunakan Sesame untuk melatih CSM-1B, kerana syarikat itu belum mendedahkan maklumat ini. Penting untuk diperhatikan bahawa model ini tidak mempunyai perlindungan yang substansial. Sesame bergantung kepada sistem kehormatan, menggalakkan pemaju dan pengguna untuk tidak menggunakan model tersebut untuk meniru suara seseorang tanpa kebenaran, mencipta bahan yang mengelirukan seperti berita palsu, atau terlibat dalam aktiviti berbahaya atau berniat jahat. Saya menguji demo di Hugging Face, dan meniru suara saya mengambil masa kurang dari satu minit. Selepas itu, menghasilkan ucapan mengenai pelbagai topik, termasuk yang kontroversi seperti pilihan raya dan propaganda Rusia, adalah sangat mudah. Consumer Reports baru-baru ini memberi amaran bahawa banyak alat pengklonan suara yang dipacu AI yang popular hari ini kekurangan perlindungan “bermakna” terhadap penipuan atau penyalahgunaan. Sesame, yang ditubuhkan oleh pencipta Oculus, Brendan Iribe, menarik perhatian yang signifikan pada akhir Februari untuk teknologi pembantunya, yang hampir mengatasi lembah yang menakutkan. Maya dan pembantu lain Sesame, Miles, bernafas, menunjukkan kelancaran pertuturan, dan boleh disela semasa bercakap, sama seperti Mod Suara OpenAI. Syarikat ini telah mendapatkan pelaburan yang tidak didedahkan daripada Andreessen Horowitz, Spark Capital, dan Matrix Partners. Selain mengembangkan teknologi pembantu suara, Sesame sedang memprototipkan cermin mata AI “yang dimaksudkan untuk dipakai sepanjang hari” yang akan menggunakan model proprietarinya.
Brief news summary
Sesame, yang diasaskan bersama oleh Brendan Iribe dari Oculus, telah memperkenalkan model pembantu suara AI, CSM-1B. Model ini mempunyai 1 bilion parameter dan dilisensikan di bawah Apache 2.0 untuk aplikasi komersial, dengan sekatan yang terhad. CSM-1B menggunakan kuantisasi vektor residual (RVQ) untuk pengekodan audio, meletakkannya di antara teknologi audio AI terkemuka seperti SoundStream dari Google. Dikembangkan berdasarkan rangka kerja Llama Meta, model ini menampilkan pengekod audio yang menghasilkan pelbagai suara, walaupun ia tidak direka untuk replikasi suara. Prestasinya dalam bahasa bukan Inggeris mungkin terhad disebabkan oleh skop data latihannya. Selain itu, ia mempunyai perlindungan minimum terhadap penyalahgunaan, bergantung terutamanya pada kod kehormatan untuk menghalang amalan berbahaya, termasuk penyalinan suara tanpa kebenaran. Pembantu suara Sesame, Maya dan Miles, dikenali kerana ciri-ciri pertuturan semula jadi mereka. Disokong oleh pelabur seperti Andreessen Horowitz, syarikat ini juga sedang meneroka pembangunan cermin mata AI yang menggabungkan teknologi suara mereka. Namun, kebimbangan mengenai potensi penipuan dan penyalahgunaan penyalinan suara AI telah muncul, seperti yang disoroti oleh laporan pengguna terkini.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Ford meneroka penyimpanan data undang-undang yang…
Ford Motor Company, sebuah syarikat Fortune 500, telah bekerjasama dengan Iagon dan Cloud Court untuk memulakan bukti konsep (PoC) yang berfokus pada penyimpanan data undang-undang bersepadu, menurut pengumuman bertarikh 18 Jun.

Paus Leo XIV Nyatakan Kekhuatiran Mengenai AI unt…
Paus Leo XIV telah menyatakan keprihatinan mendalam tentang kesan kecerdasan buatan (AI) terhadap perkembangan intelektual, neurologi, dan spiritual kanak-kanak.

Deezer Terapkan Tag Lagu AI untuk Memerangi Penip…
Deezer, perkhidmatan penstriman muzik utama yang berpusat di Paris, sedang aktif menangani isu penipuan yang semakin meningkat yang didorong oleh AI di platformnya.

Coinbase Moonsahkan Kelulusan SEC untuk Saham Ber…
Coinbase, sebuah pertukaran cryptocurrency terkemuka, sedang berusaha mendapatkan kelulusan daripada Suruhanjaya Sekuriti dan Bursa Amerika Syarikat (SEC) untuk menawarkan "ekuiti tokenisasi" kepada penggunanya, seperti yang didedahkan oleh Paul Grewal, Ketua Pegawai Guaman Coinbase, dalam satu temubual dengan Reuters.

CEO Amaran Mengenai Kesan AI ke atas Tenaga Kerja…
Newsletter Axios AM terkini meliputi kemas kini utama dalam bidang teknologi, politik, dan hal ehwal antarabangsa.

ZIGChain Summit 2025 Dedahkan Platform RWA Syaria…
Sidang Kemuncak ZIGChain 2025 yang pertama kali diadakan di Dubai menandakan satu pencapaian penting dalam kewangan decentralised, mengumpulkan pemimpin dari sektor Kewangan Tradisional (TradFi), Web2, dan Web3.

CEO Amazon Amaran Penurunan Kerja Berasaskan AI d…
CEO Amazon, Andy Jassy, telah mengeluarkan amaran penting mengenai strategi tenaga kerjanya di masa depan berikutan peningkatan integrasi kecerdasan buatan (AI) dalam operasi syarikat.