Sesame Melancarkan Model CSM-1B untuk Pembantu Suara Lanjutan Maya

Syarikat AI Sesame telah memperkenalkan model asas yang memacu Maya, satu pembantu suara yang sangat mirip kehidupan. Model ini, yang terdiri daripada 1 bilion parameter (di mana “parameter” merujuk kepada komponen berbeza dalam model), dikeluarkan di bawah lesen Apache 2. 0, membenarkan penggunaan komersial dengan sekatan yang minimum. Dinamakan CSM-1B, model ini menghasilkan “kod audio RVQ” daripada input teks dan audio, mengikut penerangan Sesame di platform perkembangan AI, Hugging Face. RVQ adalah singkatan kepada “kuantisasi vektor residual, ” satu kaedah yang digunakan untuk menyandi audio ke dalam token diskret yang dikenali sebagai kod. Teknik ini digunakan dalam pelbagai teknologi audio AI kontemporari, termasuk SoundStream Google dan Encodec Meta. CSM-1B dibina berdasarkan model dari keluarga Llama milik Meta dan menggabungkan komponen “penyahsandi” audio. Menurut Sesame, versi yang telah disempurnakan CSM memacu Maya. Dalam repositori Hugging Face dan GitHub CSM-1B, Sesame menyatakan, “Model yang sumber terbuka di sini adalah model generasi asas. Ia boleh menghasilkan pelbagai suara tetapi belum disempurnakan untuk mana-mana suara tertentu.
[…] Model ini mempunyai sedikit kemampuan untuk bahasa bukan Inggeris kerana pencemaran data dalam set latihan, tetapi prestasinya dijangka kurang optimal. ” Masih belum jelas data apa yang digunakan Sesame untuk melatih CSM-1B, kerana syarikat itu belum mendedahkan maklumat ini. Penting untuk diperhatikan bahawa model ini tidak mempunyai perlindungan yang substansial. Sesame bergantung kepada sistem kehormatan, menggalakkan pemaju dan pengguna untuk tidak menggunakan model tersebut untuk meniru suara seseorang tanpa kebenaran, mencipta bahan yang mengelirukan seperti berita palsu, atau terlibat dalam aktiviti berbahaya atau berniat jahat. Saya menguji demo di Hugging Face, dan meniru suara saya mengambil masa kurang dari satu minit. Selepas itu, menghasilkan ucapan mengenai pelbagai topik, termasuk yang kontroversi seperti pilihan raya dan propaganda Rusia, adalah sangat mudah. Consumer Reports baru-baru ini memberi amaran bahawa banyak alat pengklonan suara yang dipacu AI yang popular hari ini kekurangan perlindungan “bermakna” terhadap penipuan atau penyalahgunaan. Sesame, yang ditubuhkan oleh pencipta Oculus, Brendan Iribe, menarik perhatian yang signifikan pada akhir Februari untuk teknologi pembantunya, yang hampir mengatasi lembah yang menakutkan. Maya dan pembantu lain Sesame, Miles, bernafas, menunjukkan kelancaran pertuturan, dan boleh disela semasa bercakap, sama seperti Mod Suara OpenAI. Syarikat ini telah mendapatkan pelaburan yang tidak didedahkan daripada Andreessen Horowitz, Spark Capital, dan Matrix Partners. Selain mengembangkan teknologi pembantu suara, Sesame sedang memprototipkan cermin mata AI “yang dimaksudkan untuk dipakai sepanjang hari” yang akan menggunakan model proprietarinya.
Brief news summary
Sesame, yang diasaskan bersama oleh Brendan Iribe dari Oculus, telah memperkenalkan model pembantu suara AI, CSM-1B. Model ini mempunyai 1 bilion parameter dan dilisensikan di bawah Apache 2.0 untuk aplikasi komersial, dengan sekatan yang terhad. CSM-1B menggunakan kuantisasi vektor residual (RVQ) untuk pengekodan audio, meletakkannya di antara teknologi audio AI terkemuka seperti SoundStream dari Google. Dikembangkan berdasarkan rangka kerja Llama Meta, model ini menampilkan pengekod audio yang menghasilkan pelbagai suara, walaupun ia tidak direka untuk replikasi suara. Prestasinya dalam bahasa bukan Inggeris mungkin terhad disebabkan oleh skop data latihannya. Selain itu, ia mempunyai perlindungan minimum terhadap penyalahgunaan, bergantung terutamanya pada kod kehormatan untuk menghalang amalan berbahaya, termasuk penyalinan suara tanpa kebenaran. Pembantu suara Sesame, Maya dan Miles, dikenali kerana ciri-ciri pertuturan semula jadi mereka. Disokong oleh pelabur seperti Andreessen Horowitz, syarikat ini juga sedang meneroka pembangunan cermin mata AI yang menggabungkan teknologi suara mereka. Namun, kebimbangan mengenai potensi penipuan dan penyalahgunaan penyalinan suara AI telah muncul, seperti yang disoroti oleh laporan pengguna terkini.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Emmer menyokong Akta Kepastian Peraturan Blockcha…
Pada 21 Mei, Ahli Parlimen AS Tom Emmer (R-MN) memperkenalkan rang undang-undang bipartisan yang bertujuan untuk memberikan kejelasan undang-undang dan merangsang pembangunan blockchain di dalam Amerika Syarikat.

Oracle akan Membeli Keping Nvidia bernilai $40 Bi…
Oracle sedang melakukan pelaburan besar sebanyak $40 bilion untuk memperoleh kira-kira 400,000 cip Nvidia GB200 berprestasi tinggi bagi memperkasakan pusat data OpenAI yang akan datang di Abilene, Texas.

Amaran kejutan: Masa depan Web3 bukanlah blokchain
Pendapat oleh Grigore Roșu, pengasas dan CEO Pi Squared Mencabar dominasi blockchain dalam Web3 mungkin kelihatan hampir sebahagian daripada ajaran sesat, terutamanya kepada mereka yang sangat melabur dalam Bitcoin, Ethereum, dan teknologi berkaitan

Perubahan Besar dalam Dunia Pekerjaan AI Sedang B…
Pasar kerja sedang mengalami transformasi besar yang didorong oleh integrasi pesat kecerdasan buatan (AI) di banyak sektor perniagaan.

Saiz Pasaran Blockchain dalam Pengurusan Aset men…
Saiz Pasaran Blockchain dalam Pengurusan Aset dan Ramalan (2025–2034) Pasaran blockchain dalam pengurusan aset menggunakan teknologi blockchain untuk meningkatkan ketelusan, keselamatan, dan keberkesanan dalam pengurusan aset kewangan

Kerjasama Nvidia-Foxconn Menimbulkan Kebimbangan …
Pada pameran dagang Computex 2025 di Taipei, CEO Nvidia Jensen Huang mendapat sambutan bagaikan seorang bintang, menekankan hubungan yang semakin dekat antara Nvidia dan Taiwan.

Pelabur DeFi bergegas ke protokol Hyperliquid sel…
Deposit kripto di atas blockchain Hyperliquid, yang baru berusia tiga bulan, meningkat secara dramatik, terutamanya didorong oleh arus masuk protokol dan peserta kewangan decentralised (DeFi).