Inception, sebuah syarikat yang baru ditubuhkan di Palo Alto, yang diterajui oleh profesor ilmu komputer Stanford, Stefano Ermon, mendakwa telah mencipta model AI yang revolusioner dengan menggunakan teknologi “diffusion. ” Model inovatif ini dirujuk sebagai model bahasa besar berasaskan diffusion, atau “DLM” untuk ringkasnya. Pada masa ini, model AI generatif yang mendapat perhatian paling banyak boleh dikategorikan kepada dua jenis utama: model bahasa besar (LLM) dan model diffusion. LLM, yang direka berdasarkan seni bina transformer, pakar dalam penghasilan teks. Sebaliknya, model diffusion, teknologi di sebalik platform AI seperti Midjourney dan Sora dari OpenAI, lebih memfokuskan kepada penghasilan imej, video, dan audio. Menurut Inception, modelnya menggabungkan keupayaan LLM konvensional—seperti penghasilan kod dan menjawab soalan—dengan kelajuan yang ketara dipertingkatkan dan kos pengkomputeran yang lebih rendah. Ermon berkongsi dengan TechCrunch bahawa beliau telah lama meneroka aplikasi model diffusion untuk penghasilan teks di makmal penyelidikannya di Stanford. Kerja beliau muncul dari pemerhatian bahawa LLM tradisional beroperasi pada kadar yang lebih perlahan berbanding teknologi diffusion. Dengan LLM, Ermon menjelaskan, “anda tidak boleh menghasilkan perkataan kedua sehingga anda telah menghasilkan yang pertama, dan perkataan ketiga tidak boleh dihasilkan sehingga yang pertama dan kedua lengkap. ” Mencari pendekatan untuk menerapkan mekanisme diffusion kepada penghasilan teks, Ermon menyatakan bahawa, tidak seperti LLM yang beroperasi secara berurutan, model diffusion bermula dengan anggaran kasar keluaran (contohnya, imej) dan memperhalusi data secara menyeluruh dalam satu langkah. Ermon berteori bahawa penghasilan dan pengubahsuaian blok teks yang besar secara selari mungkin dapat dilakukan menggunakan model diffusion.
Setelah beberapa tahun penyelidikan, beliau dan salah seorang pelajarnya mencapai terobosan yang signifikan, yang mereka dokumentasikan dalam kertas penyelidikan yang diterbitkan tahun lalu. Menyedari potensi kemajuan ini, Ermon menubuhkan Inception pada musim panas lalu, dengan menjalin kerjasama dengan bekas pelajarnya Aditya Grover, seorang profesor di UCLA, dan Volodymyr Kuleshov dari Universiti Cornell untuk memimpin usaha ini bersama. Walaupun Ermon memilih untuk tidak mendedahkan butiran pembiayaan khusus bagi Inception, TechCrunch telah mengetahui bahawa Mayfield Fund adalah antara pelabur dalam syarikat tersebut. Inception telah pun memperoleh kontrak dengan pelbagai pelanggan, termasuk syarikat Fortune 100 yang tidak dinamakan, dengan memenuhi keperluan mendesak mereka untuk mengurangkan latensi AI dan meningkatkan kelajuan, menurut Ermon. “Model kami dapat memanfaatkan GPU dengan lebih cekap, ” tegas Ermon, merujuk kepada unit pemprosesan grafik yang biasanya digunakan untuk menjalankan model pengeluaran. “Saya percaya ini adalah transformasi dan akan mengubah cara model bahasa dibangunkan. ” Syarikat ini menyediakan API bersama pilihan untuk penggelaran peranti di premis dan tepi, sokongan penyesuaian model, serta pelbagai DLM yang sedia untuk digunakan yang disesuaikan untuk pelbagai aplikasi. Inception mendakwa bahawa DLM mereka boleh beroperasi sehingga 10 kali lebih pantas daripada LLM tradisional sambil menanggung kos yang juga 10 kali lebih rendah. Seorang wakil syarikat memaklumkan kepada TechCrunch, “Model pengkodean ‘kecil’ kami setara dengan prestasi mini GPT-4o [OpenAI] tetapi beroperasi dengan lebih daripada 10 kali kelajuan. Model ‘mini’ kami mengatasi alternatif sumber terbuka kecil seperti Llama 3. 1 8B [Meta], mencapai lebih daripada 1, 000 token per saat. ”
Model AI Revolusioner Inception: Gabungan Teknologi Difusi dan Bahasa
Pemasaran Anti-AI pernah dirasakan seperti trend niche di internet tetapi telah menjadi arus utama di tengah reaksi negatif terhadap AI dalam pengiklanan, menandakan keaslian dan hubungan manusia.
Teknologi deepfake telah berkembang dengan pesat dalam beberapa tahun kebelakangan ini, menghasilkan peningkatan yang luar biasa dalam menghasilkan video yang sangat realistik yang dipindahtempatkan.
Microsoft sedang meningkatkan komitmennya terhadap inovasi kecerdasan buatan di bawah kepimpinan secara visi CEO Satya Nadella.
Anda kini boleh bertanya soalan yang sangat khusus kepada model bahasa besar (LLM)—seperti meminta sokongan kaki arch dalam lingkungan radius membeli-belah tertentu—dan menerima jawapan yang jelas dan kaya konteks seperti, “Ini tiga pilihan berdekatan yang memenuhi kriteria anda.
C3.ai, Inc.
Z.ai, yang dahulu dikenali sebagai Zhipu AI, adalah syarikat teknologi utama dari China yang mengkhusus dalam kecerdasan buatan.
Jason Lemkin memimpin pusingan benih melalui SaaStr Fund dalam unicorn Owner.com, sebuah platform berasaskan AI yang mengubah cara restoran kecil beroperasi.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today