lang icon En
Jan. 30, 2025, 10:52 p.m.
2464

Mistral AI Melancarkan Model Bahasa Kecil 3: Perubahan Permainan dalam Kecekapan AI

Brief news summary

Mistral AI, sebuah syarikat permulaan Eropah yang sedang meningkat, telah melancarkan Mistral Small 3, satu model bahasa yang berkuasa dengan 24 bilion parameter. Model ini mempunyai ketepatan yang mengagumkan sebanyak 81% pada penanda aras standard dan memproses 150 token setiap saat, menjadikannya pilihan berkesan dari segi kos untuk perniagaan. Dilancarkan di bawah lesen Apache 2.0, ia membenarkan syarikat untuk mengubah suai dan menggunakan model tersebut mengikut kehendak mereka. CEO Guillaume Lample menekankan kelebihan prestasinya berbanding Llama 3.3 dari Meta, dengan kejayaannya disebabkan oleh kaedah latihan inovatif dan bukan hanya pada saiz. Dilatih menggunakan 8 trilion token, Mistral Small 3 direka untuk perusahaan yang memerlukan penyelesaian AI yang selamat dan dalam premis, terutamanya dalam bidang kewangan dan penjagaan kesihatan. Ia mengelakkan kaedah tradisional seperti pembelajaran penguatan dan data sintetik untuk meminimumkan bias. Dengan penilaian sebanyak $6 bilion dan rancangan untuk IPO, Mistral AI bertujuan untuk mengukuhkan jejaknya dalam landskap AI Eropah. Dengan peningkatan permintaan untuk model AI yang cekap dan padat, strategi Mistral tertumpu kepada meningkatkan aksesibiliti dan mengurangkan kos, membuka jalan untuk penerimaan yang lebih luas dalam industri.

Mistral AI, sebuah startup Eropah yang berkembang pesat dalam bidang kecerdasan buatan, hari ini mengumumkan pelancaran model bahasa baharu yang dikatakannya memberikan prestasi setara dengan model yang tiga kali lebih besar sambil mengurangkan perbelanjaan pengkomputeran dengan ketara. Kemajuan ini berpotensi untuk mendefinisikan semula landskap ekonomi bagi penggunaan AI yang canggih. Dinamai Mistral Small 3, model ini mempunyai 24 bilion parameter dan mencapai ketepatan 81% pada penanda aras standard, memproses 150 token sesaat. Syarikat ini membuatnya tersedia di bawah lesen terbuka Apache 2. 0, memberi kebebasan kepada perniagaan untuk mengubah dan menggunakan model itu mengikut kehendak mereka. Guillaume Lample, ketua pegawai sains Mistral, menyatakan dalam perbincangan eksklusif dengan VentureBeat, “Kami menganggapnya sebagai model terbaik dalam kalangan yang mempunyai kurang daripada 70 bilion parameter. Kami menganggarkan ia lebih kurang setara dengan Llama 3. 3 70B daripada Meta, yang dilancarkan beberapa bulan lalu dan tiga kali lebih besar. ” Pengumuman ini tiba di tengah-tengah perhatian yang meningkat terhadap kos pembangunan AI. Startup China, DeepSeek, mendakwa telah melatih model yang kompetitif hanya dengan $5. 6 juta, satu kenyataan yang mengakibatkan kerugian hampir $600 bilion dalam penilaian pasaran Nvidia minggu ini, ketika pelabur mempertimbangkan semula pelaburan besar yang dibuat oleh syarikat teknologi A. S. Strategi Mistral menekankan kecekapan berbanding skala besar semata-mata. Syarikat ini mengaitkan peningkatan prestasinya terutamanya kepada teknik latihan yang lebih baik, mengelak pendekatan yang hanya meningkatkan kuasa pengkomputeran. “Apa yang telah berubah adalah kaedah pengoptimuman latihan, ” jelas Lample kepada VentureBeat. “Kami menggunakan strategi latihan yang berbeza untuk mengoptimumkan model. ” Menurut Lample, model ini dilatih dengan 8 trilion token, manakala model serupa memerlukan kira-kira 15 trilion token.

Kecekapan yang meningkat ini dapat menjadikan teknologi AI yang canggih lebih mudah diakses oleh perniagaan yang bimbang tentang kos pengkomputeran. Penting untuk diingat, Mistral Small 3 dicipta tanpa pembelajaran pengukuhan atau data latihan sintetik—kaedah yang sering digunakan oleh pesaing. Lample menyatakan bahawa metodologi "mentah" ini membantu mengelak penggabungan bias yang tidak diingini yang mungkin sukar dikenalpasti kemudian. Model ini ditujukan khusus kepada syarikat yang memerlukan penggunaan di lokasi untuk privasi dan kebolehpercayaan, seperti yang terdapat dalam perkhidmatan kewangan, penjagaan kesihatan, dan pembuatan. Ia beroperasi pada satu GPU dan merangkumi 80-90% aplikasi perniagaan standard, menurut syarikat. “Banyak pelanggan kami lebih suka penyelesaian di lokasi disebabkan kebimbangan mereka tentang privasi dan kebolehpercayaan, ” kata Lample. “Mereka mahu perkhidmatan kritikal disokong oleh sistem yang mereka boleh kawal sepenuhnya. ” Mistral, yang mempunyai penilaian $6 bilion, sedang menjadikan dirinya sebagai pesaing utama Eropah dalam arena AI global. Syarikat ini baru-baru ini memperoleh pelaburan daripada Microsoft dan sedang bersiap sedia untuk IPO pada masa hadapan, seperti yang dinyatakan oleh CEO Arthur Mensch. Pakar industri mencadangkan bahawa dedikasi Mistral untuk membangunkan model yang lebih kecil dan lebih cekap mungkin merupakan langkah strategik yang bijak ketika sektor AI berkembang. Pendekatan ini berbeza dengan laluan yang diambil oleh syarikat seperti OpenAI dan Anthropic, yang telah menumpukan perhatian kepada penciptaan model yang semakin besar dan mahal. Lample mengungkapkan ramalannya, menyatakan, “Kami mungkin akan menyaksikan pengulangan apa yang berlaku pada tahun 2024, mungkin dalam skala yang lebih besar—sebuah kemasukan model sumber terbuka dengan lesen yang sangat membenarkan. Kami percaya bahawa model bersyarat berkemungkinan menjadi komoditi. ” Dengan persaingan yang meningkat dan kecekapan yang bertambah baik, fokus Mistral terhadap pengoptimuman model yang lebih kecil dapat memudahkan akses yang lebih luas kepada teknologi AI yang canggih, berpotensi mempercepatkan penerimaan industri sambil mengurangkan kos yang berkaitan dengan infrastruktur pengkomputeran.


Watch video about

Mistral AI Melancarkan Model Bahasa Kecil 3: Perubahan Permainan dalam Kecekapan AI

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 1:26 p.m.

15 Cara Penjualan Telah Berubah Tahun Ini dalam E…

Selama 18 bulan yang lalu, Pasukan SaaStr telah membenamkan diri dalam AI dan jualan, dengan percepatan besar bermula Jun 2025.

Dec. 23, 2025, 1:23 p.m.

GPT-5 daripada OpenAI: Apa yang Kita Tahu Setakat…

OpenAI sedang bersiap sedia untuk melancarkan GPT-5, kemajuan utama seterusnya dalam siri model bahasa besar mereka, dengan keluaran dijangka berlaku pada awal 2026.

Dec. 23, 2025, 1:20 p.m.

AI dalam SEO: Mengubah Pembinaan dan Pengoptimuma…

Kecerdasan Buatan (AI) sedang dengan pantas mengubah bidang penciptaan dan pengoptimuman kandungan dalam enjin carian (SEO).

Dec. 23, 2025, 1:20 p.m.

Penyelesaian Video Konferensi AI Tingkatkan Kerja…

Peralihan kepada kerja jarak jauh telah menonjolkan keperluan mendesak untuk alat komunikasi yang berkesan, membawa kepada peningkatan penyelesaian persidangan video berkuasa AI yang membolehkan kerjasama tanpa halangan jarak.

Dec. 23, 2025, 1:17 p.m.

Saiz Pasaran AI Dalam Perubatan, Bahagian Pasaran…

Gambaran Keseluruhan Pasaran AI dalam Perubatan Global dijangka mencapai sekitar USD 156

Dec. 23, 2025, 9:30 a.m.

Danny Sullivan dan John Mueller daripada Google t…

John Mueller dari Google mengendalikan Danny Sullivan, juga dari Google, dalam podcast Search Off the Record untuk membincangkan "Fikiran tentang SEO & SEO untuk AI

Dec. 23, 2025, 9:26 a.m.

Lexus mencuba AI generatif dalam kandungan pemasa…

Ringkasan Mendalam: Lexus telah melancarkan kempen pemasaran musim perayaan yang dicipta menggunakan kecerdasan buatan generatif, menurut satu kenyataan

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today