Mistral AI lanseeraa pienen 3 kielen mallin: Pelinmuuttaja tekoälyn tehokkuudessa.

Mistral AI, nopeasti kasvava eurooppalainen tekoäly-startup, ilmoitti tänään uuden kielimallin lanseeraamisesta. Se väittää, että malli tarjoaa suorituskyvyn, joka vastaa kolme kertaa suurempien mallien tasoa samalla kun tietokoneskustannukset vähenevät merkittävästi. Tämä edistysaskel voi muuttaa taloudellista maisemaa kehittyneen tekoälyn käyttöönotossa. Malli nimeltä Mistral Small 3 sisältää 24 miljardia parametria ja saavuttaa 81 % tarkkuuden standardipisteissä, käsitellen 150 tokenia sekunnissa. Yhtiö tarjoaa sen avoimen Apache 2. 0 -lisenssin alla, joka antaa yrityksille vapauden muokata ja ottaa sen käyttöön haluamallaan tavalla. Guillaume Lample, Mistralin päätieteilijä, totesi VentureBeatille käydyssä yksinoikeudellisessa keskustelussa: "Pidämme sitä parhaana mallina, jossa on alle 70 miljardia parametria. Arvioimme sen olevan suunnilleen verrattavissa Metan Llama 3. 3 70B:hen, joka julkaistiin muutama kuukausi sitten ja on kolme kertaa suurempi. " Tämä ilmoitus tulee aikaan, jolloin tekoälyn kehityskustannuksiin kiinnitetään entistä enemmän huomiota. Kiinalainen startup DeepSeek väitti kouluttaneensa kilpailukykyisen mallin vain 5, 6 miljoonalla dollarilla, mikä aiheutti lähes 600 miljardin dollarin arvonmenetyksen Nvidian markkina-arvossa tällä viikolla, kun sijoittajat miettivät Yhdysvaltain teknologiayritysten tekemien massiivisten investointien järkevyyttä. Mistralin strategia korostaa tehokkuutta puhtaassa mittakaavassa. Yhtiö lisää suorituskykynsä parannuksia pääasiassa parannettuihin koulutustekniikoihin, välttäen lähestymistapaa, jossa pelkästään lisätään laskentatehoa. "Mikä on muuttunut, on olennaisesti koulutuksen optimointimenetelmät", Lample selitti VentureBeatille. "Otimme käyttöön erilaisen koulutusstrategian mallin optimointiin. " Lamplen mukaan malli koulutettiin 8 triljoonalla tokenilla, kun taas vastaavat mallit vaativat noin 15 triljoonaa tokenia.
Tämä parantunut tehokkuus voi tehdä kehittyneestä tekoälyteknologiasta helpommin saavutettavaa yrityksille, jotka ovat huolissaan laskentakustannuksista. On tärkeää, että Mistral Small 3 luotiin ilman vahvistusoppimista tai synteettistä koulutusdataa – menetelmiä, joita kilpailijat usein käyttävät. Lample huomautti, että tämä "raakamuoto" auttaa estämään ei-toivottujen ennakkoluulojen sisällyttämistä, joita voi olla vaikea tunnistaa myöhemmin. Malli on erityisesti kohdistettu yrityksille, jotka tarvitsevat paikallista käyttöönottoa yksityisyyden ja luotettavuuden vuoksi, kuten rahoituspalveluissa, terveydenhuollossa ja valmistuksessa. Se toimii yhdellä GPU:lla ja kattaa 80-90 % standardiliiketoimintasovelluksista, yhtiö toteaa. "Monet asiakkaistamme suosivat paikallista ratkaisua huolensa vuoksi yksityisyydestä ja luotettavuudesta", Lample totesi. "He haluavat, että kriittiset palvelut perustuvat järjestelmiin, joita he voivat täysin hallita. " Mistral, jonka arvo on 6 miljardia dollaria, vakiinnuttaa asemansa Euroopan johtavana kilpailijana globaalissa tekoälykentässä. Yhtiö sai hiljattain investointeja Microsoftilta ja valmistautuu tulevaan osakeantiin, kuten toimitusjohtaja Arthur Mensch korosti. Alan asiantuntijat ehdottavat, että Mistralin sitoutuminen pienempien, tehokkaampien mallien kehittämiseen voi olla strategisesti oivaltavaa tekoälyalan kehittyessä. Tämä lähestymistapa eroaa sellaisista yrityksistä kuten OpenAI ja Anthropic, jotka ovat keskittyneet yhä suurempien ja kalliimpien mallien luomiseen. Lample esitti ennusteensa: "Meidän on todennäköisesti odotettavissa toistoa siitä, mitä tapahtui vuonna 2024, mahdollisesti suuremmassa mittakaavassa – avoimien lähdekoodin mallien tulva, joilla on hyvin sallivat lisenssit. Uskomme, että ehdolliset mallit todennäköisesti muuttuvat hyödykkeiksi. " Kun kilpailu kiihtyy ja tehokkuus paranee, Mistralin keskittyminen pienempien mallien optimointiin voisi helpottaa laajempaa pääsyä kehittyneeseen tekoälyteknologiaan, mahdollisesti nopeuttaen toimialan omaksumista samalla kun vähentää laskentainfrastruktuurin kustannuksia.
Brief news summary
Mistral AI, nouseva eurooppalainen startup, on lanzoinut Mistral Small 3:n, voimakkaan kielimallin, jossa on 24 miljardia parametria. Tämä malli ylistää vaikuttavaa 81 % tarkkuutta vakiomittareilla ja käsittelee 150 tokenia sekunnissa, mikä tekee siitä kustannustehokkaan valinnan yrityksille. Julkaistu Apache 2.0 -lisenssin alla, se antaa yrityksille joustavuutta muokata ja ottaa mallin käyttöön haluamallaan tavalla. Toimitusjohtaja Guillaume Lample korostaa sen suorituskyvyn ylivoimaisuutta Metan Llama 3.3:een verrattuna, liittäen sen menestyksen innovatiivisiin koulutusmenetelmiin eikä pelkkään kokoon. Koulutettu 8 triljoonalla tokenilla, Mistral Small 3 on suunniteltu yrityksille, jotka tarvitsevat turvallisia, paikallisia tekoälyratkaisuja, erityisesti rahoituksessa ja terveydenhuollossa. Se välttää perinteisiä menetelmiä, kuten vahvistusoppimista ja synteettisiä tietoja, vähentääkseen ennakkoluuloja. Arvostuksella, joka on 6 miljardia dollaria ja suunnitelmat osakeannille, Mistral AI aikoo vahvistaa asemaansa Euroopan tekoälymaisemassa. Kun kysyntä tehokkaille ja kompaktille tekoälymalleille kasvaa, Mistralin strategia keskittyy saavutettavuuden parantamiseen ja kustannusten vähentämiseen, raivaten tietä laajemmalle teollisuuden käyttöönotolle.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

ICE haluaa lisää lohkoketjuanalytiikka-teknologia…
Yhdysvaltain Maahanmuutto- ja Tullitiedustelu (ICE) lisää sijoituksiaan lohkoketju-älyteknologiaan sekä muihin tutkimusalustoihin.

Tekoälypohjainen lääkeaineiden löytö: läpimurto y…
Merkittävänä edistysaskeleena lääketutkimuksessa tutkijat ovat julkaisseet tekoälypohjaisen alustan, jonka tarkoituksena on ennustaa erilaisten lääkeaineiden tehokkuutta.

Metan 15 miljardin dollarin investointi Scale AI:…
Meta on Lopullisesti saanut aikaan merkittäviä sopimuksia ostaakseen 49 prosentin osuuden Scale AI:stä, arvoltaan yli 29 miljardia dollaria.

BTCS Inc. yhteistyössä Whartonin Mack-instituutin…
BTCS Inc., johtava yritys, joka erikoistuu lohkoketjuinfrastruktuuriin ja -teknologiaan, on ilmoittanut merkittävästä kehityksestä, joka korostaa sitoutumistaan lohkoketju-ekosysteemin edistämiseen.

Tekoälyn katsaukset: Googlen tekoälyn tuottamat y…
Google on lanseerannut innovatiivisen ominaisuuden nimeltä AI Overviews hakukoneeseensa parantaakseen käyttäjien pääsyä verkkoaineistoihin.

Pakistan muodostaa uuden "Kryptovaltuuston" sääde…
Pakistan on tehnyt merkittävän askeleen omaksuakseen ja säädelläkseen kehittyvää digitaalista taloutta perustamalla Pakistan Crypto Council (PCC) -neuvoston.

Kvanttiristiriidan ja lohkoketjun avulla voimme v…
Ei sillä, että Einstein olisi loukannut, mutta hän oli ehdottomasti väärässä kvanttimekaniikan suhteen – se ei ainoastaan kestänyt ajan hammasta, vaan on myös osoittautunut korvaamattomaksi tietokannoissa, biologiassa, optiikassa ja jopa uhkapelissä.