Meta pristato Llama 3.1 AI modelį su 405 milijardais parametrų
Brief news summary
Meta išleido didžiausią savo Llama modelį iki šiol, Llama 3.1, kuris, kaip pranešama, pralenkia OpenAI GPT-4o keliose srityse, įskaitant mąstymo etaloninius matavimus pagal nutekintus veikimo duomenis. Llama modeliai yra „atviri modeliai“, leidžiantys vartotojams kurti programas ir modifikuoti modelį pagal poreikį. Nors mažesni ir mažiau pajėgūs nei patentuoti modeliai, manoma, kad Llama 3.1 išleidimas užpildys atotrūkį. Meta bendradarbiauja su įmonėmis, tokiomis kaip Databricks ir AWS, kad talpintų Llama 3.1 modelį ir teiktų susijusius įrankius bei paslaugas. Nepaisant to, kyla susirūpinimų dėl modelio didelės apimties, sąnaudų ir ribojimų parametrų koregavime bei komercinės licencijos apribojimų. Llama 3.1 patikimumo problemas gali spręsti KU Leuven, Kembridžo universiteto ir Italijos universitetų mokslininkų siūlomas hibridinis požiūris. Koncesijų pagrindu veikiantis atminties pagrįstas samprotavimo mechanizmas derina neuroninį tinklą su simbolinėmis taisyklėmis, siekiant padidinti suprantamumą ir sprendimų priėmimą.Meta išleido naujausią savo AI modelį, Llama 3. 1, kuriame yra 405 milijardai parametrų. Modelis, kaip pranešama, viršija OpenAI GPT-4o įvairiais etaloniniais veikimo matavimais. Skirtingai nuo ankstesnių Llama modelių, Llama 3. 1 yra „atviras modelis“, kurį galima modifikuoti ir naudoti nemokamai.
Tačiau dideliam modeliui turėti reikia reikšmingų skaičiavimo išteklių, ir Meta bendradarbiauja su keletu įmonių, tokių kaip AWS ir Microsoft Azure, siūlydamos paslaugas ir įrankius modeliui talpinti. Lieka susirūpinimų dėl etikos naudojimo ir kainodaros efektyvumo, taip pat klausimas, ar kūrėjai turės lankstumą koreguoti modelio parametrus.
Watch video about
Meta pristato Llama 3.1 AI modelį su 405 milijardais parametrų
Try our premium solution and start getting clients — at no cost to you