„Alibaba“ pristato Qwen2-Math: pažangus DI matematikos srityje
Brief news summary
„Alibaba Group Holding“ pristato naują didelių kalbų modelių (LLM) rinkinį, vadinamą Qwen2-Math, kuris, kaip teigia įmonė, gali veikti geriau nei „OpenAI“ GPT-40 matematikos problemų sprendimo srityje. Šie LLM buvo sukurti remiantis anksčiau išleistais Qwen2 LLM ir apima tris įvairaus dydžio modelius. Didžiausias modelis, Qwen2-Math-72B-Instruct, viršijo kitus JAV sukurtus LLM pagal matematikos standartus. Modeliai buvo išbandyti pagal anglų ir kinų matematikos standartus, o planas yra netrukus išleisti dvikalbius modelius. „Alibaba“ DI įgaliojimai buvo dar labiau sustiprinti sėkmingai įgyvendinus Qwen-72B-Instruct LLM, kuris yra aukštai reitinguojamas atvirojo kodo modeliuose. Kinijos LLM pažanga sumažino atotrūkį nuo JAV modelių, o „Alibaba“ modelių pažanga rodo įmonės spartų DI vystymąsi.„Alibaba Group Holding“ pristato Qwen2-Math – grupę didžių kalbų modelių (LLM), skirtų matematikos problemoms spręsti, siekdama pažangos dirbtinio intelekto (DI) vystyme. Pasak „Alibaba“, šie modeliai geriau sprendžia aritmetikos ir matematikos problemas nei „OpenAI“ GPT-4o. „Alibaba“ debesies kompiuterijos padalinio Qwen komanda birželį išleido Qwen2 LLM, kuri yra naujų modelių pagrindas. Didžiausias modelis, Qwen2-Math-72B-Instruct, viršijo kitus JAV sukurtus LLM pagal matematikos standartus.
„Qwen“ komanda planuoja išleisti dvikalbius modelius ir kuria daugiakalbius LLM. „Alibaba“ DI pajėgumai buvo dar labiau sustiprinti sėkmingai įgyvendinus Qwen-72B-Instruct LLM. Proveržiai kinų DI modeliuose rodo mažėjantį atotrūkį nuo JAV modelių.
Watch video about
„Alibaba“ pristato Qwen2-Math: pažangus DI matematikos srityje
Try our premium solution and start getting clients — at no cost to you