lang icon En
March 20, 2025, 4:13 a.m.
2139

Pruna AI lansseerib avatud lähtekoodiga optimeerimisraamistiku tehisintellekti mudelite jaoks.

Brief news summary

Pruna AI, Euroopa alustav ettevõte, mis spetsialiseerub AI mudelite kokkusurumisele, on käivitanud avatud lähtekoodiga optimeerimise raamistik, mis on loodud AI mudelite efektiivsuse tõstmiseks meetodite kaudu, nagu vahemälu, kärpimine, kvantimine ja destillatsioon. Kaasasutaja ja tehnoloogiajuht John Rachwan rõhutas, et see raamistik aitab kasutajatel hinnata kvaliteedi tasakaalu, mis on seotud kokkusurumisega, samas kui jõudlus paraneb oluliselt. Kombineerides erinevad kokkusurumistehnikad kasutajasõbralikuks platvormiks, positsioneerib Pruna AI end Hugging Face'i ja selle transformeerijate kõrval. Raamistik toetab praegu mudeleid piltide ja videote genereerimiseks ning teenindab tuntud kliente, sealhulgas Scenario ja PhotoRoom. Lisaks pakub Pruna AI ettevõttesisest versiooni täiustatud optimeerimistööriistadega ja plaanib tutvustada "kokkusurumise agenti", et protsesse veelgi optimeerida. Selle professionaalne mudel töötab tasu järgi, saavutades mudeli suuruse vähendamise kuni kaheksa korda teatud rakenduste jaoks ilma jõudlust ohverdamata. Hiljuti kogus startup 6,5 miljonit dollarit seemnefondi tuntud investoritelt, kindlustades end konkurentsivõimelise ja kulutõhusa mängijana AI sektoris.

Pruna AI, Euroopa idufirma, mis keskendub AI mudelite tihendamisalgoritmide arendamisele, käivitab oma optimeerimisse raami avatud lähtekoodina sel neljapäeval. Ettevõte on loonud raamistik, mis rakendab erinevaid efektiivsuse tehnikaid, sealhulgas vahemälu, kärpimist, kvantimist ja destilleerimist, et efektiivselt optimeerida AI mudeleid. „Meie raamistik standardiseerib tihendatud mudelite salvestamise ja laadimise protsessi, ühendab neid tihendustehnikaid ning hindab teie tihendatud mudeli jõudlust pärast optimeerimist, ” ütles Pruna AI kaasasutaja ja CTO John Rachwan TechCrunchile antud intervjuus. Konkreetsemalt suudab Pruna AI raamistik hinnata, kas mudeli tihendamisel toimub olulisi kvaliteedikadu ja millised on saavutatud jõudluse parandused. „Metafora kasutades, oleme sarnased Hugging Face’iga, kui rääkida transformaatorite ja diffuuserite standardiseerimisest – kehtestades, kuidas neid nimetada, salvestada ja laadida jne. Me teeme sama efektiivsuse meetodite jaoks, ” märkis ta. Suured AI laborid kasutavad juba erinevaid tihendustehnikaid. Näiteks on OpenAI kasutanud destilleerimist, et arendada oma tuumamudelite kiiremaid iteratsioone. See lähenemine on tõenäoliselt aidanud luua GPT-4 Turbo, kiirem versioon GPT-4-st. Flux. 1-schnell piltide genereerimise mudel on veel üks näide, olles distilleeritud variatsioon Black Forest Labsi Flux. 1 mudelist. Destilleerimine hõlmab teadmiste eraldamist suuremast AI mudelist „õpetaja-õpilane” raamistikus. Arendajad saadavad päringud õpetaja mudelile ja salvestavad väljundid. Nende vastuseid saab seejärel võrrelda andmestikuga täpsuse osas, suunates õpilasmudeli koolitust, et imiteerida õpetaja käitumist. „Suurte ettevõtete puhul arendavad nad tavaliselt neid lahendusi siseiselt. Avatud lähtekoodiga kogukonnas leidub sageli tööriistu, mis keskenduvad ühele meetodile, nagu üks kvantimistehnika suurte keelemudelite jaoks või üks vahemälu lähenemine difusioonimudelite jaoks, ” selgitas Rachwan. „Siiski puuduvad ulatuslikud tööriistad, mis integreerivad ja lihtsustavad kõiki neid meetodeid.

See on peamine eelis, mida Pruna pakub. ” Kuigi Pruna AI toetab igasuguseid mudeleid – alates suurtest keelemudelitest kuni difusioonimudelite, kõne-tähestik süsteemide ja arvutinägemise rakendusteni, pöörab ettevõte praegu suuremat tähelepanu piltide ja videote genereerimise mudelitele. Pruna AI praeguste klientide hulka kuuluvad Scenario ja PhotoRoom. Lisaks avatud lähtekoodiga versioonile pakub Pruna AI ettevõtluslahendust, millel on täiustatud optimeerimisvõimekused, sealhulgas optimeerimisagent. „Kõige põnevam funktsioon, mida peagi välja toome, on tihendamisagent, ” avaldas Rachwan. „Te annate lihtsalt oma mudeli ja täpsustate: 'Vajan rohkem kiirus ilma täpsust rohkem kui 2% kaotamata. ' Agent siis teeb oma imet, määrates parima kombinatsiooni ja esitades selle teile ilma, et arendaja peaks täiendavat tööd tegema. ” Pruna AI küsib oma professionaalse versiooni eest tasu tundide kaupa. „See on võrreldav GPU rentimisega AWS-is või teistes pilveteenustes, ” lisas Rachwan. Kui teie mudel on teie AI infrastruktuuri oluline element, võib selle optimeerimine tuua kaasa olulisi kokkuhoidu tõlgendamisel. Näiteks on Pruna AI vähendanud Llama mudeli suurust kaheksa korda minimaalse kadu abil oma tihendusraamistikuga. Ettevõte soovib, et kliendid vaataksid oma tihendusraamistiku peale iseseisva investeeringuna. Hiljuti lõpetas Pruna AI seemne rahastamisringi, kogudes 6, 5 miljonit dollarit. Tähtsad investorid hõlmavad EQT Ventures, Daphni, Motier Ventures ja Kima Ventures.


Watch video about

Pruna AI lansseerib avatud lähtekoodiga optimeerimisraamistiku tehisintellekti mudelite jaoks.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 9:30 a.m.

Google'i Danny Sullivan ja John Mueller AI jaoks …

John Mueller Google’ist korraldas koos Danny Sullivaniga, kes samuti Google’ist on, Search Off the Record podcasti, arutamaks teemat „ Mõtted SEO-st ja AI jaoks

Dec. 23, 2025, 9:26 a.m.

Lexus katsetab generatiivset tehisintellekti uues…

Lühike ülevaade: Lexus on lansseerinud pühade turunduskampaania, mis on loodud generatiivse tehisintellekti abil, teatab pressiteade

Dec. 23, 2025, 9:16 a.m.

2025 oli aasta, mil tehisintellekti loodud videod…

Aastal 2025 toimus sotsiaalmeedias sügavalt muutusi, kuna tehisintellekti loodud videod hakkasid kiiresti domineerima platvormidel nagu YouTube, TikTok, Instagram ja Facebook.

Dec. 23, 2025, 9:15 a.m.

Tehisintellekt tekitab turvalisusprobleemi, mille…

Ettevõtetel võivad olla olemas küberkaitse meeskonnad, kuid paljud jäävad ettevaatlikuks AI süsteemide tegeliku ebaõnnestumise viiside suhtes, väitis AI turvalisuse uurija.

Dec. 23, 2025, 9:07 a.m.

FirstFT: Tehisintellekti võlakoormus ajab USA ett…

Selle saidi oluline komponent ei laadunud üles.

Dec. 23, 2025, 5:21 a.m.

Karjääri muutus 2026. aastal? Kõige lihtsamad teh…

Fotod Paulina Ochoa, Digital Journal Kuidas ligipääsetavad on karjäärid, kus kasutatakse tehisintellekti (TI)? Digitaalõppeplatvormi EIT Campus uus uuring tuvastab Euroopa kõige lihtsamad TI tööde sisseastumisvõimalused aastaks 2026, näidates, et mõne töö jaoks on vajalik ainult 3-6 kuuline koolitus ning teaduskraadi omamine ei ole tingimata nõutav

Dec. 23, 2025, 5:20 a.m.

Tehisintellekt videomängudes: elulisuse ja mängij…

Mängutööstus muutub kiiresti tehisintellekti (AI) tehnoloogiate integreerimise kaudu ning see muudab põhjalikult seda, kuidas mänge arendatakse ja mängijate poolt kogetakse.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today