lang icon En
Sept. 25, 2024, 5 a.m.
809

Ai2 esittelee Molmon: Avoimen lähdekoodin multimodaaliset mallit ylittävät GPT-4o:n

Brief news summary

Allen Institute for Artificial Intelligence (Ai2) on esitellyt Molmon, uraauurtavan kokoelman avoimen lähdekoodin multimodaalisia kielimalleja, jotka ovat suunniteltu kilpailemaan johtavien kilpailijoiden, kuten OpenAI, Google ja Anthropic, kanssa. Lippulaivamalli sisältää vaikuttavat 72 miljardia parametria ja ylittää OpenAI:n suuremman GPT-4o-mallin, jossa on yli triljoonaa parametria. Ai2 tarjoaa myös virtaviivaistetun mallin, jossa on 7 miljardia parametria. Molemmat mallit kehitettiin käyttämällä edistyneitä koulutustekniikoita ja huolella kuratoitua tietokantaa, joka sisältää 600 000 kuvaa, melun minimoimiseksi ja AI-hallusinaatioiden vähentämiseksi. Omaksumalla avoimen lähdekoodin mallin, Ai2 kutsuu kehittäjiä luomaan monipuolisia sovelluksia näiden mallien pohjalta. Ihmiskehittäjien tuottamien kuvakuvauksien panos oli ratkaisevan tärkeä mallien hienosäätämisessä ja vastuullisten AI-käytäntöjen parantamisessa. Molmo-sarja loistaa tiettyjen kuvan elementtien tunnistamisessa, tehden siitä ihanteellisen interaktiivisille sovelluksille. Vaikka on edelleen osa-alueita, jotka vaativat parantamista, Ai2:n aloite on merkittävä askel kohti kestävää ja yhteistyöhön perustuvaa AI:tä, joka edistää innovaatiota koko alalla.

Allen Institute for Artificial Intelligence (Ai2), tutkimusjärjestö, on esitellyt sarjan avoimen lähdekoodin multimodaalisia kielimalleja nimeltään Molmo, ja väittää niiden kilpailevan suorituskyvyllä johtavia omistettuja malleja vastaan, kuten OpenAI, Google ja Anthropic. Suurin Molmo-malli, jossa on 72 miljardia parametria, ylittää tiettävästi OpenAI:n GPT-4o:n, jossa on yli triljoonaa parametria, testeissä, jotka liittyvät kuvien ja asiakirjojen tulkintaan. Lisäksi pienempi versio, jossa on 7 miljardia parametria, vastaa läheisesti OpenAI:n huippumallia, mikä johtuu Ai2:n tehokkaista tiedonkeruu- ja koulutuskäytännöistä. Ali Farhadi, Ai2:n toimitusjohtaja, korostaa, että Molmo osoittaa avoimen lähdekoodin AI:n elinkelpoisuuden, mikä mahdollistaa kehittäjien vapaasti rakentaa sovelluksia. Vaikka osia tehokkaimmista Molmo-malleista ei ole vielä julkistettu, demoversio on saatavilla Hugging Face -alustalla. Toisin kuin muut laajat multimodaaliset mallit, jotka on koulutettu meluisilla verkosta kaapatuilla tiedoilla, Molmo perustuu kuratoituun 600, 000 kuvan tietokantaan, joka parantaa suorituskykyä merkittävästi käyttäen vähemmän resursseja, kuten johtava johtaja Ani Kembhavi totesi.

Tämä saavutettiin yksityiskohtaisten ihmisen tekijöiden antamien annotaatioiden kautta, jotka muunnettiin tiedoiksi AI-teknologioiden avulla, nopeuttaen koulutusprosessia. Asiantuntijat kuten Yacine Jernite Hugging Facesta ja Percy Liang Stanfordista vahvistavat korkealaatuisen tiedon koulutuksen edut tietojenkäsittelykustannusten vähentämiseksi. Yksi merkittävä ominaisuus Molmossa on sen kyky “osoittaa” elementtejä kuvassa, mikä parantaa vuorovaikutuksia käyttöliittymien kanssa. Demossa malli onnistui tunnistamaan ja laskemaan esineitä valokuvasta, mutta ei pystynyt löytämään tiettyjä esineitä. Ai2:n sitoutuminen avoimuuteen erottaa sen muista AI-yrityksistä, ja Molmon potentiaali riippuu kehittäjien luomista sovelluksista. Farhadi väittää, että vaikka omistetut mallit saavat merkittäviä investointeja, avoimen lähdekoodin lähestymistapa voi tuottaa parempia tuloksia, sillä se käyttää resursseja tehokkaasti ja edistää innovaatioita. “Olemme innoissamme mahdollisuudesta antaa muille ja nähdä, mitä he rakentavat tämän avulla, ” Farhadi sanoo.


Watch video about

Ai2 esittelee Molmon: Avoimen lähdekoodin multimodaaliset mallit ylittävät GPT-4o:n

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 1:26 p.m.

15 tapaa, joilla myynti on muuttunut tänä vuonna …

Viimeisen 18 kuukauden aikana SaaStr-tiimi on syventynyt tekoälyyn ja myyntiin, ja kesäkuusta 2025 alkaen kehitys on kiihtynyt merkittävästi.

Dec. 23, 2025, 1:23 p.m.

OpenAI:n GPT-5: Mitä tiedämme toistaiseksi

OpenAI valmistautuu julkaisemaan GPT-5:n, seuraavan suuren edistysaskeleen suurten kielimallien sarjassa, jonka odotetaan ilmestyvän varhaisen 2026 aikana.

Dec. 23, 2025, 1:20 p.m.

Tekoäly hakukoneoptimoinnissa: Sisällöntuotannon …

Tekoäly (AI) muokkaa nopeasti sisällönluonnin ja optimoinnin alaa hakukoneoptimoinnin (SEO) parissa.

Dec. 23, 2025, 1:20 p.m.

Tekoälypohjaiset videokonferenssiratkaisut parant…

Etätyön siirtymä on korostanut tehokkaiden viestintävälineiden olevan välttämättömiä, mikä on johtanut tekoälypohjaisten videokonferenssiratkaisujen nousuun, jotka mahdollistavat saumattoman yhteistyön etäisyyksistä riippumatta.

Dec. 23, 2025, 1:17 p.m.

Tekoäly lääketieteessä -markkinakoko, osuus, kasv…

Yleiskatsaus Globaali tekoälyn käyttö lääketieteessä markkinaennusteiden mukaan saavuttaa noin 156,8 miljardia Yhdysvaltain dollaria vuoteen 2033 mennessä, nousten vuoden 2023 arvoista 13,7 miljardia dollaria, kasvaen vahvalla CAGR:llä eli vuosittaisella keskimääräisellä kasvuprosentilla 27,6 % vuosina 2024–2033

Dec. 23, 2025, 9:30 a.m.

Google:n Danny Sullivan ja John Mueller tekoälyn …

John Mueller Googlelta isännöi Danny Sullivania, myös Googlelta, Search Off the Record -podcastissa keskustellen aiheesta "Ajatuksia SEO:sta ja SEO:sta tekoälyn (AI) aikakaudella".

Dec. 23, 2025, 9:26 a.m.

Lexus kokeilee generatiivista tekoälyä uudessa jo…

Syväluotaus: Lexus on käynnistänyt lomamarkkinointikampanjan, joka on luotu generatiivista tekoälyä hyödyntäen, kertoo lehdistötiedote

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today