lang icon En
Sept. 25, 2024, 5 a.m.
3302

Ai2 Bemutatja a Molmo-t: Nyílt Forráskódú Multimodális MI Modell

Brief news summary

Az Allen Institute for AI (Ai2) elindította a Multimodal Open Language Model (Molmo) nevű nyílt forráskódú MI modellt, amely egyesíti a vizuális megértést a beszélgetési képességekkel olyan feladatokhoz, mint a webes böngészés és a dokumentumok kezelése. Ali Farhadi vezérigazgató hangsúlyozza, hogy a Molmo célja, hogy inspirálja a fejlesztőket és kutatókat innovatív multimodális alkalmazások létrehozására. A saját tulajdonú modellekkel, mint a GPT-4 szemben, a Molmo nyílt forráskódú tervezése széleskörű testreszabási lehetőségeket kínál, megkülönböztetve a nagy versenytársaktól, mint az OpenAI és a Google. A modell különböző méretekben érkezik, beleértve a mobilbarát, 1 milliárd paraméteres verziót is, amely az hatékonyságon és a visszaélések és káros alkalmazások kezelésén dolgozik. Farhadi a Molmót praktikus alternatívának tekinti a nagyobb kereskedelmi modellekkel szemben, bár az MI érvelési képességek fejlesztése jelentős kihívást jelent. A Molmo bevezetése jelentős lépést jelez az előrehaladott MI technológiák demokratizálása felé, hozzáférhetővé téve azokat a nagyvállalatokon túl.

Az Allen Institute for AI (Ai2) bemutatta a Multimodal Open Language Model (Molmo) nevű, új, erős nyílt forráskódú MI modellt, amely képes képeket értelmezni és beszélgetéseket folytatni. Ez a technológia várhatóan lehetővé teszi a fejlesztők, kutatók és startupok számára, hogy olyan MI ügynököket hozzanak létre, amelyek különféle számítógépes feladatokat tudnak elvégezni, mint például a webes böngészés, fájlok navigálása és dokumentumok létrehozása. Ai2 vezérigazgatója, Ali Farhadi hangsúlyozza, hogy a Molmo szélesebb körű alkalmazást tesz lehetővé a multimodális modellek számára, amelyeket egyre inkább a jövő MI alkalmazásainak tekintenek. Míg olyan nagy szereplők, mint az OpenAI és a Google, vizuális képességekkel rendelkező modelleket fejlesztettek, ezek az opciók elsősorban fizetett API-kon keresztül érhetők el, ami korlátozza azok alkalmazkodóképességét konkrét felhasználásokra. Ezzel szemben a Molmo nyílt forráskódú megközelítést kínál, lehetővé téve a fejlesztők számára, hogy finomhangolják a modellt egyedi képzési adatokkal a konkrét feladatokhoz, mint például a táblázatkezelés. Az Ai2 több verziót is elindít a Molmoból, beleértve egy kompakt, 1 milliárd paraméteres modellt, amely mobil eszközökre is alkalmas.

Annak ellenére, hogy kisebb méretű, a Molmo teljesítménye megegyezik a nagyobb kereskedelmi modellekével magas színvonalú képzési adatainak köszönhetően. Míg a Molmo nyílt forráskódú jellege elősegíti az innovációt, aggodalmakat is felvet a potenciális visszaélésekkel kapcsolatban, például rosszindulatú MI ügynökök létrehozásával. Ennek ellenére Farhadi úgy véli, hogy a Molmo hatékonysága lehetővé teszi a fejlesztők számára, hogy kifinomultabb szoftvereket hozzanak létre, amelyek hatékonyan működnek majd mobil eszközökön is. Az előttünk álló kihívás nemcsak a multimodális modellek képességeinek növelésében rejlik, hanem abban is, hogy fejlesszék azok érvelési készségeit, amelyek a megbízható teljesítményhez elengedhetetlenek. A Molmo bevezetése egy lépéssel közelebb visz minket a praktikus MI ügynökök megvalósításához, amelyek függetlenül működhetnek a nagy technológiai vállalatoktól.


Watch video about

Ai2 Bemutatja a Molmo-t: Nyílt Forráskódú Multimodális MI Modell

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 16, 2026, 1:26 p.m.

A ByteDance megígéri, hogy szigorítja új AI-alapú…

A ByteDance kevesebb mint egy héttel ezelőtt kiadta a Seedance 2.0-t, ami világszerte felháborodást váltott ki művészek körében egy vírusvideóval, amelyben Tom Cruise-t és Brad Pittet látjuk harcolni, és amelyet mesterséges intelligencia generált.

Feb. 16, 2026, 1:24 p.m.

Egy mesterséges intelligencia hangrögzítő, ami el…

Az irodai dolgozók ideális forgatókönyve az, hogy egyszerűen megnyomnak egy gombot egy eszközön, amely felveszi az értekezleteket, átírja a beszélgetéseket, és átalakítja azokat intézkedésre váró feladatokká.

Feb. 16, 2026, 1:21 p.m.

A Microsoft mesterséges intelligenciával vezérelt…

A Microsoft hivatalosan is beépítette az AI-alapú Copilot segédet széles körben használt Office Csomagjába, ami jelentős lépést jelent a felhasználói interakciókban a produktivitási szoftverekkel.

Feb. 16, 2026, 9:26 a.m.

Seedance 2.0

A Seedance 2.0 egy élvonalbeli kép-ről-videóra és szöveg-ről-videóra modell, amelyet a ByteDance technológiai vállalat hozott létre.

Feb. 16, 2026, 9:24 a.m.

Az IBM Watson Health partnerséget kötött a BioTec…

Az IBM Watson Health részlege stratégiai partnerséget alakított ki a BioTech Innovations-szel, egy vezető biotechnológiai céggel, hogy forradalmasítsák a gyógyszerkutatást fejlett mesterséges intelligencia (MI) technológiák alkalmazásával.

Feb. 16, 2026, 9:19 a.m.

Az Edge Marketing megerősíti az AI-alapú keresési…

Az Edge Marketing bejelentette, hogy nemzetközileg elismert, díjnyertes AI és SEO szakértőt, Luke Goshát, új Search & AI Strategy igazgatóként nevezi ki.

Feb. 16, 2026, 9:16 a.m.

Arról, amit a legtöbb AI értékesítési eszköz nem …

Éveken keresztül az értékesítési technológia azon a feltevésen alapult, hogy a gyorsabb jobb — gyorsabb válaszok, gyorsabb követések és gyorsabb lezárások.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today