Az Allen Institute for AI (Ai2) bemutatta a Multimodal Open Language Model (Molmo) nevű, új, erős nyílt forráskódú MI modellt, amely képes képeket értelmezni és beszélgetéseket folytatni. Ez a technológia várhatóan lehetővé teszi a fejlesztők, kutatók és startupok számára, hogy olyan MI ügynököket hozzanak létre, amelyek különféle számítógépes feladatokat tudnak elvégezni, mint például a webes böngészés, fájlok navigálása és dokumentumok létrehozása. Ai2 vezérigazgatója, Ali Farhadi hangsúlyozza, hogy a Molmo szélesebb körű alkalmazást tesz lehetővé a multimodális modellek számára, amelyeket egyre inkább a jövő MI alkalmazásainak tekintenek. Míg olyan nagy szereplők, mint az OpenAI és a Google, vizuális képességekkel rendelkező modelleket fejlesztettek, ezek az opciók elsősorban fizetett API-kon keresztül érhetők el, ami korlátozza azok alkalmazkodóképességét konkrét felhasználásokra. Ezzel szemben a Molmo nyílt forráskódú megközelítést kínál, lehetővé téve a fejlesztők számára, hogy finomhangolják a modellt egyedi képzési adatokkal a konkrét feladatokhoz, mint például a táblázatkezelés. Az Ai2 több verziót is elindít a Molmoból, beleértve egy kompakt, 1 milliárd paraméteres modellt, amely mobil eszközökre is alkalmas.
Annak ellenére, hogy kisebb méretű, a Molmo teljesítménye megegyezik a nagyobb kereskedelmi modellekével magas színvonalú képzési adatainak köszönhetően. Míg a Molmo nyílt forráskódú jellege elősegíti az innovációt, aggodalmakat is felvet a potenciális visszaélésekkel kapcsolatban, például rosszindulatú MI ügynökök létrehozásával. Ennek ellenére Farhadi úgy véli, hogy a Molmo hatékonysága lehetővé teszi a fejlesztők számára, hogy kifinomultabb szoftvereket hozzanak létre, amelyek hatékonyan működnek majd mobil eszközökön is. Az előttünk álló kihívás nemcsak a multimodális modellek képességeinek növelésében rejlik, hanem abban is, hogy fejlesszék azok érvelési készségeit, amelyek a megbízható teljesítményhez elengedhetetlenek. A Molmo bevezetése egy lépéssel közelebb visz minket a praktikus MI ügynökök megvalósításához, amelyek függetlenül működhetnek a nagy technológiai vállalatoktól.
Ai2 Bemutatja a Molmo-t: Nyílt Forráskódú Multimodális MI Modell
A ByteDance kevesebb mint egy héttel ezelőtt kiadta a Seedance 2.0-t, ami világszerte felháborodást váltott ki művészek körében egy vírusvideóval, amelyben Tom Cruise-t és Brad Pittet látjuk harcolni, és amelyet mesterséges intelligencia generált.
Az irodai dolgozók ideális forgatókönyve az, hogy egyszerűen megnyomnak egy gombot egy eszközön, amely felveszi az értekezleteket, átírja a beszélgetéseket, és átalakítja azokat intézkedésre váró feladatokká.
A Microsoft hivatalosan is beépítette az AI-alapú Copilot segédet széles körben használt Office Csomagjába, ami jelentős lépést jelent a felhasználói interakciókban a produktivitási szoftverekkel.
A Seedance 2.0 egy élvonalbeli kép-ről-videóra és szöveg-ről-videóra modell, amelyet a ByteDance technológiai vállalat hozott létre.
Az IBM Watson Health részlege stratégiai partnerséget alakított ki a BioTech Innovations-szel, egy vezető biotechnológiai céggel, hogy forradalmasítsák a gyógyszerkutatást fejlett mesterséges intelligencia (MI) technológiák alkalmazásával.
Az Edge Marketing bejelentette, hogy nemzetközileg elismert, díjnyertes AI és SEO szakértőt, Luke Goshát, új Search & AI Strategy igazgatóként nevezi ki.
Éveken keresztül az értékesítési technológia azon a feltevésen alapult, hogy a gyorsabb jobb — gyorsabb válaszok, gyorsabb követések és gyorsabb lezárások.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today