lang icon English
Sept. 25, 2024, 5 a.m.
630

Ai2 presenta Molmo: Models multimodals de codi obert que superen el GPT-4o

Brief news summary

L'Allen Institute for Artificial Intelligence (Ai2) ha presentat Molmo, una col·lecció pionera de models de llenguatge multimodal de codi obert dissenyada per rivalitzar amb els competidors líders com OpenAI, Google i Anthropic. El model insígnia compta amb uns impressionants 72 mil milions de paràmetres i destaca en l’anàlisi d’imatges i documents, superant el model més gran GPT-4o d'OpenAI, que té més d'un trilió de paràmetres. A més, Ai2 ofereix una versió més fluida amb 7 mil milions de paràmetres. Tots dos models es van desenvolupar utilitzant tècniques avançades de formació i un conjunt de dades curat meticulosament de 600,000 imatges, amb l'objectiu de minimitzar el soroll i reduir les al·lucinacions de l'IA. En adoptar un model de codi obert, Ai2 convida els desenvolupadors a crear diverses aplicacions basades en aquests models. La contribució de descripcions d’imatges generades per humans va ser crucial per refinar els models i millorar les pràctiques d’IA responsables. La sèrie Molmo destaca en identificar elements específics de la imatge, cosa que la fa ideal per a aplicacions interactives. Tot i que encara hi ha aspectes que requereixen millora, la iniciativa d'Ai2 és un gran salt cap a una IA sostenible i col·laborativa, impulsant la innovació a tota la indústria.

L'Allen Institute for Artificial Intelligence (Ai2), una entitat sense ànim de lucre de recerca, ha presentat una sèrie de models de llenguatge multimodal de codi obert anomenats Molmo, afirmant que rivalitzen amb el rendiment dels models propietaris més destacats d'OpenAI, Google i Anthropic. El model Molmo més gran, amb 72 mil milions de paràmetres, suposadament supera el GPT-4o d'OpenAI, que té més d'un trilió de paràmetres, en proves relacionades amb la interpretació d’imatges i documents. A més, una versió més petita amb 7 mil milions de paràmetres iguala de prop el model capdavanter d’OpenAI, atribuït a les pràctiques eficients de recollida de dades i formació d’Ai2. Ali Farhadi, CEO d’Ai2, destaca que Molmo demostra la viabilitat de l’IA de codi obert, permetent als desenvolupadors construir aplicacions lliurement. Tot i que parts del model Molmo més potent segueixen sense ser exposades, hi ha una demostració disponible a la plataforma Hugging Face. A diferència d’altres models multimodals extensos entrenats amb dades sorolloses recopilades d’internet, Molmo es basa en un conjunt de dades curat de 600, 000 imatges, millorant significativament el rendiment mentre utilitza menys recursos, segons el director sènior Ani Kembhavi.

Això s'ha aconseguit a través d’anotacions humanes detallades convertides en dades mitjançant tecnologies d’IA, accelerant el procés de formació. Experts com Yacine Jernite de Hugging Face i Percy Liang de Stanford afirmen els beneficis d’entrenar amb dades d’alta qualitat per reduir costos computacionals. Una característica notable de Molmo és la seva capacitat per “assenyalar” elements en una imatge, millorant les interaccions amb interfícies d’usuari. En una demostració, el model va identificar i comptar objectes en una foto amb èxit, però no va poder localitzar elements específics. El compromís d’Ai2 amb l’obertura el diferencia d’altres empreses d’IA, amb el potencial de Molmo depenent de les aplicacions que els desenvolupadors creïn. Farhadi argumenta que, mentre els models propietaris atrauen inversions significatives, l’enfocament de codi obert podria donar millors resultats, ja que utilitza eficientment els recursos i fomenta la innovació. “Estem emocionats d’habilitar altres i veure què construiran amb això”, diu Farhadi.


Watch video about

Ai2 presenta Molmo: Models multimodals de codi obert que superen el GPT-4o

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 13, 2025, 1:28 p.m.

Núvols foscos col·lectivament amenaçant sobre la …

Una gran venta de tecnología sacude Wall Street ja que la gran diferència entre les valoracions de les empreses d’IA i els seus ingressos subrendibles continua ampliant-se.

Nov. 13, 2025, 1:25 p.m.

Intel·ligència artificial generativa i productivi…

Un estudi recent i exhaustiu ha revelat els efectes transformadors de la Intel·ligència Artificial Generativa (GenAI) en la productivitat de les empreses, amb un focus en el comerç electrònic.

Nov. 13, 2025, 1:25 p.m.

Eines d'Intel·ligència Artificial per a la Modera…

En els últims anys, les plataformes de xarxes socials han confiat cada vegada més en la intel·ligència artificial (IA) per millorar la moderació de contingut, especialment pel que fa al material en vídeo.

Nov. 13, 2025, 1:25 p.m.

Còpia AI SEO i GEO en línia per abordar el futur …

La Cumbre en línia AI SEO & GEO, programada pel 9 de desembre de 2025, ofereix una oportunitat essencial per a empreses i marketing digital per mantenir-se a la avantguarda en un paisatge d’optimització per a motors de cerca que evoluciona ràpidament.

Nov. 13, 2025, 1:25 p.m.

Snap Inc. Inverteix 400 milions de dòlars en la i…

Snap Inc., la company matriz de Snapchat, ha anunciat una inversió important de 400 milions de dòlars per formar una associació estratègica amb Perplexity AI, una empresa líder en motors de cerca d'IA.

Nov. 13, 2025, 1:15 p.m.

Intel·ligència Artificial per al màrqueting: Eine…

El 17 de setembre de 2025, l’oficina del sud d’Ucraïna de l’Associació Europea de Negocis (EBA) va acollir una sessió en línia molt reveladora centrada en l’impacte transformador de la intel·ligència artificial (IA) en el màrqueting.

Nov. 13, 2025, 9:22 a.m.

El director de tecnologia d'OpenAI, Yann LeCun, c…

Yann LeCun, vicepresident de Meta i principal científic d'AI, una figura destacada en la intel·ligència artificial i pioner a l'empresa, preveu abandonar Meta per iniciar la seva pròpia startup centrada en la intel·ligència artificial.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today