DeepSeek llança models d'IA de primera generació que rivalitzen amb el GPT-4 d'OpenAI.

El 20 de gener, l'start-up xinesa d'IA DeepSeek va llançar els seus models de raonament de primera generació, fent afirmacions sorprenents sobre les seves capacitats. El model DeepSeek-R1 reportadament iguala el rendiment dels millors models d'OpenAI, tot i haver estat desenvolupat amb maquinari inferior. Aquesta fita és especialment impressionant tenint en compte que va costar només 5, 6 milions de dòlars per entrenar, en comparació amb els 100 milions d'OpenAI per al GPT-4. El R1 de DeepSeek es basa en el seu model de llenguatge gran V3 i és completament de codi obert, cosa que potencialment podria transformar la indústria de la IA. L'enfocament de l'empresa en l'eficiència del maquinari prové de les restriccions d'exportació dels GPUs H100 d'Nvidia a la Xina, cosa que els ha portat a innovar amb el H800 i tècniques com la 'mescla d'experts' (DeepSeekMoE), que activa només parts del model segons les necessitats. Això redueix els requisits de transferència de dades i millora l'eficiència de l'entrenament. Aquests avenços no només acceleren els temps d'entrenament, sinó que també fan que sigui més barat i més accessible executar la inferència d'IA en maquinari menys potent.
Com a resultat, empreses com Apple i Meta poden obtenir beneficis significatius. Per a Apple, que prioritza la privacitat de les dades i el processament en dispositius, integrar els mètodes de DeepSeek podria millorar les funcions d'IA en dispositius com l'iPhone, potencialment millorant les vendes i els ingressos dels serveis. L'augment del vàndal de memòria del xip A18 Pro suporta aquests avenços, permetent funcions com Siri més intel·ligent i traduccions offline. Meta també està augmentant les seves inversions en IA, amb un augment previst del 60% en les despeses d'capital d'aquí al 2025. Al fer codi obert el seu model Llama, Meta busca maximitzar l'eficiència en les seves implementacions d'IA. La reducció dels costos d'inferència d'IA podria desbloquejar beneficis substancials per a Meta, facilitant l'escalat de solucions d'IA per als seus 3 mil milions d'usuaris. Les innovacions de DeepSeek proporcionen a Meta les eines necessàries per millorar les seves capacitats d'IA i la seva rendibilitat.
Brief news summary
El 20 de gener, la start-up xinesa d’IA DeepSeek va presentar els seus models de raonament avançats, incloent el DeepSeek-R1, dissenyat per rivalitzar amb els models més avançats d’OpenAI mentre funciona de manera eficient en maquinari menys potent. Notablement, el model V3 només requereix 5,6 milions de dòlars per al seu entrenament, significativament inferior als 100 milions d’OpenAI per al GPT-4. La naturalesa de codi obert del model R1 fomenta la seva adopció en diverses indústries. DeepSeek utilitza un enfocament de "mescla d'experts", activant només segments necessaris del model, cosa que augmenta l'eficiència en maquinari limitat. Aquest mètode, juntament amb la compressió de dades i un millor equilibrat de càrrega, accelera l’entrenament i redueix els costos d'inferència, fent que la IA sigui més accessible. Aquestes innovacions proporcionen grans oportunitats per a empreses com Apple i Meta. Apple busca millorar les seves capacitats d’IA en dispositius, centrant-se en la privacitat de l'usuari i la millora de la interacció amb el client. En contrast, Meta planeja integrar les tecnologies de DeepSeek per expandir els seus serveis d’IA, amb l'objectiu d'optimitzar els ingressos a través del seu model de codi obert Llama.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Nvidia planeja vendre tecnologia per accelerar la…
Divendres, Nvidia va revelar els seus plans per comercialitzar una nova tecnologia destinada a millorar la comunicació entre xips, un factor crític per avançar i desplegar sistemes d'intel·ligència artificial (IA).

Ripple llança un pilot de blockchain per incremen…
Ripple ha iniciat un projecte pilot amb blockchain a Colòmbia destinat a oferir suport financer als petits agricultors de panela.

La IA revoluciona la predicció meteorològica
La intel·ligència artificial (IA) està revolucionant la predicció meteorològica, assenyalant un canvi transformador comparable a la informatització de la predicció del temps dels anys 60.

Elton John considera que el govern és un 'rony to…
Elton John critica els plans del govern sobre els drets d’autor de la IA, els qual anomena “perdedors” El senyor Elton John ha condemnat durament el govern del Regne Unit per els seus plans d'exempció a les empreses tecnològiques de les lleis de drets d’autor relacionades amb la intel·ligència artificial (IA)

ONFA Fintech EUA s'associa amb Metti Capital Fund…
SAN FRANCISCO, 18 de maig de 2025 (GLOBE NEWSWIRE) — ONFA FINTECH USA, una filiale de METTITECH GROUP HOLDINGS, ha signat un acord estratègic amb el suport de Metti Capital Funding per avançar en la seva plataforma de banca digital basada en blockchain.

Microsoft pretén millorar la col·laboració i la m…
Microsoft està avançant cap a un futur on agents d’intel·ligència artificial de diferents empreses col·laboren de manera fluida i reten records específics de les tasques.

DUSK Network participarà a la Setmana de la Block…
DUSK Network participarà a la Dutch Blockchain Week el 21 de maig a Amsterdam.