lang icon En
Jan. 18, 2025, 10:52 a.m.
1934

El llançament de la IA d'Apple s'enfronta a crítiques per problemes d'accuracitat.

Brief news summary

Apple ha decidit suspendre la seva iniciativa d'IA, Apple Intelligence, en resposta a les crítiques sobre els seus resums de notícies inexactes i els titulars enganyosos. Aquesta decisió ressalta els reptes continus associats amb els models de llenguatge grans (LLMs), que sovint generen "al·lucinacions" o informació incorrecta. Malgrat que els enginyers van identificar aquests problemes, Apple va continuar amb el seu desenvolupament d'IA fins fa poc. Investigacions recents han revelat importants obstacles per als models d'IA, especialment en el raonament matemàtic, on la seva dependència del reconeixement de patrons impedeix les veritables capacitats de resolució de problemes. Per exemple, proves que utilitzaven el conjunt de dades matemàtiques GSM8K van demostrar una preocupant caiguda del 65% en precisió amb canvis menors en les variables. Aquests avenços suggereixen que, tot i que els sistemes d'IA poden semblar competents, sovint fracassen fora dels seus contextos d'entrenament, aixecant preocupacions sobre la seva fiabilitat en la generació de notícies. L'elecció d'Apple de continuar amb els seus esforços d'IA malgrat aquestes limitacions reflecteix una tendència més àmplia en la indústria, on les empreses sovint adopten tecnologies defectuoses sense abordar adequadament els problemes fonamentals, cosa que condueix a inquietuds més àmplies sobre la fiabilitat de les aplicacions d'IA.

I van avançar i ho van publicar de totes maneres. Actualització de Notícies, Amic L'última aventura d'Apple en la IA, anomenada Apple Intelligence, ha estat en gran mesura decebedora. Els seus resums de notícies, en particular, han rebut un important backlash per la mala gestió dels titulars i per proporcionar informació inexacta, cosa que ha comportat que Apple aturés tot el programa aquesta setmana per fer les correccions necessàries. Res d'això és particularment sorprenent. Els problemes com les "al·lucinacions" de la IA són un repte conegut per a tots els grans models de llenguatge, i segueix sense resoldre's, si és que es pot resoldre. No obstant això, llançar el seu model d'IA sembla especialment imprudent tenint en compte que els enginyers d'Apple havien assenyalat anteriorment defectes greus en la tecnologia. Aquesta precaució es va articular en un estudi publicat l'octubre passat. La investigació, que encara no s'ha publicat i que va examinar les capacitats de "raonament" matemàtic d'alguns dels principals LLM de la indústria, va contribuir a comprendre que aquests models no raonen de manera genuïna. "En canvi, " van assenyalar els investigadors, "busquen emular els passos de raonament que es troben en les seves dades d'entrenament. " Reptes Matemàtics Per avaluar els models d'IA, els investigadors els van encarregar resoldre milers de problemes matemàtics del conjunt de dades de referència GSM8K, d'ús comú. Una pregunta senzilla podria ser: "James compra 5 paquets de carn que pesen 4 lliures cadascun. El preu de la carn és de 5, 50 dòlars per lliura.

Quant va gastar?" Algunes preguntes eren lleugerament més complexes, però encara eren manejables per a un escolar raonablement educat. Els investigadors van ressaltar les llacunes en els models d'IA amb notable simplicitat: simplement van alterar els números a les preguntes. Aquest enfocament mitiga la contaminació de dades, és a dir, les IA no havien trobat aquests problemes específics anteriorment en les seves dades d'entrenament, sense incrementar la dificultat dels problemes. Ajustar només això va provocar una caiguda lleugera però significativa en la precisió de tots els 20 LLM provats. No obstant això, quan els investigadors van augmentar el seu mètode canviant també els noms i introduint detalls irrelevants, com especificar que un bon grapat de fruits eren "més petits del que és habitual", la disminució del rendiment va ser, tal com van dir els investigadors, "catastròfica", arribant fins al 65 per cent. El rendiment va variar entre els models, però fins i tot el més avançat, l'o1-preview d'OpenAI, va experimentar una disminució del 17, 5 per cent, mentre que el seu predecessor GPT-4o va patir una disminució del 32 per cent. Aprendre de Patrons Les implicacions són clares. "Això exposa un defecte crucial en la capacitat dels models per identificar informació pertinent per a la resolució de problemes, probablement perquè el seu raonament no està estructurat formalment en un sentit tradicional, sinó que principalment es basa en el reconeixement de patrons, " van afirmar els investigadors. En termes més simples, la IA és excel·lent a l'hora de semblar intel·ligent i sovint proporciona respostes correctes!No obstant això, un cop no pot replicar dades específiques, falla significativament. Pensa que troballes com aquestes haurien de generar dubtes significatius sobre la confiança en un model d'IA per generar titulars, reorganitzant paraules sense entendre realment com altera el missatge global; no obstant això, no sembla que sigui així. Apple era conscient dels problemes crítics que han persistit en cada LLM i va llançar el seu model independentment. Per ser justos, això s'ha convertit en la pràctica estàndard a la indústria de la IA. Més sobre IA: Una nova startup inquietant desplega agents d'IA per inundar Reddit amb publicacions promocionals dels productes dels seus clients.


Watch video about

El llançament de la IA d'Apple s'enfronta a crítiques per problemes d'accuracitat.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

Eines de moderació de contingut de vídeos amb int…

Les plataformes de xarxes socials són cada cop més utilitzant la intel·ligència artificial (IA) per millorar la seva moderació de contingut en vídeo, en abordar l’increment de vídeos com a forma dominant de comunicació en línia.

Dec. 21, 2025, 1:38 p.m.

Els Estats Units revisiten les seves restriccions…

REVERSAL DE POLÍTICA: Després de anys de restriccions cada vegada més estrictes, la decisió d’autoritzar la venda de xips H200 de Nvidia a la Xina ha provocat rebuigs per part d’alguns republicans.

Dec. 21, 2025, 1:38 p.m.

La intel·ligència artificial va ser la causa de m…

Els acomiadaments impulsats per la intel·ligència artificial han marcat el mercat laboral del 2025, amb grans empreses que han anunciat milers de baixes laborals atribuïdes a avenços en la IA.

Dec. 21, 2025, 1:36 p.m.

Llançament dels Serveis SEO Perplexity – NEWMEDIA…

RankOS™ Millora la Visibilitat de la Marca i la Citat en Perplexity AI i altres Plataformes de Cerca d'Enginy de Respostes Serveis de l'Agència SEO de Perplexity Nova York, NY, 19 de desembre de 2025 (GLOBE NEWSWIRE) — NEWMEDIA

Dec. 21, 2025, 1:22 p.m.

L'oficina familiar d'Eric Schmidt aposta per 22 s…

Una versió original d’aquest article va aparèixer a la newsletter Inside Wealth de CNBC, escrita per Robert Frank, que serveix com a recursos setmanal per a inversors i consumidors amb grans patrimonis.

Dec. 21, 2025, 1:21 p.m.

Informe sobre el futur del màrqueting: Per què el…

Els titulars s’han centrat en la inversió de mil milions de dòlars de Disney a OpenAI i han especulat sobre per què Disney va triant OpenAI en lloc de Google, amb qui està litigant per suposades infraccions de drets d’autor.

Dec. 21, 2025, 9:34 a.m.

Dades de Salesforce revelen que la IA i els agent…

Salesforce ha publicat un informe detallat sobre l'esdeveniment de compres de la Cyber Week del 2025, analitzant dades de més de 1,5 mil milions de compradors globals.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today