lang icon English
Jan. 18, 2025, 10:52 a.m.
1723

Apple'i tehisintellekti lansseerimine saab tagasilööke täpsuse probleemide tõttu.

Brief news summary

Apple on otsustanud peatada oma tehisintellekti algatuse, Apple Intelligence, vastusena kriitikale seoses ebaõigete uudiste kokkuvõtete ja eksitavate pealkirjadega. See otsus toob esile pidevad väljakutsed, millega suured keelemudelid (LLM-id) silmitsi seisavad, kuna need genereerivad sageli "hallutsioone" või valeinformatsiooni. Kuigi insenerid tuvastasid need probleemid, jätkas Apple oma tehisintellekti arendamist kuni hiljuti. Hiljutine uurimus on paljastanud märkimisväärseid takistusi tehisintellekti mudelite jaoks, eriti matemaatilises mõtlemises, kus nende sõltuvus mustrituvastusest takistab tõeliste probleemide lahendamist. Näiteks näitas GSM8K võrdlusmõõdustiku matemaatika andmestiku testimine murettekitavat 65% täpsuse langust väikeste muutuste korral. Need teadlikkused viitavad sellele, et kuigi tehisintellekti süsteemid võivad tunduda osavad, ebaõnnestuvad nad sageli oma väljaõppe kontekstist väljaspool, tekitades muresid nende usaldusväärsuse üle uudiste genereerimisel. Apple'i valik jätkata oma tehisintellekti pingutusi vaatamata nendele piirangutele peegeldab tööstuse laiemat suundumust, kus ettevõtted sageli võtavad kasutusele defektehnoloogiad, ilma et nad nõuetekohaselt käsitleksid põhiküsimusi, mis toob kaasa laiemad mured tehisintellekti rakenduste usaldusväärsuse üle.

Ja nad läksid ikkagi edasi ja vabastasid selle. Uudiste värskendus, sõber Apple'i viimane seiklus tehisintellekti vallas, nimega Apple Intelligence, on olnud peamiselt pettumust valmistav. Eriti on tema uudiste kokkuvõtted saanud märkimisväärset kriitikat pealkirjade valesti käsitlemise ja ebatäpsete andmete esitamise tõttu, sundides Apple'it kogu programmi sel nädalal peatama vajalike paranduste tegemiseks. Midagi siin ei ole eriti üllatav. Probleemid nagu AI "hallutsinatsioonid" on tuntud väljakutse kõikide suurte keelemudelite jaoks ning see probleem jääb lahendamata - kui seda üldse saab lahendada. Siiski näib AI mudeli lansseerimine olevat eriti hoolimatu, arvestades, et Apple'i insenerid olid eelnevalt välja toonud tehnoloogia tõsised puudused. See ettevaatus oli väljendatud uuringus, mis avaldati eelmisel oktoobril. Endiselt avaldamata uurimus, mis uuris mõnede juhtivate tööstuse LLM-ide matemaatilisi "järeldus" võimeid, aitas mõista, et need mudelid ei mõtle tõeliselt. "Vastupidi, " märkisid teadlased, "püüavad nad järeldusprotsesse, mis esinevad nende koolitusandmetes, jäljendada. " Matemaatika väljakutsed Tehisintellekti mudelite hindamiseks palusid teadlased neil lahendada tuhandeid matemaatika probleeme laialdaselt kasutatavas GSM8K standardkomplekti andmestikus. Lihtne küsimus võiks olla: "James ostab 5 pakki veiseliha, mis kaalub 4 naela igaüks. Veiseliha hind on 5, 50 dollarit naela kohta.

Kui palju raha ta kulutas?" Mõned küsimused olid veidi keerukamad, kuid siiski haldavad arvestatava haridustasemega põhikooliõpilase jaoks. Teadlased tõid esile AI mudelite puudujäägid tähelepanuväärse lihtsuse kaudu: nad muutsid lihtsalt küsimustes numbreid. See lähenemine vähendab andmete saastumise riski - see tähendab, et AI-d ei olnud selliste spetsiifiliste probleemidega varem koolitusandmetes kokku puutunud - samas mitte suurendades probleemide raskust. See kohandamine üksi põhjustas kergelt, kuid märkimisväärselt täpsuse languse kõigi 20 testitud LLM-i puhul. Kuid kui teadlased oma meetodit tõhustasid, muutes ka nimesid ja lisades ebaolulisi üksikasju - nagu täpsustamine, et käputäis puuvilju oli "tavapärasest väiksem" - oli tulemus langus, mis teadlaste sõnul oli "katastroofiline", ulatudes koguni 65 protsendini. Tulemused erinevad mudelite vahel, kuid isegi kõige arenenum, OpenAI o1-preview, koges 17, 5 protsendilist langust, samas kui tema eelkäija GPT-4o langes 32 protsenti. Musterteadmise õppimine Tagajärjed on selged. "See paljastab olulise puuduse mudelite võimes tuvastada asjakohast teavet probleemide lahendamiseks, tõenäoliselt seetõttu, et nende järeldamine pole formaalselt struktureeritud traditsioonilises mõttes, vaid põhineb peamiselt mustritunnustamisel, " väitsid teadlased. Lihtsamalt öeldes, AI paistab olevat intelligentne ja sageli annab õigeid vastuseid!Kuid kui tal ei õnnestu reprodutseerida spetsiifilisi andmeid, eksib ta oluliselt. Võiksite arvata, et sellised leiud peaksid tekitama tõsiseid kahtlusi AI mudeli usaldusväärsuses pealkirjade genereerimisel - sõnade ümberkorraldamisel, ilma et tõeliselt mõistetaks, kuidas see tervikukurssi muudab - kuid tundub, et see nii ei ole. Apple oli teadlik kriitilistest probleemidest, mis on püsivalt olnud kõikide LLM-ide puhul, ja käivitas oma mudeli hoolimata sellest. Tõsi, see on muutunud standardpraktikaks kogu AI tööstuses. Rohkem AI-st: Häiriv uus idufirma kasutab AI agente, et uputada Reddit reklaampostitustega klientide toodete jaoks.


Watch video about

Apple'i tehisintellekti lansseerimine saab tagasilööke täpsuse probleemide tõttu.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 17, 2025, 1:26 p.m.

Tehisintellekt videosises turunduses: sisu person…

Tehisintellekt (TI) mängib üha suuremat rolli videomarketingus, muutides seda, kuidas brändid ühendust luvad oma sihtrühma with.

Nov. 17, 2025, 1:26 p.m.

6sense’i asutaja Amanda Kahlow kogus 30 miljonit …

Kuigi suured keelemudelid (LLMs) toidetavad tehisintellekti agendid on suhteliselt uus nähtus, on nad saavutanud müügis märkimisväärset populaarsust.

Nov. 17, 2025, 1:20 p.m.

Tehisintellekti loodud sisu sotsiaalmeedia turund…

Hiljutine põhjalik ülevaade, mis hindab tehisintellekti (TI) kasutamist sotsiaalmeedia turunduses (SMM), toob esile märkimisväärsed tulemuslikkuse erinevused AI-ga loodud sisu ja inimeste loodud postituste vahel.

Nov. 17, 2025, 1:13 p.m.

Tehisintellekti toel põhinev SEO: digitaalse turu…

Tehisintellekt (TT) kujundab kiiresti otsingumootori optimeerimist (OO), pakkudes turundajatele enneolematuid võimalusi parandada veebivisibiliteeti ja parandada otsingutulemustes edetabelit.

Nov. 17, 2025, 1:11 p.m.

Jeff Bezos juhib uut inseneripõhist tehisintellek…

Jeff Bezos juhib uut tehisintellekti idufirmat nimega Project Prometheus, mis ühtib tema praeguste huvidega kosmoses ja inseneriteaduses, kirjutab The New York Times.

Nov. 17, 2025, 1:10 p.m.

Anthropic tegi suurema avalduse, mis võib kujunda…

Selles videos hõikan viimased arengud, mis mõjutavad Alphabetit (GOOG +3,33%) (GOOGL +3,39%) ning teisi tehisintellekti aktsiaturge.

Nov. 17, 2025, 9:30 a.m.

Kas BigBear.ai võiks saada järgmiseks Palantir Te…

Palantir Technologies (PLTR) on saavutanud erakordse aktsia arengut ning tõusnud viimase aasta jooksul kuni 14.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today