News
>
Apple'i tehisintellekti lansseerimine saab tagasilööke täpsuse probleemide tõttu.

Jan. 18, 2025, 10:52 a.m.

Apple'i tehisintellekti lansseerimine saab tagasilööke täpsuse probleemide tõttu.

Brief news summary

Apple on otsustanud peatada oma tehisintellekti algatuse, Apple Intelligence, vastusena kriitikale seoses ebaõigete uudiste kokkuvõtete ja eksitavate pealkirjadega. See otsus toob esile pidevad väljakutsed, millega suured keelemudelid (LLM-id) silmitsi seisavad, kuna need genereerivad sageli "hallutsioone" või valeinformatsiooni. Kuigi insenerid tuvastasid need probleemid, jätkas Apple oma tehisintellekti arendamist kuni hiljuti. Hiljutine uurimus on paljastanud märkimisväärseid takistusi tehisintellekti mudelite jaoks, eriti matemaatilises mõtlemises, kus nende sõltuvus mustrituvastusest takistab tõeliste probleemide lahendamist. Näiteks näitas GSM8K võrdlusmõõdustiku matemaatika andmestiku testimine murettekitavat 65% täpsuse langust väikeste muutuste korral. Need teadlikkused viitavad sellele, et kuigi tehisintellekti süsteemid võivad tunduda osavad, ebaõnnestuvad nad sageli oma väljaõppe kontekstist väljaspool, tekitades muresid nende usaldusväärsuse üle uudiste genereerimisel. Apple'i valik jätkata oma tehisintellekti pingutusi vaatamata nendele piirangutele peegeldab tööstuse laiemat suundumust, kus ettevõtted sageli võtavad kasutusele defektehnoloogiad, ilma et nad nõuetekohaselt käsitleksid põhiküsimusi, mis toob kaasa laiemad mured tehisintellekti rakenduste usaldusväärsuse üle.

Ja nad läksid ikkagi edasi ja vabastasid selle. Uudiste värskendus, sõber Apple'i viimane seiklus tehisintellekti vallas, nimega Apple Intelligence, on olnud peamiselt pettumust valmistav. Eriti on tema uudiste kokkuvõtted saanud märkimisväärset kriitikat pealkirjade valesti käsitlemise ja ebatäpsete andmete esitamise tõttu, sundides Apple'it kogu programmi sel nädalal peatama vajalike paranduste tegemiseks. Midagi siin ei ole eriti üllatav. Probleemid nagu AI "hallutsinatsioonid" on tuntud väljakutse kõikide suurte keelemudelite jaoks ning see probleem jääb lahendamata - kui seda üldse saab lahendada. Siiski näib AI mudeli lansseerimine olevat eriti hoolimatu, arvestades, et Apple'i insenerid olid eelnevalt välja toonud tehnoloogia tõsised puudused. See ettevaatus oli väljendatud uuringus, mis avaldati eelmisel oktoobril. Endiselt avaldamata uurimus, mis uuris mõnede juhtivate tööstuse LLM-ide matemaatilisi "järeldus" võimeid, aitas mõista, et need mudelid ei mõtle tõeliselt. "Vastupidi, " märkisid teadlased, "püüavad nad järeldusprotsesse, mis esinevad nende koolitusandmetes, jäljendada. " Matemaatika väljakutsed Tehisintellekti mudelite hindamiseks palusid teadlased neil lahendada tuhandeid matemaatika probleeme laialdaselt kasutatavas GSM8K standardkomplekti andmestikus. Lihtne küsimus võiks olla: "James ostab 5 pakki veiseliha, mis kaalub 4 naela igaüks. Veiseliha hind on 5, 50 dollarit naela kohta.

Kui palju raha ta kulutas?" Mõned küsimused olid veidi keerukamad, kuid siiski haldavad arvestatava haridustasemega põhikooliõpilase jaoks. Teadlased tõid esile AI mudelite puudujäägid tähelepanuväärse lihtsuse kaudu: nad muutsid lihtsalt küsimustes numbreid. See lähenemine vähendab andmete saastumise riski - see tähendab, et AI-d ei olnud selliste spetsiifiliste probleemidega varem koolitusandmetes kokku puutunud - samas mitte suurendades probleemide raskust. See kohandamine üksi põhjustas kergelt, kuid märkimisväärselt täpsuse languse kõigi 20 testitud LLM-i puhul. Kuid kui teadlased oma meetodit tõhustasid, muutes ka nimesid ja lisades ebaolulisi üksikasju - nagu täpsustamine, et käputäis puuvilju oli "tavapärasest väiksem" - oli tulemus langus, mis teadlaste sõnul oli "katastroofiline", ulatudes koguni 65 protsendini. Tulemused erinevad mudelite vahel, kuid isegi kõige arenenum, OpenAI o1-preview, koges 17, 5 protsendilist langust, samas kui tema eelkäija GPT-4o langes 32 protsenti. Musterteadmise õppimine Tagajärjed on selged. "See paljastab olulise puuduse mudelite võimes tuvastada asjakohast teavet probleemide lahendamiseks, tõenäoliselt seetõttu, et nende järeldamine pole formaalselt struktureeritud traditsioonilises mõttes, vaid põhineb peamiselt mustritunnustamisel, " väitsid teadlased. Lihtsamalt öeldes, AI paistab olevat intelligentne ja sageli annab õigeid vastuseid!Kuid kui tal ei õnnestu reprodutseerida spetsiifilisi andmeid, eksib ta oluliselt. Võiksite arvata, et sellised leiud peaksid tekitama tõsiseid kahtlusi AI mudeli usaldusväärsuses pealkirjade genereerimisel - sõnade ümberkorraldamisel, ilma et tõeliselt mõistetaks, kuidas see tervikukurssi muudab - kuid tundub, et see nii ei ole. Apple oli teadlik kriitilistest probleemidest, mis on püsivalt olnud kõikide LLM-ide puhul, ja käivitas oma mudeli hoolimata sellest. Tõsi, see on muutunud standardpraktikaks kogu AI tööstuses. Rohkem AI-st: Häiriv uus idufirma kasutab AI agente, et uputada Reddit reklaampostitustega klientide toodete jaoks.

News source

Watch video about

Apple'i tehisintellekti lansseerimine saab tagasilööke täpsuse probleemide tõttu.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Apple'i tehisintellekti lansseerimine saab tagasilööke täpsuse probleemide tõttu.

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Kuidas tehisintellekt muudab personaalset videomarketingut revolutsiooniliseks

1mind tõstab 30 miljoni dollari suuruse Series A investeeringu tehisintellekti põhineva müügisaadiku Mindy jaoks, mis muudab sissehõlvatud müüki

Tehisintellekti vs Inimese Sooritusevõime Sotsiaalmeedia Turunduses: Ülevaade Paljastab Põhjuslikud Sünkroniseeringu Puudujäägid

The Best for your Business

Hot news

Tehisintellekt videosises turunduses: sisu person…

6sense’i asutaja Amanda Kahlow kogus 30 miljonit …

Tehisintellekti loodud sisu sotsiaalmeedia turund…

Tehisintellekti toel põhinev SEO: digitaalse turu…

Jeff Bezos juhib uut inseneripõhist tehisintellek…

Anthropic tegi suurema avalduse, mis võib kujunda…

Kas BigBear.ai võiks saada järgmiseks Palantir Te…

AI Company

Sales

Marketing

Apple'i tehisintellekti lansseerimine saab tagasilööke täpsuse probleemide tõttu.

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Kuidas tehisintellekt muudab personaalset videomarketingut revolutsiooniliseks

1mind tõstab 30 miljoni dollari suuruse Series A investeeringu tehisintellekti põhineva müügisaadiku Mindy jaoks, mis muudab sissehõlvatud müüki

Tehisintellekti vs Inimese Sooritusevõime Sotsiaalmeedia Turunduses: Ülevaade Paljastab Põhjuslikud Sünkroniseeringu Puudujäägid

The Best for your Business

Hot news

Tehisintellekt videosises turunduses: sisu person…

6sense’i asutaja Amanda Kahlow kogus 30 miljonit …

Tehisintellekti loodud sisu sotsiaalmeedia turund…

Tehisintellekti toel põhinev SEO: digitaalse turu…

Jeff Bezos juhib uut inseneripõhist tehisintellek…

Anthropic tegi suurema avalduse, mis võib kujunda…

Kas BigBear.ai võiks saada järgmiseks Palantir Te…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?