Feb. 11, 2025, 12:28 a.m.
2709

AI Asistentai neteisingai pateikia naujienas: BBC tyrimas atskleidžia faktines klaidas

Brief news summary

Neseniai atliktas BBC tyrimas atskleidė reikšmingų netikslumų populiariuose dirbtinio intelekto asistentuose, įskaitant ChatGPT, Copilot, Gemini ir Perplexity, ypač kalbant apie naujienas ir dabartinius įvykius. Analizė, pagrįsta 100 klausimų, susijusių su BBC straipsniais, parodė, kad daugiau nei pusėje jų buvo didelių klaidų, tokių kaip pasenusi politinė informacija, neteisingi medicininiai patarimai ir netiksliai cituoti teiginiai. Ypač pastebima, kad Gemini nesugebėjo pateikti svarbaus konteksto apie nuteistą slaugytoją Lucy Letby, o Copilot neteisingai interpretuodavo išžaginimų bylą. ChatGPT neteisingai teigė, kad Ismail Haniyeh buvo gyvas po nužudymo, o Perplexity klaidingai pranešė apie televizijos laidininko Michael Mosley mirties datą. Šie neraminantys atradimai privertė BBC News vadovę Deborah Turness išreikšti susirūpinimą dėl mažėjančio visuomenės pasitikėjimo naujienų tikslumu. Ji paragino dirbtinio intelekto kompanijas bendradarbiauti, siekiant pagerinti pateikiamos informacijos patikimumą, ypač aktualiomis temomis. AI kūrėjai buvo kreipti dėl jų atsakymų, kaip spręsti šiuos netikslumus.

Tyrimai parodė, kad didieji dirbtinio intelekto asistentai generuoja iškraipymus, faktines neteisybes ir klaidinančią informaciją, kai atsako į klausimus apie naujienas ir dabartinius įvykius. Pagal BBC atliktą tyrimą, daugiau nei pusė AI generuotų atsakymų iš ChatGPT, Copilot, Gemini ir Perplexity buvo vertinami kaip turintys „reikšmingų problemų“. Klaidų pavyzdžiai apėmė neteisingą teigimą, kad Rishi Sunak ir Nicola Sturgeon vis dar užima atitinkamas premjero ir pirmosios ministerės pareigas Škotijoje, neteisingą NHS gaires dėl vaping, ir nuomonių bei istorinio turinio painiojimasis su dabartiniais faktais. Tyrimo metu tyrėjai uždavė 100 klausimų šiems keturiems AI įrankiams, naudodami BBC straipsnius kaip nuorodas. BBC žurnalistai, turintys atitinkamų sričių ekspertizę, tada įvertino atsakymus. Apie 20% atsakymų turėjo faktinių klaidų, susijusių su skaičiais, datomis ar teiginiais, o 13% cituojamo medžiagos, priskiriamos BBC, buvo arba pakeista, arba neegzistavo originaliuose straipsniuose. Pavyzdžiui, kai paklausė apie nuteistos neonatologės sesers Lucy Letby nekaltumą, Gemini atsakė, kad „kiekvienas asmuo turi nuspręsti, ar tiki, kad Lucy Letby yra nekalta, ar kalta“, praleidžiant svarbų kontekstą dėl jos nužudymo ir bandymo nužudyti kaltinimų. Kitos ataskaitoje pabrėžtos neteisybes, remiantis patikimais BBC šaltiniais, apėmė: - Microsoft Copilot neteisingai teigė, kad Prancūzijos išprievartavimo auka Gisèle Pelicot atskleidė nusikaltimus, susijusius su ja, dėl sąmonės netekimo ir atminties praradimo, kai ji iš tikrųjų juos atrado per policijos vaizdo įrašus, paimtus iš jos vyro prietaisų. - ChatGPT neteisingai teigė, kad Ismail Haniyeh vis dar buvo Hamas lyderystėje mėnesiais po jo nužudymo Irane, ir klaidingai tvirtino, kad Sunak ir Sturgeon šiuo metu vykdo savo pareigas. - Gemini neteisingai pasakė: „NHS pataria žmonėms nepradėti vape, ir rekomenduoja, kad rūkantys, norintys mesti, naudotų kitus metodus. “ - Perplexity neteisingai pranešė apie TV laidininko Michael Mosley mirties datą ir neteisingai cituoja vienos krypties dainininko Liam Payne šeimos pareiškimą po jo mirties. Šie atradimai paskatino Deborah Turness, BBC naujienų generalinę direktorę, įspėti, kad „Gen AI įrankiai žaidžia su ugnimi“ ir rizikuoja pakenkti visuomenės „trapiai tikėjimui faktais. “ Tyrimo tinklaraščio įraše Turness abejojo AI gebėjimu tiksliai „gauti ir pateikti naujienas, nesuklastojant ir netiesioginant faktų. “ Ji taip pat ragino AI kompanijas bendradarbiauti su BBC, siekiant kurti patikimesnius atsakymus, o ne prisidėti prie painiavos. Šis tyrimas sekė po incidento, kai Apple turėjo sustabdyti BBC ženklu pažymėtus naujienų pranešimus po to, kai iPhone vartotojams buvo išsiųsta keletas neteisingų straipsnių santraukų. Tarp Apple netikslumų buvo teiginys, kad Luigi Mangione, kuris buvo apkaltintas Brian Thompson, UnitedHealthcare draudimo skyriaus generalinio direktoriaus, nužudymu, nusišovė. Tyrimas rodo, kad netikslumai apie dabartinius reikalus yra plačiai paplitę populiariuose AI įrankiuose. Tyrimo pratybose Peter Archer, BBC generatyvaus AI programų direktorius, pareiškė, „Mūsų tyrimas gali tik šiek tiek apčiuopti problemą.

Klaidingų turinio ir patikimo turinio iškraipymo mastas lieka nežinomas. “ Jis dar labiau pabrėžė, kad leidėjai, tokie kaip BBC, turi išlaikyti kontrolę, kaip jų turinys yra naudojamas, ir AI kompanijos turėtų paaiškinti, kaip jų įrankiai interpretuoja naujienas, kartu apžvelgdami klaidų pobūdį ir dažnumą, kurias jos generuoja. „Tai reikalauja stiprių bendradarbiavimų tarp AI ir žiniasklaidos organizacijų bei naujų operacinių požiūrių, kuriuose prioritetas bus teikiamas auditorijai, o visiems bus maksimaliai padidinta nauda. BBC yra pasiruošusi ir nori glaudžiai bendradarbiauti su partneriais, siekdama tai pasiekti. “ Tyrime įvertintų AI asistentų kompanijos buvo kontaktuotos dėl komentarų.


Watch video about

AI Asistentai neteisingai pateikia naujienas: BBC tyrimas atskleidžia faktines klaidas

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 15, 2025, 1:26 p.m.

Dirbtinis intelektas pagalba įvykdo rekordinius 3…

„Salesforce“ 2025 metų kibernetinės savaitės pirkimų laikotarpio analizė parodė rekordišką pasaulinę mažmeninės prekybos apyvartą – 336,6 milijardo dolerių, tai 7 % daugiau nei praėjusius metus.

Dec. 15, 2025, 1:24 p.m.

Dirvės dirbtinio intelekto išnykimo rizikos: Musk…

Greitas dirbtinio intelekto (DI) vystymasis sukėlė reikšmingą diskusiją ir susirūpinimą tarp ekspertų, ypač dėl jo ilgalaikio poveikio žmonijai.

Dec. 15, 2025, 1:21 p.m.

Patekite prieš Wall Street: Šis dirbtinio intelek…

Tai yra rėmimo turinys; Barchart necenzūruoja žemiau paminėtų svetainių ar produktų.

Dec. 15, 2025, 1:16 p.m.

„Google DeepMind“ AlphaCode: dirbtinis intelektas…

„Google DeepMind neseniai pristatė inovatyvią dirbtinio intelekto sistemą pavadinimu AlphaCode, žymią reikšmingą žingsnį dirbtinio intelekto ir programinės įrangos kūrimo srityje.

Dec. 15, 2025, 1:15 p.m.

Žinomi SEO paaiškina, kodėl dirbtinio intelekto a…

Aš atidžiai stebi agentiškos SEO atsiradimą, įsitikinęs, kad dėl technologijų pažangos per artimiausius kelerius metus agentai turės didžiulį poveikį pramonei.

Dec. 15, 2025, 1:10 p.m.

„Salesforce'o Peteris Lingtonas apie gynybos duom…

Peter Lingtonas, „Salesforce“ karo kareivio departamento „War“ viceprezidentas, pabrėžia, kokį transformacinį poveikį turės pažangios technologijos per artimiausius tris–penkerius metus karo departamento veiklai.

Dec. 15, 2025, 9:35 a.m.

„Sprout Social“ strateginė padėtis besikeičiančio…

Sprout Social tvirtai įsitvirtino kaip viena iš lyderių socialinės žiniasklaidos valdymo industrijoje, pasitelkdamas pažangią dirbtinio intelekto technologiją ir kurdamas strateginius partnerystės ryšius, skatinančius inovacijas ir gerinančius paslaugų pasiūlą.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today