lang icon En
Feb. 11, 2025, 6:50 a.m.
1742

Tyrimas atskleidžia, kad AI pokalbių robotai neteisingai interpretuoja naujienų istorijas: BBC tyrimas.

Brief news summary

BBC tyrimas atskleidė reikšmingų netikslumų naujienų santraukose, kurias sukūrė pirmaujančios AI pokalbių programos, įskaitant OpenAI ChatGPT, Microsoft Copilot, Google Gemini ir Perplexity AI. Tyrimas parodė, kad daugiau nei 50% šių santraukų turėjo reikšmingų klaidų, iš kurių 19% buvo rimtų faktinių netikslumų, tokių kaip neteisingos datos ir klaidingi statistiniai duomenys. Deborah Turness, BBC News generalinė direktorė, išreiškė susirūpinimą dėl galimų dezinformacijos rizikų ir ragino technologijų įmones bendradarbiauti kuriant efektyvius sprendimus. Po laikotarpio, kai buvo apribota prieiga prie savo turinio, BBC gruodžio mėnesį pradėjo testavimo etapą 2024 m. Nustatyti netikslumai apėmė klaidingus teiginius apie viešus asmenis ir elektroninių cigarečių taisykles. Tyrimo rezultatai atskleidė, kad šios AI sistemos dažnai painioja nuomonę su faktu ir dažnai trūksta esminio konteksto. BBC Generatyviosios AI programų direktorius pabrėžė, kad leidėjams būtina išlaikyti kontrolę virš savo turinio, ir ragino AI kūrėjus didinti skaidrumą, kalbant apie naujienų apdorojimo ir dezinformacijos sprendimo metodus.

Neseniai BBC atliktas tyrimas atskleidžia, kad keturi žinomi dirbtinio intelekto (DI) pokalbių robotai klaidingai interpretuoja naujienų istorijas. Tyrimas buvo orientuotas į OpenAI ChatGPT, Microsoft Copilot, Google Gemini ir Perplexity AI, kurie gavo turinį iš BBC svetainės ir buvo paprašyti atsakyti į su naujienomis susijusius klausimus. Pasak tyrimo rezultatų, šių pokalbių robotų pateikti atsakymai turėjo "signifikantų netikslumą" ir klaidingą interpretaciją. Deborah Turness, BBC News ir Current Affairs generalinė direktorė, savo tinklaraščio įraše pažymėjo, kad nors DI siūlo "be galo daug galimybių", šias technologijas kuriantys kompanijos "žaidžia su ugnimi". Ji išreiškė susirūpinimą dėl galimų pavojų, susijusių su AI generuotais antraštėmis, abejodama, kiek laiko gali praeiti, kol tokie iškraipymai sukels rimtų realių pasekmių. Technologijų kompanijos, atsakingos už pokalbių robotus, buvo pakviestos komentuoti situaciją. Tyrime buvo prašoma ChatGPT, Copilot, Gemini ir Perplexity apibendrinti 100 naujienų straipsnių ir buvo vertinami jų atsakymai.

Žurnalistai, turintys atitinkamą kompetenciją, įvertino AI sistemų teikiamų atsakymų kokybę. Rezultatai parodė, kad 51% AI generuotų atsakymų turėjo reikšmingų problemų. Be to, 19% atsakymų, kuriose minimas BBC turinys, turėjo faktinių klaidų, kurios svyravo nuo neteisingų teiginių iki klaidingų skaitmenų ir datų. Savo tinklaraštyje ponia Turness pabrėžė bendradarbiavimo tarp BBC ir DI technologijų teikėjų būtinybę sprendžiant šias problemas. Ji ragino technologijų kompanijas "sustoti" su savo DI generuotomis naujienų santraukų, panašiai kaip Apple elgėsi po BBC skundų dėl neteisingų Apple Intelligence naujienų interpretacijų. Keletas konkrečių netikslumų, kuriuos išskyrė BBC, apėmė: - Gemini klaidingai teigė, kad NHS nerekomenduoja vartoti elektroninių cigarečių (vaping) mesti rūkyti. - ChatGPT ir Copilot neteisingai pareiškė, kad Rishi Sunak ir Nicola Sturgeon vis dar yra pareigose, nepaisant jų atsistatydinimo. - Perplexity klaidingai priskyrė citatą iš BBC News apie Artimuosius Rytus, neteisingai apibūdindamas Irano reakciją kaip "susiaurėjusią", tuo tarpu Izraelio veiksmus pavadindamas "agresyviais". Iš viso Microsoft's Copilot ir Google's Gemini pateikė daugiau reikšmingų problemų, palyginti su OpenAI's ChatGPT ir Perplexity, už kurio stovi Jeffas Bezosas. Tradiciškai BBC riboja savo turinį pokalbių robotams, tačiau leido prieigą per bandymus, vykdytus 2024 metų gruodį. Ataskaitoje nurodyta, kad be faktinių netikslumų, pokalbių robotai dažnai nesugebėjo atskirti nuomonės nuo fakto, dažnai tendencingai redagavo ir dažnai trūko kritinio konteksto. Pete Archer, BBC programos direktorė generatyviam DI, pareiškė, kad leidėjai turėtų išlaikyti kontrolę, kaip jų turinys yra naudojamas, ir DI kompanijos privalo parodyti skaidrumą, kaip jų sistemos apdoroja naujienas ir kokio masto klaidų jos generuoja.


Watch video about

Tyrimas atskleidžia, kad AI pokalbių robotai neteisingai interpretuoja naujienų istorijas: BBC tyrimas.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 9:37 a.m.

Kodėl 2026-ieji galėtų būti anti-AI marketingo me…

Versija šios istorijos pasirodė CNN Business vakaro naujienlaiškio Nightcap leidinyje.

Dec. 16, 2025, 9:29 a.m.

Dirbtinio intelekto valdomas SEO: žaidimų keitikl…

Šiandien sparčiai besivystančioje skaitmeninėje rinkoje mažosios įmonės dažnai susiduria su konkurencijos iššūkiais didesnių įmonių, nes jos naudoja didelius išteklius ir pažangias technologijas internetiniam matomumui didinti bei klientų pritraukimui.

Dec. 16, 2025, 9:28 a.m.

Nvidia įsigyja SchedMD, siekdama stiprinti atviro…

Nvidia, pasaulinis grafikos apdorojimo technologijos ir dirbtinio intelekto lyderis, pranešė apie SchedMD įsigijimą – programinės įrangos įmonės, specializuojančios dirbtinio intelekto programinės įrangos sprendimuose.

Dec. 16, 2025, 9:22 a.m.

Verslo lyderiai sutinka, kad dirbtinis intelektas…

Verslo lyderiai įvairiose industrijose toliau žvelgia į generatyviąją dirbtinį intelektą (DI) kaip transformacinę jėgą, galinčią perkurti veiklą, klientų įtraukimą ir strateginius sprendimus.

Dec. 16, 2025, 9:20 a.m.

Dirbtinio intelekto panaudojimas vaizdo konferenc…

Šiandienos sparčiai besikeičiančioje nuotolinio darbo ir virtualios komunikacijos aplinkoje vaizdo konferencijų platformos žymiai tobulėja, įtraukdamos sudėtingas dirbtinio intelekto (DI) funkcijas.

Dec. 16, 2025, 9:19 a.m.

IOC integruoja pažangias dirbtinio intelekto tech…

Tarptautinis olimpinis komitetas (TOK) planuoja diegti pažangias dirbtinio intelekto (DI) technologijas būsimuose Olimpinėse žaidynėse, siekdamas pagerinti operatyvumą ir gerinti žiūrovų patirtį.

Dec. 16, 2025, 5:43 a.m.

Zeta Global (NYSE: ZETA) pristato Athena AI rinko…

Zeta Global Skelbia Ekskluzyvų CES 2026 Programavimą, Parodantį Dirbtinio Intelekto Valdomą Marketingą ir Athena Evoliuciją 2025 m

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today