lang icon En
Feb. 11, 2025, 6:50 a.m.
1754

Štúdia odhaľuje, že AI chatboty nesprávne interpretujú správy: Vyšetrovanie BBC

Brief news summary

Štúdia BBC odhalila významné nepresnosti v súhrnoch správ vytvorených poprednými AI chatbotmi, vrátane ChatGPT od OpenAI, Copilota od Microsoftu, Geminija od Googlu a Perplexity AI. Výskum zistil, že viac ako 50 % týchto súhrnov obsahovalo významné chyby, pričom 19 % malo vážne faktické nepresnosti, ako napríklad nesprávne dátumy a zavádzajúce štatistiky. Deborah Turness, generálna riaditeľka BBC News, vyjadrila obavy z potenciálnych rizík dezinformácií a vyzvala technologické spoločnosti, aby spoločne vyvinuli účinné riešenia. Po období obmedzenia prístupu AI k jej obsahu začala BBC v decembri 2024 testovaciu fázu. Medzi zistenými nepresnosťami boli zavádzajúce vyjadrenia týkajúce sa verejných postáv a regulácií týkajúcich sa vapovania. Zistenia ukázali, že tieto AI systémy často zamieňajú názor s faktom a často im chýba základný kontext. Programový riaditeľ BBC pre generatívnu AI vyzdvihol nevyhnutnosť, aby vydavatelia udržali kontrolu nad svojím obsahom, a požiadal o väčšiu transparentnosť od vývojárov AI, pokiaľ ide o ich metódy spracovania správ a riešenia dezinformácií.

Nedávna štúdia, ktorú vykonala BBC, odhaľuje, že štyri významné chatboty umelej inteligencie (AI) nesprávne interpretujú správy. Výskum sa zameral na ChatGPT od OpenAI, Copilot od Microsoftu, Gemini od Googlu a Perplexity AI, ktoré dostali obsah z webovej stránky BBC a boli požiadané, aby reagovali na otázky súvisiace so správami. Podľa zistení obsahovali odpovede týchto chatbotov „významné nepresnosti“ a dezinformácie. Deborah Turness, generálna riaditeľka BBC News a Current Affairs, upozornila vo svojom blogu, že zatiaľ čo AI predstavuje „nekonečné príležitosti“, spoločnosti, ktoré tieto technológie vyvíjajú, „hrajú sa s ohňom“. Vyjadrila obavy o potenciálne nebezpečenstvá titulkov generovaných AI a pýtala sa, ako dlho by mohlo trvať, kým takéto skreslenia povedú k vážnym následkom v reálnom svete. Technologické spoločnosti zodpovedné za chatboty boli kontaktované pre ich reakcie. Štúdia sa zamerala na to, aby ChatGPT, Copilot, Gemini a Perplexity zhrnuli 100 spravodajských článkov a vyhodnotili ich odpovede.

Novinári so znalosťou danej problematiky hodnotili kvalitu odpovedí AI systémov. Výsledky ukázali, že 51% odpovedí generovaných AI obsahovalo významné problémy. Navyše, 19% odpovedí, ktoré sa týkali obsahu BBC, obsahovalo faktické chyby, medzi ktoré patrili nepresné vyhlásenia a chybné čísla a dátumy. Vo svojom blogu zdôraznila pani Turness potrebu spolupráce medzi BBC a poskytovateľmi AI technológií na riešení týchto výziev. Vyjadrila výzvu technologickým spoločnostiam, aby „ustúpili“ od svojich zhrnutí správ generovaných AI, podobne ako to urobil Apple po sťažnostiach BBC týkajúcich sa nesprávnych reprezentácií správ zo strany Apple Intelligence. Niekoľko konkrétnych nepresností, na ktoré poukázala BBC, zahŕňalo: - Gemini omylom uviedlo, že NHS neodporúča vaping na odvykanie od fajčenia. - ChatGPT a Copilot chybne tvrdili, že Rishi Sunak a Nicola Sturgeon sú stále vo funkcii, napriek ich odchodu. - Perplexity mylne pripísal citát z BBC News týkajúci sa Blízkeho východu a nesprávne opísal reakciu Iránu ako „umiernenú“, pričom označil činy Izraela za „agresívne“. Celkovo sa u Microsoftoveho Copilota a Googlovho Geminia vyskytlo viac významných problémov v porovnaní s ChatGPT od OpenAI a Perplexity, ktoré je podporované Jeffom Bezosom. Tradične BBC obmedzuje svoj obsah pre AI chatboty, ale počas testovania v decembri 2024 povolila prístup. Správa naznačila, že okrem faktických nepresností mali chatboty často problémy rozlíšiť medzi názormi a faktami, tendenciu k redakčnému prístupu a často im chýbal kritický kontext. Pete Archer, riaditeľ programu BBC pre generatívnu AI, uviedol, že vydavatelia by mali mať kontrolu nad tým, ako je ich obsah využívaný, a spoločnosti AI musia preukázať transparentnosť ohľadom toho, ako ich systémy spracovávajú správy a aký rozsah chýb generujú.


Watch video about

Štúdia odhaľuje, že AI chatboty nesprávne interpretujú správy: Vyšetrovanie BBC

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 1:29 p.m.

SaaStr AI aplikácia týždňa: Kintsugi – AI, ktorá …

Každý týždeň predstavujeme aplikáciu poháňanú umelou inteligenciou, ktorá rieši skutočné problémy pre B2B a cloudové spoločnosti.

Dec. 16, 2025, 1:24 p.m.

Úloha umelej intelligencie v stratégiách lokálneh…

Umelá inteligencia (AI) čoraz viac ovplyvňuje stratégie miestneho optimalizácie pre vyhľadávače (SEO).

Dec. 16, 2025, 1:22 p.m.

IND Technology získava 33 miliónov dolárov na pre…

IND Technology, austrálska spoločnosť špecializujúca sa na monitorovanie infraštruktúry pre verejné služby, získala 33 miliónov dolárov na rastové financovanie na podporu svojich aktivít založených na umelej inteligencii pre predchádzanie lesným požiarom a výpadkom elektrickej energie.

Dec. 16, 2025, 1:21 p.m.

Uvoľňovanie AI je pre vydavateľov a značky nepreh…

V posledných týždňoch čoraz viac vydavateľov a značiek čelí výraznej verejnej kritike, keď experimentujú s umelou inteligenciou (AI) v procesoch tvorby obsahu.

Dec. 16, 2025, 1:17 p.m.

Google Labs a DeepMind spúšťajú Pomelli: nástroj …

Google Labs v spolupráci s Google DeepMind predstavil Pomelli, experiment s umelou inteligenciou navrhnutý na pomoc malým a stredným podnikom pri vytváraní marketingových kampaní v súlade s ich značkou.

Dec. 16, 2025, 1:15 p.m.

Umelá inteligencia na rozpoznávanie videí zlepšuj…

V dnešnej rýchlo rastúcej digitálnej krajine spoločnosti spravujúce sociálne siete čoraz viac prijímajú pokročilé technológie na ochranu svojich online komunít.

Dec. 16, 2025, 9:37 a.m.

Prečo by mohol byť rok 2026 rokom anti-AI marketi…

Verzia tejto histórie sa objavila v newsletteri Nightcap od CNN Business.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today