lang icon En
March 14, 2025, 10:20 a.m.
2004

Rannsókn sýnir nákvæmnisvandamál með AI fréttaleitartólum

Brief news summary

Nýleg rannsókn frá Tow Center for Digital Journalism, sem farið var yfir í Columbia Journalism Review, afhjúpar alvarleg vandamál með nákvæmni hjá generative AI verkfærum sem notuð eru við fréttaleit. Rannsakendur skoðuðu átta AI kerfi og komust að því að yfir 60% fréttaleita skiluðu rangri upplýsingum, þrátt fyrir að um 25% Bandaríkjamanna kjósi þessar AI verkfæri frekar en hefðbundin leitarvél. Villuhraðinn var mjög breytilegur, þar sem Perplexity var 37%, ChatGPT Search 67%, og Grok 3 alvarlegt í 94%. Með því að rannsaka 1,600 fyrirspurnir sýndi rannsóknin að AI verkfæri veittu oft trúverðugar en rangar upplýsingar, jafnvel með takmarkaða þjálfun. Athyglisvert er að nokkur premium þjónusta, eins og Grok 3, kom verr út en ókeypis valkostir. Aðrar áhyggjur innihéldu vanefnd á Robot Exclusion Protocols, óheimilt aðgang að aðgangsgreiddum efni, og treyst á sameinaða heimildir sem leiddi til brotinna hlekka. Þessi vandamál eru stórar áskoranir fyrir útgefendur sem nota ókeypis AI verkfæri. Þó að OpenAI og Microsoft hafi viðurkennt niðurstöðurnar, svöruðu þeir ekki sérstaklega við ofangreindum vandamálum. Fyrir frekari upplýsingar, sjáðu vefsíðu Columbia Journalism Review.

Nýleg rannsókn frá Columbia Journalism Review's Tow Center for Digital Journalism leifar veruleg vandamál í nákvæmni sem tengjast generatífu AI módulunum sem notuð eru við fréttaleit. Í tilraun með átta AI-drifu leitarverkfæri kom í ljós að yfir 60% fyrirspurna leiddi til rangra upplýsinga um fréttagjafa. Um það bil 25% Bandaríkjamanna nota nú þessi AI módul í stað hefðbundinna leitarvéla, sem vekur áhyggjur um áreiðanleika þeirra. Villuhraðinn var mismunandi milli mismunandi verkfæra. Til dæmis gerði Perplexity mistök í 37% fyrirspurna, á meðan ChatGPT Search sýndi 67% villuhlutfall (134 af 200 fyrirspurnum). Grok 3 hafði hæsta villuhlutfallið, 94%. Til að framkvæma prófanirnar veittu rannsakendur beinar brot úr raunverulegum fréttagrein og báðu AI verkfærin um að greina samsvarandi upplýsingar eins og fyrirsagnir, útgefendur, dagsetningar og URL, samtals 1, 600 fyrirspurnir. Áhyggjufull þróun sem var athuguð var sú að í stað þess að neita að svara þegar ekki var víst, buðu módulurnar oft trúverðug en rangar svör, mynstrið var samræmt um öll verkfæri sem voru prófuð. Fjárhagslegar útgáfur þessa AI verkfæra, eins og Perplexity Pro ($20/mánuði) og premium þjónusta Grok 3 ($40/mánuði), sýndu stundum verra frammistöðu, þar sem þær veittu oft rangar svör þrátt fyrir að þú hönnuðust rétt við fleiri beiðnir. Tilhneiging þeirra til að bjóða óviss svör stuðlaði að hærri villuhlutfalli. Rannsóknin vakti einnig málefni varðandi stjórn útgefenda yfir efni þeirra.

Sum AI verkfæri höfðu enga aðgát fyrir Robot Exclusion Protocols sem áttu að fyrir byggja óheimil aðgengi að ákveðnu efni. Til dæmis greindi ókeypis útgáfan af Perplexity niðurstöður frá greinum í National Geographic þar sem aðgangur var sögð vera sérstaklega bönnuð. Auk þess, þegar AI verkfæri sögðu frá heimildum, tengdu þau oft við samkeyrð efni á vefum eins og Yahoo News í stað þess að vísa til upprunalegu útgefenda. Verulegt vandamál kom upp við sköpun URL – yfir helmingur tilvísana frá Google's Gemini og Grok 3 leiddi að brotnum eða óhentugum síðum, þar sem Grok 3 hafði 154 af 200 tilvísunum sem enduðu í villusíðum. Þessi staða setur útgefendur í erfiða stöðu: að loka fyrir AI krölum gæti eytt tilvísun, á meðan leyfa aðgang myndi auðvelda endurnotkun efnis án þess að upprunalegu síðurnar hagnist. Mark Howard, COO Tíma tímaritsins, tjáði áhyggjur sínar varðandi gegnsæi og stjórn, en lagði einnig til möguleika á umbótum, að núverandi AI verkfæri munu þróast jákvætt. Howard gagnrýndi beint notendur sem búast við fullkominni nákvæmni frá ókeypis AI þjónustu, þar sem hann lagði til að efasemdir séu nauðsynlegar. OpenAI og Microsoft viðurkenndu niðurstöður rannsóknarinnar en svöruðu ekki beint þeim málefnum sem reistu voru. OpenAI lagði áherslu á skuldbindingu sína við að styðja útgefendur, á meðan Microsoft fullyrti að frama væri öllum Robot Exclusion Protocols. Þetta skýrslugerð byggir á fyrri niðurstöðum frá nóvember 2024, sem þótti einnig undirstrika nákvæmnivandamál við meðhöndlun ChatGPT á fréttaefni. Fyrir frekari upplýsingar er full skýrsla aðgengileg á vefsíðu Columbia Journalism Review.


Watch video about

Rannsókn sýnir nákvæmnisvandamál með AI fréttaleitartólum

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 1:26 p.m.

15 leiðir hvernig sala hefur þá breytingu á þessu…

Á síðasta 18 mánuði hefur Team SaaStr sótt sig í gervigreind og sölu, með miklum hröðun frá og með júní 2025.

Dec. 23, 2025, 1:23 p.m.

OpenAI's GPT-5: Hvað Við Vitum Að svo Leyti

OpenAI er að undirbúa losun GPT-5, næstu stóru framför í röð stórra tungumála-kerfa, með væntanlegri útgáfu snemma árs 2026.

Dec. 23, 2025, 1:20 p.m.

Gervigreind í leitarvélabestun: Umbreyting á efni…

Gervigreind (GV) er hratt að breyta sviði efnisframleiðslu og hagræðingar innan leitarvélabúnaðar (SEO).

Dec. 23, 2025, 1:20 p.m.

Lausnir ímyndunar- og myndbandsráðstefnur á vélme…

Vöðvin til fjarlægðarvinnu hefur bent á mikilvægi skilvirkra samskiptatækja, sem leiddi til þróunar á gervigreindarstuddum myndfundarbúnaði sem gerir kleift að vinna saman á sæknan hátt á milli staða.

Dec. 23, 2025, 1:17 p.m.

Móðurmarkaður fyrir AI í læknisfræði, stærð, hlut…

Yfirlit Alþjóðamarkaður fyrir gervigreind í læknisfræði er áætlaður ná að 156,8 milljörðum USD árið 2033, frá 13,7 milljörðum USD árið 2023, með vexti á öruggum CAGR upp í 27,6% frá 2024 til 2033

Dec. 23, 2025, 9:30 a.m.

Google’s Danny Sullivan og John Mueller um leitar…

John Mueller frá Google hélt Danny Sullivan, einnig frá Google, á Search Off the Record podcasti til að ræða „Hugmyndir um SEO og SEO fyrir Gervigreind

Dec. 23, 2025, 9:26 a.m.

Lexus prófar generatíva gervigreind í nýju skemmt…

Yfirlit: Lexus hefur sett fram jólajarbók Viðskiptamerki sem byggir á gervigreind, samkvæmt fréttatilkynningu

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today