lang icon En
March 14, 2025, 10:20 a.m.
1983

კვლევა ავლენს უზუსტობის პრობლემებს AI ახალი ამბების ძიების საშუალებების გამოყენებაში

Brief news summary

კომპანიის Tow Center for Digital Journalism-ის უახლესი კვლევა, რომელიც გაშუქებულია Columbia Journalism Review-ის მიერ, საჯარო მოსმენებისათვის გამოყენებული გენერატიული ხელოვნური ინტელექტის ინსტრუმენტების ძირითადი სიზუსტის პრობლემებზე ავლენს ინფორმაციას. მკვლევარებმა გაანალიზეს რვა AI სისტემის მუშაობა და დაადგინეს, რომ სარეზერვოqueries-ის შემთხვევაში 60%-ზე მეტი ინფორმაციის არასწორი პასუხი მიადგა, მიუხედავად იმისა, რომ ამერიკელების დაახლოებით 25%-ს აცნობიერებს, რომ ეს AI ინსტრუმენტები სჯობია ტრადიციულ ძიების სისტემებს. შეცდომების სიხშირე მნიშვნელოვნად განსხვავდებოდა, კერძოდ Perplexity-ს 37%-ით, ChatGPT Search-ის 67%-ით და Grok 3-ს 94%-ით საშიშროებით. 1,600 queries-ის ანალიზით, კვლევა აჩვენებს, რომ AI ინსტრუმენტები ხშირად აწვდიდნენ შეესაბამე, მაგრამ არასწორ ინფორმაციას, თუნდაც შეზღუდული ტრენინგით. განსაკუთრებული ყურადღება მიექცა იმას, რომ ზოგიერთ პრემიუმ სერვის, როგორიცაა Grok 3, უფრო ცუდი შედეგი მოიტანა, ვიდრე უფასო ალტერნატივებმა. სხვა შეშფოთებები მოიცავდა Robot Exclusion Protocols-ის შეუსრულებლობას, გადახდილი შინაარსზე უფლებების დარღვევას და შეამჩნეულ წყაროებზე დამოკიდებულებას, რაც ცალყოვლივი ბმულების გაწყვეტას იწვევდა. ეს პრობლემები მნიშვნელოვან გამოწვევებს წარმოადგენენ გამომცემლებისათვის, რომლებიც იყენებენ უფასო AI ინსტრუმენტებს. მიუხედავად იმისა, რომ OpenAI და Microsoft აღიარეს კვლევის შედეგები, ისინი კონკრეტულად არ უპასუხეს გამოკვეთილ პრობლემებზე. დამატებითი ინფორმაციისათვის, მოიხსენიო Columbia Journalism Review-ის ვებსაიტი.

კოლუმბიის ჟურნალისტიკის მიმოხილვის ციფრული ჟურნალისტიკის Tow Center-ის მიერ ჩატარებულიRecent study ერთი უახლესი კვლევა აჩვენებს მნიშვნელოვნად გადახედილი ზუსტი პრობლემების შესახებ, რომლებიც დაკავშირებულია გენერაციული AI მოდელების გამოყენებასთან, რომლებიც გამოიყენება news searches. AI მართვადი ძიების 8 ხელსაწყოს ტესტირებისას, მკვლევარებმა აღმოაჩინეს, რომ 60%-ზე მეტი_QUERY_ები უქმნის არასწორ ინფორმაციას ახალი წყაროების შესახებ. დაახლოებით 25% ამერიკელების ამჟამად იყენებს ამ AI მოდელებს ტრადიციული ძიების ძრავების ნაცვლად, რაც აფრთხილებს მათი საიმედოობის შესახებ. შეცდომების გამოსახულებები სხვადასხვა ხელსაწყოებში განსხვავებულად იყო. თუნდაც Perplexity-მა შეცდომები ჩაატარა 37%-ში _QUERY_ები, მაშინ როცა ChatGPT Search-მა 67%-იანი შეცდომების მაჩვენებელი ჰქონდა (134 200 _QUERY_იდან). Grok 3-ს ყველაზე მაღალი ჰქონდა - 94%. ტესტების ჩატარების მიზნით, მკვლევარებმა მიაწვდეს პირდაპირი ციტატები რეალური ახალი სტატიებიდან და სთხოვეს AI ხელსაწყოებს, რომ მოიძიონ შესაბამისი დეტალები, როგორიცაა სათაურები, გამომცემლები, თარიღები და URL-ები, რაც საერთო ჯამში 1600 _QUERY_ა შეადგინა. ერთ-ერთი შეშფოთება იმავე ხასიათის ნიმუშების გაზრდილი იყო, რაც იმაზე მიუთითებს, რომ როდესაც ისინი გაწვდილი არიან პასუხებზე, რომლებიც არ არიან დარწმუნებულნი, მოდელი ხშირად სთავაზობდა დამაჯერებელი, მაგრამ შეცდომით პასუხებს, რაც თანმიმდევრულად მოხდა ყველა გამოსატარებელ ხელსაწყოში. ამ AI ხელსაწყოების პრემიუმ ვერსიები, როგორიცაა Perplexity Pro ($20/თვეში) და Grok 3-ის პრემიუმ სერვისი ($40/თვეში), ზოგჯერ უფრო ცუდად მუშაობდნენ, რადგან ისინი ხშირად მიაწვდებდნენ არასწორ პასუხებს, მიუხედავად ამისა, რომ მეტი შემცველი კითხვები სწორად გაებედათ. მათი არათანხმების პასუხების tendency contributed to higher overall error rates. კვლევამ ასევე დააყენა საკითხები გამომცემლების კონტროლის მიმართ მათი შინაარსზე.

ზოგიერთი AI ხელსაწყოები იგნორირებდა Robot Exclusion Protocols-ის შესახებ, რომელიც უნდა განკარგოს არაუფლებანი წვდომა გარკვეულ შინაარსზე. მაგალითად, Perplexity-ის უფასო ვერსია ციტირებდა ანგარიშებს National Geographic-ის paywalled სტატიებიდან, მიუხედავად იმისა, რომ წვდომა აშკარად არ იყო ნებადართული. გარდა ამისა, როდესაც AI ხელსაწყოები ნამდვილად მოიხსენიებდნენ წყაროებს, ისინი ხშირად უკავშირდებოდნენ საინფორმაციო შინაარსს საიტებზე, როგორიცაა Yahoo News, ნაცვლად იმისა, რომ სამართლებრივი გამომცემლების ლინკებზე. მნიშვნელოვანი პრობლემა გაჩნდა URL-ს შექმნის დროს - Google-ის Gemini და Grok 3-ის თითქმის ნახევარი ციტირება გამოიწვია დამტვირთული ან არარსებული გვერდებზე, Grok 3-ს ჰქონდა 200 ციტირების 154 შედეგი შეცდომის გვერდებზე. ეს მდგომარეობა გამომცემლებს რთულ მდგომარეობაში აყენებს: AI კრულერები დაბლოკვა შეიძლება გააქრობს მიწერას, მაშინ როდესაც წვდომის დაშვება უწყობს შინაარსის ხელახალ გამოყენებას, რაც ორიგინალური საიტების სასარგებლოდ არ არის. Time magazine-ის COO, მარკ ჰოვარდმა გამოთქვა შეშფოთება გამჭვირვალობისა და კონტროლის სფეროში, მაგრამ ასევე იწინასწარმეტყველა განვითარება, განაცხადებული რომ მიმდინარე AI ხელსაწყოები დადებითად განავითარება. ჰოვარდმა განსაკუთრებით გააკრიტიკა მომხმარებლები, რომლებიც მოითხოვდნენ სრულ ზუსტ პასუხებს უფასო AI სერვისებისგან, მითითება იყო, რომ სკეპტიციზმი საჭირო იყო. OpenAI და Microsoft-მა აღიარეს კვლევის შედეგები, მაგრამ არ უპასუხეს პირდაპირ აღნიშნულ პრობლემებზე. OpenAI-მ ხაზგასმით აღნიშნა თავისი ხელშეკრულებაზე მომხმარებლების მხარდაჭერისთვის, ხოლო Microsoft-ში თავდაცვის Robot Exclusion Protocols-ის დაცვას. ეს ანგარიში ეყრდნობა ნოემბრის 2024 წლის ადრეულ ინფორმაციას, რასაც მსგავსად იმყოფებოდა ChatGPT-ის ხელშეკრულებაში ახალი შინაარსის საკითხების შესახებ. დამატებითი დეტალებისთვის სრული ანგარიში ხელმისაწვდომია კოლუმბიის ჟურნალისტიკის მიმოხილვის ვებსაიტზე.


Watch video about

კვლევა ავლენს უზუსტობის პრობლემებს AI ახალი ამბების ძიების საშუალებების გამოყენებაში

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 20, 2025, 1:24 p.m.

5 საციფრო თვისება, რომელიც შესაძლოა დაანგრიოს ან …

ს概要ი და გადაწერა „ძმარს“ AI ტრანსფორმაციისა და ორგანიზაციული კულტურის შესახებ AI ტრანსფორმაცია ძირითადად კულტურული გამოწვევა წარმოადგენს, ვიდრე纯 ტექნოლოგიური

Dec. 20, 2025, 1:22 p.m.

AI გაყიდვების აგენტი: ყველაზე მომავალი გაყიდვების…

კომპანიების საბოლოო მიზანია გაყიდვების გაზრდა, მაგრამ მკაცრი კონკურენცია ამ მიზნის განსახორციელებაში ხელს უშლის.

Dec. 20, 2025, 1:19 p.m.

AI და SEO: სრულყოფილი შეხვედრა ზიდული ონლაინ ვიზუ…

მ Kunstი იArtificial და ინტელექტი (AI) საძიებო სისტემების ოპტიმიზაციაში (SEO) ფუნდამენტურად ცვლის იმ გზას, როგორითაც ინტერნეტბიზნესი ზრდის თავის ვიზიბილურობას და ორგანიზებულ ტრაფიკს იზიდავს.

Dec. 20, 2025, 1:15 p.m.

დისპლეიფის ტექნოლოგიების პროგრესი: გავლენა მედიის…

დინფეიქის ტექნოლოგიამ ბოლო დროს მნიშვნელოვან წინსვლებს მიაღწია, истеҳასა და პერსონაჟთა რეალისტურად კონტრზე ოსტატურად შეცვლილი ვიდეოები, რომლებმაც convincing მართლა რომ ვერ გახდება, რომ ისინი სინამდვილეში მანიპულირებიდან გამომდინარეობს, მოამზადა.

Dec. 20, 2025, 1:13 p.m.

ნავიდის ოپن სોર્સ ხელოვნური ინტელექტის განვითარება…

ნივდა გამოაცხადა თავისი ღია კოდის ინიციატივების მნიშვნელოვანი გაფართოება, რაც სიგნალია სტრატეგიული სიჩქარის გააქტიურებისა და ღია წყაროს ეკოსისტემის მხარდაჭერისა და განვითარებისთვის მაღალი პროდუქტივობის მომზადების გამოთვლაში (HPC) და ხელოვნური ინტელექტის სფეროში (AI).

Dec. 20, 2025, 9:38 a.m.

ნიუ-იორკის გუბერნატორი კეთი ჰოჩელი ხელს აწერს ფარ…

2025 წლის 19 დეკემბერს, ნიუ იორკის გამგებელი 컶ი ჰოჩული ხელი მოაწერა პასუხისმგებელი ხელოვნური ინტელექტის უსაფრთხოებისა და ეთიკის (RAISE) კანონს, რაც მნიშვნელოვანი ფურცლის დატოვება იყო განვითარების AI ტექნოლოგიების რეგულირებაში.

Dec. 20, 2025, 9:36 a.m.

სტრაიპმა გამოაცხადა Agentic Commerce Suite-ის გაშ…

Stripe, ქარაგმული ფინანსური სერვისების კომპანია, აწინაურა Agentic Commerce Suite-ს, ახალი გადაწყვეტა, რომელიც მიზნად ისახავს ბიზნესების შესაძლებლობას, გაყიდვები განახორციელონ მრავალი AI- აგენტის საშუალებით.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today