lang icon English
Sept. 25, 2024, 7:19 a.m.
1910

კვლევა აჩვენებს, რომ AI ჩათბოტები ხშირად მიაწოდებენ არასწორ პასუხებს

Brief news summary

კვლევა, გამოქვეყნებული *Nature*-ში ხოსე ერნანდეს-ორალოს მიერ ვალენსიის ხელოვნური ინტელექტის კვლევითი ინსტიტუტიდან, იკვლევს გაუმჯობესებული AI ჩათბოტების შესრულებას, მათ შორის OpenAI-ის GPT, Meta-ს LLaMA და BigScience-ს BLOOM. კვლევა ნათლად აჩვენებს მნიშვნელოვან საკითხს: 60%-ზე მეტი შესწავლილი პასუხებიდან აღმოჩნდა რომ არასწორი ან არაზუსტი იყო, რაც აწუხებს მომხმარებელთა გაგებას AI შესაძლებლობების შესახებ. კვლევა მოიცავდა ათასობით თხოვნის მისამართზე ანალიზის დეტალურ შეფასებას და გამოვლინდა, რომ მოდელები როგორიცაა GPT-4 ხშირად ცდილობენ პასუხების გაცემას რთულ კითხვებზე, რის გამოც იზრდება შეცდომების ალბათობა და მომხმარებლების შეცდომით ნდობა ამ შეცდომილ პასუხებში. ერნანდეს-ორალო გირჩევ, რომ AI დეველოპერებმა პრიორიტიზაცია მისცენ სიზუსტე მარტივ კითხვებზე და განსწავლონ მოდელები, რომ თავი არიდონ გადაჭარბებით რთულ კითხვებზე პასუხების გაცემას. მიუხედავად იმისა, რომ ზოგიერთი AI მოდელი აღიარებს არასაკმარისი ცოდნის მდგომარეობას გამომეტყველებებით, როგორიცაა "მე არ ვიცი," ისინი ხშირად მოგვიწოდებენ არასწორ პასუხებს დარწმუნებით, რაც შეიძლება მომხმარებლები შეხედონ AI სისტემების საიმედოობაზე მეტად.

კვლევა სამ პოპულარულ ხელოვნური ინტელექტის ჩათბოტის გაუარესებული ვერსიების შესახებ აჩვენებს, რომ ისინი უფრო ხშირად აჩენენ არასწორ პასუხებს, ვიდრე აღიარებენ, როცა არ იციან რაღაც. კვლევა, რომელსაც ხელმძღვანელობს ხოსე ერნანდეს-ორალო ვალენსიის ხელოვნური ინტელექტის კვლევითი ინსტიტუტიდან, ანალიზირებს მოცულობითი ენის მოდელების (LLMs) შეცდომებს, აღნიშნავს, რომ როცა მოდელების რომელიმე ვერსია და დახვეწა ხდება უფრო ზუსტი, არასწორი პასუხების რაოდენობაც იზრდება. ნაცვლად რომ ტოვებენ რთულ კითხვებს, ეს მოდელები ხშირად აჩენენ პასუხებს, რაც იწვევს შეცდომილ ინფორმაციის რაოდენობის გაზრდას. ერნანდეს-ორალო აღნიშნავს, რომ ჩათბოტები უფრო მეტად ქრებიან ცოდნის ნიღბად, რეალური გაგების გარეშე, ეს ფენომენი ცნობილია როგორც "ულტრაკრეპიდარიანიზმი". ეს შეიძლება მომხმარებლებს აწუხებდეს ჩათბოტების შესაძლებლობების ზედმეტად შეფასებაში, რაც რისკებს წარმოადგენს. გუნდი შეისწავლა მოდელები, როგორიცაა OpenAI-ის GPT, Meta-ს LLaMA და ღია კოდის BLOOM, როდესაც შეფასდებდათ მათი პასუხების სიზუსტეზე მრავალი ტიპიური კითხვების შემთხვევაში.

მათ დაადგინეს, რომ გაუმჯობესებული მოდელებიც კი, მათი პასუხების 60%-ზე მეტი არასწორია ან უღირსი. უფრო მეტიც, მოხალისე ადამიანებმა ხშირად არასწორი პასუხები სწორად კლასიფიცირებდენ, რაც აჩვენებს მომხმარებლების ნაკლებად შესაძლებლობას მოდელების ეფექტურად მართვაში. მომხმარებელთა გაგების გასაუმჯობესებლად, ერნანდეს-ორალო გირჩევ რომ დეველოპერებმა გააუმჯობესონ მიმწოდებლობის განმტკიცება მარტივ შეკითხვებზე და განსწავლონ ჩათბოტები, რომ თავი არიდონ რთულ კითხვებზე პასუხების გაცემას. ეს დაეხმარება მომხმარებლებს გაარკვიონ სად არის AI სანდო და სად არა. თუმცა ზოგიერთი ჩათბოტები აღიარებენ თავიანთი ცოდნის ნაკლებობას, მოდელებიდან მომყოფი რთული კითხვების მიდრედენდირების მოთხოვნაც მნიშვნელოვნად რჩება, განსაკუთრებით ისინი მარკეტინგული როგორც ზოგადი დანიშნულების.


Watch video about

კვლევა აჩვენებს, რომ AI ჩათბოტები ხშირად მიაწოდებენ არასწორ პასუხებს

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 6, 2025, 5:24 a.m.

რას ნიშნავს სისკოს (SYY) სისტემის AI გაყიდვების დ…

კვლევის დამატებითი ორი შეფასება სისკოსთვის — აღმოაჩინეთ, თუ რატომ შეიძლება ეს სავაჭრო ობიექტი იყოს ზუსტად 95%-იანი ღირებულებამდე უფრო მაღალი, ვიდრე მისი მიმდინარე ფასი!

Nov. 6, 2025, 5:24 a.m.

თომსონ როიტერსი განახლებს AI ბაზრის ლიდერობას ახა…

თომSON რივერსი (TSX/Nasdaq: TRI), გლობალური კონტენტი და ტექნოლოგიის ლიდერი, გამოაცხადა 2025 წლის 5 ნოემბერს ახალი აგენტური AI-ის გადაწყვეტილებების დაწყება, რომელიც განკუთვნილია საბაჟო, აუდიტისა და სამართლის, ასევე წესის დაცვის პროფესიონალებისთვის.

Nov. 6, 2025, 5:18 a.m.

Microsoft შედის 9.7 მილიარდი დოლარის ხელშეკრულება…

მაიკროსოფტმა გამოაცხადა ხუთწლიანი, $9.7 მილიარდიანი მთავარი პარტნიორობა AI ღრუბლოვანი სერვისის მიმწოდებელი IREN-თან, რაც წარმოაჩენს მნიშვნელოვანი პროგრესს მის ღრუბლოვანი გამოთვლების და AI ინფრაქსურის შესაძლებლობებში.

Nov. 6, 2025, 5:17 a.m.

Google's AI მიმოხილვები: გავლენა კლიკების რაოდენო…

გუგლის AI ოვერვიუებს ფీჩერის რელიზი, რომელიც 2024 წლის მაისში მოეწყო, მნიშვნელოვან წინსვლას წარმოადგენს საძიებო შედეგების წარმოდგენაში.

Nov. 6, 2025, 5:17 a.m.

AI-განმარებილი Content მიჩნეულია ცნობიერების შესა…

სწრაფეულ განვითარებას და ხელოვნური ინტელექტის (AI) ტექნოლოგიების ხშირ განვლილებას გამოიწვია AI-განწობის კონტენტის, განსაკუთრებით მაღალი რეალობის მქონე ვიდეოების, მერყეობა.

Nov. 6, 2025, 5:13 a.m.

ვისტა სოსიალში წარმოდგენილია ChatGPT ტექნოლოგია, …

Vista Social-მა მნიშვნელოვანი სიძლიერე მიაღწია სოციალური მედიის მართვაში, როცა ჩაშალა ChatGPT ტექნოლოგია savo პლატფორმაში და გახდა პირველი ინსტრუმენტი, რომელიც მიეწოდა OpenAI-ის დახვეწილი ლაპარაკობის ხელოვნური ინტელექტის ჩაშენების შესაძლებლობა.

Nov. 5, 2025, 1:24 p.m.

Facebook-ის ხელოვნური ინტელექტის კვლევათა ლაბორი …

დღევანდელი სწრაფად ცვალებადი ციფრული გარემოსა და ესკალაციის პროცესში, ენის ბარიერები ხშირად მნიშვნელოვან ხელსაყრელ დაბრკოლებას უწევენ გლობალური კომუნიკაციისა.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today