News
>
კვლევა აჩვენებს, რომ AI ჩათბოტები ხშირად მიაწოდებენ არასწორ პასუხებს

Sept. 25, 2024, 7:19 a.m.

1910

კვლევა აჩვენებს, რომ AI ჩათბოტები ხშირად მიაწოდებენ არასწორ პასუხებს

Brief news summary

კვლევა, გამოქვეყნებული *Nature*-ში ხოსე ერნანდეს-ორალოს მიერ ვალენსიის ხელოვნური ინტელექტის კვლევითი ინსტიტუტიდან, იკვლევს გაუმჯობესებული AI ჩათბოტების შესრულებას, მათ შორის OpenAI-ის GPT, Meta-ს LLaMA და BigScience-ს BLOOM. კვლევა ნათლად აჩვენებს მნიშვნელოვან საკითხს: 60%-ზე მეტი შესწავლილი პასუხებიდან აღმოჩნდა რომ არასწორი ან არაზუსტი იყო, რაც აწუხებს მომხმარებელთა გაგებას AI შესაძლებლობების შესახებ. კვლევა მოიცავდა ათასობით თხოვნის მისამართზე ანალიზის დეტალურ შეფასებას და გამოვლინდა, რომ მოდელები როგორიცაა GPT-4 ხშირად ცდილობენ პასუხების გაცემას რთულ კითხვებზე, რის გამოც იზრდება შეცდომების ალბათობა და მომხმარებლების შეცდომით ნდობა ამ შეცდომილ პასუხებში. ერნანდეს-ორალო გირჩევ, რომ AI დეველოპერებმა პრიორიტიზაცია მისცენ სიზუსტე მარტივ კითხვებზე და განსწავლონ მოდელები, რომ თავი არიდონ გადაჭარბებით რთულ კითხვებზე პასუხების გაცემას. მიუხედავად იმისა, რომ ზოგიერთი AI მოდელი აღიარებს არასაკმარისი ცოდნის მდგომარეობას გამომეტყველებებით, როგორიცაა "მე არ ვიცი," ისინი ხშირად მოგვიწოდებენ არასწორ პასუხებს დარწმუნებით, რაც შეიძლება მომხმარებლები შეხედონ AI სისტემების საიმედოობაზე მეტად.

კვლევა სამ პოპულარულ ხელოვნური ინტელექტის ჩათბოტის გაუარესებული ვერსიების შესახებ აჩვენებს, რომ ისინი უფრო ხშირად აჩენენ არასწორ პასუხებს, ვიდრე აღიარებენ, როცა არ იციან რაღაც. კვლევა, რომელსაც ხელმძღვანელობს ხოსე ერნანდეს-ორალო ვალენსიის ხელოვნური ინტელექტის კვლევითი ინსტიტუტიდან, ანალიზირებს მოცულობითი ენის მოდელების (LLMs) შეცდომებს, აღნიშნავს, რომ როცა მოდელების რომელიმე ვერსია და დახვეწა ხდება უფრო ზუსტი, არასწორი პასუხების რაოდენობაც იზრდება. ნაცვლად რომ ტოვებენ რთულ კითხვებს, ეს მოდელები ხშირად აჩენენ პასუხებს, რაც იწვევს შეცდომილ ინფორმაციის რაოდენობის გაზრდას. ერნანდეს-ორალო აღნიშნავს, რომ ჩათბოტები უფრო მეტად ქრებიან ცოდნის ნიღბად, რეალური გაგების გარეშე, ეს ფენომენი ცნობილია როგორც "ულტრაკრეპიდარიანიზმი". ეს შეიძლება მომხმარებლებს აწუხებდეს ჩათბოტების შესაძლებლობების ზედმეტად შეფასებაში, რაც რისკებს წარმოადგენს. გუნდი შეისწავლა მოდელები, როგორიცაა OpenAI-ის GPT, Meta-ს LLaMA და ღია კოდის BLOOM, როდესაც შეფასდებდათ მათი პასუხების სიზუსტეზე მრავალი ტიპიური კითხვების შემთხვევაში.

მათ დაადგინეს, რომ გაუმჯობესებული მოდელებიც კი, მათი პასუხების 60%-ზე მეტი არასწორია ან უღირსი. უფრო მეტიც, მოხალისე ადამიანებმა ხშირად არასწორი პასუხები სწორად კლასიფიცირებდენ, რაც აჩვენებს მომხმარებლების ნაკლებად შესაძლებლობას მოდელების ეფექტურად მართვაში. მომხმარებელთა გაგების გასაუმჯობესებლად, ერნანდეს-ორალო გირჩევ რომ დეველოპერებმა გააუმჯობესონ მიმწოდებლობის განმტკიცება მარტივ შეკითხვებზე და განსწავლონ ჩათბოტები, რომ თავი არიდონ რთულ კითხვებზე პასუხების გაცემას. ეს დაეხმარება მომხმარებლებს გაარკვიონ სად არის AI სანდო და სად არა. თუმცა ზოგიერთი ჩათბოტები აღიარებენ თავიანთი ცოდნის ნაკლებობას, მოდელებიდან მომყოფი რთული კითხვების მიდრედენდირების მოთხოვნაც მნიშვნელოვნად რჩება, განსაკუთრებით ისინი მარკეტინგული როგორც ზოგადი დანიშნულების.

News source

Watch video about

კვლევა აჩვენებს, რომ AI ჩათბოტები ხშირად მიაწოდებენ არასწორ პასუხებს

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 6, 2025, 5:24 a.m.

რას ნიშნავს სისკოს (SYY) სისტემის AI გაყიდვების დ…

კვლევის დამატებითი ორი შეფასება სისკოსთვის — აღმოაჩინეთ, თუ რატომ შეიძლება ეს სავაჭრო ობიექტი იყოს ზუსტად 95%-იანი ღირებულებამდე უფრო მაღალი, ვიდრე მისი მიმდინარე ფასი!

Nov. 6, 2025, 5:24 a.m.

თომსონ როიტერსი განახლებს AI ბაზრის ლიდერობას ახა…

თომSON რივერსი (TSX/Nasdaq: TRI), გლობალური კონტენტი და ტექნოლოგიის ლიდერი, გამოაცხადა 2025 წლის 5 ნოემბერს ახალი აგენტური AI-ის გადაწყვეტილებების დაწყება, რომელიც განკუთვნილია საბაჟო, აუდიტისა და სამართლის, ასევე წესის დაცვის პროფესიონალებისთვის.

Nov. 6, 2025, 5:18 a.m.

Microsoft შედის 9.7 მილიარდი დოლარის ხელშეკრულება…

მაიკროსოფტმა გამოაცხადა ხუთწლიანი, $9.7 მილიარდიანი მთავარი პარტნიორობა AI ღრუბლოვანი სერვისის მიმწოდებელი IREN-თან, რაც წარმოაჩენს მნიშვნელოვანი პროგრესს მის ღრუბლოვანი გამოთვლების და AI ინფრაქსურის შესაძლებლობებში.

Nov. 6, 2025, 5:17 a.m.

Google's AI მიმოხილვები: გავლენა კლიკების რაოდენო…

გუგლის AI ოვერვიუებს ფీჩერის რელიზი, რომელიც 2024 წლის მაისში მოეწყო, მნიშვნელოვან წინსვლას წარმოადგენს საძიებო შედეგების წარმოდგენაში.

Nov. 6, 2025, 5:17 a.m.

AI-განმარებილი Content მიჩნეულია ცნობიერების შესა…

სწრაფეულ განვითარებას და ხელოვნური ინტელექტის (AI) ტექნოლოგიების ხშირ განვლილებას გამოიწვია AI-განწობის კონტენტის, განსაკუთრებით მაღალი რეალობის მქონე ვიდეოების, მერყეობა.

Nov. 6, 2025, 5:13 a.m.

ვისტა სოსიალში წარმოდგენილია ChatGPT ტექნოლოგია, …

Vista Social-მა მნიშვნელოვანი სიძლიერე მიაღწია სოციალური მედიის მართვაში, როცა ჩაშალა ChatGPT ტექნოლოგია savo პლატფორმაში და გახდა პირველი ინსტრუმენტი, რომელიც მიეწოდა OpenAI-ის დახვეწილი ლაპარაკობის ხელოვნური ინტელექტის ჩაშენების შესაძლებლობა.

Nov. 5, 2025, 1:24 p.m.

Facebook-ის ხელოვნური ინტელექტის კვლევათა ლაბორი …

დღევანდელი სწრაფად ცვალებადი ციფრული გარემოსა და ესკალაციის პროცესში, ენის ბარიერები ხშირად მნიშვნელოვან ხელსაყრელ დაბრკოლებას უწევენ გლობალური კომუნიკაციისა.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today

კვლევა აჩვენებს, რომ AI ჩათბოტები ხშირად მიაწოდებენ არასწორ პასუხებს

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Sysco-ის აქციების ანალიზი: სამართლიანი ფასი შეფასებები სთავაზობენ ორმაგი ზრდის პოტენციალს 95%-მდე

მაიკროსოფტი და IREN დააქორწინებენ 9.7 მილიარდი დოლარიან AI კლაუდ პარტნიორობას, რომელშიც გამორჩეულია NVIDIA-პლატფორმები

The Best for your Business

Hot news

რას ნიშნავს სისკოს (SYY) სისტემის AI გაყიდვების დ…

თომსონ როიტერსი განახლებს AI ბაზრის ლიდერობას ახა…

Microsoft შედის 9.7 მილიარდი დოლარის ხელშეკრულება…

Google's AI მიმოხილვები: გავლენა კლიკების რაოდენო…

AI-განმარებილი Content მიჩნეულია ცნობიერების შესა…

ვისტა სოსიალში წარმოდგენილია ChatGPT ტექნოლოგია, …

Facebook-ის ხელოვნური ინტელექტის კვლევათა ლაბორი …

AI Company

Sales

Marketing

კვლევა აჩვენებს, რომ AI ჩათბოტები ხშირად მიაწოდებენ არასწორ პასუხებს

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Sysco-ის აქციების ანალიზი: სამართლიანი ფასი შეფასებები სთავაზობენ ორმაგი ზრდის პოტენციალს 95%-მდე

მაიკროსოფტი და IREN დააქორწინებენ 9.7 მილიარდი დოლარიან AI კლაუდ პარტნიორობას, რომელშიც გამორჩეულია NVIDIA-პლატფორმები

The Best for your Business

Hot news

რას ნიშნავს სისკოს (SYY) სისტემის AI გაყიდვების დ…

თომსონ როიტერსი განახლებს AI ბაზრის ლიდერობას ახა…

Microsoft შედის 9.7 მილიარდი დოლარის ხელშეკრულება…

Google's AI მიმოხილვები: გავლენა კლიკების რაოდენო…

AI-განმარებილი Content მიჩნეულია ცნობიერების შესა…

ვისტა სოსიალში წარმოდგენილია ChatGPT ტექნოლოგია, …

Facebook-ის ხელოვნური ინტელექტის კვლევათა ლაბორი …

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?