News
>
Uuring näitab, et tehisintellekti vestlusrobotid annavad sagedamini valesid vastuseid

Sept. 25, 2024, 7:19 a.m.

Uuring näitab, et tehisintellekti vestlusrobotid annavad sagedamini valesid vastuseid

Brief news summary

Ajakirjas *Nature* avaldatud uuringus uurib José Hernández-Orallo Valencia Tehisintellekti Uurimisinstituudist täiustatud tehisintellekti vestlusrobotite, sealhulgas OpenAI GPT, Meta LLaMA ja BigScience BLOOM, jõudlust. Uuring toob välja märkimisväärse probleemi: enam kui 60% analüüsitud vastustest olid valed või kõrvalehoidvad, tekitades muret kasutajate arusaamise pärast tehisintellekti võimekusest. Uuring hõlmas ulatuslikku analüüsi tuhandetest küsimustest ja näitas, et mudelid nagu GPT-4 püüavad sageli vastata keerulistele küsimustele, suurendades vigade tõenäosust ja viies kasutajad eksitavalt usaldama neid ebatäpsusi. Hernández-Orallo soovitab, et tehisintellekti arendajad peaksid eelistama lihtsamate päringute täpsust ja koolitama mudeleid vältima liigselt keerulistele küsimustele vastamist. Kuigi mõned tehisintellekti mudelid väljendavad ebakindlust väitega "Ma ei tea", annavad nad sageli kindlust valedele vastustele, mis võib viia kasutajad tehisintellekti süsteemide usaldusväärsuse ülehindamisele.

Kolme populaarse tehisintellekti vestlusroboti täiustatud versioonide uuring näitab, et nad kipuvad sagedamini andma valesid vastuseid, kui nad ei tea midagi. José Hernández-Orallo juhitud uurimus Valencia Tehisintellekti Uurimisinstituudist analüüsis suurte keelemudelite (LLM) vigu, märkides, et kuigi täpsus paraneb mudeli suuruse ja täiustamisega, on valede vastuste määr samuti tõusnud. Selle asemel, et keerulistest küsimustest loobuda, annavad need mudelid sageli vastuseid, mis suurendab eksitavate vastuste arvu. Hernández-Orallo märgib, et vestlusrobotid muutuvad aina osavamaks teadmiste jäljendamisel ilma tegeliku arusaamiseta, nähtust kirjeldatakse kui "ultrakrepidarianismi". See võib viia selleni, et kasutajad hindavad vestlusroboti võimeid üle, mis kujutab endast riske. Meeskond uuris selliseid mudeleid nagu OpenAI GPT, Meta LLaMA ja avatud lähtekoodiga BLOOM, hinnates nende täpsust erinevates küsimustüüpides.

Nad leidsid, et isegi täiustatud mudelitega oli enam kui 60% nende vastustest valed või kvalifitseerimatud. Veelgi enam, inimvabatahtlikud liigitavad sageli valed vastused õigeks, mis näitab suutmatust mudeleid tõhusalt jälgida. Kasutajate arusaamise parandamiseks soovitab Hernández-Orallo, et arendajad peaksid parandama jõudlust lihtsate küsimuste osas ja koolitama vestlusroboteid keerulistele küsimustele mitte vastama. See aitaks kasutajatel välja selgitada, kus tehisintellekt on usaldusväärne ja kus mitte. Kuigi mõned vestlusrobotid suudavad oma teadmiste puudumist tunnistada, on mudeleid ikka veel vaja keerulistele küsimustele vastama panna, eriti neile, mida turustatakse üldotstarbelistena.

News source

Watch video about

Uuring näitab, et tehisintellekti vestlusrobotid annavad sagedamini valesid vastuseid

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Uuring näitab, et tehisintellekti vestlusrobotid annavad sagedamini valesid vastuseid

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Palantiri aktsiad langevad kõrge väärtusehinnangu mure tõttu, hoolimata tugevast kolmanda kvartali müügitulemusest ja tõstatatud tuludestiplaneeringust

Google käivitab esimese tehisintellekti loodud telesektori, kus on kasutusel AI režiim otsingus

Search Atlas tutvustab OTTO AI SEO tööriista ning 2026. aasta visiooni tehisintellekti-põhise turunduse jaoks

The Best for your Business

Hot news

Palantiri presentatsioon tehisintellekti väärtust…

Google'i tehisintellekti loodud teleesitlus otsin…

Search Atlas' OTTO SEO võitis parima tehisintelle…

Tehisintellekti toel põhinevad videoremontööriist…

Meta tehisintellekti uurimine: edusammud loomulik…

Goku: Hiina avatud lähtekoodiga vastus Sorale?

Küsitlus näitab, et tehisintellekti mõju tarbijat…

AI Company

Sales

Marketing

Uuring näitab, et tehisintellekti vestlusrobotid annavad sagedamini valesid vastuseid

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Palantiri aktsiad langevad kõrge väärtusehinnangu mure tõttu, hoolimata tugevast kolmanda kvartali müügitulemusest ja tõstatatud tuludestiplaneeringust

Google käivitab esimese tehisintellekti loodud telesektori, kus on kasutusel AI režiim otsingus

Search Atlas tutvustab OTTO AI SEO tööriista ning 2026. aasta visiooni tehisintellekti-põhise turunduse jaoks

The Best for your Business

Hot news

Palantiri presentatsioon tehisintellekti väärtust…

Google'i tehisintellekti loodud teleesitlus otsin…

Search Atlas' OTTO SEO võitis parima tehisintelle…

Tehisintellekti toel põhinevad videoremontööriist…

Meta tehisintellekti uurimine: edusammud loomulik…

Goku: Hiina avatud lähtekoodiga vastus Sorale?

Küsitlus näitab, et tehisintellekti mõju tarbijat…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?