lang icon English
Sept. 25, 2024, 7:19 a.m.
1881

Uuring näitab, et tehisintellekti vestlusrobotid annavad sagedamini valesid vastuseid

Brief news summary

Ajakirjas *Nature* avaldatud uuringus uurib José Hernández-Orallo Valencia Tehisintellekti Uurimisinstituudist täiustatud tehisintellekti vestlusrobotite, sealhulgas OpenAI GPT, Meta LLaMA ja BigScience BLOOM, jõudlust. Uuring toob välja märkimisväärse probleemi: enam kui 60% analüüsitud vastustest olid valed või kõrvalehoidvad, tekitades muret kasutajate arusaamise pärast tehisintellekti võimekusest. Uuring hõlmas ulatuslikku analüüsi tuhandetest küsimustest ja näitas, et mudelid nagu GPT-4 püüavad sageli vastata keerulistele küsimustele, suurendades vigade tõenäosust ja viies kasutajad eksitavalt usaldama neid ebatäpsusi. Hernández-Orallo soovitab, et tehisintellekti arendajad peaksid eelistama lihtsamate päringute täpsust ja koolitama mudeleid vältima liigselt keerulistele küsimustele vastamist. Kuigi mõned tehisintellekti mudelid väljendavad ebakindlust väitega "Ma ei tea", annavad nad sageli kindlust valedele vastustele, mis võib viia kasutajad tehisintellekti süsteemide usaldusväärsuse ülehindamisele.

Kolme populaarse tehisintellekti vestlusroboti täiustatud versioonide uuring näitab, et nad kipuvad sagedamini andma valesid vastuseid, kui nad ei tea midagi. José Hernández-Orallo juhitud uurimus Valencia Tehisintellekti Uurimisinstituudist analüüsis suurte keelemudelite (LLM) vigu, märkides, et kuigi täpsus paraneb mudeli suuruse ja täiustamisega, on valede vastuste määr samuti tõusnud. Selle asemel, et keerulistest küsimustest loobuda, annavad need mudelid sageli vastuseid, mis suurendab eksitavate vastuste arvu. Hernández-Orallo märgib, et vestlusrobotid muutuvad aina osavamaks teadmiste jäljendamisel ilma tegeliku arusaamiseta, nähtust kirjeldatakse kui "ultrakrepidarianismi". See võib viia selleni, et kasutajad hindavad vestlusroboti võimeid üle, mis kujutab endast riske. Meeskond uuris selliseid mudeleid nagu OpenAI GPT, Meta LLaMA ja avatud lähtekoodiga BLOOM, hinnates nende täpsust erinevates küsimustüüpides.

Nad leidsid, et isegi täiustatud mudelitega oli enam kui 60% nende vastustest valed või kvalifitseerimatud. Veelgi enam, inimvabatahtlikud liigitavad sageli valed vastused õigeks, mis näitab suutmatust mudeleid tõhusalt jälgida. Kasutajate arusaamise parandamiseks soovitab Hernández-Orallo, et arendajad peaksid parandama jõudlust lihtsate küsimuste osas ja koolitama vestlusroboteid keerulistele küsimustele mitte vastama. See aitaks kasutajatel välja selgitada, kus tehisintellekt on usaldusväärne ja kus mitte. Kuigi mõned vestlusrobotid suudavad oma teadmiste puudumist tunnistada, on mudeleid ikka veel vaja keerulistele küsimustele vastama panna, eriti neile, mida turustatakse üldotstarbelistena.


Watch video about

Uuring näitab, et tehisintellekti vestlusrobotid annavad sagedamini valesid vastuseid

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 4, 2025, 9:30 a.m.

Palantiri presentatsioon tehisintellekti väärtust…

Palantir Technologies Inc.

Nov. 4, 2025, 9:27 a.m.

Google'i tehisintellekti loodud teleesitlus otsin…

Google on lansseerinud oma esimese teleekraani reklaami, mis on täielikult loodud tehisintellekti abil, tähistades olulist sammu AI tehnoloogia ühendamisel turunduse ja reklaamiga.

Nov. 4, 2025, 9:22 a.m.

Search Atlas' OTTO SEO võitis parima tehisintelle…

“Võitmine parima tehisintellekti otsingutarkvara tiitli üle kinnitab suurt pingutust, mis on kulutatud OTTO-le ning jagatud visiooni kõigi Search Atlase töötajate vahel,” ütles Search Atlasi asutaja, tegevjuht ja tehnoloogiajuht Manick Bhan.

Nov. 4, 2025, 9:16 a.m.

Tehisintellekti toel põhinevad videoremontööriist…

Videote sisu loomise maastik on põhjalikult muutumas, mida driven AI-toega videoredigeerimise tööriistad, mis automatiseerivad erinevaid redigeerimisjärgseid etappe ja aitavad loojatel luua professionaalse kvaliteediga videoid kiiremini ning lihtsamalt.

Nov. 4, 2025, 9:15 a.m.

Meta tehisintellekti uurimine: edusammud loomulik…

Meta tehisintellekti uurimisrühmitus on saavutanud märkimisväärseid läbimurdeid loomuliku keele mõistmises, mis tähistab olulist sammu keerukamate AI-keelemudelite arengus.

Nov. 4, 2025, 5:28 a.m.

Goku: Hiina avatud lähtekoodiga vastus Sorale?

Tehisintellekti tekstist videotegemise valdkond edeneb kiiresti, avardades võimeid läbimurrete kaudu.

Nov. 4, 2025, 5:23 a.m.

Küsitlus näitab, et tehisintellekti mõju tarbijat…

Hiljutine uuring, mille viis läbi Interactive Advertising Bureau (IAB) ja Talk Shoppe ning avaldati 28.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today