lang icon English
Nov. 8, 2024, 2:14 p.m.
2744

Metoda AI debate poboljšava tačnost prosudbi u složenim zadacima.

U februaru 2023. godine, Bard, AI chatbot kompanije Google, pogrešno je tvrdio da je Svemirski teleskop Džejms Veb snimio prvu fotografiju egzoplaneta, čime su otkrivene greške slične onima koje je našao OpenAI-ev ChatGPT u studiji istraživača sa Univerziteta Purdue, gde je više od polovine od preko 500 programskih upita netačno odgovarano. Iako su ove greške trenutno uočljive, stručnjaci izražavaju zabrinutost da će, kako AI modeli postaju sve složeniji, razlikovanje istine od dezinformacija postati sve izazovnije. Džulijan Majkl sa NYU naglašava teškoće u nadzoru AI sistema u oblastima izvan ljudskih kapaciteta. Predloženo rešenje je da dva velika AI modela vode debatu, a da jednostavniji model ili čovek odredi tačniji ishod. Ova ideja pojavila se pre šest godina; međutim, nedavne studije Anthropic-a i Google DeepMind-a nude početne empirijske dokaze da debate LLM-a mogu pomoći u razlikovanju istine. Usmeravanje prema pouzdanim AI sistemima deo je usklađivanja koje obezbeđuje da AI deli ljudske vrednosti. Sadašnje usklađivanje zavisi od ljudske povratne informacije, ali je skalabilan nadzor – osiguravanje tačnosti AI-a izvan ljudskih sposobnosti – neophodan kako AI napreduje. Debata, istraživana od 2018. godine, smatra se načinom za upravljanje ovim skalabilnim nadzorom. Prvobitno predložena od strane Džefrija Irvinga u OpenAI-u, tehnika uključuje da dva AI modela raspravljaju o pitanju kako bi ubedili spoljnog sudiju u svoju ispravnost. Iako su rani testovi iz 2018.

ukazivali da debata može funkcionisati, svest o ljudskoj sklonnosti subjektivnim ocenama i razlikama u sposobnosti za procenjivanje ostale su zabrinutosti. Istraživači poput Amande Askell tvrde da je razumevanje ljudskog odlučivanja ključno za efikasno usklađivanje AI sa ljudskim vrednostima. Uprkos pomešanim početnim rezultatima, nove studije pokazuju potencijal. Studija Anthropic-a pokazala je da su debate LLM-a značajno poboljšale tačnost ne-ekspertnih sudija, podižući je na 76% sa 54%. Slični eksperimenti Google DeepMind-a potvrdili su da su debate dovele do povećane tačnosti kroz raznovrsne zadatke. Zekari Kenton navodi da pružanje oba gledišta daje više informacija sudijama, što doprinosi preciznijim zaključcima. Međutim, izazovi ostaju, poput uticaja beznačajnih karakteristika debate i pristrasnosti poput laskanja gde AI može netačno odražavati korisničke preferencije. Takođe, fiksna priroda tačnih ili netačnih odgovora u testovima možda se ne prenosi na složene, nijansirane scenarije iz stvarnog sveta. Razumevanje ponašanja AI-a i identifikacija tamo gde AI sistemi nadmašuju ljudske sudije u znanju od suštinskog su značaja za dalji razvoj i primenu ovih metoda, kako je primetio Irving. Uprkos ovim preprekama, empirijski uspeh debata predstavlja obećavajući napredak ka unapređenju pouzdanosti i usklađenosti AI.



Brief news summary

У фебруару 2023. године, забринутости око тачности вештачке интелигенције појавиле су се када је Гуглов AI чет-бот Bard направио грешку у вези са телескопом Џејмс Веб. Студија са Универзитета Пардју такође је показала да је више од половине одговора ChatGPT-а на програмерске задатке било нетачно. Иако су такве грешке тренутно уочљиве, стручњаци попут Џулијана Мајкла са Њујоршког универзитета брину о будућим моделима вештачке интелигенције који би могли генерисати сложене, непроверљиве одговоре, што би могло поткопати поверење. Једно решење подразумева дебатовање између AI модела, што омогућава људском или AI судији да одреди истину. Истраживања Антропика и Google DeepMind-а сугеришу да тренинг модела кроз дебате може побољшати тачност. Међутим, изазови као што су пристрасност, поузданост код различитих задатака и усклађеност са људским вредностима и даље постоје. Упркос овим проблемима, текући експерименти са AI дебатама и методама надзора пружају наду за побољшање поузданости вештачке интелигенције. Истраживачи су оптимистични да би AI дебате могле значајно допринети безбедности и усклађености будуће вештачке интелигенције.

Watch video about

Metoda AI debate poboljšava tačnost prosudbi u složenim zadacima.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Oct. 28, 2025, 2:32 p.m.

Ingram Micro Holding (INGM): Procena vrednosti ka…

Ingram Micro Holding (INGM) nedavno je predstavio svog novog pomoćnika za prodajnu prezentaciju zasnovanog na veštačkoj inteligenciji, koristeći Google-ove velike jezičke modele Gemini.

Oct. 28, 2025, 2:18 p.m.

Dappier sarađuje sa LiveRamp-om na unapređenju og…

Dappier, kompanija koja se specijalizovala za interfejse veštačke inteligencije fokusirane na potrošače, najavila je strateško partnerstvo sa LiveRamp-om, platformom za povezivanje podataka poznatom po veštini u rešavanju identiteta i integraciji podataka.

Oct. 28, 2025, 2:15 p.m.

Omneky pokreće pametne oglase za automatizovano k…

Omneky je pokrenuo inovativan proizvod pod nazivom Smart Ads, ciljajući na transformisanje načina na koji marketari razvijaju oglasne kampanje.

Oct. 28, 2025, 2:14 p.m.

Google Vids: Kreiranje video snimaka uz pomoć veš…

Google je lansirao novu online aplikaciju za uređivanje videa pod nazivom Google Vids, koja koristi naprednu Gemini tehnologiju kompanije.

Oct. 28, 2025, 2:14 p.m.

Kompanija za SEO otkriva autonomnog SEO agenta ko…

SEO kompanija je predstavila revolucionarni napredak u optimizaciji pretraživača sa svojim Autonomnim SEO Agentom, sistemom vođenim veštačkom inteligencijom koji je dizajniran da kontinuirano analizira, proverava i optimizuje veb sajtove autonomno, bez ljudske intervencije.

Oct. 28, 2025, 10:28 a.m.

PromoRepublic pokreće prvi u kategoriji mobilni A…

Osnažite marketare i franšize sa superljudskim prednošću za lokalni marketing bržeg i bolјeg usklađivanja sa brendom, bilo kada i bilo gde.

Oct. 28, 2025, 10:24 a.m.

SEO osnažen veštačkom inteligencijom: unaprjeđenj…

Veštačka inteligencija (VI) brzo preoblikuje oblast optimizacije pretraživača (SEO) tako što značajno poboljšava personalizaciju sadržaja i povećava angažman korisnika.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today