lang icon English
Nov. 8, 2024, 2:14 p.m.
2926

AI rökræðuaðferð eykur nákvæmni dóma í flóknum verkefnum.

Brief news summary

Í febrúar 2023 vöknuðu áhyggjur af nákvæmni gervigreindar þegar AI spjallmenni Google, Bard, gerði mistök varðandi James Webb geimsjónaukann. Rannsókn frá Purdue háskólanum sýndi einnig að meira en helmingur forritunarsvara ChatGPT var rangur. Þó að slík mistök séu greinanleg núna, hafa sérfræðingar eins og Julian Michael frá NYU áhyggjur af því að framtíðar AI-líkön muni framleiða flóknar, óstaðfestanlegar upplýsingar sem gætu grafið undan trausti. Ein lausn felur í sér að láta AI-líkön rökræða hvort við annað, sem hjálpar dómaranum, manni eða AI, að komast að sannleikanum. Niðurstöður frá Anthropic og Google DeepMind benda til þess að þjálfun líkanna í gegnum rökræður geti bætt nákvæmni. En samt eru áskoranir eins og hlutdrægni, áreiðanleiki yfir ýmis verkefni og samræmi við gildi manna. Þrátt fyrir þessi vandamál bjóða tilraunir með AI-rökræður og eftirlitsaðferðir upp á von um aukið traust á gervigreind. Rannsakendur eru bjartsýnir á að AI-rökræður gætu haft veruleg áhrif á öryggi og samræmi gervigreindar í framtíðinni.

Í febrúar 2023 gaf gervigreindarspjallmenni Google, Bard, ranglega upp að James Webb geimsjónaukinn hefði tekið fyrstu myndina af fjarplánetu, en slíkar villur í líkingu við þær sem fundust í ChatGPT frá OpenAI komu í ljós í rannsókn frá Purdue háskóla. Þar voru meira en helmingur af yfir 500 forritunarspurningum ranglega svaraðar. Þó þessar villur séu nú áberandi, hafa sérfræðingar áhyggjur af því að þegar AI módel verða flóknari, gæti verið sífellt erfiðara að greina milli sannleika og rangfærslna. Julian Michael frá NYU bendir á erfiðleika við eftirlit með AI kerfum á sviðum utan getu mannsins. Ein tilboðn lausn er að leyfa tveimur stórum AI módelum að rökræða, þar sem einfaldara módel eða manneskja ákveður réttari niðurstöðu. Þessi hugmynd kom fyrst fram fyrir sex árum; hins vegar bjóða nýlegar rannsóknir frá Anthropic og Google DeepMind upp á fyrstu empírísku sönnunargögn um að LLM rökræður geti hjálpað við að greina sannleika. Að koma á traustum AI kerfum er þáttur í samræmingu, sem tryggir að AI deili gildum mannsins. Núverandi samræming byggir á endurgjöf frá mönnum, en yfirgripsmikið eftirlit – að tryggja nákvæmni AI umfram getu mannsins – er nauðsynlegt þegar AI þróast. Rökræða, sem hefur verið rannsökuð frá 2018, er talin leið til að takast á við þetta yfirgripsmikla eftirlit. Upphaflega stungið upp á af Geoffrey Irving hjá OpenAI, felur aðferðin í sér að tvö AI módel deili um spurningu til að sannfæra ytri dómara um réttleika sinn. Þó frumprófanir í 2018 gæfu til kynna að rökræða gæti virkað, voru áhyggjur um tilhneigingu manna til huglægs mats og mismunandi færni í mati enn til staðar.

Rannsakendur eins og Amanda Askell halda því fram að skilningur á ákvörðunartöku manna sé nauðsynlegur til að samræma AI mannlegum gildum á áhrifaríkan hátt. Þrátt fyrir misjafnar upphafsniðurstöður benda nýjar rannsóknir til möguleika. Rannsókn Anthropic sýndi að LLM rökræður bættu nákvæmni dómaranna, hækka hana í 76% úr 54%. Samskonar tilraunir Google DeepMind staðfestu að rökræður leiddu til aukinnar nákvæmni í fjölbreyttum verkefnum. Zachary Kenton segir að það að sjá báðar hliðar veiti dómurunum meiri upplýsingar, sem stuðli að nákvæmari niðurstöðum. Þrátt fyrir það eru áskoranir enn til staðar, eins og áhrif smávægilegra eiginleika rökræðanna og hlutdrægni eins og smjaður þar sem AI getur echoð smakasér notenda rangt. Einnig, að fastar réttar eða rangar svarar í prófum þarf ekki að eiga sér stað í flóknum, blæbrigðaríkum raunheimsverkefnum. Að skilja hegðun AI og finna út hvar AI kerfi fara fram úr þekkingu mannlegra dómara er mikilvægt fyrir áframhaldandi þróun og beitingu þessara aðferða, eins og Irving bendir á. Þrátt fyrir þessar hindranir, býður empírískur árangur rökræðna upp á efnilega framþróun í átt að því að bæta áreiðanleika og samræmingu AI.


Watch video about

AI rökræðuaðferð eykur nákvæmni dóma í flóknum verkefnum.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 8, 2025, 1:29 p.m.

Markaðsyfirlit: Tæknifyrirtæki og Gervigreindarfy…

Verðbréf urðu fyrir sínum fyrsta viku tapinu í þrjár vikur á föstudag, þar sem fjárfestar drógu úr kaupum vegna áhyggja af flótti á metnum fyrirtækjum í gervigreind.

Nov. 8, 2025, 1:25 p.m.

Vista Social kynning á ChatGPT tækni, verður fyrs…

Vista Social hefur náð verulegum framförum í stjórnun samfélagsmiðla með því að samþætta ChatGPT tækni inn í vettvang sinn og er orðið fyrsta tól til að innleiða háþróaða samtalsgervigreind OpenAI.

Nov. 8, 2025, 1:21 p.m.

Nýtning gervigreindarleiðis í sölum: Að byggja li…

Í hröðum breytingum á seldu landslagi eru framfarir í gervigreind (GV), einkum gervigreindarstjórar sem eru knúnir af stórum tungumálalíkönum (LLMs), væntanlegar til að breyta grundvallarháttum á hvernig sölugögn eru rekin.

Nov. 8, 2025, 1:18 p.m.

Vast Data fjárfesta 1,17 milljarða dollar í gervi…

Vast Data, AI sproti sem sérhæfir sig í háþróuðum gagnageymd, hefur tryggt sér viðskiptasamning að fjárhæð 1,17 milljarða dollara við skýjavaldverkið CoreWeave, sem markar mikilvæga stækkun á samstarfi þeirra í kjölfar aukins eftirspurnar eftir öflugri og skilvirkari AI-infrastruktur.

Nov. 8, 2025, 1:14 p.m.

Gervigreindarstýrð tölvuleikir: Að skapa dýnamísk…

Á síðustu árum hefur spilageirinn gengið í gegnum stórt breytingarferli sem orsakast af samþættingu gervigreindar (AI) tækni.

Nov. 8, 2025, 1:13 p.m.

Vélalæst SEO greining: Klynið dýpri innsýn

Gervigreindi (AI) er að breyta SEO greiningarsviði hratt og veldur nýrri öld af betri innsýn í frammistöðu vefsíðna og hegðun notenda.

Nov. 8, 2025, 9:41 a.m.

Samsung og Nvidia vinna saman að „AI risaverksmið…

Samsung hefur tilkynnt metnaðarfulla áætlanir um byggingu „AI Megafabriku“, nýstárlegri aðstöðu sem knúin er af yfir 50.000 Nvidia GPU-ekum og notar Nvidia Omniverse vettvanginn.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today