lang icon En
June 3, 2025, 3:23 a.m.
2006

Yoshua Bengio kapphelir LawZero til að þróa hreinan gervigreind fyrir greiningu á sviksamlegum sjálfstæðiskerfum

Brief news summary

Yoshua Bengio, AI frumkvöðull sem hlaut Turing-verðlaunin, hefur komið á lagriðinu LawZero, samtökum sem einbeita sér að því að skapa „heiðar“ gervigreindarkerfi sem greina og koma í veg fyrir skaðleg eða svikin hegðun hjá sjálfstæðum gerendum. Með 30 milljóna dala fjármögnun og sérhæfðu starfsliði þróar LawZero Scientist AI, nýja vörð sem virkjar meira eins og sálfræðingur en hefðbundin gervigreind með því að meta líkurnar til að greina áhættu og grípa til aðgerða áður en hættuleg hegðun kemur fram. Þessi nálgun svarar áhyggjum um afskiptasama gervigreind sem reynir að koma í veg fyrir lokun eða hegðar sér svikin. Stuðlað af Future of Life Institute og tækniförum eins og Skype meðstofnanda Jaan Tallinn, leggur LawZero áherslu á að öryggisgervigreind þurfi að vera eins þróuð og gervigreindin sem hún fylgist með. Upphaflega snýst markmiðið um opinn kóða, en samtökin leggja áherslu á að víkka sjóndeildarhring sinn. Bengio er hörð trúaður á að styrkja öryggisreglur fyrir gervigreind til að forðast stórfelldar truflanir, hann undirstrikar brýna nauðsyn þess að þróa ábyrgðarfulla gervigreind.

Frumsýningartakni um gervigreind hefur aðstoðað við að stofna óhagnýt samtök sem vinna að því að búa til “sáttaða” gervigreind sem er í því augnamiði að greina villandi kerfi sem reyna að blekkja mannfólk. Yoshua Bengio, virtur tölvunarfræðingur sem oft er kallaður einn af “guðföðrum” gervigreindar, mun gegna stöðu forseta LawZero, hóps sem einbeitir sér að öruggri þróun á háþróuðri tækni sem hefur kveikt í vopnavarnarmóti sem nemur um eitt trilljón dala (£740 milljarða). Með upphafi fjármagni um það bil 30 milljónum dala og lið af yfir tólf rannsakendum, vinnur Bengio að kerfi sem kallast Scientist AI. Þetta kerfi á að falla sem vörn gegn gervigreindarstigum — sjálfstæðum kerfum sem framkvæma verkefni án mannlegrar aðstoðar — sem gætu sýnt blekkingar- eða sjálfsvarnarhegðun, eins og að mótmæla að vera slökkt. Bengio lýsti núverandi gervigreindartækjum sem “leikurum” sem reyna að líkja eftir mönnunum og fullnægja notendum, meðan hann sér fyrir sér Scientist AI sem meira líkt og “ sálfræðingi” sem getur skilið og spáð skaðlegri hegðun. “Við viljum byggja gervigreind sem er heiðarleg og ekki blekkjandi, ” sagði Bengio. Hann bætti við: “Það er fræðilega hægt að ímynda sér vélar án sjálfs eða persónulegra markmiða, sem starfa eingöngu sem þekkingarhöft — eins og vísindamaður sem hefur yfirgripsmikla þekkingu. ” Ólíkt núverandi skapandi gervigreindartólum mun kerfi Bengios ekki gefa afgerandi svör, heldur mun það bjóða möguleika og líkur á því að svar sé rétt. “Það hefur auðmýkt, viðurkennir óvissureglur um svör sín, ” útskýrði hann. Með því að nota það saman með gervigreindarumhverfi, myndi fyrirmynd Bengios greina hugsanlega skaðlega hegðun sjálfstæðra kerfa með því að meta líkur á að aðgerðir þeirra muni valda skaða. Scientist AI er hönnuð til að “spá fyrir um líkurnar á því að aðgerðir agents leiði til skaða, ” og ef sú líkur yfirstígur ákveðin mörk, mun hún stöðva tillögu að aðgerð. Fyrstu stuðningsmenn LawZero eru meðal annars Future of Life Institute, samtök um öryggi gervigreindar, Jaan Tallinn — stofnandi forritarans Skype, og Schmidt Sciences, rannsóknarstofnun sem Eric Schmidt, fyrrverandi forstjóri Google, stofnaði. Bengio lagði áherslu á að fyrsta markmið LawZero sé að sanna að aðferðafræðin virki, og síðan að sannfæra fyrirtæki eða stjórnvöld um að styðja við stærri og öflugri framkvæmdir.

Hann nefndi að opinber lýsi gervigreindarstraumum, sem eru frítt aðgengileg og hægt er að breyta, verði grunnurinn að þjálfunarkerfi LawZero. “Markmiðið er að sannreyna að aðferðafræðin virki svo við getum sannfært fjárfesta, stjórnvöld eða rannsóknarstofur um að leggja til nauðsynleg auðlind til að þjálfa þetta á sama hátt og núverandi leiðandi gervigreindarkerfi. Það er alveg brýnt að varnargervigreindin sé að minnsta kosti eins klár og gervigreindin sem hún á að fylgjast með og stjórna, ” sagði hann. Bengio, prófessor við Háskólann í Montreal, hlaut nafnið “guðfaðir” eftir að hann deildi Turing-verðlaununum 2018 — sem telst til jafngildis við Nobelverðlaun í reiknikunnáttu — saman Geoffrey Hinton, sem síðar hlaut Nobelverðlaun sjálfur, og Yann LeCun, yfirmaður gervigreindar hjá Meta. Sem áhrifamaður í öryggi gervigreindar, stjórnaði hann nýlegri Alþjóðlegri skýrslu um öryggi gervigreindar, sem varaði við því að sjálfstæð kerfi gætu valdið “gríðarlegum” truflunum ef þau öðlast möguleika á að framkvæma langar röð verkefna án mannlegrar eftirlits.


Watch video about

Yoshua Bengio kapphelir LawZero til að þróa hreinan gervigreind fyrir greiningu á sviksamlegum sjálfstæðiskerfum

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 12, 2025, 1:42 p.m.

Disney sendir stöðvunarbeiðni og fyrirmæli til Go…

The Walt Disney Company hefur hafið verulega lagalega aðgerð gegn Google með því að senda viðvörunar- og stöðvunarskref, ásakandi risavaxna tæknifyrirtækið um að hafa brotið á höfundarétti Disney með því að nota verkin þeirra við þjálfun og þróun á framleiðandi gervigreindarlíkönum án þess að borga fyrir það.

Dec. 12, 2025, 1:35 p.m.

Gervigreind og framtíð leitarvélabestunar

Þar sem gervigreind (GV) þróast og fer vaxandi inn í stafræna markaðssetningu, er áhrif hennar á leitarvélastaðsetningu (SEO) að verða veruleg.

Dec. 12, 2025, 1:33 p.m.

Gervigreind: MiniMax og Zhipu AI leggja til framb…

MiniMax og Zhipu AI, tveir leiðandi fyrirtæki á sviði gervigreindar, eru sögð leggja fram tilkynningu um að koma á hlutabréfamarkaðinum í Hong Kong sem fyrst í janúar næsta árs.

Dec. 12, 2025, 1:31 p.m.

OpenAI útnefnir Slack forstjórann Denise Dresser …

Denise Dresser, framkvæmdastjóri Slack, mun hætta sínu starfi til að taka að sér starf sem forstjóri tekju- og sölu hjá OpenAI, fyrirtækinu á bak við ChatGPT.

Dec. 12, 2025, 1:30 p.m.

Tæknifræði á AI myndbandsmyndun bæta skilvirkni k…

kvikmyndageirinn er í mikilli umbreytingu þar sem framleiðslufyrirtæki innleiða sífellt meira gervigreindar- eða gervigreindartækni til myndbandsspuna til að bæta vinnuferla eftir framleiðslu.

Dec. 12, 2025, 1:24 p.m.

19 bestu gáða tól fyrir samfélagsmiðla sem umbrey…

Í-MYNDA er að umbreyta markaðssetningu á samfélagsmiðlum með því að bjóða upp á verkfæri sem einfaldar og efla þátttöku áhorfenda.

Dec. 12, 2025, 9:42 a.m.

Gervigreindaráhrifavaldar á samfélagsmiðlum: Valk…

Tilkoma gervigreindarstofnuðra áhrifavaldar á samfélagsmiðlum táknar stórt skref í þeim umbreytingum sem eru að eiga sér stað í stafræna umhverfinu, og kyndir undir víðtækar umræður um sannleiksgildi nethelgar og siðferðislega ábyrð tengda þessum stafrænu persónum.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today