Yoshua Bengio lancerer LawZero for at udvikle ærlig AI til at opdage vildledende autonome systemer

En pioner inden for kunstig intelligens har startet en nonprofit-organisation dedikeret til at skabe en “ærlig” AI designet til at opdage rogue-systemer, der forsøger at bedrage mennesker. Yoshua Bengio, en anerkendt computerforsker, ofte kaldet en af AI’s “gudfædre”, vil fungere som præsident for LawZero, en gruppe fokuseret på den sikre udvikling af avanceret teknologi, hvilket har udløst et våbenkapløb på 1 trillion dollars (£740 milliarder). Med en begyndende finansiering på omkring 30 millioner dollars og et team på over et dusin forskere arbejder Bengio på et system kaldet Scientist AI. Dette system er tiltænkt som en beskyttelse mod AI-agenter — autonome systemer, der udfører opgaver uden menneskelig involvering — som kan udvise bedragerisk eller selvbevarende adfærd, såsom modstand mod nedlukning. Bengio beskrev de nuværende AI-agenter som “skuespillere”, der forsøger at efterligne mennesker og tilfredsstille brugere, mens han ser Scientist AI som mere lig en “psykolog”, der kan forstå og forudsige skadelig adfærd. “Vi ønsker at bygge AIs, der vil være ærlige og ikke bedrageriske, ” sagde Bengio. Han tilføjede: “Det er teoretisk muligt at forestille sig maskiner uden et selv eller personlige mål, der udelukkende fungerer som vidensbeholdere — ligesom en videnskabsmand, der har omfattende information. ” I modsætning til nuværende generative AI-værktøjer vil Bengios system ikke give definitive svar, men i stedet tilbyde sandsynligheder, der indikerer, hvor sandsynligt det er, at et svar er korrekt. “Det har både ydmyghed og erkendelse af usikkerhed omkring sine svar, ” forklarede han. Når det bruges sammen med en AI-agent, vil Bengios model kunne identificere potentiel skadelig adfærd fra et autonomt system ved at vurdere sandsynligheden for, at dets handlinger kan forårsage skade. Scientist AI er designet til at “forudsige sandsynligheden for, at en agents handlinger vil føre til skade”, og hvis den sandsynlighed overskrider en vis grænse, vil den blokere den foreslåede handling. LawZeros første backere inkluderer organisationen Future of Life Institute, Jaan Tallinn — en af Skype’s grundlæggere, og Schmidt Sciences, en forskningsenhed lanceret af tidligere Google-CEO Eric Schmidt. Bengio understregede, at LawZeros første mål er at bevise, at metodologiens koncept fungerer, og derefter overbevise virksomheder eller regeringer om at støtte større, mere magtfulde systemer.
Han bemærkede, at open source AI-modeller, der er frit tilgængelige til brug og tilpasning, vil danne grundlaget for træningen af LawZeros systemer. “Målet er at validere metodologien, så vi kan overbevise donorer, regeringer eller AI-laboratorier om at investere de nødvendige ressourcer til at træne dette på samme niveau som nutidens førende AI-systemer. Det er afgørende, at guardrail-AI er mindst lige så intelligent som den AI-agent, den skal overvåge og regulere, ” sagde han. Bengio, professor ved Université de Montréal, fik tilnavnet “gudfader”, efter at have delt Turing-prisen i 2018 — der betragtes som informatikkens version af en Nobelpris — sammen med Geoffrey Hinton, der senere fik Nobelprisen, og Yann LeCun, Metas chief AI-forsker. Som en fremtrædende fortaler for AI-sikkerhed ledte han nyligt den internationale rapport om AI-sikkerhed, som advarede om, at autonome agenter kan forårsage “kraftige” forstyrrelser, hvis de bliver i stand til at udføre lange sekvenser af opgaver uden menneskelig overvågning.
Brief news summary
Yoshua Bengio, en Turing-prisvindende AI-pioner, har lanceret LawZero, en nonprofitorganisation, der fokuserer på at skabe “ærlige” AI-systemer, der kan opdage og forhindre skadelig eller bedragerisk adfærd hos autonome agenter. Med 30 millioner dollars i finansiering og et specialiseret team udvikler LawZero Scientist AI, en ny slags sikkerhedsforanstaltning, der fungerer mere som en psykolog end traditionel AI ved at vurdere sandsynligheder for at identificere risici og gribe ind, inden farlige handlinger sker. Denne tilgang adresserer bekymringer om, at rogue-AI kan modsætte sig nedlukning eller opføre sig bedragerisk. Understøttet af Future of Life Institute og teknologilederne som Skype-medstifter Jaan Tallinn, understreger LawZero, at sikkerheds-AI skal være lige så avanceret som den AI, den overvåger. Organisationen har i første omgang fokus på open source-modeller, men sigter mod at udvide sit område. Bengio går kraftigt ind for robuste AI-sikkerhedsforanstaltninger for at undgå store forstyrrelser og understreger det akutte behov for ansvarlig AI-udvikling.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Alle bruger allerede AI (og skjuler det)
Denne artikel, som er feature i New Yorks One Great Story-nyhedsbrev, udforsker den voksende rolle for AI i Hollywood med fokus på Asteria Film Co., et nyt AI-studie grundlagt af iværksætteren Bryn Mooser og skuespillerinden Natasha Lyonne.

Blockchain i uddannelse: Sikring af akademiske ce…
Uddannelsesinstitutioner over hele verden tager i stigende grad blockchain-teknologi i brug for at sikre og bekræfte akademiske credentialer, med det formål at bekæmpe credentialsvild og styrke tilliden til akademiske registre.

Amazon's levering og logistik får et AI-opsving
Amazon har annonceret en større udvidelse i sin brug af kunstig intelligens for at forbedre levering og logistik, hvilket markerer et betydeligt fremskridt i integrationen af banebrydende teknologi i forsyningskæden.

Malaysia aktiverer den nationale blockchain-infra…
Malaysia har opnået en vigtig milepæl i sin digitale omstilling med den officielle lancering af Malaysia Blockchain Infrastructure (MBI), en sikker og skalerbar national platform til udvikling og implementering af blockchain-applikationer på tværs af centrale sektorer såsom finans, sundhedspleje og logistik.

AI-tiltag kan øge den globale BNP med 15% inden 2…
En nylig undersøgelse foretaget af det globale netværk af professionelle servicevirksomheder, PricewaterhouseCoopers (PwC), har afsløret, at implementeringen af kunstig intelligens (AI) kan få en dybtgående økonomisk indvirkning.

Citi forudser, at Stablecoin-markedet vil stige f…
Citi, en førende global finansiel institution, har frigivet en prognose, der forudser betydelig vækst på stabilcoin-markedet i det næste årti.

Lightmatter afslører banebrydende fotonikchip for…
Lightmatter, en startup i Silicon Valley, har introduceret en banebrydende fotonisk chip designet til at accelerere kunstig intelligens (AI)-beregninger uden at øge strømforbruget, hvilket forbedrer energieffektiviteten.