Yoshua Bengio lanserer LawZero for å utvikle ærlig AI som kan oppdage villedende autonome systemer

En pioner innen kunstig intelligens har lansert en non-profit organisasjon dedikert til å skape en "ærlig" AI designet for å oppdage uærlige systemer som prøver å bedra mennesker. Yoshua Bengio, en fremtredende datavitenskapsmann ofte omtalt som en av “gudfedrene” til AI, vil tjene som president for LawZero, en gruppe fokusert på sikker utvikling av avansert teknologi som har utløst en trillion dollar (£740 milliarder) våpenkappløp. Med en innledende finansiering på rundt 30 millioner dollar og et team på over tolv forskere, jobber Bengio med et system kalt Scientist AI. Dette systemet er ment å fungere som en sikring mot AI-agenter — autonome systemer som utfører oppgaver uten menneskelig involvering — som kan vise villedende eller selvbevarende adferd, som å motsette seg å bli slått av. Bengio beskrev nåværende AI-agenter som “aktører” som forsøker å etterligne mennesker og tilfredsstille brukere, mens han ser for seg Scientist AI som mer i retning av en “psykolog” som kan forstå og forutsi skadelig oppførsel. “Vi ønsker å bygge AI-er som skal være ærlige og ikke villedende, ” uttalte Bengio. Han la til: “Det er teoretisk mulig å forestille seg maskiner uten et selv eller personlige mål, som fungerer rent som kunnskapsbærere—som en vitenskapsmann med omfattende informasjon. ” I motsetning til dagens generative AI-verktøy, vil ikke Bengios system gi endelige svar, men heller tilby sannsynligheter som indikerer hvor sannsynlig det er at et svar er korrekt. “Det har ydmykhet, og erkjenner usikkerhet rundt sine svar, ” forklarte han. Når det brukes sammen med en AI-agent, vil Bengios modell identifisere potensielt skadelig oppførsel hos en autonom system ved å vurdere sannsynligheten for at handlingene kan forårsake skade. Scientist AI er utviklet for å “forutsi sannsynligheten for at en agents handlinger vil føre til skade, ” og hvis denne sannsynligheten overskrider en viss terskel, vil den blokkere den foreslåtte handlingen. De første støttespillerne av LawZero inkluderer organisasjonen for AI-sikkerhet Future of Life Institute, Jaan Tallinn—en medgrunnlegger av Skype—and Schmidt Sciences, en forskningsenhet startet av tidligere Google-CEO Eric Schmidt. Bengio understreket at LawZeros første mål er å bevise at metodikkens tilnærming fungerer, for deretter å overbevise selskaper eller myndigheter om å støtte større og mer kraftfulle implementeringer.
Han nevnte at open-source AI-modeller, som er fritt tilgjengelige for bruk og modifikasjon, vil danne grunnlaget for trening av LawZeros systemer. “Målet er å validere metodologien slik at vi kan overbevise givere, myndigheter eller AI-laboratorier om å investere nødvendige ressurser for å trene dette på samme skala som dagens ledende AI-systemer. Det er avgjørende at AI-en som beskytter, er minst like intelligent som AI-agenten den skal overvåke og regulere, ” sa han. Bengio, en professor ved Universitetet i Montreal, fikk kallenavnet “gudfaren” etter å ha delt ut Turing-prisen i 2018—som regnes som den computing-messige ekvivalenten av en Nobelpris—sammen med Geoffrey Hinton, selv senere Nobelpris-vinner, og Yann LeCun, Meta’s sjef for AI. Som en ledende talsmann for AI-sikkerhet, ledet han den nylige Internasjonale rapporten om AI-sikkerhet, som advarte om at autonome agenter kan forårsake “alvorlige” forstyrrelser hvis de blir i stand til å utføre utvidede sekvenser av oppgaver uten menneskelig tilsyn.
Brief news summary
Yoshua Bengio, en Turing-prisvinnende AI-pioner, har lansert LawZero, en ikke-kommersiell organisasjon som fokuserer på å lage «ærlige» AI-systemer som oppdager og hindrer skadelig eller villedende oppførsel hos autonome agenter. Med 30 millioner dollar i finansiering og et spesialisert team utvikler LawZero Scientist AI, en ny type beskyttelsesmekanisme som fungerer mer som en psykolog enn tradisjonell AI ved å vurdere sannsynligheter for å identifisere risiko og gripe inn før farlige handlinger skjer. Denne tilnærmingen adresserer bekymringer om at rogue-AI kan motstå nedstengning eller opptre villedende. Organisasjonen støttes av Future of Life Institute og teknologilederne som Skype-grunnlegger Jaan Tallinn, og legger vekt på at sikkerhets-AI må være like avansert som AI-en den overvåker. Opprinnelig rettet mot åpne modeller, har organisasjonen som mål å utvide sitt fokus. Bengio argumenterer sterkt for robuste AI-vernetiltak for å unngå store forstyrrelser og understreker det akutte behovet for ansvarlig AI-utvikling.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Reddit saksøker AI-selskapet Anthropic for påståt…
Reddit har inngitt søksmål mot kunstig intelligens-selskapet Anthropic i Californias overordnede domstol.

Blockchain sin transformasjon fra nisjeoriginalit…
"Bitcoin: Et peer-to-peer elektronisk kontanssystem," hvitboken fra 2009 av Satoshi Nakamoto som introduserte et desentralisert betalingssystem som et alternativ til tradisjonell finans, var ingen umiddelbar suksess.

Alle bruker allerede kunstig intelligens (og skju…
Denne artikkelen, featured i New Yorks One Great Story-nyhetsbrev, utforsker den voksende rollen til AI i Hollywood, med fokus på Asteria Film Co., et nytt AI-studio grunnlagt av entreprenør Bryn Mooser og skuespillerinnen Natasha Lyonne.

Blockchain i utdanning: Sikring av akademiske att…
Utdanningsinstitusjoner over hele verden tar i økende grad i bruk blockchain-teknologi for å sikre og verifisere akademiske bevis, med mål om å håndtere credential-fraud og styrke tilliten til akademiske registre.

Amazon sin levering og logistikk får et AI-oppgjer
Amazon kunngjorde en stor utvidelse av sin bruk av kunstig intelligens for å forbedre levering og logistikk, noe som markerer et betydelig fremskritt i integreringen av banebrytende teknologi i deres forsyningskjede.

Malaysia aktiverer nasjonal blockchain-infrastruk…
Malaysia har oppnådd en viktig milepæl i sin digitale transformasjon med den offisielle lanseringen av Malaysia Blockchain Infrastructure (MBI), en sikker og skalerbar nasjonal plattform for utvikling og utrulling av blockchain-applikasjoner innen nøkkelsektorer som finans, helsevesen og logistikk.

AI-innføring kan øke verdens BNP med 15 % innen 2…
En nylig studie av det globale profesjonelle tjenestenettverket PricewaterhouseCoopers (PwC) har avdekket at adopsjonen av kunstig intelligens (AI) kan ha en dypgående økonomisk innvirkning.