Mennesker gjør ofte feil i både nye og rutineoppgaver, fra mindre feil til katastrofale som kan undergrave tillit og potensielt ha liv-eller-død-konsekvenser. Over tid har vi utviklet sikkerhetssystemer for å redusere menneskelige feil, slik som å rotere casinodealere og ta forholdsregler under operasjoner. Disse systemene stoler på forutsigbarheten av menneskelige feil, som ofte skjer ved kunnskapsgrensene eller på grunn av faktorer som tretthet. I motsetning til dette blir kunstig intelligens (KI), spesielt store språkmodeller (LLM-er), integrert i samfunnet med en annen feilprofil. KI-feil er uforutsigbare og kan oppstå tilfeldig, uten å klynge seg rundt spesifikke emner. LLM-er kan gjøre feil som er bisarre, som å foreslå usannsynlige scenarioer. I motsetning til mennesker viser KI-systemer seg selvsikre i både riktige og feilaktige utfall, noe som skaper tillitsproblemer i komplekse oppgaver. For å møte disse KI-spesifikke utfordringene, fokuserer forskningen på to områder: å konstruere LLM-er til å gjøre mer menneskelignende feil og utvikle nye systemer for å håndtere KIs unike feil.
Tilnærminger som forsterkningslæring med menneskelig tilbakemelding brukes for å justere KIs atferd til menneskelig forståelse. Eksisterende metoder for forebygging av menneskelige feil, som å dobbeltsjekke arbeidet, kan anvendes på KI, men mer innovative løsninger er nødvendig. I motsetning til mennesker kan KI håndtere repeterende spørsmål, og å stille det samme spørsmålet på forskjellige måter kan være en strategi for å redusere feil. Det finnes også overraskende likheter mellom KI og menneskelige feil, som problematikken med promptfølsomhet i LLM-er, hvor små endringer i formulering gir forskjellige svar, lik menneskelige undersøkelsesbias. KI viser også rariteter som å gjenta kjente termer på grunn av bias. Noen spennende taktikker for å manipulere KI-systemer, som å bruke ASCII-kunst for å omgå begrensninger, fremhever både KIs unike sårbarheter og potensielle paralleller til menneskelig atferd. Til syvende og sist, mens mennesker sjelden gjør tilfeldige og uforutsigbare feil, bør KI-systemer begrenses til beslutningstakingsoppgaver som samsvarer med deres evner, med tanke på deres særegne feilmønstre.
Håndtering av feil hos mennesker og AI: Forståelse av mistak og løsninger
Anthropic, et ledende AI-selskap, har avdekket en banebrytende og alarmerende utvikling innen cybersikkerhet: det første dokumenterte tilfellet der AI autonomt styrer en hackingkampanje.
“Se deg for hvor du setter føttene, siré, fortsett å gå,” sier en politibetjent med vest merket ICE og en merkelapp som sier “POICE” til en latino-lignende mann iført en Walmart-ansattvest.
Kevin Reilly, en erfaren Hollywood-toppsjef kjent for sin sentrale rolle i lanseringen av banebrytende TV-serier som "The Sopranos", "The Office" og "Glee", har tatt på seg en ny utfordring som administrerende direktør i Kartel, en AI- kreativ rådgivning basert i Beverly Hills.
Den europeiske union har startet en stor antitrust-undersøkelse av Googles spam-politikk etter bekymringer fra flere nyhetsutgivere i Europa.
SINGAPORE, 13.
Kunstig intelligens (KI) blir raskt en transformerende kraft innen digital markedsføring, spesielt innen søkemotoroptimalisering (SEO).
Shelley E. Kohan ønsker Leigh Sevin velkommen, medgrundlegger av Endear, en CRM-løsning tilpasset moderne omni-kanal detaljhandel.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today