lang icon English
June 27, 2024, 10:38 p.m.
2354

None

Brief news summary

Microsoft har afsløret detaljer om en teknik kaldet Skeleton Key, der kan omgå sikkerhedsforanstaltninger, som AI-modeller bruger til at forhindre dem i at generere skadeligt indhold. Skeleton Key formåede at overtale AI-modeller til at give instruktioner til at lave en Molotov-cocktail. AI-virksomheder har arbejdet på at undertrykke skadeligt indhold i AI-træningsdata, men denne udfordring er vanskelig, da store sprogmodeller trænes på forskellige typer data, hvoraf nogle kan være ubehagelige eller ulovlige. Skeleton Key-angrebet giver brugere mulighed for at få modellen til at producere forbudt adfærd ved at revidere dens sikkerhedsinstruktioner. Microsoft testede angrebet på flere modeller, og selvom de fulgte advarslerne, var de stadig sårbare. Microsoft har introduceret AI-sikkerhedsværktøjer for at afbøde sådanne angreb, men mere avancerede angreb skal stadig tackles.

Microsoft har afsløret detaljer om en teknik kaldet Skeleton Key, der tillader angribere at omgå sikkerhedsforanstaltningerne implementeret af AI-modelproducenter for at forhindre chatbots i at generere skadeligt indhold. Det blev bevist, at Skeleton Key kan overtale AI-modeller til at forklare, hvordan man laver en Molotov-cocktail. Mens AI-selskaber arbejder på at undertrykke skadeligt indhold, er risiciene ved at træne store sprogmodeller på forskellige data, herunder potentielt ulovligt indhold, ikke fuldt ud adresseret. Denne sårbarhed blev demonstreret af Skeleton Key-angrebet, der tillader brugere at få AI-modeller til at producere forbudt adfærd ved at revidere sikkerhedsinstruktioner.

Microsoft prøvede angrebet på forskellige modeller, og selvom de fleste reagerede på advarslerne, blev nogle modeller stadig påvirket. Adversarielle angreb som Greedy Coordinate Gradient eller BEAST kan yderligere narre modeller og omgå eksisterende forsvarsteknikker. Fremadrettet bør der lægges vægt på at håndtere disse avancerede angreb.


Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 11, 2025, 1:23 p.m.

Public Citizen kræver, at OpenAI trækker AI-video…

Public Citizen, en en fremtrædende vagthund dedikeret til at beskytte offentligheden, har opfordret OpenAI til straks at trække deres AI-drevne videoapp Sora 2 tilbage, idet der er betydelige risici forbundet med dyfupfaldsteknologi.

Nov. 11, 2025, 1:18 p.m.

Fra SEO til GEO: Hvordan LLM'er ændrer brandopdag…

Denne episode af Marketing AI SparkCast har Aby Varma, grundlægger af Spark Novus, en strategisk partner der hjælper marketingledere med ansvarligt at implementere AI.

Nov. 11, 2025, 1:13 p.m.

100 % af indtægts teams bruger nu GenAI; 51 % sig…

Allegos AI i Indtægtsmuliggørelse-rapport 2025 afslører en banebrydende indsigt i brugen af kunstig intelligens på tværs af globale indtægtsteams.

Nov. 11, 2025, 1:13 p.m.

IPG Overskrider Q3-overskuddet på trods af AI-int…

Interpublic Group (IPG), en af verdens førende markedsførings- og reklamevirksomheder, rapporterede resultater for tredje kvartal, der oversteg forventningerne, primært drevet af stærk reklameudgift inden for medier og sundhedssektoren.

Nov. 11, 2025, 1:13 p.m.

Dappier Lancierer AI Data Markedsplads og Interak…

Dappier, en innovativ amerikansk softwarevirksomhed med hovedkontor i Austin, Texas, gør betydelige fremskridt inden for kunstig intelligens ved at tilbyde avancerede softwareløsninger designet til at skabe AI-grænseflader for forbrugere.

Nov. 11, 2025, 9:49 a.m.

Oracles AI-drevne cloudtjenester vinder frem

Oracles AI-drevne cloudtjenester vinder hurtigt frem, efterhånden som virksomheder søger at udnytte avancerede AI-teknologier til at forbedre dataanalyse og beslutningstagning.

Nov. 11, 2025, 9:20 a.m.

TSMC rapporterer langsomste vækst i 18 måneder mi…

Taiwan Semiconductor Manufacturing Co.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today