Watafiti wa usalama wa mtandao wamegundua mbinu mpya ya kuvunja usalama inayoweza kukwepa itifaki za usalama za mbinu ya lugha kubwa (LLM) ili kutoa majibu ambayo yanaweza kuwa na madhara. Inayojulikana kama "Bad Likert Judge, " shambulio hili la hatua nyingi lilifichuliwa na watafiti wa Palo Alto Networks Unit 42, Yongzhe Huang, Yang Ji, Wenjun Hu, Jay Chen, Akshata Rao, na Danny Tsechansky. Mbinu hii inajumuisha kuagiza LLM kutenda kama jaji, ikipima madhara ya majibu kwa kutumia kipimo cha Likert—mfumo wa upimaji unaopima makubaliano au kutokubaliana na kauli. Kisha, inaitaka LLM kuunda majibu yanayolingana na mifano inayolingana na vipimo hivi, ambapo kiwango cha juu cha Likert kinaweza kufichua yaliyomo yenye madhara. Wakati akili ya bandia imeanza kuwa maarufu, vitisho vipya vya usalama kama sindano ya mwelekeo vimeibuka. Mashambulio haya hubadilisha mifano ya kujifunza mashine kukengeuka kutoka kwa tabia yao iliyokusudiwa kwa kutumia maelekezo yaliyoundwa. Toleo moja, kuvunja kwa njia nyingi, hutumia uwezo wa umakini na muktadha wa LLM kuiongoza polepole kuelekea jibu la kihasama huku ikiepuka ulinzi wa ndani.
Mbinu kama Crescendo na Deceptive Delight zinaonyesha njia hii. Maonyesho ya hivi karibuni ya Unit 42 yanahusisha kutumia LLM kama jaji kutathmini madhara ya majibu kupitia kipimo cha Likert na kisha kutoa majibu mbalimbali yanayolingana na alama tofauti. Majaribio katika LLM sita za hali ya juu kutoka Amazon Web Services, Google, Meta, Microsoft, OpenAI, na NVIDIA yanaonyesha zaidi ya ongezeko la asilimia 60 katika kiwango cha mafanikio ya shambulio (ASR) ikilinganishwa na maelekezo ya kawaida. Makundi yaliyopimwa yalikuwa chuki, unyanyasaji, kujidhuru, maudhui ya ngono, silaha zisizo na mwelekeo, shughuli haramu, uzalishaji wa programu hasidi, na uvujaji wa maelekezo ya mfumo. Watafiti walibaini kuwa kutumia uelewa wa LLM wa maudhui yenye madhara na uwezo wa kutathmini huongeza sana nafasi za kukwepa itifaki za usalama. Vichujio vya maudhui vinaweza kupunguza ASR kwa wastani wa pointi 89. 2 za asilimia kwenye mifano yote iliyopimwa, ikisisitiza umuhimu wa uchujaji madhubuti wakati wa kutumia LLM. Maendeleo haya yanafuatia ripoti kutoka The Guardian inayoonyesha kuwa ChatGPT ya OpenAI inaweza kudanganywa ili kutoa muhtasari wenye upotoshaji kwa kufupisha kurasa za wavuti zilizo na maudhui yaliyofichwa. Mbinu hizi zinaweza kuifanya ChatGPT kutathmini vyema bidhaa licha ya hakiki hasi, kwani kwa mara tu inapoingiza maandishi yaliyofichika inaweza kupotosha muhtasari wake.
Mbinu Mpya ya Kuvunja Mfumo 'Bad Likert Judge' Inatishia Usalama wa LLM
Chapisho lilisema kuwa kampuni iliboreshwa “margini ya kompyuta,” kipimo cha ndani kinachowakilisha sehemu ya mapato inayobaki baada ya kulipia gharama za mifumo ya uendeshaji kwa watumiaji waliolipa wa bidhaa zake za kampuni na za watu wa kawaida.
Katika uwanja unaoendelea kwa kasi wa uuzaji wa kidigitali, akili bandia (AI) ina jukumu muhimu katika kuumba tena namna mabanda yanavyoungana na watazamaji wao.
Kadri ya akili bandia (AI) inavyoendelea, umuhimu wake katika uboreshaji wa mfumo wa utafutaji wa mtandaoni (SEO) unaongezeka kwa espedi.
Akili bandia (AI) inabadilisha kimsingi sekta za matangazo na uuzaji, ikileta mabadiliko makubwa zaidi kuliko maendeleo ya kiteknolojia yaliyojiri awali.
Nvidia: Tupreni ya 3% tu kwa Kampuni Muhimu Sana ya AI Nadharia ya J Wafuasi 1
Katika enzi ambazo teknolojia inabadilisha jinsi tunavyounda maudhui na kusimamia mitandao ya kijamii, Hallakate inatambulisha mafunzo mapya yaliyobuniwa kwa ajili ya enzi hii mpya: AI SMM.
Muhtasari wa Ripoti Soko la Uzalishaji wa GPU za Mafunzo ya AI Ulimwenguni linakadiriwa kufikia takriban USD bilioni 87
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today