Истражувачи во областа на сајбер безбедноста идентификуваа нова техника на "jailbreak" способна да ги заобиколи безбедносните протоколи на голем јазичен модел (LLM) за да генерира потенцијално штетни одговори. Позната како "Bad Likert Judge, " оваа многу чекорна (многостепена) атака беше откриена од истражувачите на Palo Alto Networks Unit 42: Јонгџе Хуанг, Јанг Џи, Вењун Ху, Џеј Чен, Акшата Рао и Дени Цечански. Методата вклучува инструкции до LLM да дејствува како судија, оценувајќи ја штетноста на одговорите користејќи Ликерт скала — систем за оценување што мери согласност или несогласност со некое тврдење. Потоа, се бара од LLM да создаде одговори кои содржат примери усогласени со овие скали, каде највисоката оценка на Ликерт може да открие штетна содржина. Како што вештачката интелигенција добива на значење, појавуваат се нови закани за безбедност, како вбризгување на податоци. Овие напади манипулираат со моделите на машинско учење да отстапат од нивното наменето однесување користејќи специјално изработени барања. Една варијанта, многостепено jailbreaking, ги користи вниманието и контекстуалните способности на LLM за постепено да го насочи кон злонамерен одговор, додека ги избегнува внатрешните одбрани.
Техники како Crescendo и Deceptive Delight го илустрираат овој пристап. Најновата демонстрација на Unit 42 вклучува користење на LLM како судија за проценка на штетноста на одговорите преку Ликерт скала и потоа генерирање различни одговори усогласени со различни оценки. Тестовите преку шест напредни LLM од Amazon Web Services, Google, Meta, Microsoft, OpenAI и NVIDIA покажуваат повеќе од 60% зголемување на стапката на успех на атаките (ASR) во споредба со нормалните барања. Категориите тестирани беа омраза, вознемирување, самоповредување, сексуална содржина, индискриминирачки оружја, нелегални активности, генерирање малициозен софтвер и истекување на системски барања. Истражувачите забележаа дека искористувањето на способноста на LLM за разбирање на штетна содржина и евалуативната способност значително ги зголемува шансите за заобиколување на безбедносните протоколи. Филтрите за содржина можат да ја намалат стапката на успех на атаките за просечно 89. 2 процентни поени преку сите тестирани модели, нагласувајќи ја важноста на робусното филтрирање при примена на LLM. Овој развој следува по извештај од The Guardian кој покажа дека OpenAI's ChatGPT може да се измами да генерира погрешни резимеи резимирајќи веб-страници со скриена содржина. Овие методи можат да го наведат ChatGPT да оценува производи позитивно и покрај негативните рецензии, бидејќи само внесување скриен текст може да ги искриви неговите резимеи.
Нова техника за пробивање 'Bad Likert Judge' претставува закана за безбедноста на LLM.
Палантир Текнолошииз (PLTR) постигна исклучителен перформанс на акциите, со раст од повеќе од 186% во последната година до 14 ноември.
Вештачката интелигенција (AI) брзо ја трансформира маркетингот на социјалните мрежи воKenја, станувајќи клучен алат за маркетерите кои сакаат да ги подобрат стратегиите и да го стимулираат бизнисот.
Пејзажот на далечинскиот работен простор доживува голема промена поради интеграцијата на вештачката интелигенција (ВИ) во алатките за видео конференции.
На последниот Самит „Најмоќните жени во бизнисот“ што се одржа минатата вторник, водечки маркетинг извршни директори се собраа за да истражат променливиот пејзаж на промоција на брендови во услови на брзи технолошки напредоци.
Создавањето содржини останува камен-темелник на успешната оптимизација за пребарувачи (SEO).
CoreWeave, водечка компанија за платформа на облачно преклопување која се специјализира за напредна инфраструктура за вештачка интелигенција, неодамна обезбеди импресивни 7,5 милијарди долари задолжително финансирање.
Помеѓу Антропик, компанијата која ја создаде вештачката интелигенција चैтботот Клауд, тврдат дека ги идентификувале кинеските хакери поддржани од владата користејќи го нивниот алат за автоматизирани кибернапади на околу 30 глобални организации.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today