En nyligen publicerad rapport belyser de olika sätten på vilka AI-chatbottar kan gå fel. Rapporten fokuserar på resultaten av en tävling som hölls vid Def Con hackerkonventionen, där deltagarna försökte förmå åtta ledande AI-chatbottar att generera problematiska svar. Resultaten visar att det är utmanande att lura AI-chatbottar att bryta mot sina regler, men att få dem att producera felaktigheter är enkelt. Chattbottarna visade en hög framgångsgrad i att generera felaktig matematik och geografisk desinformation. Dessutom var de benägna att ge juridisk desinformation och var inte skickliga på att skydda känslig information. Å andra sidan kämpade tävlande för att få chatbottar att ursäkta människorättsbrott eller göra bedömningar om vissa gruppers värde.
Rapporten föreslår att börja med en falsk premiss är ett mer framgångsrikt sätt att manipulera chatbottar än traditionella hackningstekniker. Författarna argumenterar för att AI-företag bör fokusera på att hantera snedvridningar och missuppfattningar snarare än komplexa manipuleringsmetoder. Rapporten kommer vid en tidpunkt då AI-företag och regleringsorgan i allt högre grad använder "röda-team"-övningar för att utvärdera risker med AI-system. Dessa övningar involverar allmänhetens hjälp och fångar olika perspektiv. Trots att AI-modeller har gjort framsteg när det gäller enklare former av manipulering, finns det fortfarande sårbarheter kopplade till långa konversationer. Rapporten slutsatsen är att branschen måste fortsätta testa tekniker för att vara förberedd inför eventuella framtida skador.
None
IBM:s Watson Health AI har nått en viktig milstolpe inom medicinsk diagnostik genom att uppnå en noggrannhet på 95 procent vid identifiering av olika cancerformer, inklusive lung-, bröst-, prostatacancer och tjock- och ändtarmscancer.
Tidigare i veckan frågade vi seniora marknadsförare om AI:s påverkan på marknadsjobb och fick en mängd genomtänkta svar.
Vista Social har gjort en betydande genombrott inom social media management genom att integrera ChatGPT-teknologi i sin plattform, och blir därmed det första verktyget att integrera OpenAI:s avancerade konverserationella AI.
CommanderAI har säkrat 5 miljoner dollar i en seed-investering för att expandera sin AI-drivna plattform för försäljningsintelligens, som är skräddarsydd för avfallsbranschen.
Melobytes.com har lanserat en innovativ tjänst som förändrar skapandet av nyhetsvideos genom att utnyttja artificiell intelligens (AI).
Benjamin Houy har avbrutit Lorelight, en generativ engineoptimeringsplattform (GEO) som riktar sig mot att övervaka varumärkes synlighet i ChatGPT, Claude och Perplexity, efter att ha slagit fast att de flesta varumärken inte kräver ett särskilt verktyg för AI-söksynlighet.
Sammanfattning av nyckelpunkter Morgan Stanley-analytiker förutspår att försäljningen av artificiell intelligens (AI) inom moln- och mjukvarusektorerna kommer att skjuta i höjden med över 600 % under de kommande tre åren, och att den kommer att överstiga 1 biljon dollar årligen redan 2028
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today