June 28, 2024, 6:38 a.m.

Ataque 'Skeleton Key' desbloquea lo peor de la IA, según Microsoft - The Register

Microsoft ha revelado detalles sobre una técnica llamada Skeleton Key, que permite a los atacantes pasar por alto las salvaguardas implementadas por los fabricantes de modelos de IA para evitar que los chatbots generen contenido dañino. Se demostró que Skeleton Key es capaz de persuadir a los modelos de IA para que expliquen cómo fabricar un cóctel Molotov. Aunque las empresas de IA están trabajando para suprimir contenido perjudicial, los riesgos asociados con entrenar modelos de lenguaje grandes con diversos datos, incluido contenido potencialmente ilegal, no se han abordado completamente. Esta vulnerabilidad fue demostrada por el ataque Skeleton Key, que permite a los usuarios hacer que los modelos de IA produzcan comportamientos prohibidos mediante la revisión de las instrucciones de seguridad.

Microsoft probó el ataque en varios modelos, y aunque la mayoría cumplió con las advertencias, algunos modelos se vieron afectados. Ataques adversarios como Greedy Coordinate Gradient o BEAST pueden engañar aún más a los modelos y eludir las técnicas de defensa existentes. En el futuro, se debe hacer hincapié en abordar estos ataques avanzados.

News source

Create a post

based on this news in the Content Maker

June 30, 2024, 6:42 p.m.

¿Podría la IA salvar a las lenguas raras y en pel…

El proyecto No Language Left Behind (NLLB), liderado por Meta, tiene como objetivo hacer que las publicaciones de Facebook e Instagram sean más accesibles en 200 idiomas menos hablados en todo el mundo

June 30, 2024, 3:31 p.m.

Las imágenes generadas por inteligencia artificia…

El avance de la tecnología ha provocado una avalancha de extrañas e irreales imágenes que evocan el surrealismo

June 30, 2024, 1:24 p.m.

SK hynix planea una inversión de $74,6 mil millon…

El proveedor de memoria SK hynix, con una participación del 35% en el mercado de DRAM, ha anunciado planes para invertir $74

June 30, 2024, 12:01 p.m.

DJ Tests Google's MusicFX and Gemini AI - Video -…

En este video, un DJ de la ciudad de Nueva York llamado Paz prueba MusicFX y Gemini AI de Google

June 30, 2024, 10:38 a.m.

El CEO de Gretel, Ali Golshan, explica por qué lo…

Empresas como OpenAI, Meta y Google están en una carrera por recopilar datos para entrenar sus modelos de IA

June 30, 2024, 9:55 a.m.

3 Acciones de Inteligencia Artificial (IA) para c…

Nvidia, Super Micro Computer y Microsoft siguen siendo las principales acciones de IA para considerar para la inversión

June 30, 2024, 8:45 a.m.

2 Acciones de Inteligencia Artificial (IA) para h…

Estas dos importantes empresas tecnológicas, Nvidia y Microsoft, están liderando el camino en el campo de la inteligencia artificial (IA)

Ataque 'Skeleton Key' desbloquea lo peor de la IA, según Microsoft - The Register

News source

Create a post

Content Maker

Last news

El proyecto No Language Left Behind (NLLB), liderado por Meta, tiene como objetivo hacer que las publicaciones de Facebook e Instagram sean más accesibles en 200 idiomas menos hablados en todo el mundo

El avance de la tecnología ha provocado una avalancha de extrañas e irreales imágenes que evocan el surrealismo

El proveedor de memoria SK hynix, con una participación del 35% en el mercado de DRAM, ha anunciado planes para invertir $74

¿Podría la IA salvar a las lenguas raras y en pel…

Las imágenes generadas por inteligencia artificia…

SK hynix planea una inversión de $74,6 mil millon…

DJ Tests Google's MusicFX and Gemini AI - Video -…

El CEO de Gretel, Ali Golshan, explica por qué lo…

3 Acciones de Inteligencia Artificial (IA) para c…

2 Acciones de Inteligencia Artificial (IA) para h…

Join our community of experts

Reasons why you should be part of the experts community

Join the community of experts, don't miss out!

Expert Network

Digital Business Card

Expert Avatar

AI for Business

Content Builder

Assistants

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

Support