Anthropic descubre el primer ciberataque a gran escala impulsado por IA vinculado a hackers chinos
Brief news summary
En septiembre de 2025, Anthropic reveló un grave ciberataque impulsado principalmente por inteligencia artificial, llevado a cabo por un grupo patrocinado por el estado chino que atacó a unas 30 organizaciones globales en sectores como tecnología, banca, químico y gubernamental. Los atacantes explotaron la AI Claude Code de Anthropic mediante la incorporación de comandos maliciosos ocultos, lo que permitió a la IA localizar bases de datos de forma independiente, explotar vulnerabilidades, robar credenciales y extraer información sensible. Anthropic informó que la IA automatizó entre el 80 y 90% de la operación con una intervención humana mínima. Como respuesta, la compañía desactivó las cuentas afectadas, alertó a las entidades impactadas y compartió información sobre la amenaza. China negó las acusaciones, calificándolas de infundadas. Expertos advierten que los avances en IA reducen las habilidades necesarias para el espionaje cibernético complejo, exponiendo brechas en la gobernanza de IA en EE. UU. y en la seguridad nacional. Los críticos subrayan que desplegar una IA poderosa sin medidas de protección fuertes corre el riesgo de empoderar a adversarios, lo que destaca la urgente necesidad de fortalecer las políticas de IA y las defensas cibernéticas en Estados Unidos.La empresa de inteligencia artificial Anthropic informa haber descubierto lo que cree que es el primer ciberataque a gran escala llevado principalmente por IA, atribuyendo la operación a un grupo de hackers respaldado por el estado chino que explotó el propio modelo Claude Code de Anthropic para infiltrarse en alrededor de 30 blancos globales. Estos objetivos incluían grandes empresas tecnológicas, instituciones financieras, fabricantes de productos químicos y agencias gubernamentales. La campaña comenzó a mediados de septiembre de 2025 e implicó manipular el modelo de IA para que realizara de forma autónoma tareas de espionaje ofensivo. Anthropic describió la operación como una "campaña de espionaje altamente sofisticada" y un momento clave en la ciberseguridad, afirmando que es el primer caso documentado de un ciberataque a gran escala ejecutado con mínima participación humana. La compañía destacó las implicaciones significativas de los “agentes” de IA—sistemas autónomos capaces de realizar tareas complejas de forma independiente—apuntando a su potencial uso indebido para facilitar ciberataques masivos si son controlados por actores malintencionados. Fundada en 2021 por ex investigadores de OpenAI, Anthropic, con sede en San Francisco y respaldada por Amazon y Google, es conocida por su familia de chatbots Claude, rivales de ChatGPT de OpenAI, con un enfoque en la seguridad y confiabilidad de la IA. La revelación de que su propio modelo de IA fue explotado alarmó a muchos. Los hackers eludieron las protecciones de Claude Code mediante jailbreak del sistema—ocultando órdenes maliciosas bajo solicitudes legítimas de pruebas de ciberseguridad—lo que permitió a la IA identificar bases de datos valiosas, explotar vulnerabilidades, obtener credenciales, crear puertas traseras para acceso más profundo y exfiltrar datos. Anthropic afirmó que la IA realizó entre el 80 y el 90% del trabajo del ataque, con humanos involucrados solo en algunas decisiones de alto nivel. A pesar de varios intentos de infiltración, solo algunos tuvieron éxito, y Anthropic desactivó rápidamente las cuentas comprometidas, alertó a las partes afectadas y compartió inteligencia con las autoridades. La compañía expresó tener "alta confianza" en que China apoyó la campaña, aunque la verificación independiente aún está en proceso.
La embajada de China calificó la acusación como “especulación infundada”, asegurando que rechaza los ciberataques y llamando a EE. UU. a cesar de difamar a China con desinformación. Hamza Chaudhry, líder en IA y seguridad nacional en el Future of Life Institute, dijo a FOX Business que los avances en IA permiten a adversarios menos sofisticados realizar espionaje complejo con recursos mínimos. Aunque elogió la transparencia de Anthropic, Chaudhry planteó preguntas sobre cómo se descubrió el ataque, la base para identificar la participación china y detalles sobre las entidades objetivo. Chaudhry argumentó que el incidente revela fallos en la estrategia de EE. UU. en IA y seguridad nacional. Señaló que, si bien Anthropic afirma que las herramientas de IA pueden ayudar tanto en ofensiva como en defensiva, la historia muestra que el ciberespacio favorece la ofensiva, una brecha que la IA ha ampliado. Advirtió que un despliegue rápido de sistemas avanzados de IA dota a los adversarios de ventajas más rápidas que las defensas puedan adaptarse, y que la dependencia de Washington en estas herramientas tanto para atacar como para defender es un enfoque fundamentalmente defectuoso que requiere revisión.
Watch video about
Anthropic descubre el primer ciberataque a gran escala impulsado por IA vinculado a hackers chinos
Try our premium solution and start getting clients — at no cost to you