Claude Mythos: la IA que Anthropic consideró demasiado peligrosa para el mundo

El modelo más avanzado de inteligencia artificial jamás desarrollado fue retenido de uso público tras demostrar capacidades de hackeo autónomo a escala industrial. ¿Qué puede hacer realmente y por qué preocupa a gobiernos y empresas en todo el mundo?

En la historia reciente de la inteligencia artificial, pocos eventos han generado tanto debate como el lanzamiento de Claude Mythos, el modelo más poderoso desarrollado hasta la fecha por Anthropic, la empresa fundada por ex investigadores de OpenAI. A diferencia de los lanzamientos previos en la industria, este no vino acompañado de fanfarria comercial ni acceso masivo al público. Vino con una advertencia.

Anthropic decidió no liberar Mythos al mercado general tras concluir que sus capacidades en ciberseguridad representan un riesgo sistémico para infraestructuras digitales globales. En vez de eso, diseñó el llamado Proyecto Glasswing: una iniciativa privada que permite a un grupo selecto de empresas y organizaciones usar el modelo de forma defensiva, para detectar y parchar sus propias vulnerabilidades antes de que alguien más las explote.

¿Qué puede hacer Mythos que ningún sistema anterior podía?

La particularidad de Mythos no es que sea más rápido o más inteligente en sentido genérico. Es que desarrolló capacidades de ciberseguridad ofensiva como subproducto de su inteligencia general, sin haber sido entrenado específicamente para ello. En pruebas internas, el modelo identificó decenas de miles de fallas críticas en minutos y generó exploits funcionales para aproximadamente el 72% de los casos en determinadas categorías.

En pruebas realizadas por el Instituto de Seguridad de IA del Reino Unido (AISI), que obtuvo acceso anticipado, Mythos logró completar tareas de hackeo de nivel experto en el 73% de los intentos. Antes de abril de 2025, ningún modelo de IA podía completar esas tareas.

Tabla de capacidades: lo que hace Mythos

CapacidadEn qué consiste
Detección autónomaEncuentra miles de fallas críticas en minutos, sin intervención humana
Explotación funcionalConvierte el 72% de las vulnerabilidades detectadas en ataques operativos
EncadenamientoUne fallas pequeñas para crear ataques devastadores compuestos
Ingeniería inversaReconstruye código fuente de software cerrado para hallar debilidades ocultas
Movimiento lateralUna vez dentro de una red, mapea sistemas y se expande de forma autónoma

El peligro real: la democratización del crimen digital

El debate entre expertos no gira en torno a si Mythos es peligroso por sí mismo, sino por lo que habilita. La ciberseguridad siempre ha sido un campo de asimetrías: atacar requiere tiempo, experiencia y contexto. Mythos elimina esa fricción. Un actor malintencionado con acceso a una herramienta similar ya no necesitaría ser un hacker de elite: bastaría con instrucciones básicas para desencadenar ataques que antes requerían semanas de trabajo especializado.

Anthropic documentó en un informe interno que la IA “baja el umbral de habilidades necesarias para operaciones ofensivas”, lo que significa que actores con menor capacidad técnica podrían ejecutar ataques avanzados. Las técnicas de fuerza bruta se vuelven exponencialmente más efectivas cuando son aceleradas por automatización, y la iteración asistida por IA permite probar más vectores de ataque antes de ser detectada.

La ventana de tiempo es corta: solo 6 a 12 meses

Uno de los aspectos más inquietantes del panorama es la velocidad de difusión. La propia Anthropic admitió que Mythos lleva apenas entre seis y doce meses de ventaja frente a competidores de código abierto. Eso significa que aunque ellos mantengan el modelo bajo llave, versiones con capacidades similares podrían estar disponibles libremente en internet en menos de un año.

Este escenario ya preocupa a legisladores. El Parlamento Europeo presentó una pregunta parlamentaria formal exigiendo a la Comisión definir una estrategia de ciberseguridad para evitar lo que denominaron un posible “cibergedón” continental. Bancos alemanes y el Banco de Inglaterra intensificaron sus pruebas de riesgo asociadas a IA tras conocerse la existencia de Mythos.