- Claude Mythos Preview ha detectado miles de fallos críticos en software fundamental, superando ampliamente la capacidad de detección humana y de herramientas tradicionales.
- Project Glasswing es una coalición restringida de 50 gigantes tecnológicos y financieros que utilizan esta IA para parchear vulnerabilidades antes de que sean explotadas.
- El modelo permanece bajo acceso controlado debido a su nivel de riesgo ASL-4, ya que posee la capacidad de generar exploits funcionales de forma autónoma.

Imagínate que el software que sostiene internet, desde los navegadores que usas para leer esto hasta los sistemas operativos de los servidores más potentes, tuviera grietas invisibles que nadie había visto en décadas. Pues bien, resulta que Anthropic ha dado la campanada con una herramienta que no solo encuentra esas grietas, sino que sabe exactamente cómo entrar por ellas, obligando a toda la industria a replantearse cómo protegemos nuestros datos.
No estamos hablando de una simple actualización de un chat inteligente, sino de un cambio de paradigma absoluto. Con el lanzamiento de Project Glasswing, la compañía ha decidido jugar a la defensiva proactiva, reuniendo a los pesos pesados del sector tecnológico y financiero para limpiar el código global antes de que alguien con malas intenciones decida usar la misma tecnología para montar un caos digital.
El cerebro detrás de la operación: Claude Mythos Preview
El verdadero motor de todo este tinglado es Claude Mythos Preview, un modelo de IA que deja en ridículo a sus predecesores en cuanto a análisis de seguridad. A diferencia de los modelos comerciales, Mythos tiene una capacidad de razonamiento profundo que le permite identificar miles de vulnerabilidades zero-day, es decir, fallos que ni siquiera los desarrolladores originales conocían.
Lo que hace que este modelo sea una auténtica bestia es su habilidad para el encadenamiento de vulnerabilidades. En el mundo real, un hacker no suele usar un solo agujero, sino que combina varios fallos menores para lograr un acceso total. Mythos puede deducir cómo unir estas piezas y, lo que es más impactante, es capaz de escribir y ejecutar código de prueba para demostrar que el fallo es real y explotable, eliminando así el ruido de los falsos positivos que tanto fastidian a los analistas de ciberseguridad y sus herramientas.

Cifras que ponen los pelos de punta
Si creías que el software maduro era seguro, los datos de Glasswing te van a quitar el sueño. En apenas treinta días, los socios del programa detectaron más de 10.000 vulnerabilidades de gravedad alta o crítica. Solo Cloudflare, que ya es un referente en seguridad, encontró 2.000 bugs en sus propios sistemas, de los cuales 400 eran críticos, demostrando que ni siquiera los más preparados están exentos de errores.
La situación con el código abierto es todavía más alarmante. Anthropic analizó unos 1.000 proyectos esenciales para la red y encontró más de 23.000 posibles fallos, con 6.202 de ellos catalogados como graves. Para que te hagas una idea, el modelo desenterró un fallo en OpenBSD que llevaba 27 años dormido, además de errores de 16 y 17 años en FFmpeg y FreeBSD, respectivamente. Software que había pasado por mil auditorías y que seguía teniendo una puerta abierta.
¿Por qué no podemos usar Mythos en casa?
Seguramente te preguntes por qué Anthropic no suelta este modelo al público. La respuesta es sencilla: es demasiado peligroso. Mythos ha sido clasificado internamente como ASL-4 (AI Safety Level 4), lo que significa que tiene un potencial de daño catastrófico si cae en manos equivocadas. Un modelo que encuentra un bug con tanta precisión puede, en un abrir y cerrar de ojos, generar el exploit perfecto para atacar una infraestructura de sectores críticos.
Por eso, el acceso está restringido a un círculo cerrado de 50 organizaciones seleccionadas, entre las que figuran gigantes como Microsoft, Google, Apple, Amazon y JPMorganChase. La idea es que estas entidades utilicen la IA para parchear el software de forma masiva antes de que los atacantes desarrollen sus propias herramientas basadas en modelos similares. Es, básicamente, una carrera armamentística donde Anthropic quiere que los buenos lleven la delantera.
Lecciones para el sector y el futuro del desarrollo
Este despliegue nos deja claro que la seguridad ya no puede ser algo que se añade al final del proyecto. Cloudflare ha señalado que el uso de agentes de IA requiere un entorno de pruebas muy específico; no basta con pedirle al modelo que «busque errores», sino que hay que segmentar las tareas y usar revisión adversaria (un segundo agente que cuestione los resultados del primero) para evitar que la IA se invente cosas.
Además, se ha evidenciado un cuello de botella humano preocupante: la IA encuentra fallos más rápido de lo que los programadores pueden corregirlos. Mientras Mythos detecta miles de errores, el proceso de triage, reporte y parcheo sigue dependiendo de personas que están desbordadas. Esto ha llevado a que algunas empresas intenten reducir sus SLAs de respuesta a tan solo dos horas desde la publicación de un CVE, aunque esto conlleva el riesgo de lanzar parches sin las pruebas de regresión adecuadas.
Para combatir esto, Anthropic ha lanzado Claude Security en beta para clientes empresariales y el Cyber Verification Program, permitiendo que profesionales legítimos usen sus modelos sin las restricciones habituales. También han destinado millones de dólares a fundaciones como la Linux Foundation y Apache para ayudar a los mantenedores de código abierto a gestionar este tsunami de reportes de seguridad.
La realidad es que el coste de descubrir vulnerabilidades ha caído en picado y la ventana entre el hallazgo y la explotación es ahora más estrecha que nunca. El éxito de Project Glasswing demuestra que la única forma de sobrevivir en este nuevo ecosistema es mediante la transparencia y la colaboración intersectorial, aceptando que la IA es ahora la herramienta principal tanto para el ataque como para la defensa de la infraestructura digital global.