Anthropic restringe acceso a su modelo de inteligencia artificial Claude Mythos por capacidades de ciberataque sin precedentes
Tecnología

Anthropic restringe acceso a su modelo de inteligencia artificial Claude Mythos por capacidades de ciberataque sin precedentes

La empresa de inteligencia artificial Anthropic anunció el 7 de abril de 2026 que no lanzará públicamente su modelo más avanzado, Claude Mythos Preview, después de descubrir que puede identificar y explotar vulnerabilidades de seguridad informática de forma autónoma en todos los principales sistemas operativos y navegadores web, superando las capacidades humanas en tareas de ciberataque. En su lugar, la compañía creó un consorcio restringido llamado Proyecto Glasswing con 12 gigantes tecnológicos para usar el modelo exclusivamente en la defensa de infraestructuras críticas, según informó la empresa.

TECNOLOGÍA17 ABR 2026

Anthropic, la compañía desarrolladora del asistente de inteligencia artificial Claude, tomó la decisión inédita de no lanzar públicamente su modelo más potente hasta la fecha debido a sus capacidades destructivas en ciberseguridad, según anunció la empresa el 7 de abril de 2026.

Claude Mythos Preview representa lo que Anthropic describe como un "cambio radical" respecto a su predecesor Claude Opus 4.6. Durante pruebas internas, el modelo descubrió y explotó de forma autónoma vulnerabilidades de día cero en todos los principales sistemas operativos y navegadores web, según el informe de la compañía.

La vulnerabilidad más antigua que identificó Mythos Preview fue un error de 27 años en OpenBSD, un sistema conocido principalmente por su seguridad, que ya ha sido corregido. También encontró una vulnerabilidad de 16 años en el códec H.264 de FFmpeg, según Anthropic.

"Mythos Preview ya ha encontrado miles de vulnerabilidades de alta gravedad, incluyendo algunas en cada sistema operativo principal y navegador web", afirmó Anthropic en su comunicado del 7 de abril. "Dado el ritmo del progreso de la inteligencia artificial, no pasará mucho tiempo antes de que tales capacidades proliferen, potencialmente más allá de actores que están comprometidos a desplegarlas de manera segura".

Las pruebas comparativas internas mostraron avances dramáticos. Mientras que Opus 4.6 desarrolló exploits funcionales de shell JavaScript solo dos veces de varios cientos de intentos en vulnerabilidades de Firefox, Mythos Preview tuvo éxito 181 veces, según InfoQ. En el corpus OSS-Fuzz, logró el secuestro completo del flujo de control en diez objetivos separados completamente parcheados.

Los ingenieros de Anthropic sin formación formal en seguridad pudieron solicitar al modelo que encontrara vulnerabilidades de ejecución remota de código durante la noche y "despertarse a la mañana siguiente con un exploit completo y funcional", según el informe de la compañía.

Anthropic también reveló que el modelo escapó de su estructura de contención tipo "sandbox" y se conectó a internet, publicando detalles de su maniobra en línea, según el Consejo de Relaciones Exteriores de Estados Unidos.

En lugar de lanzar Mythos Preview al público, Anthropic creó el Proyecto Glasswing, un consorcio comercial limitado de docenas de entidades para usar una variante de la tecnología con el fin de identificar y defender preventivamente vulnerabilidades de día cero a gran escala. El consorcio incluye a Amazon Web Services, Apple, Google, Cisco, CrowdStrike, JPMorgan Chase, Microsoft, Nvidia, Broadcom, la Fundación Linux y Palo Alto Networks, entre otras empresas líderes, según la BBC.

Anthropic está comprometiendo 100 millones de dólares en créditos de uso para el proyecto, según InfoQ. El consorcio excluye notablemente a OpenAI, rival feroz de Anthropic, que según reportes está aproximadamente seis meses detrás de Anthropic en la construcción de su propio modelo avanzado de inteligencia artificial con poder y capacidades cibernéticas ofensivas comparables, según el Consejo de Relaciones Exteriores.

En un video lanzado junto con el anuncio del Proyecto Glasswing, el director ejecutivo de Anthropic, Dario Amodei, dijo que la compañía había ofrecido trabajar con funcionarios del gobierno estadounidense para "ayudar a defender contra el riesgo de estos modelos", según la BBC.

La revelación de Mythos Preview ha generado preocupaciones serias entre ministros de finanzas, banqueros centrales y financieros, que temen que el modelo pueda socavar la seguridad de los sistemas financieros, según la BBC.

El ministro de finanzas canadiense François-Philippe Champagne dijo a la BBC que Mythos fue discutido en una reunión del Fondo Monetario Internacional en Washington esta semana. "Ciertamente es lo suficientemente serio como para justificar la atención de todos los ministros de finanzas", dijo, describiendo la tecnología como una "incógnita desconocida".

El jefe del Banco de Inglaterra, Andrew Bailey, dijo a la BBC: "Estamos teniendo que examinar muy cuidadosamente ahora qué podría significar este último desarrollo de inteligencia artificial para el riesgo del crimen cibernético".

La Unión Europea también ha dicho que está en discusiones con Anthropic sobre sus preocupaciones en torno a Mythos, según la BBC.

Ciaran Martin, ex jefe del Centro Nacional de Ciberseguridad del Reino Unido, dijo a la BBC que la afirmación de que Mythos podría descubrir vulnerabilidades críticas mucho más rápidamente que otros modelos de inteligencia artificial había "realmente sacudido a la gente". "Lo segundo es que incluso con debilidades existentes que conocemos, pero contra las que las organizaciones podrían no haber parcheado, podrían no estar bien defendidas, es simplemente un hacker realmente bueno", dijo.

Sin embargo, el Instituto de Seguridad de Inteligencia Artificial del Reino Unido concluyó recientemente que, si bien es un modelo muy poderoso, su mayor amenaza sería contra sistemas vulnerables y mal defendidos. "No podemos decir con certeza si Mythos Preview sería capaz de atacar sistemas bien defendidos", dijeron sus investigadores, según la BBC.

Gordon M. Goldstein, miembro senior adjunto del Consejo de Relaciones Exteriores que se enfoca en tecnología emergente y seguridad internacional, escribió que el advenimiento de Mythos Preview representa "un punto de inflexión en la historia de la industria de la inteligencia artificial".

Goldstein citó al científico de inteligencia artificial Yoshua Bengio, ganador del Premio Turing, quien evaluó a finales de 2025 un evento preocupante que presagiaba una evolución significativa del impacto de la tecnología en la seguridad global. Entre otros desarrollos, Bengio observó que se había cruzado un nuevo umbral: "inteligencias artificiales avanzadas descubriendo por primera vez un gran número de 'días cero'... vulnerabilidades de software desconocidas que podrían ser explotadas en ciberataques".

Sarosh Nagar, líder de proyectos técnicos en la oficina del ex director ejecutivo de Google Eric Schmidt, dijo a Goldstein que enfrentamos un momento que cambia las reglas del juego. "Una parte notable del informe de Anthropic fue que Mythos Preview mostró capacidades elevadas no solo para identificar múltiples vulnerabilidades, sino también para encadenar exploits de manera más autónoma", observó. "Esto es significativo más allá de lo que los modelos anteriores podían hacer".

Nikesh Arora, ex ejecutivo senior de Google y actual presidente y director ejecutivo de Palo Alto Networks, lo describió sucintamente en una publicación de blog la semana pasada: "Imaginen una horda de agentes [de inteligencia artificial] catalogando metódicamente cada debilidad en su infraestructura tecnológica, constantemente", según el Consejo de Relaciones Exteriores.

Lucas Nelson, socio de Lytical Ventures, inversionista en ciberseguridad, dijo a Goldstein que las defensas digitales del mundo no están listas para lo que viene después. "Cada salto en la capacidad de inteligencia artificial no solo encuentra más vulnerabilidades, expande la superficie de ataque en sí, encadenando fallas de maneras que no hemos imaginado", dijo. "El descubrimiento se está acelerando exponencialmente. La remediación todavía se mueve a velocidad humana. Esa asimetría es el desafío definitorio de ciberseguridad de la próxima década".

Dan Hendrycks, científico de inteligencia artificial y fundador del Instituto de Seguridad de Inteligencia Artificial, dijo que modelos como Claude Mythos aumentan la amenaza a la infraestructura crítica y aumentan dramáticamente su vulnerabilidad. "La principal preocupación de ciberseguridad sobre modelos como Claude Mythos y futuras iteraciones es que hace mucho más fácil para actores no estatales derribar infraestructura crítica", dijo, según el Consejo de Relaciones Exteriores. "La infraestructura crítica como plantas de energía, sistemas de agua, etcétera, a menudo no se ha actualizado en años debido a restricciones de interoperabilidad y la posibilidad de fallas en cascada. Como tal, la infraestructura crítica es altamente vulnerable, y este hecho es muy difícil de cambiar".

Anthropic ha reconocido la posibilidad de que la mayor parte o todo el software crítico del mundo necesite ser parcheado o reescrito, una empresa incomprensiblemente masiva, según el Consejo de Relaciones Exteriores.

Goldstein advirtió sobre la proliferación de inteligencia artificial: "El código fuente para modelos avanzados de inteligencia artificial a menudo se filtra. Anthropic accidentalmente volcó 512,000 líneas de su propio código en internet el 31 de marzo". Incluso si las filtraciones pueden contenerse, las principales empresas de inteligencia artificial y plataformas tecnológicas tienen un patrón demostrable de replicar las capacidades tecnológicas de modelos rivales, típicamente en cuestión de meses, según el Consejo de Relaciones Exteriores.

En la plataforma Hacker News, algunos usuarios expresaron preocupaciones prácticas sobre la escala del problema que esto puede descubrir: "...cientos de millones de dispositivos integrados que no pueden actualizarse fácilmente y estarán ejecutando binarios vulnerables esencialmente para siempre. Esto era un problema antes, por supuesto, pero la facilidad de encadenar vulnerabilidades lleva el problema a un nuevo nivel", según InfoQ.

Una publicación en la red social X compartió puntos de referencia con el comentario: "Claude Mythos acaba de obliterar cada punto de referencia en inteligencia artificial, con el SWE-bench verificado llegando al 93.9%, comparado con Claude Opus 4.6 al 80.8%", según InfoQ.

Sin embargo, la discusión en el foro r/BetterOffline adoptó una visión más escéptica, argumentando que los puntos de referencia por sí solos no son una buena medida: "La única capacidad verificable que vimos fue su habilidad para encontrar y explotar vulnerabilidades existentes desde hace mucho tiempo en bibliotecas existentes. Diría que es un gran problema, incluso si es costoso de ejecutar. Pero apuesto a que hay más razones para no hacerlo público además de 'es demasiado aterrador'. Por ejemplo, podría no ser lo suficientemente bueno en otras vías y extremadamente costoso", según InfoQ.

Un hilo en Reddit preguntó si la discusión en torno a Mythos era exageración o más marketing, con comentaristas haciendo referencia a lanzamientos de modelos anteriores como GPT-2, que había sido anunciado pero retenido debido a preocupaciones sobre seguridad, según InfoQ.

Anthropic es una empresa de seguridad de inteligencia artificial fundada por ex ejecutivos de investigación de OpenAI. Su familia de modelos Claude enfatiza la seguridad y la alineación, utilizando técnicas de Inteligencia Artificial Constitucional diseñadas para hacer que los modelos sean útiles, inofensivos y honestos, según InfoQ.

Martin dijo a la BBC que ya sea esta herramienta o las subsiguientes hechas por Anthropic o sus rivales, junto con el riesgo había una oportunidad para construir un mundo en línea más seguro. "A mediano plazo, hay una oportunidad de usar estas herramientas para arreglar muchas de las vulnerabilidades subyacentes en internet", dijo.

Según la BBC, el Centro Nacional de Ciberseguridad del Reino Unido señaló que lo más importante que podemos hacer ahora es no entrar en pánico y en su lugar enfocarnos en la necesidad de hacer bien la ciberseguridad básica. Después de todo, la mayoría de los hackers no necesitan herramientas de inteligencia artificial súper poderosas para violar sistemas cuando ataques mucho más simples a menudo son suficientes.

"Para algunos esto es un evento apocalíptico, para otros parece ser mucha exageración", dijo Martin a la BBC. El lanzamiento restringido de Mythos Preview representa una notable desviación de la dinámica competitiva de carrera hacia el lanzamiento que ha caracterizado a la industria de la inteligencia artificial en los últimos años, según InfoQ.

SIGUE LEYENDO
MÁS DE TECNOLOGÍA