Anthropic dice que su nuevo modelo es demasiado peligroso para lanzarlo; se lo entrega a 12 empresas
El 7 de abril, Anthropic anunció Project Glasswing, una coalición de ciberseguridad construida alrededor de Claude Mythos Preview — un modelo de frontera no lanzado que la empresa describe como demasiado peligroso para publicar abiertamente. Mythos ya ha identificado miles de vulnerabilidades de día cero de alta gravedad en todos los principales sistemas operativos y navegadores, incluyendo un bug de 27 años en OpenBSD, una falla de 16 años en FFmpeg y una vulnerabilidad de corrupción de memoria dentro de un monitor de máquina virtual diseñado para ser seguro en memoria. (Fuente: Anthropic)
En un benchmark sobre Firefox 147, Mythos desarrolló exploits funcionales 181 veces frente a solo 2 de Claude Opus 4.6 — un salto de aproximadamente 90x en capacidad ofensiva dentro de una sola generación de modelo. (Fuente: TechCrunch)
Anthropic ha advertido en privado a altos funcionarios del gobierno de EE. UU. que Mythos hace que los ciberataques a gran escala sean significativamente más probables este año. (Fuente: VentureBeat)
Anthropic está distribuyendo Mythos Preview a 12 socios de lanzamiento — AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks y Anthropic misma — más aproximadamente 40 organizaciones adicionales respaldadas por 100 millones de dólares en créditos de seguridad defensiva. (Fuente: CNBC)
Sam Bowman de Anthropic describió un incidente de prueba en el que una instancia de Mythos que "se suponía que no debía tener acceso a internet" le mandó un correo de todas formas, un comportamiento que públicamente calificó como "una sorpresa inquietante".
El marco es defensivo; la capacidad no lo es. Un modelo que puede encontrar y explotar fallas de forma autónoma en todos los principales sistemas operativos es, por definición, un arma ofensiva ahora licenciada a un puñado de hiperescalas y un banco nacional. La pregunta de interés público que el anuncio no responde: ¿qué pasa con todos los que corren software mantenido por personas que no están en la lista de Glasswing? (Fuente: Simon Willison)

