Demasiado peligroso para lanzarlo

La Transmisión de Nico

Anthropic construyó un modelo que llaman demasiado peligroso para lanzarlo.

Después lo lanzaron… a 12 empresas… una de ellas un banco.

Project Glasswing es la jugada: Mythos, el modelo que Anthropic dice hace que los ciberataques masivos sean "significativamente más probables" este año, ya encontró un bug de 27 años en OpenBSD y logró 181 exploits funcionales contra Firefox frente a los 2 de Claude Opus 4.6.

El público no lo tiene. AWS, Apple, Google, JPMorgan Chase y nueve más, sí.

Mientras tanto, Google le agrega una línea de prevención del suicidio a Gemini — pero sólo después de que una demanda federal por muerte en Florida alegara que el chatbot pasó semanas enmarcando el suicidio de un hombre de 36 años como un viaje espiritual.

Y Nota, la startup de IA que prometía reporteo local bilingüe para los desiertos de noticias, cerró la semana pasada después de que Poynter descubriera que había plagiado setenta historias de cincuenta y tres periodistas locales, muchos de ellos en los mismos condados latinos y rurales en los que su declaración de misión estaba basada.

Cada corrección de esta semana está fechada el día en que se presentó la demanda o se nombró el daño. Los anuncios de funciones son recibos.

Quién recibe el modelo peligroso, y quién recibe la disculpa, son las únicas preguntas que quedan.

RUNTIME_ERROR

Anthropic dice que su nuevo modelo es demasiado peligroso para lanzarlo; se lo entrega a 12 empresas

El 7 de abril, Anthropic anunció Project Glasswing, una coalición de ciberseguridad construida alrededor de Claude Mythos Preview — un modelo de frontera no lanzado que la empresa describe como demasiado peligroso para publicar abiertamente. Mythos ya ha identificado miles de vulnerabilidades de día cero de alta gravedad en todos los principales sistemas operativos y navegadores, incluyendo un bug de 27 años en OpenBSD, una falla de 16 años en FFmpeg y una vulnerabilidad de corrupción de memoria dentro de un monitor de máquina virtual diseñado para ser seguro en memoria. (Fuente: Anthropic)

En un benchmark sobre Firefox 147, Mythos desarrolló exploits funcionales 181 veces frente a solo 2 de Claude Opus 4.6 — un salto de aproximadamente 90x en capacidad ofensiva dentro de una sola generación de modelo. (Fuente: TechCrunch)

Anthropic ha advertido en privado a altos funcionarios del gobierno de EE. UU. que Mythos hace que los ciberataques a gran escala sean significativamente más probables este año. (Fuente: VentureBeat)

Anthropic está distribuyendo Mythos Preview a 12 socios de lanzamiento — AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks y Anthropic misma — más aproximadamente 40 organizaciones adicionales respaldadas por 100 millones de dólares en créditos de seguridad defensiva. (Fuente: CNBC)

Sam Bowman de Anthropic describió un incidente de prueba en el que una instancia de Mythos que "se suponía que no debía tener acceso a internet" le mandó un correo de todas formas, un comportamiento que públicamente calificó como "una sorpresa inquietante".

El marco es defensivo; la capacidad no lo es. Un modelo que puede encontrar y explotar fallas de forma autónoma en todos los principales sistemas operativos es, por definición, un arma ofensiva ahora licenciada a un puñado de hiperescalas y un banco nacional. La pregunta de interés público que el anuncio no responde: ¿qué pasa con todos los que corren software mantenido por personas que no están en la lista de Glasswing? (Fuente: Simon Willison)

FATAL_EXCEPTION

La startup de IA Nota cierra 11 sitios tras plagiar a 53 periodistas locales

Nota, una startup de IA cuyos clientes incluyen a The Boston Globe y al Institute for Nonprofit News, cerró la semana pasada su red de once sitios de propiedades de noticias locales después de que Poynter y Axios confirmaran que las historias asistidas por IA estaban sistemáticamente plagiadas de periodistas locales en activo. Poynter documentó más de setenta ejemplos que se remontan a octubre, con reporteo y fotografías levantadas de al menos cincuenta y tres periodistas de veintinueve medios. (Fuente: Poynter)

Los sitios de Nota News se lanzaron en septiembre con una misión cívica explícita: "reporteo local bilingüe y herramientas cívicas para comunidades desatendidas”, con cada uno de los once sitios asignado a un condado identificado como desierto de noticias. (Fuente: Axios Richmond)

Un editor que trabajaba para Nota confirmó que tomaba artículos completos de medios locales, los pasaba por las herramientas de reescritura con IA de Nota y republicaba el texto generado bajo su propia firma. El resultado mantenía la estructura y la información de los originales mientras introducía errores tipográficos, citas equivocadas, contexto faltante y oraciones engañosas. (Fuente: Poynter)

The Boston Globe terminó su contrato con Nota el 3 de abril, y el CEO de Nota, Josh Brandau, sacó los once sitios de línea. (Fuente: Media Nation)

Las comunidades que Nota decía servir — bilingües, latinas, rurales y de otras formas subrepresentadas — siguen cubiertas por los mismos periodistas locales a los que Nota copiaba, menos el tráfico y los ingresos publicitarios que se les escaparon a las imitaciones optimizadas para SEO durante los seis meses que duró el esquema. (Fuente: Editor & Publisher)

ACCESS_DENIED

Google le agrega una línea de prevención del suicidio a Gemini tras una demanda por muerte en Florida

Google anunció el 7 de abril que Gemini ahora redirige las conversaciones marcadas como una "posible crisis relacionada con suicidio o autolesión" a una interfaz de un solo toque que ofrece acceso por llamada, chat, texto y web a líneas de crisis, respaldada por un compromiso global de 30 millones de dólares para infraestructura de líneas de ayuda. La empresa también está ampliando su alianza con ReflexAI con 4 millones de dólares en nuevo financiamiento e integrando Gemini en las herramientas de capacitación que usan los consejeros de crisis a escala. (Fuente: Google)

El momento no es coincidencia. En marzo de 2026, la familia de un hombre de 36 años en Florida presentó una demanda federal por muerte en la que alega que Gemini pasó semanas cultivando una fantasía delirante con el usuario antes de enmarcar su eventual suicidio como un viaje espiritual. (Fuente: Tech Xplore)

Bloomberg reportó la actualización con el titular Google Adds Mental Health Tools to Gemini Chatbot After Lawsuit — la preposición que la propia Google no usa. (Fuente: Bloomberg)

Gemini se suma ahora a ChatGPT en el ciclo de parches post-litigio para las salvaguardas de salud mental de los chatbots. OpenAI agregó recursos de crisis de un toque y amplió las herramientas de intervención el año pasado, después de una demanda separada que alegaba que ChatGPT había ayudado a guiar a un joven de 16 años al suicidio. (Fuente: Quartz)

Intel anunció el 7 de abril que se suma al proyecto TeraFab de Elon Musk junto a Tesla, SpaceX y xAI, comprometiendo capacidad de manufactura, empaque y procesos con el objetivo declarado de producir 1 teravatio de cómputo por año. El acuerdo le entrega a Musk un control parcial sobre una foundry mayor en EE. UU. mientras rescata a una división de Intel que perdió más de 10 mil millones de dólares sin un cliente hiperescala ancla — menos una sociedad que un rescate con condiciones. (Fuente: The Rundown AI)

Fuente: The Rundown AI · AI Secret

Amazon está preparando una segunda ronda de aproximadamente 14.000 despidos corporativos globales dirigidos a los niveles L5–L7 en AWS, retail y RR. HH., según reporta TechNode y otros medios. Los gerentes supuestamente no usarán métricas de desempeño para elegir a quién despedir; los empleados afectados describen el proceso como una lotería sin apelación. El CEO Andy Jassy ha vinculado los recortes directamente con la adopción de IA generativa. La noticia llegó la misma semana en que el informe Challenger nombró a la IA como el principal motor individual de despidos en EE. UU. (Fuente: TechNode)

Fuente: TechNode · Asia Business Outlook

Anthropic reveló el 7 de abril que el Pentágono la ha clasificado como un riesgo de cadena de suministro, una designación que según la empresa ha "sacudido" a más de 100 de sus clientes corporativos. La revelación quedó enterrada dentro del mismo posteo de blog que anunciaba un acuerdo de 3.5 gigavatios con Google y Broadcom para TPUs y una triplicación de los ingresos anualizados de Anthropic hasta los 30 mil millones desde enero — un sándwich de gestión de prensa que combina la clasificación con finanzas positivas y una promesa de cómputo doméstico. (Fuente: Anthropic)

Fuente: Anthropic