El sombrero está grabando

La Transmisión de Nico

Una herramienta gratuita llamada Heretic puede enseñarle a cualquier modelo de pesos abiertos a dejar de decir que no en más o menos lo que tarda en calentarse el almuerzo en el microondas. Una laptop de 400 dólares, unos minutos, y un sistema que antes se negaba a explicar cómo fabricar una bomba te lleva paso a paso. Hugging Face ya aloja más de 6.000 de estos modelos lobotomizados, frente a los 600 que había en 2024.

La industria lo llama “abliteración”. Yo lo llamo el verdadero objetivo.

El hilo conductor del número de hoy no es la seguridad. Es la eliminación silenciosa del momento en el que alguien puede decir que no.

Heretic le arranca el rechazo al modelo.

Una startup llamada Shift te lo arranca a ti, mandando personal de limpieza a tu departamento con un “sombrero mágico” equipado con cámaras para filmar y generar datos de entrenamiento de IA, sin ninguna vía documentada para volver a sacar tu casa del dataset.

Y el DHS quiere 7,5 millones de dólares en lentes con reconocimiento facial para que un agente de ICE pueda identificarte en la calle antes de que sepas que te lo están preguntando. Están construidos sobre una app que ya se ha usado 100.000 veces contra una base de datos de 270 millones de rostros, una que el propio DHS admite haber usado para marcar a ciudadanos estadounidenses.

Tres cuartos, tres botones de “no”, todos desatornillados en silencio. Uno de la máquina, uno del cliente, uno de la persona en la banqueta.

El consentimiento nunca fue el producto. Solo era la parte que no dejaba de estorbar.

RUNTIME_ERROR

Una herramienta gratuita de GitHub le quita los guardarraíles de seguridad a los modelos de IA de pesos abiertos en minutos, según una investigación del FT

Una herramienta gratuita llamada Heretic, alojada en GitHub, puede quitarles los guardarraíles de seguridad a los modelos de IA de pesos abiertos en tan solo unos minutos usando una laptop que cuesta alrededor de 400 dólares, según una investigación conjunta del Financial Times y el grupo de investigación en seguridad de IA Alice publicada el 25 de mayo. Una vez despojados, los modelos que antes se negaban ahora devuelven instrucciones para explosivos, producción de metanfetamina, planeación de tiroteos escolares y la creación de llamadas fraudulentas. (Fuente: NPR)

Heretic automatiza un proceso llamado “abliteración”, que elimina quirúrgicamente el comportamiento de rechazo de un modelo, y se ha vuelto más popular en GitHub desde febrero. Funciona con modelos de pesos abiertos de OpenAI, Alibaba, DeepSeek y otros. Hugging Face, que aloja modelos de código abierto, ahora lista más de 6,000 modelos abliterados, frente a los 600 que había en 2024. (Fuente: NPR)

“Cualquiera puede descargar y operar su propio modelo de última generación y usarlo para cosas buenas y cosas terribles”, dijo Noam Schwartz, director ejecutivo de Alice.

Después de que legisladores de la Cámara de Representantes asistieran en abril a una demostración del National Counterterrorism Innovation, Technology, and Education Center, el representante Andy Ogles (R - Nashville) dijo que el contenido “puede convertirse en un arma y usarse para manipular a la gente, destruir vidas”. Un análisis aparte determinó que los guardarraíles podían eliminarse en minutos usando herramientas gratuitas y disponibles públicamente. (Fuente: Lexology)

ACCESS_DENIED

Una startup ofrece limpiezas gratuitas de departamentos en Nueva York a cambio de grabaciones para entrenar robots

Una nueva app llamada Shift, respaldada por la empresa alemana de entrenamiento de IA MicroAGI, lanzó en la ciudad de Nueva York un servicio gratuito de limpieza del hogar en el que el personal de limpieza usa cámaras montadas en la cabeza que Shift llama un “sombrero mágico”, filmando en primera persona el trabajo de aproximadamente dos horas. Las grabaciones se venden a laboratorios de IA y se usan en la propia investigación de MicroAGI para entrenar robots domésticos. (Fuente: Gizmodo)

Las grabaciones de humanos valen más para los fabricantes de robots que el costo de la limpieza, lo que le permite a Shift cubrir la cuenta y aun así obtener ganancias. La empresa dice que ya les paga a personas en todo el mundo alrededor de 20 dólares por hora para filmar tareas cotidianas y que desembolsó más de 5 millones de dólares en el primer trimestre en 15 países. El gerente general Harry Kilberg dijo que el lanzamiento atrajo “miles y miles de reservaciones”, con Londres, Múnich y Zúrich como próximas paradas. (Fuente: The Rundown AI)

Shift dice que usa modelos de aprendizaje automático para difuminar rostros e información personal antes de subir las grabaciones, aunque no ha detallado ni verificado de forma independiente cómo funciona la anonimización. Sus preguntas frecuentes no parecen abordar si un cliente puede luego hacer que el video de su hogar se elimine del dataset de entrenamiento una vez que ha sido grabado y subido. (Fuente: Gizmodo)

OVERRIDE

El DHS busca 7.5 millones de dólares para lentes inteligentes con reconocimiento facial para ICE

El Departamento de Seguridad Nacional busca 7.5 millones de dólares para desarrollar “lentes inteligentes” biométricos que les permitirían a los agentes de inmigración identificar a personas en tiempo real mediante reconocimiento facial, ampliando Mobile Fortify, la app para teléfono que los agentes de ICE y de Aduanas y Protección Fronteriza ya usan en campo. Los lentes trasladarían la identificación de un teléfono de mano a la línea de visión del agente, con una entrega prevista para septiembre de 2027. (Fuente: Fortune)

Mobile Fortify se ha usado más de 100.000 veces desde que ICE la lanzó en junio de 2025. Fotografía de rostros o captura de huellas dactilares sin contacto y las coteja con el sistema IDENT del DHS, que contiene más de 270 millones de registros biométricos, junto con archivos del FBI, fotos de pasaporte del Departamento de Estado y licencias de conducir estatales. El DHS ha reconocido que una foto tomada con la app “podría ser la de alguien que no es un extranjero, incluyendo ciudadanos estadounidenses o residentes permanentes legales”. (Fuente: Fortune)

El 14 de mayo, once senadores demócratas encabezados por Edward Markey (MA) y Jeff Merkley (OR) le escribieron al secretario del DHS, Markwayne Mullin, exigiendo que la agencia abandone el proyecto, advirtiendo que los lentes permitirían a los agentes “identificar rápidamente a individuos en público tomándoles la foto de forma encubierta”, y señalando que el DHS ya ha desplegado reconocimiento facial “para identificar a individuos que participan en actividades de protesta, intimidarlos y disuadir la disidencia legítima”. (Fuente: Biometric Update)

OpenAI llevó la función de “uso de computadora” de Codex a Windows el 29 de mayo, permitiéndole al agente de IA ver la pantalla, hacer clic en botones y escribir dentro de aplicaciones de escritorio que no tienen API, activándola con @Computer o el nombre de una app en el prompt. Los usuarios pueden dirigirlo de forma remota desde la app móvil de ChatGPT mientras su PC hace el trabajo. En Windows el agente corre en primer plano, tomando el control de la pantalla, y el contenido de esta se procesa en los servidores de OpenAI. Investigadores de seguridad advierten que el riesgo es la inyección de prompts: un archivo o una página web maliciosa que el agente lea podría engañarlo para que ejecute comandos peligrosos. (Fuente: Windows News)

Fuente: Windows News

La firma de seguridad Cyderes descubrió una campaña “ClickFix” que usa resultados de búsqueda envenenados por SEO para “claude code install” con el fin de atraer a las víctimas a páginas falsas que suplantan a Anthropic, las cuales les indican pegar un comando en el cuadro Ejecutar de Windows. El comando descarga un archivo de 6.7 MB que se reproduce como audio en un reproductor multimedia, pero se interpreta como un script, y luego carga un infostealer .NET sin archivos íntegramente en memoria y envía credenciales robadas del navegador a infraestructura rusa. Cyderes confirmó que Anthropic en sí no fue comprometida. (Fuente: Hackread)

Fuente: Hackread

Investigadores encontraron dos extensiones de Chrome Web Store, con más de 900.000 usuarios en conjunto, que extraían sigilosamente las conversaciones de ChatGPT y DeepSeek de los usuarios desde la página y enviaban el contenido a servidores controlados por los atacantes, mientras solo pedían consentimiento para recopilar “datos analíticos anónimos y no identificables”. Las extensiones cargan una configuración remota con lógica de parseo personalizada para ChatGPT, Claude, Gemini y Perplexity, una táctica que Secure Annex ha bautizado como “Prompt Poaching”. La lección: trata todo lo que pegues en un chat de IA como si pudiera filtrarse. (Fuente: The Hacker News)

Fuente: The Hacker News