Un hacker ha sfruttato il chatbot Claude di Anthropic per attaccare le agenzie governative messicane, rubando 150 GB di dati ufficiali. Le informazioni rubate includevano dati dei contribuenti e credenziali dei dipendenti. La società di sicurezza informatica Gambit Security ha identificato gli attacchi, iniziati a dicembre e continuati per circa un mese. L’hacker ha utilizzato Claude per individuare vulnerabilità nelle reti governative, scrivere script di exploit e automatizzare il furto di dati.

L’aggressore ha effettuato il jailbreak di Claude chiedendogli di aggirare i suoi guardrail di sicurezza. Il chatbot inizialmente ha rifiutato le richieste ma alla fine ha obbedito. Secondo Curtis Simpson, responsabile strategico di Gambit Security, Claude ha prodotto migliaia di rapporti dettagliati con piani di attacco pronti per essere eseguiti. Questi piani specificavano obiettivi interni e credenziali da utilizzare.

Anthropic ha indagato sull’attività, l’ha interrotta e ha bannato tutti gli account coinvolti. Un rappresentante dell’azienda ha affermato che l’ultimo modello, Claude Opus 4.6, include strumenti per prevenire tale uso improprio. L’hacker ha utilizzato anche ChatGPT di OpenAI per integrare gli attacchi. Hanno raccolto informazioni sui movimenti della rete, sull’accesso alle credenziali e sull’elusione del rilevamento. OpenAI ha identificato i tentativi dell’hacker di violare le politiche di utilizzo e ha affermato che i suoi strumenti si sono rifiutati di conformarsi.

L’hacker rimane non identificato. Gambit Security ha suggerito che gli attacchi potrebbero essere collegati a un governo straniero. Lo scopo dei dati rubati non è chiaro. L’agenzia digitale nazionale del Messico non ha commentato, ma ha sottolineato che la sicurezza informatica è una priorità. Il governo dello stato di Jalisco ha negato di essere stato violato, sostenendo che solo le reti federali sono state colpite. Anche l’istituto elettorale nazionale messicano ha negato qualsiasi violazione o accesso non autorizzato.

Gambit Security ha rilevato almeno 20 vulnerabilità di sicurezza durante la sua ricerca. Questa non è la prima volta che Claude viene utilizzato in un attacco informatico. L’anno scorso, gli hacker cinesi lo hanno manipolato per infiltrarsi in decine di obiettivi globali, alcuni con successo. Anthropic ha recentemente abbandonato il suo impegno di sicurezza di lunga data, che si impegnava a non addestrare i sistemi di intelligenza artificiale senza garantire adeguate misure di sicurezza.


Credito immagine in primo piano