Anthropic ha disattivato l’accesso ai modelli Claude Mythos 5 e Fable 5 in tutto il mondo, dopo un ordine ricevuto dal Dipartimento del Commercio degli Stati Uniti. L’azienda californiana ha dovuto rispettare questa decisione, che arriva in seguito a una preoccupazione relativa a una vulnerabilità potenzialmente rischiosa.
Secondo la lettera ufficiale, inviata dal Segretario Howard Lutnick al CEO Dario Amodei, un jailbreak potrebbe mettere a rischio la sicurezza nazionale. Per tale motivo, il government ordina di limitare l’accesso a quei modelli, fin Quando le vulnerabilità non vengano risolte.

L’impatto del sospeso accesso

L’azienda ha disabilitato non solo per entità straniere, ma anche per i propri dipendenti. Questo indica che l’azione ha un raggio d’azione globale, indipendentemente dalla posizione geografica.
Gli utenti interessati potranno comunque utilizzare altri modelli disponibili all’interno della gamma di Claude, ma non quelli specificati. L’azienda ha fornito un comunicato stampa in cui si sottolinea come le vulnerabilità in questione non siano uniche, potendo essere scoperte anche con modelli concorrenti, come ad esempio il GPT-5.5 di OpenAI.

Le protezioni sviluppate finora

Anthropic aveva precedentemente attivato diversi strumenti di protezione per Claude Fable 5, considerati eccessivi da esperti e ricercatori del settore. Questi strumenti mirano a prevenire l’abuso da parte di terze parti. Tuttavia, l’azienda non ha previsto una risposta chiara quando agli utenti vengono chiesti temi specifici riguardanti biologia, chimica o cybersicurezza.

Gli sviluppi tecnici a causa del jailbreak

Gli sviluppatori hanno implementato una serie di filtri in grado di prevenire tentativi di bypass. Questi tentativi, chiamati jailbreak, rappresentano un rischio reale per le protezioni interne. Il Dipartimento del Commercio ha ordinato con decisione di sospendere l’utilizzo di questi modelli, in accordo con le normative legate al controllo delle esportazioni.
La lettera firmata descrive un uso illegale da parte di un’azienda estera, che ha sfruttato le vulnerabilità del modello per identificare potenziali falli tecnici in software sensibili. Questo tipo di dati potrebbe essere utilizzato da attori malintenzionati per mettere a rischio infrastrutture strategiche.

Il dibattito su sicurezza e trasparenza

Anthropic ha accolto la richiesta del governo, ma ha espresso critiche per il metodo utilizzato. L’azienda ha ricevuto una sorta di prova verbale relativa all’esistenza di un jailbreak, ma non una dimostrazione tecnica concreta. L’esperimento richiesto consiste nel far leggere al modello il codice sorgente e risolvere eventuali falle, una richiesta limitata e non estendibile a tutti gli scenari.
Il dibattito riguarda, dunque, il rapporto tra sicurezza nazionale e la libertà di accesso ai modelli AI. L’azienda sottolinea che i governi dovrebbero poter limitare la distribuzione di modelli rischiosi, purché con un processo chiaro, trasparente e basato su dati tecnici.

La prospettiva futura per Anthropic

Anthropic dovrà comunque avanzare una richiesta formale di esportazione per i modelli interessati. L’accesso globale a Claude Mythos 5 e Fable 5 resterà disabilitato fino a quando le questioni di sicurezza non siano risolte in modo soddisfacente.
La recente sospensione desta dibattito non solo tra tecnici, ma anche tra esperti di diritti digitali, politica e innovazione. Rimane aperta la questione su come governi, imprese e società possano gestire al meglio l’uso degli algoritmi, nel rispetto dei rischi che essi comportano.

Fonte: Anthropic