Anthropic ha disattivato l’accesso ai modelli Claude Mythos 5 e Fable 5 in tutto il mondo, rispondendo a un ordine del Dipartimento del Commercio degli Stati Uniti. L’azienda californiana, come spiegato in un comunicato ufficiale, è stata obbligata a sospendere temporaneamente l’accesso al modello per motivi di sicurezza nazionale.

Il jailbreak come minaccia

Nella lettera inviata dal Segretario del Commercio, Howard Lutnick, al CEO di Anthropic, Dario Amodei, si fa riferimento a un jailbreak che potrebbe rappresentare un rischio. Un’azienda straniera ha riferito di aver trovato un sistema per aggirare le protezioni interne dell’AI e utilizzarla per scoprire vulnerabilità in software, attacchi che potrebbero compromettere la sicurezza nazionale.

Il Dipartimento del Commercio ha ordinato il blocco dell’accesso ai modelli seguendo le regole per il controllo delle esportazioni. Secondo il governatore, Anthropic deve chiedere una licenza per procedere all’esportazione del modello e rimuovere eventuali vulnerabilità. Il blocco sarà in atto finché tali rischi non siano risolti.

Le protezioni di Claude Fable 5

Anthropic aveva sviluppato delle protezioni per Claude Fable 5. Questi filtri sono destinati a bloccare l’utilizzo di informazioni dannose o pericolose. Sono stati creati con classificatori in grado di resistere ai jailbreak. Tuttavia, gli esperti sono rimasti delusi per la rigida struttura dei filtri, in particolare per i limiti su cyber sicurezza, biologia e chimica.

Secondo i ricercatori, i filtri impediscono risposte su argomenti specifici, come vulnerabilità informatiche o composti chimici. Questi strumenti sono fondamentali per chi vuole capire il funzionamento di un certo software o per eseguire test di sicurezza. Anthropic non risponde a domande in quelle aree, limitando di fatto l’utilizzo del modello.

La risposta di Anthropic e le sue critiche

Anthropic ha rispettato l’ordine del governo, ma ha espresso dubbi su come la decisione è stata comunicata e giustificata. Secondo l’azienda, il governo Usa ha fornito una prova limitata riguardo al jailbreak. I test eseguiti, come spiega un tecnico anonimo, non rappresentano un attacco esteso e universale, bensì solo un esempio specifico.

Anthropic ritiene che un government debba poter intervenire per bloccare modelli non sicuri, ma ritiene che la procedura debba rispettare determinati standard. L’ordine Usa non è basato su dati concreti e trasparenti, ed è stato espresso senza procedure chiare. Questo ha messo in discussione i principi di uguaglianza e trasparenza che un simile intervento richiederebbe.

Che impatto ha avuto

L’ordine riguarda ogni entità o persona straniera che tenta di ottenere informazioni tramite Claude Fable 5. Include pure i dipendenti di Anthropic, anche se residenti negli Stati Uniti. Questo ha portato alla sospensione definitiva per chiunque tenti di accedere al modello, anche temporaneamente.

Nel comunicato, Anthropic precisa che le vulnerabilità riferite sono minime. Altri modelli, come GPT-5.5 di OpenAI, sono già in grado di individuare le stesse debolezze. Anthropic, nonostante l’atteggiamento di rispetto formale verso il governo, chiede una maggiore apertura e una comunicazione trasparente per poter risolvere eventuali problemi.

Un momento chiave per la governance dell’IA

La sospensione di Mythos 5 e Fable 5 rappresenta uno spunto di riflessione per il futuro dell’Intelligenza Artificiale. Mentre i governi cercheranno di regolamentare l’utilizzo di questi modelli, le aziende devono bilanciare la libertà tecnica con la sicurezza nazionale.

Il caso di Anthropic e Usa mette in luce le problematiche di chi utilizza IA avanzata. Il governo Usa potrebbe non sempre fornire informazioni adeguate o trasparenti per giustificare misure così drastiche. Per gli sviluppatori e i ricercatori, quindi, diventa fondamentale ottenere garanzie sui processi decisionali.

Inoltre, questo incidente pone questioni di fondo sull’eccessiva regolazione e la mancanza di controllo da parte di esperti indipendenti. Il modello Claude Fable 5 aveva sviluppato filtri per evitare danni, eppure un singolo esempio, non ben documentato, ha portato a una sospensione globale. Questo potrebbe scoraggiare la ricerca e lo sviluppo in ambiti tecnologicamente sensibili.

Perspective future

Per il mercato dell’AI, l’incidente potrebbe cambiare rotta. Alcuni esperti ritengono che Anthropic seguirà nuove strategie per rendere il modello più rispondente a regole di sicurezza. Il CEO Amodei ha già espresso intenzioni di collaborare con il governo Usa ma in modo costruttivo.

Ulteriori protezioni saranno integrate in modo trasparente.

Verrà richiesta una valutazione tecnica indipendente del jailbreak.

Si potrebbe procedere a un dialogo strutturato con il Dipartimento del Commercio.

In ogni caso, Anthropic ribadisce che l’AI è un bene sociale e un motore di innovazione. Un equilibrio tra regolazione e sviluppo tecnologico si pone quindi come obiettivo prioritario. Solo con una governance trasparente si potranno creare modelli intelligenti veramente utili per la società.