Il governo statunitense ha ordinato di周五 (15:21 ET) ad Anthropic di bloccare immediatamente l'accesso a due dei modelli AI più potenti: Claude Fable 5 e Claude Mythos 5. La decisione è stata motivata da preoccupazioni per la sicurezza nazionale e ha costretto la compagnia a disattivare entrambi i modelli per tutti gli utenti in tutto il mondo, non solo per i cittadini stranieri, come originariamente limitato dall’ordine di controllo delle esportazioni.

Perché Questo è Importante?

Claude Mythos è definito da Anthropic come il modello AI più avanzato. Fin da una presentazione anticipata a inizio aprile, la compagnia ha mantenuto le sue funzionalità estremamente ristrette perché il modello è in grado di identificare vulnerabilità nei principali sistemi operativi e browser del web. Il suo potenziale aveva generato un programma controllato chiamato "Project Glasswing", che prevede la condivisione del modello con circa 50 organizzazioni selezionate, come Amazon, Apple, Google, Microsoft e CrowdStrike, al fine di supportare la sicurezza informatica in una forma difensiva.

Fable 5, invece, è stato rilasciato solo tre giorni prima dell'ordine di blocco del governo. Era una versione di Mythos adattata per uso commerciale generale e dotata di "rail guard" per prevenire risposte in aree a rischio come la cybersecurity e la biologia. Si è rivelato immediatamente, secondo i test di Vals AI, il modello AI più potente disponibile al pubblico.

Quali Sono le Argomentazioni di Anthropic?

Secondo Anthropic, l'ordine governativo è motivato da un presunto "jailbreak" del modello Fable 5. Finora, però, il governo ha fornito solo prove verbali di un "potenziale jailbreak di ampio raggio, non universale", come lo descrive Anthropic. Il jailbreak, spiega la società, si basa su una richiesta specifica al modello di leggere un certo codice e di individuare potenziali fallacie del software.

Questo livello di capacità, osserva Anthropic, è già ampiamente disponibile in altri modelli AI accessibili al pubblico, tra cui OpenAI GPT-5.5, e viene utilizzato regolarmente dagli esperti di cyber in contesti difensivi. Anthropic evidenzia inoltre che i suoi sistemi di protezione più forti operano attraverso classificatori indipendenti, che funzionano separatamente dal modello principale, rendendo molto difficile generare contenuti dannosi. Un recente esame dell'utilizzo non ha rivelato prove che tali protezioni siano state effettivamente superate, né si siano prodotti contenuti pericolosi.

Le Recriminazioni di Anthropic

Nonostante questi argomenti, il governo ha comunque deciso di procedere con il blocco. Anthropic ha espresso chiaramente il suo disappunto nel suo post sul blog. La compagnia ha sostenuto che trovare un possibile jailbreak non dovrebbe costituire una motivazione sufficiente per richiamare un modello AI commercializzato a centinaia di milioni di utenti. Secondo Anthropic, se questo standard fosse applicato universalmente, bloccherebbe l'intera industria dei providers di modelli AI di frontiera.

Implicazioni per l’IPO e la Strategia di Sicurezza

Anthropic aveva precedentemente costruito la sua identità pubblica come alternativa più sicura ai rivali tecnologici. Questa strategia, però, si è dimostrata controproducente. Proprio la precauzione con cui la compagnia limitava l'accesso al modello Mythos, che descriveva come così pericoloso da non essere rilasciabile apertamente, ha attirato l’attenzione dei governatori, generando un livello di scrutinio che potrebbe seriamente disturbare i piani aziendali. Si prevede un'offerta di quotazione in borsa (IPO) nel 2024, ma adesso Anthropic dovrà affrontare anche il rischio per la sua credibilità e la sua immagine pubblica.

Gli Opponents Reagiscono

Una figura che sembra trarre qualche beneficio da questa situazione è Sam Altman, fondatore e chief executive di OpenAI. A inizio aprile, durante un’intervista con il podcaster Ashlee Vance, Altman aveva espresso una sorta di critica a Anthropic, commentando che il modo in cui la compagnia aveva presentato Mythos come un “prodotto pericoloso” era una strategia di marketing basata su paura. “L’idea di dire ‘abbiamo inventato una bomba... non lasceremo che esploda’, finisce per produrre un mercato per i ripari”, aveva argomentato Altman.

Sebbene non abbia previsto un intervento diretto del governo, ha sottolineato che quando un’azienda passa parecchio tempo a parlare dell’estrema pericolosità del proprio AI, il resto del mondo – incluso il governo – tende ad ascoltare. Per Anthropic, la lezione potrebbe essere chiara ma costosa.