Lo stop imposto dagli Stati Uniti ai modelli Fable 5 e Mythos 5 di Anthropic apre un precedente sui controlli export applicati ai sistemi di AI più avanzati. In gioco ci sono cybersecurity, accesso degli alleati e sovranità tecnologica europea.

La questione di un jailbreak

Il blocco imposto dagli Stati Uniti ai modelli Fable 5 e Mythos 5 di Anthropic trasforma una questione di sicurezza informatica in un precedente politico e industriale per tutta l’AI avanzata. Il punto non riguarda solo una possibile tecnica di jailbreak, cioè un modo per aggirare le protezioni di un modello. Riguarda la possibilità che Washington usi i controlli export sui modelli AI come leva diretta per decidere chi può accedere alle capacità più potenti sviluppate dalle aziende americane.

Disattivazione e risposta dell’azienda

Anthropic ha dichiarato in una nota pubblicata il 12 giugno 2026 di aver ricevuto alle 17:21 ora della costa Est una direttiva del governo Usa, basata su autorità di sicurezza nazionale, per sospendere l’accesso a Fable 5 e Mythos 5 da parte di qualunque cittadino straniero, dentro o fuori dagli Stati Uniti, inclusi i dipendenti non statunitensi della società. L’effetto pratico, secondo l’azienda, è stato la disattivazione dei due modelli per tutti i clienti, per evitare violazioni della direttiva.

I nuovi modelli di Anthropic

La decisione arriva a pochi giorni dal lancio. Anthropic aveva presentato Claude Fable 5 e Claude Mythos 5 il 9 giugno 2026: Fable 5 come modello più potente disponibile al pubblico nella famiglia Claude, Mythos 5 come modello a disponibilità limitata per partner selezionati, soprattutto in ambito cybersecurity, attraverso Project Glasswing. Nella documentazione tecnica Anthropic descrive i due sistemi come basati sullo stesso modello sottostante; a distinguerli sono soprattutto le salvaguardie applicate alle aree più sensibili, tra cui sicurezza informatica e biologia.

I rischi della dual use

La misura statunitense nasce da un rischio tipico dei modelli dual use: le stesse capacità che aiutano un team di sicurezza a trovare vulnerabilità possono assistere un attaccante nella scoperta e nello sfruttamento di falle software. Anthropic sostiene che il caso alla base della direttiva riguardi un jailbreak ristretto, non universale, usato per individuare un numero limitato di vulnerabilità già note e minori. L’azienda afferma inoltre che risultati simili sarebbero ottenibili anche con altri modelli pubblicamente disponibili.

Ricerche e studi accademici

La questione è credibile perché il settore si muove già su questa linea. Nella system card di GPT-5.5, pubblicata da OpenAI il 23 aprile 2026, il modello viene classificato con capacità High nel dominio cybersecurity, pur sotto la soglia Critical definita dal Preparedness Framework. Lo stesso documento descrive test su CTF professionali, CVE-Bench, cyber range e valutazioni esterne di Irregular, del Center for AI Standards and Innovation statunitense e dell’AI Security Institute britannico.

Un altro lavoro, CVE-Bench, presentato su arXiv nel 2025 da Yuxuan Zhu e altri quindici autori, costruisce un benchmark su vulnerabilità web reali e rileva che i migliori agenti testati risolvono fino al 13% delle vulnerabilità nel perimetro valutato.

Esempi di sfruttamento di vulnerabilità

Questi risultati non provano che ogni modello frontier sia immediatamente utilizzabile per campagne offensive autonome su larga scala. Indicano però che le capacità cyber stanno diventando abbastanza concrete da richiedere controlli tecnici, accessi differenziati, monitoraggio e responsabilità sull’uso.

Il contesto politico di riferimento

Il tempismo rende il caso più delicato. Il 2 giugno 2026 la Casa Bianca ha firmato l’ordine esecutivo “Promoting Advanced Artificial Intelligence Innovation and Security”, poi pubblicato nel Federal Register come EO 14409. Il provvedimento prevede benchmark classificati per valutare le capacità cyber avanzate dei modelli e un quadro volontario di collaborazione tra governo e sviluppatori, con accesso anticipato fino a 30 giorni per i modelli frontier coperti.

Nello stesso ordine, però, la Casa Bianca precisa che quella sezione non autorizza la creazione di un requisito obbligatorio di licenza, pre-approvazione o permesso governativo per sviluppare, pubblicare, rilasciare o distribuire nuovi modelli AI. Il blocco dei modelli Anthropic, arrivato dieci giorni dopo, apre quindi un problema di coerenza istituzionale: formalmente il quadro resta volontario, ma nella pratica l’export control può produrre un effetto simile a una sospensione immediata.

Conseguenze per imprese e partner

La differenza non è solo giuridica. Una pre-approvazione trasparente definisce criteri, tempi, responsabilità e possibilità di contestazione. Un intervento emergenziale basato su autorità di sicurezza nazionale può essere più rapido, ma rischia di lasciare imprese, clienti e partner internazionali senza criteri stabili per pianificare rilasci, contratti e architetture operative.

I passaggi chiave

Il caso colpisce una società che ha costruito gran parte della propria reputazione sulla sicurezza dell’AI.
Anthropic presenta Fable 5 come un modello con salvaguardie conservative.
Qualche richiesta sensibile viene reindirizzata a Claude Opus 4.8.
Il modello di classe Mythos introduce una conservazione dei dati cliente per finalità di sicurezza.
Questa scelta serve a individuare e mitigare jailbreak complessi.
Tuttavia, il modello presenta costi commerciali e di fiducia per i clienti enterprise.

I numeri dell’investimento

La scala economica rende ogni blocco più pesante. Il 28 maggio 2026 Anthropic ha annunciato una Series H da 65 miliardi di dollari, con valutazione post-money di 965 miliardi. Amazon, già partner industriale centrale, ha comunicato a maggio 2026 un nuovo accordo che prevede 5 miliardi di dollari di investimento immediato e fino a 20 miliardi aggiuntivi, oltre agli 8 miliardi già investiti, insieme a un impegno di Anthropic a spendere oltre 100 miliardi di dollari in dieci anni su tecnologie AWS.

Questi numeri spiegano perché lo stop non è una semplice interruzione di servizio. I modelli frontier sono ormai parte di filiere industriali che includono cloud, chip, piattaforme per sviluppatori, cybersecurity, consulenza, pubblica amministrazione e ricerca. Quando un modello viene disattivato per ragioni di export control, l’effetto si propaga lungo integrazioni tecniche, contratti, roadmap di prodotto e programmi di difesa digitale.

Le conseguenze per l'Europa

Per l’Europa il caso Anthropic è un promemoria concre