Anthropic propone un salto di scala nella regolazione dei modelli di frontiera. Nel documento “Advanced AI Framework”, diffuso a giugno 2026, l’azienda sostiene che la sola trasparenza non basta più e che i governi debbano imporre obblighi precisi ai grandi sviluppatori: test sui rischi catastrofici, verifiche esterne, pubblicazione periodica dei risultati, segnalazione rapida degli incidenti critici e, nei casi estremi, poteri pubblici per bloccare o limitare il rilascio di modelli giudicati troppo pericolosi. È un passaggio politico rilevante perché arriva da una delle società che stanno costruendo i sistemi più avanzati e perché lega la governance dell’AI non solo alla tutela dei consumatori o del copyright, ma a rischi di sicurezza nazionale, biosecurity e cyberoffense.

Due pilastri: responsabilità del settore e resilienza del Paese

Il testo ha due pilastri. Il primo riguarda i doveri dei “frontier developer”, cioè le aziende che addestrano modelli abbastanza potenti da generare rischi sistemici. Il secondo riguarda la resilienza pubblica: investimenti in biosorveglianza, contromisure mediche, sicurezza del software, patching, protezione delle infrastrutture critiche e capacità di risposta statale. La tesi di fondo è: anche con regole severe sui laboratori, il rischio non scende abbastanza se Stati, sanità e reti digitali restano vulnerabili.

Soglie quantitative per i modelli da monitorare

Il framework fissa una soglia quantitativa per individuare i soggetti coperti: modelli addestrati con oltre 10²⁵ FLOP, sviluppati da aziende con oltre 500 milioni di dollari di ricavi annui legati all’AI oppure più di 1 miliardo di dollari l’anno di spesa in ricerca e sviluppo sull’AI.

Quattro categorie di rischio principale

Nel documento, Anthropic concentra l’attenzione su quattro categorie di rischio:

Rischi per la sicurezza nazionale come cyber-attacchi, manipolazione politica, destabilizzazione socio-economica;
Rischi biologici come la creazione accidentale o intenzionale di patogeni;
Rischi per la governance globale derivanti da modelli che possano sconvolgere l’informazione o il sistema educativo;
Rischi per la stabilità economica legati al controllo eccessivo di mercati chiave o di sistemi di finanza.

Framework obbligatorio e reporting periodico

Sul piano operativo, la società chiede che ogni sviluppatore coperto pubblichi un safety framework, cioè un quadro di sicurezza che spieghi come valuta i rischi, quali standard usa, quali mitigazioni applica e quale dirigente ne risponde formalmente. Chiede poi risk report almeno semestrali, system card quando un nuovo modello alza in modo sostanziale le capacità o viene distribuito con salvaguardie più deboli, e notifica degli incidenti critici entro 15 giorni dalla scoperta. La logica è costruire un flusso continuo di informazioni verso governi, valutatori e pubblico, senza affidare tutto a dichiarazioni occasionali.

Ruolo cruciale degli evaluators indipendenti

Un punto che merita attenzione è che Anthropic scrive esplicitamente che la trasparenza, da sola, non è sufficiente. Per questo propone valutazioni indipendenti obbligatorie entro sei mesi dall’entrata in vigore delle regole, con accesso per gli evaluator a versioni non redatte dei report, ai modelli più capaci e alle informazioni sulle salvaguardie adottate. Il valutatore dovrebbe poi pubblicare una revisione autonoma del giudizio di rischio dell’azienda, compresa l’eventuale contestazione di conclusioni troppo ottimistiche.

Poteri d’emergenza per l’autorità pubblica

Il passaggio più netto è sui poteri dell’autorità pubblica. Il documento non si limita a chiedere reporting e audit. Propone che un’agenzia possa intervenire quando mancano valutazioni credibili, quando l’esaminatore indipendente non è davvero terzo, quando l’accesso ai dati è stato insufficiente o quando il modello, anche tenendo conto delle salvaguardie, continua a presentare un rischio significativo di danno catastrofico. In questi casi, secondo Anthropic, dovrebbero essere possibili multe, stop al dispiegamento di ulteriori modelli e, nelle situazioni estreme, restrizioni anche su sistemi già distribuiti.

È il punto che segna la distanza rispetto all’approccio volontario degli ultimi due anni. Anthropic stessa, nel febbraio 2026, ha aggiornato la propria Responsible Scaling Policy alla versione 3.0, cioè il quadro interno con cui dichiara di gestire i rischi catastrofici dei modelli. Ma con il nuovo documento l’azienda dice in sostanza che l’autoregolazione non basta più, e che servono strumenti legali capaci di produrre conseguenze reali.

Presa di posizione chiara del CEO

Questo orientamento è stato ribadito anche nella presa di posizione pubblicata da Anthropic il 10 giugno 2026, “Policy on the AI Exponential”, dove l’azienda sostiene che i policymaker si muovono con tempi troppo lenti rispetto al progresso dei modelli e che le istituzioni devono prepararsi a poteri di interdizione verso i dispiegamenti più pericolosi. Nello stesso giorno, Axios ha sintetizzato la posizione di Dario Amodei in modo esplicito: il governo, secondo il ceo di Anthropic, dovrebbe poter bloccare l’AI pericolosa.

Biologia e cybersecurity come aree di focus

Nel documento, i due capitoli più sviluppati sul versante della resilienza pubblica riguardano minacce biologiche e informatiche. Non è una scelta casuale. Anthropic sostiene che qui i canali di danno sono più concreti e che esistono già politiche pubbliche su cui innestare investimenti aggiuntivi. Sul fronte bio, il framework propone standard aggiornati di biosicurezza e biosecurity, screening obbligatorio per la sintesi genica, sorveglianza “pathogen-agnostic”, stock strategici di dispositivi protettivi, sviluppo accelerato di antivirali e piattaforme produttive adattabili per vaccini e terapie.

Sul fronte cyber, chiede manutenzione e auditing del software open source e legacy, autenticazione resistente al phishing, supporto operativo agli enti più deboli, mappatura delle supply chain software, remediation rapida delle vulnerabilità e capacità di patching molto più veloce nelle infrastrutture critiche.

Collaborazione con il NIST

Questa parte dialoga con iniziative già in corso negli Stati Uniti. Il Center for AI Standards and Innovation, il centro NIST che ha raccolto l’eredità dell’U.S. AI Safety Institute, indica tra i rischi prioritari proprio cybersecurity, biosecurity e armi chimiche, e si propone come punto di contatto tra governo e industria per test e ricerca collaborativa sui sistemi commerciali più avanzati. Il NIST, inoltre, il 7 aprile 2026 ha pubblicato una concept note per un profilo del proprio AI Risk Management Framework dedicato all’uso affidabile dell’AI nelle infrastrutture critiche.