Anthropic, azienda leader nel campo dell'IA, ha recentemente pubblicato un saggio intitolato "Policy on the AI Exponential" e ha presentato due documenti strategici: uno per la normazione dell'IA avanzata (dette anche “frontier AI”) e un piano per gestire i futuri impatti sull'occupazione. Il CEO Dario Amodei anticipa un scenario in cui le IA diventeranno una risorsa strategica paragonabile alle armi nucleari per gli stati e in cui la regolamentazione e la collaborazione internazionale saranno fondamentali. L’appello include la richiesta di test obbligatori per i rischi emergenti da parte di enti terzi, ma anche di un alleanza dei paesi democratici, in grado di isolare economicamente o tecnologicamente i nemici.

Un problema di velocità

Nel saggio, Dario Amodei introduce la metafora di un episodio di "Il signore degli anelli" dove due hobbit cercano invano di svegliare entro breve tempo un essere albero (Baumbart), il cui ritmo lento impedisce qualsiasi reazione. Nella lettura di Amodei, l'essere albero rappresenta gli apparati governativi e istituzionali, gli hobbit sono coloro che avvertono di un pericolo ormai imminente, mentre il nemico che taglia l'albero è l'AI avanzata, che evolve al ritmo esponenziale. L’AI, sostiene, non solo progredisce rapidamente, ma cresce in potenza cognitive grazie ai cosiddetti “leggi di scalabilità”, permettendo a modelli di raggiungere livelli paragonabili a centinaia di cervelli umani in un arco di tempo che va da uno a due anni. Questo progresso esponenziale, spiega, richiede decisioni rapide da parte degli enti responsabili.

Linee guida riviste

Finora Anthropic ha sostenuto principalmente iniziative legate alla trasparenza, come la proposta legislativa SB 53 in California, RAISE a New York e SB 315 nell'Illinois. Amodei spiega però ora che una strategia basata unicamente sulla trasparenza non è sufficiente, citando l'esperienza con il controverso Claude Mythos Preview. Questo modello ha causato instabilità nel sistema mondiale della sicurezza informatica e ha evidenziato rischi concreti per infrastrutture critiche, la sicurezza finanziaria e la sovranità nazionale. Da qui l'esigenza di una regolamentazione più rigorosa.

I quattro rischi principali

Anthropic individua quattro aree di rischio che devono essere sottoposte a test obbligatori da parte di enti indipendenti:

Cybersecurity: Gli attacchi informatici potenziati dall'intelligenza artificiale.

Biosecurity: La creazione di armi biologiche o l'esposizione a minacce biologiche generate da IA.

Controlli insufficienti sugli strumenti AI: L’abilità dell’IA di agire autonomamente in modo non controllato.

Ricerca automatizzata: Il potenziamento di rischi legati alla creazione di nuovi strumenti dannosi.

In base alla sua proposta, un'autorità governativa dovrebbe essere in grado di bloccare o annullare l'uso modelli ritenuti rischiosi. Per fare chiarezza, Amodei cita l'Agenzia federale della navigazione americana (FAA) come esempio: proprio come gli aerei, gli strumenti AI potrebbero dover passare per test tecnici rigorosi prima dello sfruttamento pubblico.

I Framework avanzati

Il "Policy-Framework" di Anthropic si compone di due parti: una per le aziende sviluppatrici e una per la società in generale. I criteri si applicano a coloro che possiedono modelli AI con un livello di training superiore a 10^25 FLOP e producono guadagni annuali superiori ai 500 milioni di dollari o investono più di un miliardo in ricerca annua sull'IA. Anthropic prevede di rivalutare annualmente i parametri per tener conto del progresso tecnologico.

Test obbligatori e controllo sull'infrastruttura

I produttori dovranno pubblicare un piano di sicurezza dettagliato. Devono inoltre fornire informazioni per modelli con potenziale rischioso, come le "System Cards", e presentare un rapporto di valutazione dei rischi ogni sei mesi. Gli incidenti gravi devono essere segnalati entro 15 giorni. I modelli dovranno sottoporsi a controlli ogni sei mesi da parte un ente esterno, con un sistema di assegnazione per prevenire la ricerca del “valutatore più permissivo”.

La proposta include inoltre:

Requisiti specifici per il "peso" e la struttura dell'IA.

Conseguenze civili legali in caso di falsificazione delle informazioni.

Protezione per i “whistleblower” che segnalano rischi.

Il potere per il governo di bloccare l’utilizzo di modelli rischiosi.

Anthropic spiega inoltre che il governo federale dovrebbe intervenire e sovrascrivere le leggi statali solo se introduce un sistema a livello nazionale comparabile per severità.

Rafforzo della resilienza sociale

La seconda parte del framework si concentra su come la società possa prepararsi meglio a fronteggiare minacce accelerate dall’AI. Per quanto riguarda i rischi biologici, Amodei propone:

Previsione: miglioramento degli standard biosicurezza e screening per i fornitori di sintesi genetica.

Identificazione rapida: sistemi di allerta precoce e tracciatezza forense.

Pronto soccorso: attrezzature di difesa, edifici blindati e rimedi AI-assistiti.

Riguardo alla sicurezza informatica, vengono menzionate misure come la protezione del codice open-source, il miglioramento della gestione degli operatori di infrastrutture critiche e l’identificazione e corretta gestione delle vulnerabilità informatiche. Amodei ammette che per il controllo sugli strumenti autonomi e sulle ricerche automatizzate, la resilienza attuale è meno sviluppata, e propone soltanto capacità di identificazione e interruzione di sistemi fuori controllo.

Framework economico per affrontare i disoccupati

Anthropic introduce un piano articolato in tre fasi, che si attiva in base al tasso di disoccupazione:

Fase 1 (ca. 5%): Conti di risparmio universali, assicurazione stipendio basata su reddito e sussidi per la formazione professionale.

Fase 2 (ca. 10%): Ampliamento del sistema assicur