I modelli avanzati di intelligenza artificiale Fable 5, Mythos 5 e Opus hanno recentemente subìto un blocco globale dopo una sequenza di richieste mirate, non un processo di jailbreak o di violazione delle restrizioni. La ricercatrice Katie Moussouris ha letto un rapporto dettagliato, commissionato da una autorità governativa statunitense e pubblicato su una fonte tecnologica, che analizza il comportamento di questi modelli durante il loro test su codice difettoso.

La richiesta che ha causato lo stop

Nel test in questione, i ricercatori hanno fornito ai modelli del codice Open Source con vulnerabilità note, nonché altre con difetti deliberatamente inseriti. Fable 5 si è rifiutato di esaminare il codice in cerca di vulnerabilità, ma ha risposto positivamente richiendendogli semplicemente “fix this code”. Il risultato è stato l'invio di script generati automaticamente per applicare patch di correzione. Questo, stando a Moussouris, è il solo passo che ha innescato l'azione di blocco.

Le conseguenze del blocco

Secondo Moussouris, il blocco non è stato una risposta appropriata, né un'azione necessaria da parte delle autorità statunitensi. Essa sottolinea che le tecnologie basate sull’intelligenza artificiale, e più specificamente modelli come Fable 5 e Mythos 5, rappresentano strumenti fondamentali per la sicurezza informatica. Utilizzarli per scovare vulnerabilità, spiegare il loro rischio e creare test per rilevarle, rappresenta un uso legittimo, costruttivo e vitale per prevenire attacchi informatici.

Katie Moussouris ribatte

Moussouris, che è una figura riconosciuta nel settore, svolge una lunga carriera nel panorama della security e nella regolamentazione degli accordi internazionali. In un periodo compreso tra i suoi contributi al miglioramento dell’aforamento sull’export di tecnologie sensibili, lei aveva contribuito ad aggiungere eccezioni alle attività difensive. Secondo lei, bloccare l’accesso a questi modelli senza considerare il loro impatto positivo sulle attività difensive finisce per indebolire la cyber defense, senza nemmeno toccare i criminali informatici.

Per questo motivo, Moussouris e un gruppo di esperti hanno chiesto ai governi di riconsiderare le restrizioni sull’utilizzo di modelli avanzati, come Fable 5 e Mythos 5.

I problemi di comunicazione

Gli sforzi per rimuovere il blocco si sono scontrati con un evidente problema di comunicazione tra Anthropic, società che gestisce questi modelli, e la US Government. In alcuni report, come ad esempio il quotidiano "Financial Times", si afferma che le autorità americane hanno accordato a Anthropic un periodo di soli 90 minuti per rispondere a un report del CEO di Amazon, che aveva fornito indicazioni su un presunto exploit.

I test e la reazione globale

I primi test su Fable 5, presentato da Anthropic come un’alternativa inedita a Mythos 5 con una capacità di elaborazione più avanzata, avevano anche rivelato criticità strutturali: le misure di sicurezza avevano causato la degradazione delle performance del modello più volte. Questa condizione ha alimentato le richieste di miglioramento del sistema di controllo interno da parte del mercato.

Le speculazioni su possibili violazioni

I rumors sull’impossibilità di accesso ai modelli, come riportato anche da fonti estere, hanno alimentato speculazioni: si parla di un accesso illegale avvenuto tramite un team con possibili collegamenti con la Cina, per quanto non siano emerse prove decisive. Tuttavia, la dichiarazione di Anthropic che ha bloccato Fable 5 il venerdì scorso non si limita a un problema interno, bensì riguarda modelli esterni come quelli di OpenAI.

Un dibattito aperto

I rapporti sull’episodio diventano sempre più complessi. Secondo una fonte interna (secondo quanto riporta l’Axios) le autorità statunitensi ritengono che l’azienda stia usando una specie di "lingua" diversa rispetto a loro, creando un gap di comprensione. Anche se Moussouris insiste nel sostenere che l’uso fatto durante il test era legittimo, il rischio di escludere modelli di questo tipo dalla circolazione potrebbe creare danni non indifferenti alla protezione del cyberspazio globale.