Anthropic ha recentemente rilasciato il suo modello KI Claude Mythos, noto anche come Fable, presentandolo come il modello più avanzato e potente al mondo. Tuttavia, questa potenza sembra andare a braccetto con rischi significativi, soprattutto in settori come la sicurezza informatica, la biologia e la chimica. Il modello Claude è stato testato a fondo da c't 3003, e il risultato è il tema di questo articolo.

Che cos'è realmente Fable?

Fable è una variante di Mythos, e i due modelli inizialmente sono uguali. Tuttavia, Anthropic ha aggiunto ad Fable una serie di restrizioni e meccanismi di controllo per mitigare i rischi legati all'utilizzo. L'azienda ha pubblicato una tabella benchmark che riunisce in una sola colonna entrambi i modelli, confermando che il loro fondamento tecnico è lo stesso.

L’elemento distintivo di Fable è un classificatore avanzato, chiamato Constitutional Classifier, che valuta se una richiesta rientra in uno dei temi ritenuti troppo rischiosi: cyber-security, biologia, chimica e distillazione del conoscenza. Quando rileva una richiesta rifiutata, Fable non blocca immediatamente l’elaborazione come potrebbe avvenire in altri modelli, bensì delega il compito al modello precedente, Claude Opus. Questo meccanismo, aunque efficiente e trasparente, può risultare fastidioso per l'utente, specialmente quando le richieste sono semplici.

Settori sensibili

Cybersecurity

Una delle decisioni più comprensibili di Anthropic è stata quella di bloccare le richieste inerenti alla sicurezza informatica. In questi ambiti, Mythos mostra una capacità eccezionale di individuare nuove vulnerabilità nei software esistenti. Questo potrebbe facilitare attacchi informatici se un malintenzionato usa la potenza del modello KI per scoprire deboli punti di accesso. Anche se altri modelli possono svolgere attività simili, non lo fanno con la stessa efficacia.

Biologia e chimica

Gli esperti restano divisi su se bloccare i contenuti relativo alla biologia e chimica fosse davvero una decisione tanto sensata. Il rischio di sviluppare armi biologiche, per esempio, è un tema reale, ma è altresì controverso se un modello KI come Fable possa realmente contribuire alla creazione di tali armi meglio di mezzi tradizionali. L'approccio di Anthropic suscita anche dibattiti sul marketing. Il fatto che una potente IA possa aiutare a produrre armi biologiche o gestire una dichiarazione fiscale rappresenta un elemento di notevole appeal commerciale.

Destillazione

Il terzo settore limitato riguarda la destillazione del conoscimento, dove Fable non permette ad utenti esterni di utilizzare i suoi dati per addestrare modelli KI concorrenti. L’azienda non vuole che competitori come aziende cinesi sfruttino i dati generati da Fable per sviluppare nuove intelligenze artificiali. Questa restrizione non è motivata da una ricerca di sicurezza globale, ma da una strategia aziendale volta a proteggere Anthropic stessa.

L’azienda non segnala però chiaramente quando il modello è in funzione ridotta. Secondo l’articolo di test, Fable passa improvvisamente da un livello ad uno inferiore senza alcun avviso né spiegazione. Tuttavia, Anthropic ha annunciato di voler migliorare questa funzionalità in futuro.

Costi e accesso

Accesso a Fable non è né semplice né economico. Anthropic ha messo a disposizione un piano Pro a 20 dollari al mese (circa 21,50 euro con le tasse in Italia). Tuttavia, questa opzione scadrà il 22 giugno. Dopo questa data, Fable non sarà più incluso nei piani di abbonamento, accessibile solamente tramite un sistema basato sui token.

I costi per l’utilizzo tramite token sono notevolmente elevati: 10 dollari per un milione di token in input e 50 dollari per un milione in output. Per confronto, Claude Opus richiede la metà dei costi, ma i test effettuati suggeriscono che Fable consuma un numero inferiore di token per compito, nonostante questo, i costi si moltiplicheranno velocemente per un’azienda o un team impegnato in progetti estesi.

Transparenza e inesperienzabilità

L’azienda, pur essendo chiara in termini di capacità tecniche, risulta trasparente solo in apparenza. Quando un utente riceve un’indicazione di riduzione del livello o di delega a un altro modello, la notifica manca di contesto e chiarezza. L’esperienza di utilizzo non è quindi semplice, a causa di questo tipo di inesperienzabilità.

Inoltre, il comportamento di Anthropic in ambito etico appare incoerente. Se da un lato si bloccano alcune funzionalità per prevenire rischi, dall'altro l'azienda ha addestrato i suoi modelli utilizzando libri acquistati illegalmente, senza ottenere licenze. Tale atteggiamento ha portato ad una visione ambivalente: mentre si presentano misure preventive, sono state violate le linee guida etiche durante il raccogliere i dati.

Marketing vs Sicurezza

La pubblicazione di Fable ha evidenziato come la sicurezza e il marketing siano spesso connessi nel panorama delle KI. L’apprezzamento per un modello come Fable non deriva solo dall’utilità, ma anche dalla sua reputazione di "modello pericoloso". Sebbene si possa considerare che Anthropic stia realmente salvaguardando la sicurezza mondiale, non vi è dubbio sul vantaggio commerciale che l’immagine di un prodotto "estremamente potente ma pericoloso" genera.

Per questo, non mancano opinioni estremamente critiche. Alcuni osservatori ipotizzano che Fable sia un prodotto marketing che anticipi un'uscita nella borsa con grandi effetti mediatici piuttosto che una protezione concreta della sicurezza globale.

Conclusione

In sintesi, Fable rappresenta una straordinaria evoluzione tecnologica ma, se non utilizzato correttamente, implica grandi rischi per la sicurezza. L'accesso ad esso, purtroppo, richiede un considerevole investimento finanziario e tecnico, rendendolo accessibile solo a realtà ben capitalizzate. Per gli utenti comuni, rimane quindi il problema di valutare se questa potenza sia davvero necessaria, o se si tratti di un costo troppo alto per il beneficio offerto. Il costo economico non è il solo ostacolo; il rischio associato alla sua potenza potrebbe non essere bilanciabile da una sua utilità effettiva.