Anthropic aveva promesso che Mythos sarebbe uscito solo quando fossero pronti gli strumenti di controllo. Ora il momento è arrivato. Fable 5 batte i suoi concorrenti in compiti complessi e lunghi. Sull’indice SWE-Bench Pro, raggiunge un punteggio del 80,3%, più di dieci punti sopra Claude Opus 4.8 e venti sopra GPT-5.5 di OpenAI. Per quanto riguarda le richieste brevi, le differenze sono ridotte a pochi punti. La forza di Fable 5 si rivela soprattutto quando si affrontano progetti autonomi di ingegneria del software o compiti che richiedono un ragionamento avanzato e multi-stadio.

Claude fable

Filtri diretti verso modelli meno potenti

Quando Fable 5 rileva una richiesta che coinvolge biologia, chimica o cibersicurezza, non rifiuta di rispondere. Piuttosto, passa a Claude Opus 4.8, un modello meno performante in questi settori sensibili. Anthropic afferma che il 95% delle sessioni dei primi utenti non ha attivato alcun filtro. Oltre 1000 ore di test interni non hanno prodotto alcun jailbreak riuscito.

Ma perché tante precauzioni? I test effettuati sul modello non limitato Mythos sono impressionanti.

    • Là dove uno specialista in sicurezza impiega settimane per sfruttare una vulnerabilità, Mythos può farlo in poche ore.
    • Negli esperimenti interni su vulnerabilità del kernel di Windows, il modello ha causato crash del sistema nella maggior parte dei casi, con il primo esito positivo in una mezz’ora sola.

Questi risultati spiegano perché Anthropic ha impiegato mesi prima di rilasciare qualsiasi cosa.

Due versioni e due livelli di accesso

Parallelamente a Fable 5, Anthropic ha lanciato Claude Mythos 5. L'accesso è limitato solo alle organizzazioni già incluse nel programma Glasswing. Un programma di accesso fidato dovrebbe espandere gradualmente il perimetro. Questo sistema a due velocità sintetizza tutta la tensione in cui si muove Anthropic. L’azienda vuole dimostrare di ospitare il modello più avanzato del mercato, pur mostrando di voler imporre a sé stessa dei confini.

Entrambi i modelli sono addebitati con un costo di 10 dollari per ogni milione di token di input e 50 dollari per l’output, che è il doppio del prezzo di Claude Opus 4.8.

Un lancio in clima delicato

Anthropic lancia questo modello in piena contrapposizione con l’amministrazione Trump. Il Dipartimento della Difesa ha annullato i suoi accordi con l’azienda a causa del rifiuto di Anthropic di rimuovere le limitazioni per il controllo di massa. La Casa Bianca ha comunque testato Mythos e creato un sistema di valutazione dei modelli prima del loro lancio sul mercato.