Anthropic ha annunciato il lancio dei nuovi modelli Claude Fable 5 e Claude Mythos 5 il 9 giugno 2026, entrambi appartenenti alla classe "Mythos-class". Questa classe si colloca al di sopra della classe "Opus-class" in termini di capacità. Il modello Fable 5 è stato rilasciato per un uso generale, mentre il modello Mythos 5 ha alcuni sistemi di sicurezza rimossi e rimane in distribuzione limitata.
Fable 5 e Mythos 5
I modelli della classe Mythos rappresentano una categoria avanzata all'interno della serie Claude. Il primo modello, il Claude Mythos Preview, è stato rilasciato nel mese di aprile attraverso il progetto Project Glasswing.
Fable 5 e Mythos 5 condividono lo stesso modello sottostante. La differenza principale sta nei sistemi di sicurezza: Fable 5 è dotato di classificatori di sicurezza per un uso generale, mentre in Mythos 5 alcuni di questi classificatori sono stati rimossi, mantenendolo rilasciato in maniera limitata.
I nomi riflettono questa suddivisione. "Fable" deriva dal latino fabula, che significa "quel che viene raccontato", mentre "Mythos" corrisponde al termine greco. La distinzione tra i due modelli si basa sulle differenti misure di sicurezza, motivo per cui hanno nomi diversi.
Caratteristiche tecniche
La versione Fable 5 è definita il modello più avanzato lanciato finora da Anthropic per un uso generale. Si adatta a compiti complessi che richiedono una forte capacità di ragionamento e azione a termine. Le capacità di Fable 5 superano qualsiasi altro modello precedentemente reso disponibile.
Entrambi i modelli supportano una finestra di contesto di 1 milione di token di default e permettono fino a 128k token di output per richiesta. La tariffa di utilizzo è fissata a $10 per ogni milione di token di input e $50 per ogni milione di token di output, che rappresenta meno della metà del costo rispetto al precedente Claude Mythos Preview.
L'ambito di capacità
Anthropic afferma che Fable 5 supera la maggior parte dei benchmark di capacità esistenti. Mostra livelli di prestazione eccezionali in diverse aree, tra cui ingegneria del software, lavoro conoscitivo, visione artificiale e ricerca scientifica.
Ingrandimento e migrazione del codice
- Test di Stripe: Il modello ha completato una migrazione in un codice software di 50 milioni di linee in un solo giorno, rispetto ai 2 mesi necessari a una squadra umana.
Efficacia nel coding
- Cognition’s FrontierCode: Fable 5 registra il punteggio più alto tra i modelli d’avanguardia, anche con un sforzo medio.
Capacità nel settore finanziario
- Hebbia Finance Benchmark: Fable 5 ottiene il punteggio più alto in materia di motivi senior di ragionamento finanziario, interpretazione di grafici e risoluzione di problemi.
Visione artificiale
Anthropic denomina Fable 5 il modello con le capacità di visione più avanzate oggi disponibili. Estrae informazioni numeriche precise da figure scientifiche, ricostruisce codice da screenshot e necessita di meno "scaffolding" rispetto ai modelli precedenti.
Nel gioco Slay the Spire, il modello ha mostrato di migliorare il suo rendimento con la capacità di memoria, raggiungendo risultati migliorati tre volte rispetto al modello Opus 4.8.
Mythos 5 e ambito scientifico
- Progettazione di proteine: Gli esperti di progettazione di proteine hanno accelerato la produzione farmaceutica da 10 volte.
- Hipotesi scientifiche: Mythos 5 è stato il primo modello a produrre ipotesi scientifiche innovative nella biologia molecolare, apprezzate dal 80% di ricercatori in test abbaglianti.
- Genomica: Mythos 5 ha sviluppato una ricerca genetica non lineare autonomamente nel corso di una settimana, costruendo un modello su dati di singole cellule di 138 specie animali, che ha superato un modello recente pubblicato su Science.
Funzionamento dei sistemi di sicurezza
La distribuzione di tali modelli avanzati comporta un certo rischio, in particolare riguardo all’uso improprio. Per prevenire abusi, Fable 5 è stato lanciato con nuove classificazioni di sicurezza. Questi sistemi riconoscono richieste potenzialmente dannose, tra cui tentativi di disattivare i controlli di sicurezza, impedendo al modello principale di fornire risposte inappropriate.
Classificatori e risposte predefinite
- Quando i sistemi di sicurezza di Fable 5 segnalano una richiesta, il modello Opus 4.8 gestisce la risposta.
- I casi coperti includono cybersecurity, biologia e chimica, e distillazione.
- In caso di richieste di biologia o chimica, Fable 5 fa attualmente riferimento prevalentemente a Opus 4.8.
Analisi di vulnerabilità
- Anthropic ha sottoposto i sistemi di controllo ad un test diffuso: un bug bounty esterno ha prodotto zero vulnerabilità universali in oltre 1.000 ore.
- Una vulnerabilità universale permetterebbe a un utente di usare il modello come se non avesse alcun sistema di controllo.
- I progressi nella vulnerabilità universale erano avvenuti solo in una finestra di test breve.
Scenario d'uso
I modelli Fable 5 e Mythos 5 si rivolgono a diversi workflow per equipe tecniche:
- Migrare codice su larga scala: I modelli sono utili per grandi refactor e migrazioni cross-repo. Il test su Stripe ne mostra l'applicazione su una struttura di 50 milioni di linee.
- Pipeline di coding automatizzate: La riduzione di interazione e l’efficienza per token favoriscono attività multistep di agenti autonomi. GitHub segnala autonomia e affidabilità in compiti complessi di coding.
- Analisi finanziaria: La capacità di ragionare da documenti e grafici si presta a una analisi finanziaria di alto livello. Hebbia e IMC hanno riscontrato miglioramenti nel ragionamento e nell'analisi di dati finanziari.