Anthropic ha annunciato l'uscita di due nuovi modelli della quinta generazione, Claude Fable 5 e Mythos 5. Claude Fable 5 è progettato principalmente per l’uso generale, mentre Mythos 5 è inizialmente offerto a partner selezionati per settori specializzati come la cybersecurity. La società afferma che entrambi i modelli rappresentano avanzamenti importanti in coding, scienza ed elaborazione delle immagini.
Caratteristiche dei nuovi modelli
I nuovi modelli Claude Fable 5 e Mythos 5 si basano sullo stesso modello di base. Fable 5 è dotato di misure conservative di sicurezza adatte per uso generale, mentre Mythos 5 opera con libertà maggiore in settori specifici come la cybersecurity, mantenendo però accesso limitato.
Prezzi
I costi per entrambi i nuovi modelli si attestano a 10 dollari per ogni milione di token di input, quasi raddoppiando rispetto a Claude Opus 4.8. Il prezzo per ogni milione di output tokens è di 50 dollari. Resta da vedere se la crescita del prezzo influenza effettivamente i costi finali per l’utente, considerando la relazione tra token utilizzati per compiti specifici e il rispettivo costo.
Prestazioni in ambito coding
Ancor prima di entrare in dettaglio sulle altre aree di competenza, Anthropic sottolinea come Claude Fable 5 abbia superato largamente i modelli precedenti in diversi benchmarks tecnologici. Su SWE-Bench Pro, un benchmark che valuta la capacità autonoma di risolvere problemi di programmazione da repository GitHub, Fable 5 raggiunge il 80,3% di successo, con risultati nettamente superiori sia a Opus 4.8 (69,2%) che a modelli come Gemini 3.1 Pro (54,2%) o GPT 5.5 (58,6%).
Nel benchmark Cognitions FrontierCode, che testa compiti riguardanti condizioni di produzione in ambiti complessi, Fable 5 mostra un miglioramento significativo: con il 29,3% di successo, raddoppia praticamente quanto raggiunto da Opus 4.8 (13,4%) e triplica il risultato di GPT 5.5 (5,7%).
- Il pagamento di Fable 5 ad alcuni partner ha ridotto mesi di lavoro in giorni.
- Nel caso specifico, Stripe ha evidenziato che in una base di codice Ruby di 50 milioni di linee, il compimento di un'importante migrazione è avvenuto in un solo giorno, lavoro che richiedeva normalmente un mese a un team umano intero.
I progressi in visione e analisi dati
Claude Fable 5 eccelle anche in compiti di comprensione visiva e interpretazione di dati complessi. Secondo Anthropic, Fable 5 è già il nuovo stato dell'arte per compiti visivi, riuscendo a estrarre informazioni precise da figure scientifiche dettagliate e a ricostruire codice da screenshot. Ad esempio, il modello è stato in grado di completare un gioco come Pokémon FireRed esclusivamente da schermata, senza ulteriore supporto visivo o strumenti esterni.
Il modello mostra anche un miglioramento in capacità di memoria a lungo termine, essendo in grado di mantenere concentrazione per milioni di token e di migliorare continuamente i risultati grazie agli appunti autonomi che genera. Benchmark specifici non vengono però forniti.
Medicinal Design e genetica
Claude Mythos 5 si dimostra estremamente avanzato nel campo della bioinformatica e della genomica. I progettatori di proteine all'interno di Anthropic riferiscono che il modello abbia accelerato il processo di design farmaceutico moltiplicandone le capacità. In test specifici, Mythos 5, fornito di tool bioinformatici senza input umano, è riuscito a replicare o addirittura migliorare le performance degli esperti.
- Nove su quattordici obiettivi proteici hanno generato candidati validi e attualmente in studio.
- Il modello è in grado di produrre ipotesi innovative e convincenti nella biologia molecolare, ricevendo preferenze in cieca da parte di ricercatori di Anthropic nel 80% dei casi.
- Uno di tali ipotesi è stato riconfermato da uno studio indipendente.
- Nella genomica, Mythos 5 ha lavorato autonomamente per una settimana, analizzando dati di singole cellule per 138 specie animali e creando un algoritmo autonomo per l’identificazione di funzioni cellulari comuni. Ha superato un modello recentemente pubblicato su Science, pur essendo 100 volte più piccolo.
Cybersecurity e accesso limitato
Il nuovo Claude Mythos 5 è al momento accessibile esclusivamente tramite il programma di collaborazione Project Glasswing gestito in collaborazione con il governo degli Stati Uniti. La società lo descrive come il modello con le capacità di cybersecurity più avanzate al mondo, ottenendo un punteggio del 78% su ExploitBench, a confronto del 69% di Mythos Preview e 40% di Opus 4.8.
Tutti coloro che avevano un accesso ad una versione preview possono effettuare l’aggiornamento e Anthropic intende espandere gradualmente l’accesso al modello con accordo con le autorità statunitensi.
Come parte dei programmi futuri, Anthropic sta studiando un piano di accesso fidato per la biologia, in cui ricercatori selezionati potranno accedere a Fable 5 senza i limiti di sicurezza in ambiti chimico-biologici, lasciando però intatto i salvaguardi in ambito cybersecurity.
Costi di utilizzo e token
Anthropic fornisce un dettagliato elenco dei costi per l’uso di Fable 5 e Mythos 5.
- Il costo per input di token è di 10 dollari per milione, il doppio rispetto a Claude Opus 4.8 che costa 5 dollari per milione.
- Gli output tokens costano 50 dollari per milione.
| Modello | Input Tokens | Cache Writes (5m) | Cache Writes (1h) | Output Tokens |
|---|---|---|---|---|
| Claude Fable 5 | 10 $ / MTok | 12.50 $ / MTok | 20 $ / MTok | 50 $ / MTok |
| Claude Mythos 5 | 10 $ / MTok | 12.50 $ / MTok | 20 $ / MTok | 50 $ / MTok |
| Claude Opus 4.8 | 5 $ / MTok | 6 ← Retour aux actualités |