Anthropic ha lanciato Claude Fable 5, il primo modello pubblicamente accessibile della classe "Mythos". Secondo i primi test, il modello ha registrato un significativo aumento delle sue capacità di programmazione, tuttavia filtri di sicurezza, costi e protezione dei dati suscitano preoccupazioni da parte degli utenti.

Una classe leggendaria

Claude Fable 5 occupa la prima posizione in quasi tutti i benchmarks. È la versione pubblicamente accessibile della cosiddetta classe "Mythos". Stando alle dichiarazioni di Anthropic, Fable 5 condivide la base del modello con Claude Mythos 5, aggiungendo però filtri rigorosi che bloccano le richieste potenzialmente dannose nei settori di cybersecurity, biologia, chimica e distillazione di modelli. Mythos 5 verrà rilasciato in seguito, ma sarà accessibile solo a un ristretto nucleo di utenti.

Non è chiaro cosa "Mythos" significhi dal punto di vista tecnico. Secondo Dan Shipper, fondatore di Every, che ha avuto accesso anticipato, Anthropic non ha introdotto nulla di straordinario nell’architettura. Simon Willison, uno sviluppatore, condivide la stessa opinione ed ipotizza che "Mythos" si riferisca semplicemente al modello più grande e potente all’interno della serie Anthropic. I test sottolineano quanto Fable 5 si "sentisse" grande, non solo per la velocità e i costi ma anche per l'ampiezza delle sue conoscenze.

Leader dei benchmark, ma con riserve

Claude Fable 5 è in cima alla lista praticamente di ogni classifica. Nell’indice Artificial Analysis Intelligence Index raggiunge i 64,9 punti, circa cinque in più rispetto al migliore modello della concorrenza, GPT-5.5. Nel benchmark GDPval-AA per le attività reali, raggiunge un Elo di 1932. Humanity's Last Exam dà a Fable un punteggio del 53%, sette punti in più rispetto a Opus 4.8. Una singola iterazione completa del test costa però 2.200 dollari in totale, compresi i fall back.

Il servizio di valutazione Vals mette in cima Fable 5 in tutti i benchmark di programmazione. Sul test SWE-bench Verified, raggiunge il 95%, e su Vibe Code Bench un incredibile 90,35%. Secondo la piattaforma di test Devin, il tool di codifica ha registrato un record nel suo test interno FrontierCode.

Nonostante i numeri, molti esperti sono restii. In Hacker News, alcuni affermano che il balzo in avanti sia solo una banale "iterazione". Willison stesso ammette che i suoi commenti siano solo "vibes", mancano confronti scientifici corretti.

Un'accelerazione per grandi compiti

Quando il modello eccelle, lo fa con chiarezza. Ethan Mollick, usando Claude Code, ha testato Fable creando una carta isocrona dei tempi di viaggio. Il modello ha avviato autonomamente diversi sottoagenti per ricerche su oltre 2.200 linee aeree, orari ferroviari e velocità stradali, mentre ha scritto il codice in parallelo e lo ha fatti testare ad altri agenti. Un secondo progetto, un software che corregge giudizi sia umani che di IA, è stato completato in nove ore e mezza da Fable.

Nell’azienda Every, sono stati creati modelli tridimensionali interattivi della Biblioteca di Babele di Borges e un’analisi di sondaggi molto più precisa delle ricerche manuale.

Nei benchmark per senior engineer, Fable ha raggiunto 91 su 100, rispetto a 63 per Opus 4.8 e 62 per GPT-5.5.

Shipper definisce Fable un "drive Warp": perfetto per compiti grandi, ben definiti da eseguire asincronamente, ma non per interazioni rapide. Secondo Willison, Fable è "un mostro".

Una pericolosa mancanza di controllo

Questo potere viene però ad un prezzo. Mentre Mollick non ha contribuito molto personalmente e non ha capito le centinaia di decisioni interne del modello, il commento è stato di sentirsi trasformato da "mago a committente". Il servizio di revisione del codice CodeRabbit elogia Fable per la capacità di gestire problemi di programmazione autonomi, ma avverte che in termini di precisione nel controllo del codice, Fable è inferiore a Opus 4.8.

I filtri di sicurezza rendono il modello inutilizzabile per molti

Il punto più controverso riguarda i meccanismi di sicurezza. Fable blocca automaticamente le query sensibili, sostituendole con Opus 4.8 o rifiutando la risposta. Secondo il rapporto Artificial Analysis, questo accade in circa l’otto al nove percento dei casi, specialmente quando vengono poste domande scientifiche.

Nelle esperienze degli utenti, i filtri colpiscono spesso query innocue. Per esempio, un fisico medico ha commentato che il modello è inutilizzabile a causa dell’uso frequente del termine "nuclear". Altri riferiscono di problemi come la segmentazione di immagini di risonanza magnetica rifiutate per bio-terrorismo, una domanda circa la trasmissione della malaria bloccata o una semplice revisione di sicurezza considerata un rischio informatico.

Una reazione più estrema arriva da un ricercatore, che commenta: "Come ricercatore, questo è il modello più inutile che io abbia mai provato". Tuttavia, appunto, proprio negli ambiti in cui le capacità di Fable sarebbero le più utili, è inutile per moltissimi utenti.

L’intervento invisibile di Anthropic

Un dettaglio emerso di recente da Simon Willison e riguardante la System Card di 319 pagine è interessante: Anthropic ha installato interventi invisibili progettati per peggiorare volontariamente le prestazioni di Fable su domande che si riferiscono all’ideazione di tecnologie concorrenti "frontier", come i piani di training o il design di acceleratori di apprendimento. A differenza dei filtri in ambiti scientifici, non c’è un fallback visibile; invece, Anthropic modifica in silenzio i prompt o applica vettori di steering per modificare la risposta.

Il traffico interessato non supera lo 0,03%, ma Willison non apprezza un modello che manipola le risposte su questioni di ML-accellerator design al fine di frenare la ricerca concorrente, anche se fosse potenzialmente allineata con gli obiettivi di Anthropic.

Costi proibitivi per molti

Altro punto dibattuto è il rapporto tra capacità e costo: per chi esce dagli abbonamenti promozionali, il costo può risultare estremamente elevato. Un utente aziendale ha riferito che il passaggio da un