Anthropic ha portato per la prima volta i propri modelli AI al pubblico, presentando il Claude Fable 5, la prima versione pubblicamente disponibile del suo modello Mythos. Sebbene Fable 5 eccelli in ingegneria del software, lavoro intellettuale e visione, presenta limitazioni rigide sulla sua utilità in settori ad alto rischio come cybersecurity, biologia, chimica e distillazione, dove interrompe le risposte e ricade sui modelli Claude Opus 4.8.
Da Aprile a Giugno: Espansione del Modello
Originariamente lanciato come versione di anteprima nel mese di aprile, Mythos era inizialmente limitato a pochi partner per precauzione cybersecurity. Nella settimana scorsa, Anthropic ha espanso l’accesso ad oltre centinaia di organizzazioni in 15 paesi, concentrando l’accesso su quelle che gestiscono infrastrutture critiche.
Ora, una versione di questa tecnologia è disponibile per tutti attraverso l’API di Anthropic Claude e i piani d’impresa basati sul consumo. L’accesso tramite abbonamento verrà gradualmente introdotto: fino al 22 giugno, Fable 5 sarà incluso nei piani Pro, Max, Team e aziendali di sottoscrizione a titolo gratuito. Dopo il 23 giugno, Anthropic ritirerà Fable 5 da quei piani, richiedendo l’utilizzo di crediti a pagamento. Il piano è di reintegrarlo quanto prima come funzione standard negli abbonamenti.
Introduzione dei Nuovi Modelli
Al contempo, Anthropic sta rilasciando una nuova versione di Mythos chiamata Mythos 5 alle organizzazioni già approvate. La distribuzione di Fable 5 arriva mentre Anthropic si prepara per entrare nei mercati pubblici, seguendo la scalata di OpenAI ed Elon Musk's SpaceX.
Appello alla Collaborazione Globale
Il lancio di Fable 5 coincide anche con l'appello dell’azienda ad altre principali strutture AI a stabilire un freno comune per lo sviluppo di tecnologie avanzate. Anthropic ha lanciato un allarme per il rapido sviluppo delle tecnologie, sostenendo che i sistemi potrebbero raggiungere auto-miglioramenti ricorsivi (RSI), autonomamente, senza interventi umani.
Sicurezza e Test Rigorosi
Test Estesi
- Anthropic ha testato rigorosamente i propri modelli con tentativi di jailbreak.
- Un programma di premio per difetti esterni ha prodotto zero jailbreak di massa in oltre 1.000 ore di test.
- Anthropic ha collaborato con organizzazioni esterne per il testing e non ha individuato jailbreak universali.
Politiche di Conservazione
Con il lancio di Fable 5 e Mythos 5, Anthropic richiederà un periodo di conservazione dei dati di 30 giorni, anche per quelle organizzazioni che avevano accordi di conservazione zero. Secondo l’azienda, i dati non saranno utilizzati per l’addestramento, ma per difendere da attacchi complessi e nuovi, inclusi nuovi jailbreak, e ridurre i falsi positivi.
Efficacia del Fable 5 su Terzi
Nelle prove effettuate, l'azienda analitica Hex ha affermato che Fable ha ottenuto un punteggio del 90% nel suo benchmark analitico di base per compiti di lunga durata. L’azienda ha commentato che Fable mostra “un giudizio forte e un’attenzione alla sfumatura su domande complesse.”
Una piattaforma di coding Vibe-Base44 ha osservato che Fable è migliorato nel “sviluppo in tempo reale di intere applicazioni” e offre eccellente utilizzo degli strumenti. La piattaforma AI-powered workspace Genspark ha affermato che Fable ha battuto tutti gli altri modelli nei suoi test e ha mostrato un risultato significativamente migliore su compiti come il design UI e il codice di giochi.
Prezzi e Considerazioni sul Mercato
Entrambi i modelli Fable 5 e Mythos 5 costano 10 dollari per un milione di token in input e 50 dollari per un milione di token in output, raddoppiando il prezzo di Opus 4.8. Questo prezzo potrebbe servire da deterrente per un uso diffuso.
Tendenze di Costi e Feedback
Molte aziende stanno diventando critiche verso i costi dell’AI dopo aver ricevuto le bollette o aver esaurito preventivi annuali. Modelli avanzati come Opus 4.8 possono peggiorare questi problemi, con abilità avanzate di ragionamento capace di suddividere un unico input in multiple attività.
Anthropic ritiene che la domanda per Fable 5 sarà molto alta, potenzialmente non facile da prevedere. Alcune aziende, come la piattaforma di ricompense per lo shopping Rakuten, potrebbero considerare l’importanza del modello sufficiente per sostenere il costo.