La startup giapponese Sakana AI ha annunciato Fugu, un sistema in grado di coordinare dinamicamente modelli linguistici artificiali da un pool intercambiabile, comportandosi come un singolo modello attraverso un'unica API. Questo sistema è stato progettato per superare le prestazioni dei modelli principali di Anthropic, Fable 5 e Mythos Preview.
Fugu esiste in due varianti: una versione base per compiti quotidiani e una versione più potente, Fugu Ultra, che punta a risultati massimi in problemi complessi e multi-step. Alcuni utenti precoci lo utilizzano già in settori come la ricerca scientifica, l’analisi della cybersecurity e le ricerche di brevetti e letteratura.
Sistema modulare per evitare la dipendenza da un unico fornitore
Il sistema Fugu è progettato espressamente come protezione contro la dipendenza da un unico provider. Sakana AI riferisce che accesso a sistemi AI di alto livello può sparire improvvisamente a causa di cambiamenti di politica estera o regolamentari. Il pool di modelli del sistema Fugu è intercambiabile, quindi il sistema può reindirizzarsi verso altri modelli se un provider va fuori servizio.
“Per un'organizzazione o una nazione, affidarsi esclusivamente alle API di una singola azienda per infrastrutture critiche, finanza o governance significa affrontare un rischio reale,” dichiara Sakana AI nella sua dichiarazione. Tuttavia, prestazioni reali dipendono totalmente da quali modelli sono nel pool. Se diversi fornitori bloccano l'accesso nello stesso momento, opzioni di Fugu vengono ridotte in modo corrispondente.
Risultati di benchmark in diversi compiti
Sakana AI ha pubblicato benchmark che dimostrano le prestazioni di Fugu in diversi ambiti. Di seguito una tabella che mostra come Fugu si confronta con modelli base:
- SWE Bench Pro: Fugu 59,0 / Fugu Ultra 73,7
- TerminalBench 2.1: Fugu 80,2 / Fugu Ultra 82,1
- LiveCodeBench: Fugu 92,9 / Fugu Ultra 93,2
- LiveCodeBench Pro: Fugu 87,8 / Fugu Ultra 90,8
- Humanity's Last Exam: Fugu 47,2 / Fugu Ultra 50,0
- CharXiv Reasoning: Fugu 85,1 / Fugu Ultra 86,6
- GPQA-D: Fugu 95,5 / Fugu Ultra 95,5
- SciCode: Fugu 60,1 / Fugu Ultra 58,7
- τ³ Banking: Fugu 21,7 / Fugu Ultra 20,6
- Long-Context Reasoning: Fugu 74,7 / Fugu Ultra 73,3
- MRCRv2: Fugu 86,6 / Fugu Ultra 93,6
Fugu Ultra è in grado di battere Anthropic Fable 5 e Mythos Preview, pur non includendoli nel suo pool, poiché questi modelli non sono pubblicamente disponibili. Inclusi, Fugu potrebbe raggiungere risultati ancora superiori.
Esempi pratici e feedback utenti iniziali
Gli utenti beta di Fugu, che sono circa 500, hanno testato il sistema in situazioni reali. Fugu ha dimostrato di eccellere in workflow complessi e multistep come analisi di dati automatizzati, recensioni di codice e sicurezza.
Un software developer ha osservato come Fugu Ultra identificasse molto più bugs durante le recensioni di codice rispetto a GPT-5.5. “Mentre altri strumenti segnalano circa tre problemi, Fugu ne ha individuati più di venti.” Sakana AI ha inoltre affermato che Fugu supera Gemini 3.1 Pro, Opus 4.8 e GPT 5.5 in test interni per ricerca automatizzata, progettazione meccanica e analisi finanziaria.
Un video mostra, tra l’altro, come Fugu riesca a risolvere e visualizzare il cubo di Rubik più velocemente di modelli singoli.
Visione e ricerca alla base di Fugu
L'approccio tecnico di Fugu si basa su due studi presentati da Sakana AI al ICLR 2026, intitolati Trinity e Conductor. L’ideologia di fondo mira ad applicare principi naturali come la comportamento di stormo, l’evoluzione e la intelligenza collettiva per creare sistemi AI più potenti.
La compagnia non vede l'intelligenza artificiale come un problema relativo a singoli modelli, ma come un sistema collaborativo che ecceda in modo significativo le potenzialità di un modello unico.
Sakana AI è fondata da due ex ricercatori AI di Google, Llion Jones e David Ha. Jones, tra l’altro, ha co-scritto il celebre paper 2017 “Attention Is All You Need” che è alla base dei Transformers.
Fugu è già disponibile, accessibile tramite un’unica API, sia sulla pagina ufficiale del prodotto che sul sistema console. Sakana offre piani di sottoscrizione per uso giornaliero ed un modello a consumo per carichi di lavoro più grandi.
La visione di Sakana punta verso un ecosistema AI in cui i modelli lavorano insieme, non come soluzioni isolate. Fugu non solo rappresenta un sistema avanzato, ma una soluzione innovativa per il futuro dell’intelligenza artificiale.