Sakana AI ha annunciato il lancio di Fugu, una soluzione volta a orchestrare operazioni multiagente e affrontare i rischi di blocco del fornitore nei sistemi aziendali. Le imprese espongono vulnerabilità operative quando si affidano esclusivamente ad API AI monocromatiche. Sakana AI ha sviluppato Fugu come risposta a questa concentrazione rischiosa, creando un modello linguistico di gestione che attiva una pool di modelli diversificati per compiti complessi.

Gestione dei rischi geopolitici

Le controlli di esportazione recentemente applicati a modelli di AI come Fable e Mythos, prodotti da Anthropic, dimostrano come l'accesso a determinate architetture fondamentali possa essere sospeso in base a decisioni di politica estera. Fugu funziona da riserva in caso di interruzioni improvvise nel ciclo di fornitura. La piattaforma si basa su un sistema interamente sostituibile di agenti.

Attraverso l'interruttore automatico di traffico verso fornitori non bloccati o degradati, Fugu garantisce continuità del servizio. Sakana AI afferma che questa funzionalità fornisce l'architettura resiliente necessaria per l'autosufficienza tecnologica.

Piani di distribuzione di Fugu

Sono disponibili due livelli di utilizzo per rispondere a diverse esigenze di latenza operativa.

Fugu Standard priorizza la bassa latenza per compiti quotidiani, integrandosi con strumenti standard come Codex per la programmazione e la revisione del codice in tempo reale. Le aziende che seguono rigorosi regolamenti sulla governance dei dati possono escludere manualmente alcuni modelli sottostanti dalla routing pool normale di Fugu.
Fugu Ultra è destinato a problemi analitici complessi che richiedono massima precisione. Questa varietà coordina una maggiore rete di agenti esperti per compiti come analisi dettagliate di pubblicazioni accademiche, ricerche letterarie e analisi brevettuali.

Confronti dei benchmark

Sakana AI afferma che Fugu Ultra è competitivo nei confronti dei principali modelli chiusi come Fable 5 e Mythos Preview, nei test di ragionamento tecnico, ingegneristico e scientifico. La gestione multiagente consente alle imprese di accedere a capacità computazionali di alto livello senza il rischio di concentrazione di fornitori o esposizione a controlli di esportazione associati a quei modelli chiusi.

Implementazione nella cybersecurity

Più di 500 utenti hanno testato il sistema durante un programma di beta esteso incentrato su flussi di lavoro computazionali estesi. Con la cybersecurity come area focale per modelli come Claude Mythos, i team di ingegneria hanno adottato Fugu Ultra per automatizzare interi cicli di valutazione della sicurezza.

Gli operatori umani emettevano una singola istruzione, e il motore di orchestrazione completava l’intera fase di esplorazione. Il modello ha condotto con successo verifiche di scripting incrociato (cross-site scripting) e iniezioni SQL, accompagnate da una completa revisione dell'autenticazione.

Fugu Ultra ha effettuato la valutazione del rischio senza mai mettere a rischio l'infrastruttura di destinazione.
I test si sono conclusi con la generazione di un rapporto di debolezza chiara, corredato di prove verificate e passaggi specifici affinché le squadre di intervento umano possano riprendere il controllo.

L'esecuzione ha dimostrato che l'approccio multiagente mantiene rigorosi limiti operativi, pur svolgendo sequenze complesse di test di sicurezza informatica.

Revisione del codice software

I team di programmazione hanno integrato Fugu Ultra nei loro principali canali di revisione codice, confrontando le capacità di individuazione di difetti con strumenti istituiti a livello singolo. L'orchestrazione ha costantemente superato le basi in termini di identificazione di errori logici e vulnerabilità informatiche in complessi codici enterprise.

Un ingegnere coinvolto nel progetto beta ha dichiarato: “Per la revisione del codice, Fugu Ultra è significativamente migliore di GPT-5.5. Fornisce risposte complete e individua difetti che gli altri strumenti non riescono a trovare. Mentre gli altri flaggano circa tre problemi, Fugu ne individua più di venti. È diventato il modello che io utilizzo per tutte le revisioni.”

Ricerca automatizzata e stabilità della personalità

I laboratori di scienze dati hanno impiegato Fugu Ultra in quasi completa autonomia per la ricerca. Il sistema ha effettuato ipotesi matematiche, eseguito code di test, interpretato i punti di fallimento e modificato approcci per mantenerne il processo, richiedendo solo interventi esterni occasionali.

Questa capacità affronta direttamente i limiti operativi dei modelli a singola chiamata, che richiedono costanti aggiustamenti manuale per recuperare da errori logici. Un dirigente di un'azienda non identificata ha considerato la stabilità a lungo termine della personalità come un advantage principale.

“La qualità dell'output è alla pari con i modelli AI ai massimi livelli. Tuttavia, Fugu ha dimostrato una straordinaria stabilità della personalità, mantenendo identità coerente dove altri modelli decadono dopo lunghi cicli,” ha commentato l’esecutivo. “Per prodotti basati su agenti, potrebbe contare di più rispetto ai benchmark puri.”

Convalida estesa sui benchmark

Il design interno di Fugu è stato costruito su una ricerca estesa sull’orchestrazione di modelli. Questa fondazione tecnica deriva da studi pubblicati nei lavori ICLR 2026 di Sakana AI, in particolare i framework Trinity e Conductor.

I fondamenti accademici permettono a Fugu di processare richieste comprese quando un'azione richiede la delega a degli agenti rispetto a una risoluzione diretta. Il modello interno linguistico stabilisce protocollando di comunicazione tra gli agenti singoli e strutturando la sintesi finale dei loro singoli output computazionali.

Test di validazione

I test di validazione nei confronti dei concorrenti nell’AI frontier hanno coperto discipline complesse e aperte, che vanno dalla predizione delle serie finanziarie di tempo alla progettazione meccanica. Fugu ha dimostrato capacità eccellenti in test logici fisici nascosti e interpretazione visiva, compresi la soluzione del cubo di Rubik e l’analisi della scrittura a mano in giapponese.

La capacità di eccellere sia nei modelli quantitativi finanziari che nei processi visivi qualitativi conferma l'efficacia dell'approccio di orchestrazione multiagente. Sakana AI ha strutturato per una crescita organica, sfruttando l’evoluzione del mercato hardware e software AI.

Poiché il prodotto si basa interamente su logiche orchestrali apprese, e non su set di regole fissi, esso beneficia automaticamente delle innovazioni provenienti da fornitori esterni. Sakana AI ha l