Il panorama dell'intelligenza artificiale è in rapida evoluzione, con una transizione significativa dai sistemi tradizionali a chatbot ad applicazioni sempre più autonome. Al centro di questa rivoluzione si trova Blaxel, una piattaforma di calcolo innovativa progettata specificamente per gli agenti IA. Per approfondire questa visione, abbiamo avuto l'opportunità di intervistare Mathis Joffre, cofondatore e responsabile dell'ingegneria di Blaxel, un ingegnere infrastrutturale esperto con un notevole passato in OVHcloud e Orange Business.

Chi è Mathis Joffre e cos'è Blaxel?

Mathis Joffre è un ingegnere infrastrutturale con una comprovata esperienza, avendo contribuito in precedenza allo sviluppo di una delle più grandi piattaforme cloud europee presso OVHcloud. In Blaxel, dirige lo sviluppo di sistemi scalabili a bassa latenza, su misura per gli agenti IA, e contribuisce in modo essenziale agli strumenti open source dell'azienda, promuovendo un deployment orientato alle prestazioni.

Blaxel è una piattaforma di calcolo creata appositamente per gli agenti IA autonomi. Il suo obiettivo è permettere agli sviluppatori di creare, testare ed eseguire workflow di agenti senza dover gestire l'infrastruttura sottostante. L'architettura di Blaxel è robusta e innovativa, includendo:

MicroVM ultra-veloci: per un'esecuzione efficiente e isolata.
Esecuzione di task in batch: per gestire carichi di lavoro complessi.
Una gateway globale: per il routing e il failover, garantendo resilienza e disponibilità.

La piattaforma pone una forte enfasi su:

Sandboxing sicuro: per isolare gli agenti e garantire la sicurezza.
Osservabilità in tempo reale: per monitorare le prestazioni e il comportamento degli agenti.
Scalabilità trasparente: per supportare deployment di agenti a livello di produzione senza interruzioni.

L'ispirazione per Blaxel: dagli endpoint IA agli agenti autonomi

L'esperienza di Joffre in OVHcloud ha giocato un ruolo cruciale nella genesi di Blaxel. Durante i suoi tre anni di lavoro in ricerca e sviluppo nell'IA e nell'infrastruttura dati, in particolare sul prodotto AI Endpoints, ha avuto un'illuminazione. "Ho realizzato quanto sarebbe diventata complessa la prossima generazione di architetture cloud e di casi d'uso dell'IA", afferma Joffre. Il passaggio dai tradizionali chatbot a sistemi completamente autonomi non è solo un miglioramento delle applicazioni; impone un ripensamento radicale dell'intera pila software e dell'architettura dei data center. "È stata questa consapevolezza a spingermi a creare Blaxel", spiega.

L'esperienza ingegneristica e la filosofia di Blaxel

Riflettendo sul suo percorso ingegneristico, dalla creazione di strumenti di rete presso Orange Business alla definizione di stack presso OVHcloud, Joffre sottolinea come questa esperienza abbia plasmato l'architettura e la filosofia di Blaxel. "Direi: mantenete i piedi per terra", afferma. Sebbene la rivoluzione dell'IA possa sembrare ipotetica o sopravvalutata, l'unico modo per concretizzarla è concentrarsi su casi d'uso reali e risolverli in modo efficace. Questo approccio ha plasmato Blaxel fin dall'inizio: "L'abbiamo progettato intorno alle esigenze reali dei nostri clienti, dalla generazione di codice all'analisi video. Piuttosto che seguire le tendenze, volevamo offrire una piattaforma su misura che fornisse agli agenti esattamente ciò di cui hanno bisogno per lavorare efficacemente", specifica Joffre.

Il ruolo del protocollo MCP e delle gateway di modelli multiregionali

Un aspetto fondamentale dell'efficacia degli agenti è la loro capacità di accedere a informazioni contestuali pertinenti. Joffre spiega che gli agenti sono fondamentalmente orientati al contesto. Per affrontare questa sfida, Blaxel ha sviluppato il Model Context Protocol (MCP). "MCP costituisce la nostra interfaccia principale per l'integrazione degli agenti nella nostra infrastruttura", afferma. Proprio come gli sviluppatori utilizzano le API REST per connettere applicazioni nel mondo SaaS, useranno MCP per fornire un contesto specifico e utilizzabile ai loro agenti.

Tuttavia, il contesto da solo non è sufficiente. Gli agenti si basano anche su LLM (Large Language Models), come quelli offerti da OpenAI o Anthropic. Con la crescente domanda, i server di questi fornitori possono talvolta essere sovraccarichi di traffico. È qui che entrano in gioco le gateway di modelli multiregionali di Blaxel. Queste gateway permettono di reindirizzare dinamicamente il traffico verso l'endpoint LLM disponibile più vicino (in termini di latenza), sia esso OpenAI, Anthropic o un altro fornitore. Questo non solo migliora i tempi di risposta, ma garantisce anche la tolleranza agli errori (attraverso il failover verso altri fornitori) e la scalabilità (distribuendo il carico su più regioni e modelli).

API progettate per gli agenti, non per gli umani

Un momento di svolta per Joffre è stata la pubblicazione di OpenAI Operator. "Fu una rivelazione: capii che il futuro avrebbe visto gli agenti consumare direttamente l'infrastruttura", ricorda. Inizialmente, gli agenti si limitavano ad analizzare dati storici e rispondere a domande. Poi si sono evoluti nella generazione di codice. Il passo logico successivo è che possano implementare autonomamente questo codice.

Questa visione è al centro della filosofia di Blaxel. "È per questo che pensiamo che gli agenti abbiano bisogno di un proprio cloud, appositamente progettato attorno all'idea che il futuro delle operazioni IT sarà guidato da agenti autonomi", spiega Joffre.

Lacune delle piattaforme esistenti per agenti su larga scala

Joffre critica le piattaforme cloud e di hosting di agenti esistenti (come Modal, RunPod, Replicate, ecc.) per non essere state concepite per le esigenze degli agenti di intelligenza artificiale. "La maggior parte delle piattaforme attuali non sono progettate per agenti persistenti, con stato e autonomi, ma per task senza stato o API di inferenza", afferma. Questo porta a combinare calcolo, memoria, storage e rete in un modo non previsto per supportare processi a lunga durata, con memoria, cicli di feedback e I/O complessi. Il risultato, secondo Joffre, è che si ottengono "sistemi fragili o un significativo sovraccarico operativo". La lacuna è evidente: "Abbiamo bisogno di un'infrastruttura in cui gli agenti siano attori di primo piano, e non elementi secondari."

Errori comuni nello sviluppo di agenti autonomi in produzione

Joffre identifica diversi "anti-modelli" comuni che i sviluppatori commettono quando implementano agenti autonomi in produzione rispetto allo sviluppo/test. "L'errore più comune consiste nel trattare gli agenti come funzioni: invocati, eseguiti e poi dimenticati", avverte. In produzione, gli agenti devono conservare il contesto, gestire gli strumenti e talvolta reagire a segnali esterni in tempo reale. Un altro errore è sottovalutare la complessità degli ambienti reali:

API instabili
Dati incoerenti
Transizioni di stato inaspettate

"I sviluppatori spesso testano in condizioni ideali, ma la realtà della produzione richiede un'osservabilità robusta, ambienti sandbox e strategie di recupero", sottolinea Joffre.

Funzionalità trasformatrici: il forking di snapshot

La roadmap di Blaxel include funzionalità avanzate come il forking di snapshot, il failover automatico e un'ulteriore ottimizzazione del calcolo. Tra queste, Joffre identifica il forking di snapshot come la più trasformatrice per i sistemi basati su agenti. "Senza dubbio", afferma. Questa funzionalità apre la strada a debugging, sperimentazione e schemi di ragionamento paralleli, che sono inaccessibili negli ambienti cloud classici. "Immaginate un agente che arriva a un punto di decisione: divide il suo sandbox in più rami, esplora diversi risultati in parallelo, quindi sceglie la migliore strada da seguire", spiega Joffre. Questo tipo di logica di ramificazione è intrinseca ai workflow degli agenti, ma "totalmente estranea agli ambienti di esecuzione cloud tradizionali". In sintesi, "trasforma fondamentalmente la nostra concezione dell'autonomia e del controllo dei flussi."

Il futuro degli agenti IA e l'evoluzione di Blaxel

Gartner prevede che il 75% delle applicazioni utilizzerà agenti IA entro il 2028, indicando un futuro in cui gli agenti saranno onnipresenti in tutti i settori. Joffre prevede che Blaxel si evolverà per supportare questa crescita massiccia. "A misura che gli agenti si generalizzano, prevediamo che Blaxel evolverà dallo status di 'infrastruttura per agenti IA' a quello di 'strato operativo' su cui si basano, gestendo il ciclo di vita, la coordinazione e persino le interazioni con il marketplace", spiega. Su Blaxel, non si tratterà solo di implementare agenti, ma di "comporli, monitorarli e avere agenti che ne gestiranno altri". Joffre osserva già l'emergere di casi d'uso in settori quali la finanza, la sicurezza e l'automazione aziendale, a testimonianza del potenziale trasformativo di questa nuova era guidata dagli agenti di intelligenza artificiale.