Nel panorama in rapida evoluzione dell'intelligenza artificiale, la terminologia può cambiare con una velocità sorprendente. Quelli che un tempo erano considerati concetti fondamentali, come il RAG (Retrieval-Augmented Generation) e l'ingegneria dei prompt, stanno ora lasciando il posto a nuove espressioni. Nell'era degli agenti AI, i riflettori sono puntati su termini come MCP (Model Context Protocol) e, soprattutto, sull'ingegneria del contesto.
La domanda se il RAG sia ormai obsoleto è stata posta già lo scorso maggio a Douwe Kiela, CEO di Contextual AI e co-autore dell'influente articolo accademico del 2020 che ha introdotto il RAG al mondo. La crescente attenzione verso l'MCP, un meccanismo di recupero dati per i Large Language Models simile al RAG, ha dominato le discussioni nell'ultimo anno. Kiela stesso ammette che, sebbene il RAG non sia scomparso, il termine utilizzato dagli sviluppatori e dagli ingegneri AI si è evoluto.
“Credo che le persone lo abbiano ora ribrandizzato come ingegneria del contesto, che include MCP e RAG,” ha affermato Kiela. “Voglio dire, la ‘R’ in RAG sta solo per ‘retrieval’ (recupero). Quindi, credo di averlo detto anche l'ultima volta, se stai usando MCP per fare il tuo recupero, allora è fondamentalmente RAG, giusto?” Questa prospettiva chiarisce che il RAG, pur avendo perso risonanza come termine specifico tra gli sviluppatori, rimane una componente integrale delle metodologie di recupero dati sottostanti, ora subsumate sotto la più ampia categoria dell'ingegneria del contesto.
Contextual AI, l'azienda di Kiela, continua a integrare il RAG nel suo stack tecnologico, come evidenziato nella sua documentazione, sebbene non sia più prominente sulla homepage. La scelta del nome "Contextual AI" si rivela particolarmente azzeccata, data l'ascesa del termine "ingegneria del contesto" come espressione del momento nel settore.
Il lancio di Agent Composer di Contextual AI
Come molte altre aziende di intelligenza artificiale, anche Contextual AI si sta concentrando intensamente sugli agenti. Questa settimana, l'azienda ha lanciato un nuovo strumento chiamato Agent Composer. In un comunicato stampa, Contextual AI ha descritto Agent Composer come “lo strato di infrastruttura e orchestrazione che gestisce il contesto, impone le guardrail e mantiene l'affidabilità degli agenti attraverso flussi di lavoro di ingegneria multi-step.”
Agent Composer si aggiunge agli altri strumenti disponibili sulla piattaforma Contextual AI, che Kiela descrive come un "livello contestuale." “Quindi hai il modello linguistico, hai i tuoi dati,” ha spiegato. “E se sei un'impresa, hai i tuoi dati sparsi ovunque, ed è molto, molto rumoroso, giusto? E queste aziende non consolideranno tutti questi dati in un unico luogo, quindi quello che puoi fare con la nostra piattaforma è collegare tutte queste diverse fonti di dati.” Da queste fonti, gli utenti creano ciò che Contextual AI chiama "data store." Parte del compito di Agent Composer, dice Kiela, è aiutare le imprese a costruire agenti basati sui loro data store.
Agent Composer include tutti gli elementi che un'impresa potrebbe desiderare per creare agenti. Questi includono:
- Template pre-costruiti
- Un'interfaccia di prompting
- Un visual builder
- API
- E così via.
Agent Composer vs. Strumenti di codifica AI
Negli ultimi dodici mesi, strumenti di codifica AI come Claude Code e Cursor hanno goduto di immensa popolarità nelle imprese. Ci si potrebbe chiedere cosa offra Agent Composer di Contextual AI rispetto a soluzioni come Claude Code, che molti sviluppatori aziendali utilizzano già per creare agenti personalizzati.
“Direi che quei [strumenti di codifica AI] sono essenzialmente harnesses per i modelli linguistici,” ha risposto Kiela. “‘Harness’ è una delle parole d'ordine in questo momento. Quindi, penso che tu possa pensare alla nostra piattaforma come un modo per creare 'harnesses personalizzati.' Puoi fondamentalmente costruire il tuo Cursor, o puoi eseguire la tua istanza specifica di Claude Code sulla nostra piattaforma, in modo da non doverti preoccupare di eseguire le cose localmente, o cose del genere.” La visione di Kiela suggerisce che, mentre Claude Code e Cursor agiscono come "wrapper" o "harnesses" attorno a un modello AI, spesso sono legati all'ambiente di sviluppo locale (come strumenti CLI o app desktop). Contextual AI, invece, consente alle imprese di creare i propri wrapper personalizzati ma ospitati centralmente, offrendo i benefici di sicurezza e governance tipicamente richiesti dagli ambienti aziendali.
Un'altra tendenza significativa è l'emergere di piattaforme di sviluppo di agenti. LangChain, forse il pioniere degli strumenti di ingegneria AI, sta ora promuovendo la sua "piattaforma di ingegneria degli agenti" – chiamata LangSmith – sulla sua homepage. Kiela ha commentato come Contextual AI si posizioni rispetto a prodotti come LangSmith: “Penso che siano più focalizzati su sviluppatori di livello inferiore e su quelli che definirei sviluppatori indie,” ha risposto. “Quindi si tratta davvero di prototipazione SaaS, e hanno molte opzioni diverse. Credo che noi siamo molto più opinionated e molto più di livello enterprise, quindi siamo davvero focalizzati sugli sviluppatori e gli utenti enterprise di [queste] soluzioni.”
L'ingegneria del contesto: una nuova definizione
La terminologia nel campo dello sviluppo AI cambia così rapidamente che è essenziale definire cosa significhi "ingegneria del contesto," specialmente in relazione agli agenti AI. Anthropic, una delle aziende di sviluppo AI più in voga del momento grazie a Claude Code, ha pubblicato un approfondimento lo scorso settembre. Anthropic sostiene che “l'ingegneria del contesto è la progressione naturale dell'ingegneria dei prompt.” Invece di fornire una serie di prompt a un LLM, come si faceva nei "vecchi tempi" del 2022-2023, gli ingegneri sono ora incoraggiati a gestire “l'intero stato del contesto (istruzioni di sistema, strumenti, Model Context Protocol (MCP), dati esterni, cronologia dei messaggi, ecc.).”
Il termine "agente" stesso è oggetto di dibattito, ma la maggior parte concorda sul fatto che si tratti di un programma software che esegue un ciclo. Secondo Anthropic, un agente “che esegue un ciclo genera sempre più dati che potrebbero essere rilevanti per il turno successivo di inferenza, e queste informazioni devono essere ciclicamente raffinate.” Questo è esattamente ciò che fa l'ingegneria del contesto: garantire che l'agente abbia accesso e gestisca le informazioni più pertinenti in ogni fase del suo ciclo operativo.
Nello specifico, Anthropic afferma che Claude Code adotta un approccio "just in time" all'ingegneria del contesto, il che significa che “caricherà dinamicamente i dati nel contesto al runtime usando gli strumenti.” Kiela ha confermato che Contextual AI adotta un approccio simile. “Sì, la maggior parte di queste soluzioni sono just-in-time,” ha detto. “Se allarghiamo un po' la prospettiva, c'è sempre un compromesso tra quanta informazione vuoi pre-processare [...] e quanta informazione vuoi cercare durante il tempo di interrogazione... quindi, essenzialmente, just-in-time. E il giusto compromesso tra queste due modalità di elaborazione dipende davvero dal problema che stai risolvendo. Quindi, in alcuni casi, se devi essere estremamente veloce, probabilmente vorrai fare molto più pre-processing. Se hai un po' più di tempo e puoi essere agentic, allora forse non hai bisogno di fare così tanto, perché puoi avere più tentativi e tutti i tipi di strategie diverse per arrivare alla risposta.”
Casi d'uso degli agenti
Quali tipi di soluzioni basate su agenti stanno implementando i clienti di Contextual AI? Kiela ha risposto che la sua azienda tende a concentrarsi sull'“ingegneria complessa,” come quella nell'industria dei semiconduttori. “In questo ambito, vediamo molta trazione attorno alla capacità di consentire agli ingegneri di muoversi più velocemente avendo accesso a tutta la conoscenza interna, sbloccando così la conoscenza ingegneristica istituzionale,” ha affermato.
Uno dei loro casi d'uso più popolari è l'esecuzione di un'analisi delle cause radice con un agente, un processo descritto in un post del blog di novembre. “Quindi è abbastanza potente,” ha continuato. “Si tratta davvero di prendere dump di log o tutti i tipi di set di dati diversi relativi a qualcosa che è andato storto, e poi devi analizzare qual è la causa radice. Puoi confrontare questo con la documentazione interna, magari con i rapporti di bug esistenti. Magari vuoi aprire automaticamente una PR sulla tua codebase che lo risolve. Quindi c'è molto interesse in questo.” Questo esempio evidenzia la capacità degli agenti di automatizzare e migliorare processi critici che tradizionalmente richiedono un'ampia analisi manuale e l'incrocio di diverse fonti di dati.
Conclusione
In sintesi, il RAG non è affatto "morto": è semplicemente stato ribrandizzato e incorporato nel concetto più ampio di "ingegneria del contesto." Questa evoluzione terminologica riflette un cambiamento fondamentale nel modo in cui gli sviluppatori interagiscono con i modelli linguistici di grandi dimensioni e costruiscono sistemi basati sull'IA.
È evidente che la pratica dell'ingegneria del software nell'era degli agenti continua a evolversi a un ritmo vertiginoso. Aziende come Contextual AI e Anthropic stanno fornendo strumenti sempre più sofisticati per una vasta gamma di sviluppatori, consentendo loro di ottimizzare e personalizzare i cicli degli agenti, spingendo i confini di ciò che è possibile con l'intelligenza artificiale e preparandosi per una nuova generazione di applicazioni intelligenti e autonome.