Introduzione

Sebbene Retrieval-Augmented Generation (RAG) abbia rappresentato un passo fondamentale nel primo periodo dell’utilizzo dell’IA aziendale, si è evoluta in qualcosa di molto più ampio negli ultimi due anni. Le organizzazioni si sono rese conto che semplicemente recuperare frammenti di testo utilizzando la ricerca vettoriale non era sufficiente. Il contesto necessita di essere governato, spiegabile e adattabile allo scopo dell’agente.

Questo articolo esplora l'evoluzione di queste tecniche e ciò che significa per i leader dei dati e dell'IA che costruiscono sistemi in grado di ragionare in modo responsabile.

Ne conoscerete i risposte a alcune domande fondamentali:

Come migliorano i Knowledge Graph il RAG
Come le Semantic Layers aiutano gli LLM a ottenere risposte migliori
Come si evolve RAG nell’era dell’Agentic AI

RAG: Che Cos'è?

RAG, o Retrieval-Augmented Generation, è una tecnica per recuperare informazioni rilevanti per aumentare il prompt inviato a un LLM al fine di migliorare la risposta del modello.

Subito dopo il lancio del ChatGPT nel novembre 2022, gli utenti si sono accorti che i LLM non erano (speriamo) addestrati sui propri dati. Per colmare questa lacuna, le squadre hanno iniziato a sviluppare metodi per recuperare dati rilevanti al momento delle query per aumentare il prompt – un'approccio noto come Retrieval-Augmented Generation (RAG).

Il termine RAG risale a un documento Meta del 2020, ma la popolarità dei modelli GPT ha portato il termine e la pratica all’attenzione generale.

Strumenti come LangChain e LlamaIndex hanno aiutato gli sviluppatori a costruire queste pipeline di recupero. LangChain è stato lanciato circa nello stesso periodo del ChatGPT per connettre diversi componenti come modelli generativi, agenti, e memoria. LlamaIndex è stato presentato per affrontare la limitazione della finestra di contesto in GPT3, abilitandone la capacità di fare RAG. Gli sviluppatori hanno scoperto che i database vettoriali offrivano un modo veloce e scalabile per alimentare la parte di recupero del RAG, e database come Weaviate, Pinecone e Chroma sono diventati componenti standard nell’architettura RAG.

Che Cos'è GraphRAG?

GraphRAG è una variante di RAG dove il database di base utilizzato per il recupero è un Knowledge Graph o un database grafo.

Una variante del RAG è diventata particolarmente popolare: GraphRAG. L’idea qui è che i dati necessari a completare i prompt degli LLM vengano conservati in un Knowledge Graph. Questo permette al modello di ragionare sugli entity e sulle relazioni piuttosto che su blocchi di testo non strutturati.

Nel corso del 2023, i ricercatori hanno iniziato a pubblicare articoli esplorando come i Knowledge Graph e gli LLM possano complementarsi a vicenda. Nella fine del 2023, Juan Sequeda, Dean Allemang e Bryon Jacob di data.world hanno pubblicato un documento dimostrando come i Knowledge Graph possano migliorare l’accuratezza e l’esplicabilità degli LLM. Nel luglio del 2024 Microsoft ha open-sourced il proprio framework GraphRAG, rendendo così possibile l’accesso al metodo grafo per un pubblico più vasto.

La Crescita di GraphRAG

L’ascesa di GraphRAG ha rinnovato l’interesse nei Knowledge Graph in modo simile a quando Google ha lanciato il proprio Knowledge Graph nel 2012. L'atteso richiesto di contesto strutturato e di recupero esplicabile ha dato nuovo rilievo ai Knowledge Graph.

Nel corso dei anni 2023–2025, il mercato ha reagito velocemente. Tra gli eventi significativi, nel gennaio 2023 Digital Science ha acquisito Metaphactory: una piattaforma che supporta i clienti nell'adozione accelerata dei Knowledge Graph.

Nel febbraio 2023, Progress ha acquisito MarkLogic, una potente piattaforma per la gestione di dati RDF, il formato principale per la tecnologia del grafo.

Nel luglio 2024, Samsung ha acquisito Oxford Semantic Technologies, produttrice di RDFox, un database grafo, per abilitare il ragionamento e le capacità di conoscenza personalizzata su dispositivi.

Nel 2024, Ontotext e Semantic Web Company hanno unito i loro sforzi per creare Graphwise, posizionandosi chiaramente sul GraphRAG. La fusione ha dato visibilità al potenziale dei Knowledge Graph nell’evoluzione del GraphRAG.

Nel 2025, una mossa significativa è stata l’acquisizione di data.world da parte di ServiceNow, integrando un catalogo dati basato su grafi e una livello semantica nel proprio piattaforma aziendale.

La Caduta di RAG e l'Ascesa della Context Engineering

Is RAG morta? No, invece si è evoluta. La versione originale di RAG dipendeva da una singola ricerca vettoriale densa e presentava i risultati piú rilevanti direttamente all'LLM. GraphRAG ha migliorato questo aspetto aggiungendo alcune analitiche di grafo e filtri per entity e relazioni.

Queste implementazioni hanno quasi immediatamente incontrato limiti riguardo ad accuratezza, scalabilità e rumore. Questi problemi hanno spinto RAG verso nuove evoluzioni note sotto diversi nomi: agentic retrieval, RAG 2.0, e di recente, context engineering. L'implementazione originale è sostanzialmente morta, ma i suoi discendenti sono fiorenti, e il termine stesso è ancora in uso in molte discussioni sul progresso dell'AI.

Nel ruolo di Product Lead in una azienda leader nella semantica dati e AI ho lavorato a risolvere il divario tra i dati e il loro significato per grandi aziende in tutto il mondo. Rendere i dati adatti all’IA richiede un mix di resa interoperabile, scopritore e utilizzabile tali da alimentare gli LLM con informazioni contestualmente rilevanti per produrre risultati corretti e affidabili. Per le imprese di grandi dimensioni, regolate in modo rigoroso e gestite in complessità crescente, il compito non è da poco.