La Google Cloud presenta una novità per affrontare il problema del contesto nei sistemi di intelligenza artificiale: introduce il formato Open Knowledge Format (OKF), una specifica basata su Markdown per rappresentare e trasferire conoscenze in modo standardizzato. Obiettivo fondamentale della soluzione è rendere interoperabili e accessibili i vari insiemi di conoscenza algoritmica in base a modelli diffusi all’interno della comunità degli sviluppatori.
Un formato aperto per strutturare le conoscenze
Open Knowledge Format (OKF) v0.1 è una speciale versione di Markdown con frontmatter YAML aggiunto. Essa presenta un campo obbligatorio, il "type", accompagnato da un insieme limitato di campi opzionali come Titolo, Descrizione, Risorsa, Etichette (Tags) e Timestamp.
Tutti i contenuti vengono aggiunti nel corpo Markdown, dove gli utenti o gli agenti possono inserire informazioni aggiuntive, testi esplicativi, link e altro. Gli utenti e le applicazioni sono in grado di collegare i concetti reciproci tramite normali link Markdown, costruendo così un grafo di conoscenze interconnesse. Il formato, essendo compatibile con Markdown standard, è leggibile in qualsiasi editor, visualizzabile in GitHub e facilmente indexabile da strumenti di ricerca.
Il problema del contesto: un ostacolo per gli agenti IA
Nella pratica, molte organizzazioni riscontrano un problema comune: le informazioni necessarie per il corretto funzionamento degli agenti IA si trovano frammentate in varie piattaforme o strumenti. Queste includono cataloghi di metadati, Wiki aziendali, commenti nei codici, notebook di Jupyter o addirittura le mente di singoli ingegneri. Un agente che debba, ad esempio, generare una query SQL per un certo dataset, dovrà recuperare informazioni da diversi ambienti.
Attualmente ogni sviluppatore di algoritmi risolve il problema del contesto in modo completamente diverso, e ogni provider di cataloghi crea modelli ridondanti del medesimo tipo. Soluzioni come i "Vaults" di Obsidian, file tipo "AGENTS.md" o "CLAUDE.md", o repository di tipo "Metadata as Code" seguono modelli simili, ma non sono pensati per interoperare fra loro. Il problema? Il know-how viene intrappolato all'interno di ogni sistema che lo ha generato. Google Cloud afferma che il formato OKF mira a risolvere questa lacuna, unificando e facilitando lo scambio di dati contestuali.
Principi di progettazione e compatibilità
La specifica di OKF si basa su tre principi fondamentali. Primo, il formato è estremamente ridotto: il solo campo obbligatorio richiesto è "type", mentre gli altri sono lasciati al giudizio e alle esigenze del produttore del documento. Secondo, OKF distacca il produttore dal consumatore, consentendo a entrambi di operare in autonomia. Un Bundle scritto da un utente può essere letto da un agente, mentre un documento prodotto da un algoritmo può essere visualizzato da un visualizzatore.
Terzo, il formato non impone restrizioni su un determinato framework, piattaforma cloud o database: OKF è agnostico rispetto ai fornitori. Questo permette flessibilità e interoperabilità senza dipendenze.
Implementazioni pratiche e casi d'uso
La Google Cloud ha rilasciato insieme alla specifica diverse implementazioni di riferimento. Tra queste: un agente denominato "Enrichment Agent" che esaminando i datasets di BigQuery, produce per ogni tabella un documento conforme a OKF. Un visualizzatore di dati statici in formato HTML è stato incluso, così come tre bundles di esempio per e-commerce GA4, database Stack Overflow, e dataset Bitcoin.
Per supportare l'adozione di OKF, Google Cloud ha aggiornato il proprio Knowledge Catalog, abilitando la distribuzione e l'uso del formato in contesti di Agenti IA. La specifica, i codici sorgente e le librerie sono accessibili su GitHub, mentre la documentazione specifica per l'integrazione col Knowledge Catalog è reperibile separatamente.
Contenuti e abbonamenti per gli amanti dell'IA
Google Cloud ha collaborato con un noto editore tecnologico, THE DECODER, per fornire aggiornamenti e informazioni senza hype sull'intelligenza artificiale. Questo servizio è disponibile tramite un abbonamento: gli iscritti possono partecipare alle discussioni nei commenti, ricevere email settimanali sull’IA, newsletter speciali annuali con lo stato dell’arte, e godere di sconti su eventi dedicati.
I lettori possono accedere all'archivio online e scaricare articoli degli anni precedenti, iniziando da zero, per costruire un'esperienza di apprendimento mirata.