Gli sviluppatori di intelligenza artificiale (AI) hanno introdotto il termine "tool calling" per descrivere la capacità dei modelli di interagire con strumenti esterni. Questa funzionalità permette ai modelli di interrogare API e database per migliorare la loro funzionalità e rispondere con maggiore efficacia alle richieste degli utenti.

Che cos'è il tool calling?

Il tool calling è la capacità dei modelli di intelligenza artificiale di interagire con strumenti, API o sistemi esterni per migliorare le loro funzionalità. Questi sistemi possono effettuare query a database, recuperare informazioni in tempo reale, eseguire funzioni o completare operazioni complesse oltre le loro capacità native.

Soprattutto negli agenti AI, il tool calling rappresenta un fattore chiave. Consente ai sistemi autonomi di completare compiti complessi accedendo e utilizzando dinamicamente risorse esterne. Non solo permette di rispondere alle domande, ma anche di automatizzare workflow, interagire con database, svolgere risoluzioni multi-passo e prendere decisioni in tempo reale.

Perché il tool calling è importante?

I modelli linguistici di grandi dimensioni (Large Language Models, LLM) sono tradizionalmente limitati ai dati su cui sono stati addestrati. Il processo di addestramento richiede tempo e risorse significative.

Prima dell'introduzione del tool calling, i modelli come GPT-2 di OpenAI erano statici e non potevano recuperare informazioni aggiornate.
Questo mancato accesso a dati in tempo reale li ha resi poco consapevoli del mondo reale, creando difficoltà con query che richiedevano informazioni dinamiche, come i mercati finanziari.
Per superare questa limitazione, sono state integrate API, plug-in e dati esterni, permettendo ai modelli di accedere a informazioni aggiornate.

Come funziona il tool calling?

Il tool calling implica l’interazione di diversi componenti che collaborano per facilitare l'accesso all'AI a strumenti esterni. Modelli moderni come Claude di Anthropic, Llama 3 di Meta, Mistral e IBM® Granite integrano in varia misura questa funzionalità.

Componenti chiave:

Il modello AI riconosce quando non ha abbastanza informazioni o necessita di una funzione esterna per completare la richiesta.
L’interfaccia API consente all’AI di comunicare con strumenti esterni e ricevere informazioni strutturate.
I parametri di input devono conformarsi al formato richiesto dallo strumento selezionato, assicurando una corretta elaborazione.
Sistema di elaborazione che formatta e presenta i dati ottenuti in modo utile per l'utente.

Esempio pratico: il tempo a San Francisco

Immagine di chiedere a un modello AI: “Che tempo fa a San Francisco in questo momento?”.

Riconoscimento: L’AI identifica che le informazioni necessarie non fanno parte della sua conoscenza pre-esistente.
Selezione del tool: L’AI sceglie uno strumento in grado di fornire dati meteorologici in tempo reale.
Creazione e invio della query: Vengono formulati i parametri come posizione e formato, e inviati all’API selezionata.
Ricezione della risposta: La risposta dell’API, che può arrivare in formato JSON o XML, viene elaborata.
Elaborazione e risposta: L’AI riassume le informazioni ricevute in un linguaggio semplice e comprensibile.

Integrazione con la retrieval-augmented generation

Il tool calling può essere integrato con la tecnica di retrieval-augmented generation (RAG), che permette ai modelli di utilizzare sia dati strutturati che informali.

Una volta che un modello AI riceve input, può interrogare un database e recuperare dati contestuali rilevanti prima di generare una risposta. Questo processo produce output più ricchi di informazioni e adatti al contesto. Un vantaggio dell’RAG è la sua flessibilità rispetto al tool calling tradizionale: permette di attingere da fonti diversificate e integrarsi meglio con ragionamenti avanzati.

Benefici del tool calling

L’utilizzo del tool calling permette diversi vantaggi:

Maggiore accuratezza: accesso a informazioni in tempo reale per risposte precise.
Automazione dei processi: completamento di workflow complessi in modo autonomo.
Agilità nella risposta: risposte rapide a query complesse.
Ottimizzazione: riduzione delle richieste multiple per gli strumenti, ottimizzando latenza e costa.

Caso d’uso: agenti AI

I tool calling aprono la strada agli agenti AI, che non si limitano a rispondere ad appelli specifici, ma svolgono compiti complessi in modo autonoma. Per esempio:

Agenti di customer service: possono accedere a database clienti.
Strumenti finanziari: analizzano costi e mercati.
Applicazioni logistico-spedizionarie: ottimizzano la gestione delle consegne.
Agenti di ricerca: forniscono informazioni rilevanti ai ricercatori.

Futuro del tool calling

Il tool calling è in evoluzione costante e sta trasformando la capacità degli LLM di svolgere ruoli di assistenti in agenti digitali autonomi. Con l’evoluzione dell’AI, sempre più modelli saranno capaci di adattarsi a diversi tipi di strumenti e a diversi sistemi a seconda del contesto in cui vengono utilizzati.

Piattaforme come IBM stanno investendo in tool calling per migliorare la capacità dei modelli di interazione dinamica con gli utenti, rendendo l’AI un compagno decisivo nel mondo moderno.