Se i chatbot basati sull'intelligenza artificiale (IA) sono in grado di comporre poesie con brillantezza, si scontrano con notevoli difficoltà quando devono elaborare tabelle di numeri complessi. Il Professor Maxime Cordy, ricercatore scientifico senior in intelligenza artificiale e ingegneria del software presso l'Università del Lussemburgo, all'interno del centro di ricerca interdisciplinare SnT (Interdisciplinary Centre for Security, Reliability and Trust), sta lavorando attivamente per cambiare questa realtà.

«Oggi, chiedere a un chatbot di elaborare dati in tabelle è come cercare di lavorare su un foglio di calcolo in Word», spiega il Professor Cordy. «Questo lascia indietro molte professioni. Stiamo conducendo ricerche che cambieranno il gioco, portando i vantaggi dei chatbot IA ai compiti di calcolo». L'ambizione è chiara: rendere l'IA conversazionale non solo un maestro del linguaggio, ma anche un esperto affidabile nella gestione dei dati numerici, sbloccando così nuove possibilità per settori che dipendono fortemente dall'analisi quantitativa.

Le attuali limitazioni degli strumenti IA

ChatGPT e strumenti simili si basano su grandi modelli di linguaggio (LLM), addestrati su enormi quantità di testo liberamente accessibile su Internet. Il loro punto di forza risiede nella comprensione e generazione di testo, ma la loro architettura non è intrinsecamente progettata per l'accuratezza numerica. L'elaborazione di tabelle numeriche, tuttavia, richiede modelli tabellari specifici, che operano su principi diversi e necessitano di insiemi di dati di addestramento altrettanto specifici.

L'addestramento di questi modelli tabellari presenta le proprie sfide, in particolare l'accesso ai dati di addestramento corretti. Spesso, questi dati non sono disponibili online, rendendo necessaria la creazione di modelli su misura per diversi domini, come le previsioni meteorologiche o il punteggio finanziario. Inoltre, i modelli di IA possono essere delle vere e proprie "scatole nere", il che significa che il loro processo decisionale è opaco. In settori critici come la finanza e le statistiche, è fondamentale comprendere come questi modelli giungono ai loro risultati, un requisito che gli LLM attuali non sempre possono soddisfare.

«Oggi, chiedere a un chatbot di trattare dati in tabelle, è come cercare di lavorare su una foglio di calcolo in Word.»

Maxime Cordy, Assistant professor in Software Engineering for AI Systems, SnT

Questo bisogno di personalizzazione e le preoccupazioni in materia di trasparenza rendono difficile l'adozione di strumenti avanzati in molte industrie. Di conseguenza, queste continuano a utilizzare metodi tradizionali per i compiti di calcolo, come Excel o gli alberi di decisione. «Questi metodi sono interpretabili, efficaci e precisi nella maggior parte dei casi», spiega il Professor Cordy. «Il deep learning, al contrario, incontra spesso difficoltà quando applicato a dati tabellari, non solo in termini di accuratezza ma anche di interpretabilità, un fattore chiave per la fiducia e l'adozione in contesti professionali rigorosi.»

L'emergere dei foundation models per dati tabellari

Tuttavia, una nuova generazione di foundation models per i dati tabellari sta emergendo, ispirata dal successo dei modelli di linguaggio nel campo del testo. Questi modelli rappresentano un passo avanti significativo, promettendo di superare molte delle limitazioni attuali. «Invece di costruire un modello distinto per ogni compito, ora è possibile fornire a un foundation model un set di dati e il problema da risolvere», spiega il Professor Cordy. «Questo tenterà di dare una risposta senza necessitare di un riaddestramento completo.»

Questa innovazione potrebbe rendere l'adozione dell'IA molto più scalabile, poiché un unico modello potente potrebbe essere riutilizzato per molteplici problemi, una volta che i dati sono stati preparati adeguatamente. Le implicazioni sono chiare e profonde per settori quali:

la finanza
l'assicurazione
la logistica
le statistiche

con applicazioni dirette in aree vitali come la rilevazione di frodi, la modellizzazione dei rischi e le previsioni economiche. La capacità di un singolo modello di adattarsi a diversi contesti senza un'ampia riprogrammazione o riaddestramento ridurrebbe drasticamente i costi e i tempi di implementazione, rendendo l'IA avanzata accessibile a un pubblico più ampio di aziende e professionisti.

Quando la chat incontra i numeri

Al giorno d'oggi, gli utenti si aspettano di dialogare naturalmente con l'IA. Attivare funzioni di chat per le tabelle è essenziale per un'esperienza utente intuitiva, ma i sistemi di linguaggio e di numeri non cooperano ancora bene. La sfida fondamentale è che «gli LLM sono generatori di testo, non calcolatori», precisa il Professor Cordy. «Chiedete loro di calcolare una media e rischiano di darvi un risultato falso con aplomb, un po' come le "allucinazioni" testuali che si osservano già nella generazione di testo.»

Le allucinazioni testuali sono spesso più facili da rilevare per un lettore attento, poiché un testo incoerente o fattualmente errato può essere identificato attraverso la conoscenza generale o la verifica incrociata. Al contrario, gli errori di calcolo presentano una sfida maggiore: un numero sbagliato può sembrare plausibile e passare inosservato, con conseguenze potenzialmente gravi in contesti decisionali. Per i modelli tabellari, è quindi essenziale disporre di uno strumento robusto che richieda pochissime correzioni umane, garantendo affidabilità e precisione.

La soluzione: l'IA aumentata da strumenti (tool-augmented AI)

La soluzione a queste sfide risiede nell'IA aumentata da strumenti (tool-augmented AI), dove un modello di linguaggio utilizza sistemi dedicati al ragionamento numerico. Questo approccio innovativo permette di combinare la fluidità e l'interattività dei modelli di linguaggio con la precisione ineccepibile degli strumenti computazionali. Tale integrazione include l'utilizzo di:

i foundation models per le tabelle
i pacchetti statistici classici
i motori di fogli di calcolo

Questa strategia, denominata anche IA agentica (agentic AI), consente al modello di linguaggio di scegliere lo strumento più appropriato per un determinato compito di calcolo e di creare l'spiegazione finale in un formato comprensibile. «Pensate a questo come a un coordinatore intelligente», illustra il Professor Cordy. «Il modello di linguaggio fornisce un risultato comprensibile e conversazionale, mentre gli strumenti specializzati garantiscono che la risposta sia corretta e numericamente esatta.» Questo garantisce sia la facilità d'uso che la rigorosa accuratezza dei dati, un connubio essenziale per l'adozione professionale.

Testare con dati reali

Nel campo dell'IA, nulla può sostituire i test su dati reali per convalidare l'efficacia e l'affidabilità dei modelli. Lo SnT vanta una lunga esperienza di collaborazione con l'industria e le istituzioni, facendo progredire la ricerca e portando nuove tecnologie ai suoi partner. Per questo specifico settore di ricerca, il team del Professor Cordy è alla ricerca di un partner disposto a fornire dati reali al fine di testare il loro concetto di «ChatGPT per le tabelle» in un ambiente pratico.

Le aziende che collaborano potrebbero caricare i loro dati, porre una domanda e ottenere istantaneamente i risultati di diversi foundation models per tabelle, presentati fianco a fianco. Questo approccio comparativo metterebbe in luce i punti di forza e i limiti di ciascun modello, rendendo i test più accessibili e le decisioni sull'adozione dell'IA più informate e basate su evidenze concrete. È un modo per democratizzare il processo di valutazione, consentendo anche alle PMI di accedere a capacità di test avanzate.

«Non si può garantire che un modello sia sempre corretto, ma si può misurare con quale frequenza si comporta bene sotto stress», sottolinea il Professor Cordy. «Stiamo sviluppando metodi per testare la robustezza, la sicurezza, i bias e l'affidabilità, oltre all'accuratezza. Questo demistifica i modelli e permette agli utenti di vedere ciò che è possibile oggi e dove si trovano i limiti.» Tale trasparenza è cruciale per costruire la fiducia e per un'adozione responsabile dell'IA, specialmente in settori regolamentati.

L'AI Factory e la democratizzazione dell'IA

Questa filosofia di democratizzazione della valutazione dell'IA è anche uno dei pilastri dell'AI Factory. Questa iniziativa è stata lanciata in stretta collaborazione con LuxProvide, Luxinnovation, il Luxembourg National Data Service, il Luxembourg Institute of Science and Technology e altri sette partner associati. Il suo obiettivo primario è quello di sostenere le aziende lussemburghesi proponendo loro un insieme completo di servizi IA, fornendo un ecosistema robusto per lo sviluppo e l'implementazione dell'intelligenza artificiale.

Uno di questi servizi fondamentali sarà una piattaforma aperta di valutazione per gli integratori e gli sviluppatori di IA. L'ambizione è ambiziosa: consentire alle organizzazioni di specificare il proprio dominio — che sia finanza, biometria, o statistiche — e di generare automaticamente una dashboard di test pertinenti per qualsiasi strumento IA che desiderino utilizzare. Questo elimina la necessità di competenze specialistiche profonde in fase di test, rendendo l'IA più accessibile anche a chi non ha un team di data scientist interno.

In futuro, i contributori potranno anche aggiungere i propri strumenti di valutazione, creando un vero e proprio mercato di moduli di valutazione, simile a un app store su un telefono. Questa visione mira a creare un ecosistema collaborativo dove innovazione e valutazione si supportano a vicenda, accelerando lo sviluppo di soluzioni IA affidabili e pertinenti per un'ampia gamma di applicazioni e settori economici. L'AI Factory si posiziona così come un catalizzatore per l'innovazione e la fiducia nel campo dell'IA in Lussemburgo e oltre.