Data2Story, un'innovativa pipeline sviluppata da ricerca congiunta tra Oxford e Stanford, introduce un modo completamente nuovo di generare articoli giornalistici interattivi partendo da un file CSV, utilizzando sette agenti AI specializzati. L’obiettivo principale di questo sistema, denominato "Data Journalist Agent", è di automatizzare gran parte dell'elaborazione giornalistica dati senza compromettere la verificabilità dell'informazione. L'esperimento si basa su Claude Code, un ambiente di programmazione AI, per orchestrare i sette agenti dedicati. L'applicazione ha ricevuto una risposta positiva da parte dei lettori, dimostrando che il prodotto generato ha una serie di vantaggi rispetto agli articoli scritti a mano.
Un Processo Interamente Automatizzato
Data2Story funziona in modo completamente automatizzato. Dato un file CSV, il sistema genera un articolo completo composto da contesto, statistiche, grafici e interattività. La caratteristica centrale del sistema è il "Panels Inspector", una funzione che collega ogni frase e ogni grafico a una fonte specifica, che può essere un URL esterno o un'istruzione di codice eseguibile. Questo rende quasi il 93% delle affermazioni visibili verificabili, una percentuale significativamente superiore a quella degli articoli umani, che si ferma al 25%.
Ogni affermazione, grafico o elemento interattivo dell’articolo viene accompagnato da un "index card" che mostra la provenienza esatta in forma strutturata. Gli utenti possono non solo verificare l'origine di ogni affermazione, ma anche eseguire il codice che genera i dati. Questo eleva i parametri di trasparenza e accuratezza in un settore spesso criticato per mancanza di trasparenza.
Sette Agenti, Un Lavoro Editorializzabile
Il core di Data2Story è formato da sette agenti AI che replicano le funzioni di un giornale tradizionale. "Il Detective" raccoglie informazioni contestuali tramite ricerche online; "l’Analista" esegue analisi quantitative; "l'Editor" decide il punto focale del racconto; "il Designer" scegli il formato visivo; "l’Programmista" genera il codice HTML; "l&Auditor" testa il layout; ed infine "l'Inspector" collega tutte le informazioni alle loro fonti.
Dimostrazione Pratica e Ricerca Comparativa
Gli autori hanno testato il sistema su diversi dataset pubblici. Fra gli esempi, hanno utilizzato i dati della FIFA 2026 per generare un articolo su rischi climatici, dimostrando che Data2Story può trattare dataset complessi e produrre contenuti contestualizzati. Hanno confrontato gli articoli generati con le pubblicazioni originali di tre fonti: The Economist, The Pudding e TidyTuesday.
I lettori partecipari hanno valutato 18 paia di articoli, e i risultati mostrano una chiara preferenza per quelli generati da Data2Story, specialmente in termini di trasparenza e dati, dove ha ottenuto un punteggio superiore di +1.49 su una scala di sette. In totale, il 74% ha preferito l’articolo prodotto dagli agenti AI, mentre solo il 25% ha scelto l’articolo umano e il restante 2% ha espresso un pareggio.
Confronti per Tipo di Fonte
Il confronto riscuote successo in particolar modo in articoli di tipo dati, come quelli di The Economist e TidyTuesday. Tuttavia, contro i report grafici curati a mano da The Pudding, c'è stato un pareggio statistico. Questo suggerisce che, mentre l'AI eccelli nella trattazione di dati e contestualizzazione, essa presenta limiti nel design artistico e nella costruzione di interfacce creative.
Nel confronto per affermazioni, Data2Story ha coperto circa la metà delle affermazioni umane, mentre i giornalisti hanno incluso solo un terzo delle affermazioni generate dall’IA. L’agente ha integrato nuovi angoli visibili ma non catturato completamente la trama editoriale chiave, soprattutto in brevi sintesi come quelle dell'Economist.
Limiti Umani non Sostituiti
I ricercatori evidenziano tre ambiti in cui i giornalisti umani mantengono il vantaggio: la prospettiva editoriale, la creazione di disegni grafici unici, e la comprensione di contenuti complessi su singole grafiche. Ad esempio, mentre l’agente mostra statistiche sui tassi di riparazione, i giornalisti riescono a spiegare le barriere strutturate che influiscono negli esiti di riparazione. In termini di presentazione, Data2Story inserisce solo un’immagine statica, mentre The Pudding permette una interazione totale con i dati.
Un Supporto, non un Sostituto
Gli autori presentano Data2Story come uno strumento di supporto per i giornalisti, non come sostituto. L’IA si occupa di calcoli, grafici e verificabilità; gli umani forniscono il punto di vista editoriale e la capacità di raccontare storie che i dati da soli non possono rappresentare. L’applicazione si dimostra particolarmente utile nel trattamento di dataset di nicchia che altrimenti non avrebbero ricevuto alcun coprimano.
Il Futuro della Verifica AI
Una limitazione del sistema è che attualmente funziona in modo totalmente automatizzato senza un intervento umano. Gli autori menzionano come futuro lavoro la versione "umanizzata", dove l'utente possa intervenire nel processo e correggere o completare il lavoro del sistema. Data2Story rappresenta inoltre un passo avanti nel campo della verificabilità, tentando di risolvere il problema delle "hallucinazioni di attribuzione", nel quale i sistemi AI citano fonti errate anche quando forniscono risposte corrette.
Con lo sviluppo di funzioni simili, ad esempio "Search as Code" di Perplexity, si punta a ulteriormente migliorare la trasparenza e l’accuratezza delle risposte generate in modo automatizzato. Gli sviluppatori di Data2Story hanno pubblicizzato il loro strumento all’indirizzo data2story.github.io, offrendo il codice open-source su GitHub per permettere una collaborazione congiunta.