Introduzione alla modellazione epidemiologica

La modellazione epidemiologica è riconosciuta come uno strumento fondamentale per comprendere le dinamiche delle malattie infettive e per guidare decisioni e politiche di sanità pubblica [1–5]. I modelli meccanicistici, in particolare, sono saldamente radicati nelle leggi governative note e nei principi fisici della trasmissione delle malattie. Questi modelli sono stati ampiamente utilizzati per studiare una vasta gamma di infezioni, tra cui le infezioni respiratorie [6–8], le malattie a trasmissione sessuale [9, 10] e le malattie trasmesse da vettori [11, 12]. A differenza dei modelli empirici, che si concentrano principalmente sull'adattamento dei dati senza necessariamente incorporare le cause sottostanti dei modelli osservati, i modelli meccanicistici mirano a spiegare come e perché le epidemie si sviluppano.

Sfide dei modelli meccanicistici tradizionali

Nonostante la loro utilità nel prevedere e controllare la diffusione delle malattie infettive, i modelli meccanicistici tradizionali, come la classica struttura suscettibile-infetto-recuperato (SIR), affrontano diverse sfide significative. In primo luogo, l'affidabilità di questi modelli dipende fortemente dall'accuratezza dei parametri stimati che governano le dinamiche di trasmissione [5, 13, 14]. Tuttavia, i modelli attuali sono spesso limitati da semplificazioni e dalla disponibilità dei dati. Ad esempio, la trasmissibilità di una malattia, sebbene modellata come dinamica, è frequentemente calibrata utilizzando dati di decessi o ospedalizzazioni in ritardo e potenzialmente incompleti. Allo stesso modo, i modelli di contatto umano, cruciali per comprendere la trasmissione, sono spesso assunti come statici a causa dell'accesso limitato a dati di alta qualità e in tempo reale. Inoltre, l'impatto degli interventi è tipicamente modellato utilizzando termini lineari, non riuscendo a catturare pienamente la complessa interazione tra le risposte del pubblico e l'evoluzione del patogeno.

In secondo luogo, nonostante la ricchezza di conoscenze epidemiologiche codificate in fonti di dati non strutturati e multimodali (ad esempio, immagini satellitari, social media, cartelle cliniche elettroniche), la loro incorporazione nei modelli meccanicistici si è basata in gran parte sull'estrazione manuale delle caratteristiche, ostacolando l'utilizzo efficace della ricchezza di questi dati [15–17]. Questo approccio limita la capacità di sfruttare appieno il potenziale informativo insito in tali vasti e complessi set di dati, che potrebbero offrire intuizioni più profonde sulle dinamiche delle malattie e sui fattori che influenzano la loro diffusione.

In terzo luogo, l'avvento dei big data [18, 19] ha stimolato lo sviluppo di modelli meccanicistici più complessi che offrono descrizioni granulari e dettagliate delle dinamiche delle malattie [20, 21]. Tuttavia, questa maggiore complessità aumenta anche in modo significativo le risorse computazionali richieste per la calibrazione e la convalida dei modelli, la simulazione delle epidemie e l'ottimizzazione. La necessità di una maggiore potenza di calcolo e di metodi più efficienti per la gestione e l'analisi di questi dati complessi rappresenta un ostacolo importante all'adozione diffusa e all'efficacia di tali modelli avanzati.

L'intelligenza artificiale come soluzione innovativa

I recenti progressi nell'intelligenza artificiale (AI), in particolare nell'apprendimento automatico (ML) e nell'apprendimento profondo (DL), offrono soluzioni promettenti per superare le sfide e i limiti della modellazione epidemiologica tradizionale basata su modelli meccanicistici [22–26]. Le tecniche di AI dimostrano capacità eccezionali nel prevedere risultati futuri, nell'elaborare diverse banche dati e nell'estrarre schemi e intuizioni sfumate dai big data. Vari approcci basati sull'AI sono stati implementati con successo per applicazioni sanitarie [27–30], tra cui l'analisi di immagini mediche, la scoperta di farmaci, la previsione degli esiti clinici e l'ottimizzazione dei trattamenti.

Il potenziale dell'AI di trasformare la modellazione epidemiologica è stato attivamente esplorato in diverse discipline [31–34]. Una linea di ricerca si concentra su modelli predittivi puramente basati sull'AI [35–37], considerati alternative ai modelli meccanicistici tradizionali. Sebbene questi modelli predittivi possano ottenere buoni risultati nelle previsioni epidemiche a breve termine, la loro mancanza di meccanismi sottostanti ne limita l'utilità per la pianificazione a lungo termine e l'analisi di scenari. I modelli integrati, che combinano le capacità di data-mining delle tecniche di AI con il potere esplicativo dei modelli meccanicistici, stanno guadagnando un'attenzione significativa. Nonostante l'ampio spettro di metodi di AI disponibili, le attuali integrazioni con i modelli epidemiologici meccanicistici sono prevalentemente limitate ai modelli statistici tradizionali, in particolare per l'inferenza dei parametri e la calibrazione dei modelli [38–41]. Le esplorazioni sulle tecniche emergenti di ML e DL, sebbene promettenti e in rapida espansione, rimangono frammentate a causa della complessità di queste tecniche e delle sfide di comunicazione interdisciplinare. Colmare questo divario è cruciale per sfruttare appieno la potenza dell'AI per far progredire la modellazione epidemiologica.

Obiettivi e metodologie della rassegna esplorativa

Le rassegne esistenti sulle applicazioni emergenti dell'AI nella gestione delle malattie infettive si sono concentrate principalmente sugli aspetti clinici (ad esempio, diagnosi e trattamento), sulla scoperta di farmaci e sui modelli predittivi puramente basati sull'AI [18, 42–45]. Alcune rassegne hanno fornito panoramiche delle applicazioni dell'AI nella sorveglianza delle malattie infettive [46–48], offrendo spunti sull'integrazione tra AI e modelli meccanicistici; tuttavia, mancava una rassegna completa dedicata specificamente a questa integrazione. Questa rassegna esplorativa si propone di colmare questa lacuna sintetizzando sistematicamente la letteratura in questo campo emergente. L'obiettivo è identificare soluzioni con il potenziale di soddisfare le esigenze immediate nella modellazione epidemiologica provenienti da varie discipline, delineare i divari tra la ricerca e le applicazioni nel mondo reale e evidenziare direzioni di ricerca promettenti per l'utilizzo di modelli integrati al fine di fornire una guida politica basata sui dati.

Risultati dello studio: selezione e caratteristiche

La strategia di ricerca adottata ha prodotto un totale di 15.460 studi. Questa vasta raccolta includeva 15.422 record provenienti da ricerche di database, 17 identificati tramite ricerca retroattiva delle citazioni e 21 individuati attraverso una ricerca manuale di riviste pertinenti e atti di conferenze. Dopo un rigoroso processo di eliminazione dei duplicati, sono stati rimossi 6.267 articoli, lasciando 9.193 studi da sottoporre a screening iniziale. Di questi, 807 studi sono avanzati alla fase di revisione del testo completo. Infine, dopo un'attenta valutazione, 245 studi sono stati inclusi in questa rassegna esplorativa (i dettagli metodologici sono forniti nella sezione Metodi e illustrati nella Fig. 1, mentre le caratteristiche complete di questi studi sono disponibili nell'Appendice Supplementare 5).

La Figura 1, che fa riferimento al diagramma di flusso PRISMA, illustra in modo dettagliato la strategia di ricerca, il processo di screening e la selezione degli articoli, garantendo trasparenza e riproducibilità dei risultati della rassegna.

Ambiti di applicazione e malattie studiate

Gli studi selezionati hanno coperto una vasta gamma di aree di applicazione per modelli integrati, focalizzandosi su diverse malattie infettive. Complessivamente, sono state investigate 26 malattie infettive distinte utilizzando questi modelli integrati (per un elenco dettagliato, si veda l'Appendice Supplementare 6). La maggior parte di questi studi si è concentrata sulla COVID-19, rappresentando un'enorme proporzione con 148 studi (pari al 60%) del totale. Seguono l'influenza con 18 studi (7%), la dengue con 4 studi (2%) e l'HIV con 3 studi (1%). È interessante notare che, oltre a queste malattie specifiche, 56 studi (23%) hanno utilizzato scenari di malattia ipotetici per dimostrare l'applicabilità dei metodi piuttosto che indagare malattie reali.

Questo fenomeno riflette l'utilità degli scenari ipotetici per testare la robustezza e la versatilità di nuove tecniche di modellazione in un ambiente controllato prima della loro applicazione a situazioni epidemiologiche concrete. Il recente aumento della ricerca sulla COVID-19 ha notevolmente incrementato il volume degli studi che integrano l'AI con i modelli epidemiologici. In effetti, 217 (89%) degli studi inclusi sono stati pubblicati tra il 2020 e il 2023, evidenziando una rapida accelerazione dell'interesse e dell'attività di ricerca in questo specifico campo durante la pandemia e negli anni immediatamente successivi. Nonostante questo incremento nel volume degli studi di ricerca, permangono delle sfide e la frammentazione è ancora presente, richiedendo ulteriori sforzi per consolidare e far progredire il campo.

Questa rassegna esplorativa mette in luce il valore pratico dei modelli integrati, inclusi i progressi nella previsione delle malattie, nella parametrizzazione dei modelli e nella calibrazione. Tuttavia, rimangono significative lacune di ricerca che necessitano di essere affrontate. Queste includono la necessità di una migliore incorporazione di considerazioni realistiche sul processo decisionale, un'esplorazione più ampia di set di dati diversi e un'ulteriore indagine sui meccanismi biologici e socio-comportamentali. Affrontare queste lacune sbloccherà il potenziale sinergico dell'AI e della modellazione meccanicistica per migliorare la comprensione delle dinamiche delle malattie e supportare una pianificazione e una risposta più efficaci della sanità pubblica.