La salute è uno dei settori in cui le persone utilizzano in modo più significativo ChatGPT. Ogni settimana, più di 230 milioni di utenti si rivolgono a ChatGPT per aiuto su questioni relative alla salute e al benessere: interpretare informazioni sanitarie, comprendere i risultati dei test, prepararsi per visite mediche, capire le assicurazioni, adottare abitudini più salutari e trovare domande su cui porre l’attenzione.

GPT-5.5 Instant e i progressi nella salute

Con GPT-5.5 Instant, si osserva un miglioramento sostanziale riguardo alla salute, in particolare nella capacità di riconoscere quando è necessario un intervento urgente, chiedere informazioni pertinenti, spiegare l’incertezza e rendere più accessibile informazioni complesse. Nel momento in cui viene sottoposto alle valutazioni di salute più impegnative, GPT-5.5 Instant dimostra una capacità paragonabile ai modelli avanzati in sperimentazione. Questo progresso permette a più persone di beneficiare dei miglioramenti, grazie alla sua disponibilità gratuita per tutti gli utenti.

Questo avanzamento rappresenta sia un progresso tecnologico che il lavoro diretto da medici coinvolti nelle valutazioni mediche. Un network internazionale di medici aiuta a definire gli standard di qualità in contesti sanitari reali, analizzando risposte generate dal modello, descrivendo comportamenti ideali e individuando gli errori. Collaborare con i medici permette una misurazione precisa del progresso e un miglioramento costante della risposta fornita da ChatGPT.

Valutazione del progresso nel settore salute

Qualunque progresso nel campo della salute deve concentrarsi su risposte accurate, comprensibili, dotate di buon giudizio. Questo include la capacità di riconoscere quando è richiesta ulteriore informazione, spiegare incertezze senza esagerare la fiducia o aiutare le persone a capire quando cercare cure.

Per misurare l’avanzamento, vengono utilizzati standard valutativi sanitari, come HealthBench e HealthBench Professional. Questi valutano conversazioni realistiche e rubriche scritte da medici per giudicare qualità come precisione, sicurezza, comunicazione, attenzione al contesto, completezza e escalation appropriata.

GPT-5.5 Instant, disponibile da maggio 2026, ha raggiunto una performance paragonabile ai modelli frontali del settore in valutazioni aggregate di salubrità (es. HealthBench Professional), segnando un sostanziale miglioramento rispetto a GPT-5.3 Instant.

Confronti con risposte di medici

In un’altra valutazione, si chiese ai medici di scrivere risposte a conversazioni mediche rappresentative, con accesso illimitato a Internet ma senza l’aiuto di IA. Un panel separato di medici confrontò queste risposte con quelle generate dai modelli nel tempo, esaminando criteri rilevanti come precisione, comunicazione, completezza, aderenza alle istruzioni e utility decisionale, sulla base di 3500 risposte valutate.

Le risposte di GPT-5.5 Instant sono risultate superiori a quelle scritte da medici e a quelle generate da modelli precedenti in diversi criteri di questa valutazione

Secondo i medici, le risposte di GPT-5.5 Instant presentano meno fallimenti rispetto a quelle degli altri modelli e ai medici stessi. Per esempio, il modello mostra meno casi in cui manchi il riferimento al contesto sanitario locale, in cui non vengano riconosciuti segnali di emergenza o in cui non si richieda contestualmente maggiori informazioni all’utente rispetto a quanto avvenga con altri modelli o con i medici.

Riduzione degli inesatti fattuali

Un’altra misura del recente progresso del modello è rappresentata da una riduzione dell’incidenza di inesatti negli interventi sanitari. Utilizzando un sistema di monitoraggio che preserva la privacy, viene osservato che la percentuale di risposte con problematiche di fattualità è scesa del 71% negli ultimi due mesi, su migliaia di messaggi sanitari processati ogni settimana.

Qualità delle nuove risposte

Confrontando le risposte generate per reali domande sanitarie nel tempo si osservano miglioramenti concreti per la salute: riconoscere quando una situazione richiede attenzione medica immediata, gestire l’incertezza con una migliore giudicazione e fornire chiare e utili indicazioni a chi consulta. Questi fattori sono cruciali per migliorare l’esperienza dell’utente.

L’esperienza medica alle spalle dei progressi

I progressi di ChatGPT in salute sono fortemente supportati da un network globale di esperti. OpenAI lavora con più di 260 medici in 60 paesi, 49 lingue e 26 specialità. Le loro valutazioni guidano ChatGPT nell’affrontare domande sanitarie, che vanno da argomenti di vita quotidiana a situazioni cliniche complesse.

I medici esamino esempi di risposte generate dal modello e giudicano se sono accurate, chiare, complete, sufficientemente prudenti e utili. I loro commenti rivelano dove le risposte potrebbero non tenere conto di informazione cruciale, sembrare eccessivamente certe, non spiegare le prossime azioni oppure non incoraggiare chiaramente a cercare cure mediche.

Ad oggi, i medici hanno esaminato oltre 700.000 risposte generate, rappresentative di conversazioni reali con pazienti e operatori sanitari. Ogni pochi minuti, un medico analizza una nuova risposta e fornisce feedback che diventa una guida dettagliata per i ricercatori. In questo modo, si riesce a misurare meglio quando i modelli miglioreranno ulteriormente e dove ci sia ancora spazio per miglioramenti.

Accesso universale ai progressi sanitari

Questo lavoro favorisce inoltre lo sviluppo di OpenAI in ambito salute, supportando la creazione di strumenti pensati specificatamente per il settore sanitario. Strumenti come ChatGPT per Clinici e OpenAI per la Sanità offrono ai professioni medici supporto nei compiti di documentazione, ricerca e assistenza sanitaria.

Lavorare per un futuro in cui la salute umana possa trarre benefici concreti da AGI (Intelligenza Artificiale Generale) rappresenta uno tra gli obiettivi più personali e significativi per OpenAI. Mentre i modelli continueranno a migliorare, l’intento di OpenAI rimane garantire una ChatGPT sempre più precisa e utile in momenti cruciali, e portare tale progresso a una sempre più vasta platea di utenti.