Un Elenco di Grandi Modelli Linguistici (LLM)
I Large Language Models (LLM) sono diventati il fondamento dello sviluppo moderno nel campo dell'intelligenza artificiale. Essi hanno inaugurato e stanno plasmando l'era dell'IA generativa, spaziando da semplici applicazioni di chatbot all'ingegneria agentiva e altri complessi flussi di lavoro automatizzati guidati da agenti IA. La loro comparsa segna un punto di svolta fondamentale nella storia del machine learning.
Con la crescente maturità della tecnologia, un numero sempre maggiore di nuovi LLM viene immesso sul mercato. Sia i principali sviluppatori di IA, sia nuove startup e grandi aziende consolidate, rilasciano e perfezionano costantemente nuovi modelli. Allo stesso tempo, la comunità open-source lavora continuamente alla messa a punto di LLM open-source, combinando e modificando modelli esistenti con set di dati personalizzati per creare innumerevoli varianti. Pertanto, nessuna lista di LLM può considerarsi completa, e anche la lista "più completa" non manterrebbe tale pretesa a lungo.
Di seguito è riportato un elenco di alcuni dei Large Language Models attualmente più noti e potenti. Ecco alcuni punti da considerare:
- In pratica, gli LLM si dividono generalmente in due categorie: LLM a sorgente chiusa, disponibili esclusivamente come offerte commerciali tramite lo sviluppatore del modello, e modelli aperti, messi a disposizione gratuitamente.
LLM a Sorgente Chiusa
Un modello a sorgente chiusa, o modello proprietario, è accessibile solo direttamente sulla piattaforma dello sviluppatore del modello, su altre piattaforme per le quali ha concesso in licenza il suo modello, o tramite l'API proprietaria del fornitore del modello.
Poiché gli sviluppatori di modelli chiusi trattano i loro dettagli tecnici come segreti commerciali strettamente custoditi, è generalmente impossibile conoscere con certezza le specifiche esatte della dimensione di un modello chiuso, l'architettura della sua rete neurale o il suo processo di addestramento. Sebbene alcuni dettagli possano essere dedotti – ad esempio, confrontando la velocità di inferenza, l'utilizzo della memoria GPU e le prestazioni di benchmark di un modello chiuso con quelle di modelli aperti i cui dettagli sono pubblicamente noti – questi sono raramente, se non mai, confermati.
Almeno dal 2022 circa, la maggior parte dei modelli pionieristici all'avanguardia in un dato momento sono modelli chiusi, ma questo riflette principalmente le realtà storiche del settore e non una superiorità intrinseca dei modelli chiusi rispetto ai modelli aperti. Di seguito sono elencate alcune delle serie di modelli chiusi più notevoli, in ordine alfabetico.
Modelli linguistici Claude di Anthropic
I modelli linguistici Claude di Anthropic sono tra i più potenti al mondo. Anthropic è stata fondata nel 2021 da ex dipendenti di OpenAI, originariamente come laboratorio di ricerca per la sicurezza dell'IA. L'approccio dell'azienda allo sviluppo dei modelli si basa sul concetto unico di AI Costituzionale. La "costituzione" di Claude è un documento che serve da guida non solo per il comportamento dei dipendenti di Anthropic, ma anche per il comportamento (e la creazione di dati di addestramento sintetici) dei modelli Claude stessi.
A partire da Claude 3, le generazioni successive di Claude dispongono di modelli multimodali in tre diverse dimensioni:
- Claude Haiku
- Claude Sonnet
- Claude Opus
Claude Haiku, Sonnet e Opus possono tutti elaborare input di testo, audio e immagini, e produrre output di testo o audio (come text-to-speech). A differenza della maggior parte dei loro concorrenti con modelli chiusi, finora non erano stati in grado di generare immagini (e la piattaforma Claude su cui si basano). Tuttavia, dal 12 marzo 2026, Claude è ora in grado di generare immagini. Accedendo ai modelli tramite l'API di Claude, gli utenti possono impostare il "livello di sforzo" del processo di inferenza di Sonnet o Opus su "max", "alto", "medio", "basso" o "adattivo".
Gemini di Google
Gemini è la serie di modelli linguistici chiusi di Google, sviluppata dalla sussidiaria Google DeepMind e presentata per la prima volta nel dicembre 2023. È degno di nota che Google Brain (che si è fusa con DeepMind in Google DeepMind nel 2023) è stata responsabile dello sviluppo dell'architettura Transformer, che ha reso possibili i primi grandi modelli linguistici (LLM) dopo aver pubblicato il rivoluzionario lavoro di ricerca "Attention is All You Need" nel 2017.
Dall'inizio del 2025, Google ha rilasciato ogni generazione dei modelli Gemini in tre diverse dimensioni, che sono costantemente modelli per il ragionamento logico. Accedendo tramite l'API di Gemini, gli utenti possono scegliere uno dei diversi "livelli di pensiero" per personalizzare il numero di token e il tempo impiegato dal modello prima di generare un output finale.
I modelli Gemini Pro, Flash e Flash-Lite sono intrinsecamente multimodali: possono elaborare input di testo, audio, immagini o video e generare output di testo. Se si accede tramite la piattaforma Gemini, è possibile creare output multimodali utilizzando i modelli separati e specializzati di Gemini per la generazione di immagini, video o musica.
Dal rilascio di Gemini 2.5 Pro nel marzo 2025, che all'epoca raggiunse le migliori prestazioni del settore nella maggior parte dei benchmark accademici, i modelli Gemini competono con Claude e la serie GPT di OpenAI per il titolo dei LLM più potenti al mondo. In generale, lo status di modello "top" cambia ogni volta che viene rilasciato un nuovo modello rivoluzionario da una di queste tre serie.
Grok di xAI
Grok è una famiglia di LLM proprietari creati da xAI e lanciati per la prima volta nel novembre 2023 come chatbot in anteprima beta su X (ex Twitter). Nell'aprile 2025, xAI ha rilasciato l'accesso API per Grok 3, all'epoca il nuovo modello di punta dell'azienda.
La gamma di modelli di Grok si è evoluta continuamente nel corso delle varie generazioni di modelli.
A partire da Grok 4, i modelli Grok possono elaborare input di testo, immagini e voce. Sebbene gli LLM Grok non possano fornire output multimodali, gli output di immagini e video possono essere generati tramite la piattaforma Grok Imagine utilizzando il modello Aurora di xAI.
Indipendentemente dalla sua pura capacità prestazionale, gran parte della storia di Grok (e in particolare quella del chatbot Grok) è stata segnata da controversie, come accuse di diffusione di disinformazione elettorale, l'introduzione di punti di vista polarizzanti in conversazioni non correlate e il consolidamento di stereotipi dannosi.
In dichiarazioni pubbliche, Elon Musk, CEO di xAI, ha dichiarato che "il nostro approccio generale è rilasciare l'ultima versione come open source non appena la versione successiva sarà pienamente disponibile."1
xAI ha rilasciato Grok 1 come software open-source nel marzo 2024 con la licenza Apache 2.0. Sebbene Grok 3 fosse già stato rilasciato nel febbraio 2025, il successivo rilascio open-source di un altro modello è avvenuto solo nell'agosto 2025. In modo alquanto confuso, xAI (e Musk) hanno annunciato di aver rilasciato "Grok 2.5"2 come open source, sebbene in precedenza non fosse stato né nominato né annunciato alcun modello con quel nome. La scheda del modello su Hugging Face lo identifica persino come "Grok-2".
In questo annuncio dell'agosto 2025, Musk ha lasciato intendere che Grok 3 sarebbe stato rilasciato anch'esso come open source in "circa sei mesi". Otto mesi dopo, la data di rilascio della versione open-source non era ancora stata annunciata.
Serie GPT di OpenAI
La serie GPT di OpenAI – acronimo di "Generative Pretrained Transformer" – è ampiamente accreditata per aver inaugurato l'attuale era dell'IA generativa, in particolare dopo l'introduzione di ChatGPT.
1 Dichiarazioni pubbliche di Elon Musk, xAI. 2 Annuncio di xAI (e Musk) nell'agosto 2025.