GLM-5.2 rappresenta un passo avanti significativo nella famiglia di modelli di linguaggio di Z.ai. Lanciato il 13 giugno 2026, è la terza principale versione del GLM-5, seguendo i rilasci di GLM-5 (11 febbraio), GLM-5-Turbo (15 marzo) e GLM-5.1 (7 aprile). In pochi mesi è stato lanciato un totale di quattro modelli flagship dedicati al coding.

Contesto Utilizzabile Di 1 Miliardo Di Token

Il dettaglio più rilevante di GLM-5.2 è la finestra di contesto di 1.000.000 di token. Q.aia indica la variante come glm-5.2[1m] nelle configurazioni interne. Ogni risposta può restituire fino a 131.072 token, un aumento di circa 5 volte rispetto ai 200.000 token del GLM-5.1.

Una finestra di contesto di 1 milione di token modifica radicalmente l'approccio di un agente di codifica. L’agente può memorizzare l’intera struttura di un repository di dimensioni medie nel contesto attivo. Questo include file sorgenti, test, configurazioni e storia delle conversazioni. Si evita la necessità di continuo riepiloghi, come avviene invece con finestre più piccole.

Due Livelli Di Pensiero: High e Max

Z.ai introdurrà due livelli di elaborazione: High e Max. Per compiti complessi, Z.ai consiglia l’utilizzo di Max. Nel contesto di Claude Code, il comando /effort consente di selezionare il livello desiderato. Le opzioni xhigh, max e ultracode vengono mappate su Max per il GLM-5.2.

Architettura e Cambiamenti

Nelle note di rilascio, Z.ai non ha specificato l’architettura esatta di GLM-5.2. Tuttavia, in base alle fonti community, il modello di base GLM-5 prevede un modello MoE (Mixture of Experts) con 744 miliardi di parametri. Per ogni token, vengono attivati 40 miliardi di parametri. Il modello precedente, GLM-5.1, manteneva questa struttura con addestramenti mirati post.

La finestra di contesto più ampia e la potente architettura supportano un utilizzo avanzato. Per sfruttare al massimo la potenziale finestra di contesto di 1 milione di token, Z.ai ha fornito strumenti come il GLM-5.2 Setup Generator & Context Visualizer.

L’Assenza Dei Benchmark Iniziale

Rimane però una questione fondamentale: Z.ai non ha fornito benchmark per il modello al lancio. Non sono disponibili né punteggi SWE-bench, né dati Terminal-Bench o Code Arena. L'annuncio si è focalizzato su disponibilità, contesto e roadmap relativa al codice open-source.

Un confronto tra le specifiche principali mostra che GLM-5.2 supera il GLM-5.1 in molti aspetti, compresa la finestra di contesto (1.000.000 token contro 200.000), e la capacità di output (131.072 token) rispetto a dati non definiti.

Applicazioni Esempio

Rifattorizzazione di interi repository: Caricare un repository nel contesto con un unico passo evita costanti richieste di file.
Eseguire test estesi: Lavorare su loop di agenti lungo fino a ore e con migliaia di passaggi.
Utilizzo diretto di Claude Code: Sostituire URL e identificatore del modello per un trasferimento rapido tra modelli.
Analisi di documenti estesi: Inserire specifiche più lunghe di 200K in un unico carico di dati.

Come Configurare GLM-5.2

Per integrarlo con Claude Code, modificare il file ~/.claude/settings.json per indicare 1M come modello principale. Per l'attribuzione, impostare ANTHROPICDEFAULTOPUS_MODEL su glm-5.2[1m].

Ecco un esempio di configurazione:

export ANTHROPICDEFAULTHAIKU_MODEL="glm-4.5-air"
export ANTHROPICDEFAULTSONNET_MODEL="glm-5.2[1m]"
export ANTHROPICDEFAULTOPUS_MODEL="glm-5.2[1m]"

Una volta configurato, eseguire /effort max per attivare la potenza di GLM-5.2. In alternativa, selezionare la piattaforma OpenAI Compatible per Cline e fissare l’URL a https://api.z.ai/api/coding/.

Conclusione

GLM-5.2 è subito disponibile per tutti i clienti del GLM Coding Plan, comprese le versioni Lite, Pro, Max e Team. Anche se non è incluso alcun benchmark immediato, è compatibile con otto strumenti agenti al momento del lancio, come Claude Code, Cline, OpenCode, e OpenClaw.

Con la sua finestra di contesto estesa e le capacità avanzate di elaborazione, GLM-5.2 rappresenta una svolta per lo sviluppo di codice autonomo e per l’utilizzo di contesti estesi. Z.ai invita gli sviluppatori a provare queste nuove funzionalità tramite demo interattive e configurazioni ottimizzate.