Questo articolo tratta Kimi K2.7 Code, un modello open-source lanciato da Moonshot AI specificatamente per l'esecuzione di compiti di programmazione avanzati e per flussi di lavoro basati su agenti. Il modello, disponibile come open-weights su Hugging Face, rappresenta un'evoluzione rispetto al predecessore Kimi K2.6, ma Moonshot AI consiglia K2.6 quando si affrontano attività generali al di fuori della programmazione.

Risultati migliorati ma non sufficienti a superare i leader

K2.7 Code mostra una significativa crescita rispetto al predecessore, come dimostrato nei test interni di Moonshot AI: il punteggio sale da 50.9 a 62.0 su Kimi Code Bench v2. Su Program Bench, cresce da 48.3 a 53.6, e su MLS Bench Lite, aumenta da 26.7 a 35.1. In termini di benchmark specifici per agenti, il modello raggiunge i 76.0 su MCP Atlas (dai precedenti 69.4) e i 81.1 su MCPMark Verified (dagli ex 72.8).

Tuttavia, in confronto diretto con modelli come GPT-5.5 e Claude Opus 4.8, K2.7 Code mostra una performance inferiore su quasi tutte le metriche di programmazione. Su Program Bench, ad esempio, GPT-5.5 ottiene 69.1 a fronte dei 53.6 di K2.7 Code. Su Kimi Code Bench v2, la differenza è di 69.0 a 62.0.

Prestazioni solide nei test basati sugli agenti

I test condotti su MCPMark Verified rilevano una buona performance del modello, nonostante continui a sottoperformare i leader. Il risultato ottenuto da K2.7 Code è 81.1, vicino a 76.4 registrato da Opus 4.8, ma ben distante rispetto a GPT-5.5 che raggiunge 92.9.

Architettura e parametri

Kimi K2.7 Code adotta un'architettura di tipo Mixture-of-Experts (MoE) con un totale di un trilione di parametri, di cui solo 32 miliardi sono attivi per token. Il modello conta 384 esperti, con otto selezionati per token. La sua lunghezza di contesto è di 256.000 token.

Sistema di visione personalizzato e architettura avanzata

Più che la sola architettura avanzata, il modello presenta una personalizzazione unica con un encoder visivo denominato MoonViT. MoonViT ha 400 milioni di parametri, permettendo al modello di processare immagini e video insieme al testo. Gli sviluppatori osservano anche una maggiore efficienza, con circa il 30% in meno di token di ragionamento necessari rispetto a Kimi K2.6.

Modalità rapida e accesso API

Il modello include inoltre una modalità "6x High-Speed", nonché la compatibilità con varie piattaforme come il Kimi API, il CLI Kimi Code, e motori di inferenza come vLLM e SGLang. La quantizzazione INT4 nativa rende possibile l'uso in ambienti hardware meno performanti o più economici.

Un prezzo significativamente inferiore ai concorrenti

Gli utenti hanno accesso a una tariffa API di $0.95 al milione per token di input e $4.00 al milione per token di output. Gli accessi al cache riducono il prezzo degli input a $0.19 al milione.

Confronto competitivo

Modello GPT-5.5: $5.00 al milione per token di input, $30.00 al milione per output.

Claude Opus 4.8: $5.00/$25.00.

Claude Fable 5 (sospeso temporaneamente): $10.00/$50.00.

In confronto, Kimi K2.7 Code è significativamente più economico. Il modello Fable 5, ad esempio, ha un costo di 12 volte superiore per i token di output.

Licenza MIT modificata

I modelli di Kimi adottano una licenza MIT modificata che consente l'utilizzo gratuito, la modifica e la redistribuzione. Tuttavia, chiunque utilizza il modello o le sue modifiche in prodotti commerciali con oltre 100 milioni di utenti mensili attivi o più di 20 milioni di dollari di entrate mensili deve visualizzare "Kimi K2.7 Code" in modo prominente nell'interfaccia.

Un significativo contributo all'economia dei token

Il costo per token sta emergendo come un fattore competitivo chiave a parità di qualità intrinseca del modello. Questo trend segnala una transizione all'economia dei token. La disponibilità su Hugging Face e la sottoscrizione a THE DECODER per aggiornamenti sull'intelligenza artificiale offrono un accesso completo, ma il vero driver competitivo è la capacità di Moonshot di offrire un modello avanzato in termini di rapporto prezzo-prestazioni.