Moonshot AI ha recentemente annunciato la pubblicazione di Kimi K2.7-Code, un modello avanzato di intelligenza artificiale incentrato sulla programmazione e sull’esecuzione di compiti complessi. Le pesanti informazioni del modello sono accessibili su Hugging Face sotto una licenza Modified MIT e i consumatori possono interagire con il modello tramite Kimi API e Kimi Code.

Ciò che differenzia K2.7-Code?

K2.7-Code è un modello Mixture-of-Experts, con un numero totale di 1 trilione di parametri e un'attivazione di 32 miliardi di parametri per token. La sua struttura include 384 esperti, 8 dei quali vengono selezionati per ogni token, uniti a uno condiviso. Il modello possiede anche 61 strati, tra cui un livello denso.

L’attenzione del modello utilizza MLA (Multi-Layer Attention), mentre per il percorso feed-forward si utilizza la funzione SwiGLU. L’encoder visione MoonViT, che ha aggiunto 400 milioni di parametri, è stato incluso per fornire input da immagini e video. K2.7-Code è dotato di una quantizzazione INT4 nativa, con finestra di contesto di 256K token.

Parametri chiave

Totali: 1T parametri

Token di attivazione: 32B

Esperti totali: 384

Estratto: 8 per token

Strati: 61 (1 strato denso incluso)

Encoder visione MoonViT: 400M parametri aggiunti

Quantizzazione nativa: INT4

Finestra di contesto: 256K token

Le limitazioni

Due limitazioni fondamentali vengono applicate al modello. La modalità "Thinking" è obbligatoria, e disattivarla provoca un errore nell’API. I parametri di campionamento sono fissi: temperatura 1.0, top_p 0.95, n 1, senza penalità. La massima uscita di token è fissata a 32.768.

Benchmark

I test condotti dal team Moonshot mostrano che K2.7-Code ha superato la versione precedente, K2.6, in tutti gli scenari di valutazione. Il miglioramento più significativo si presenta nel benchmark di codifica Kimi Code Bench v2, passando da 50.9 a 62.0.

Confronto Benchmark

Benchmark	Kimi K2.6	Kimi K2.7-Code	GPT-5.5	Claude Opus 4.8
Kimi Code Bench v2	50.9	62.0	69.0	67.4
Program Bench	48.3	53.6	69.1	63.8
MLS Bench Lite	26.7	35.1	35.5	42.8
Kimi Claw 24/7 Bench	42.9	46.9	52.8	50.4
MCP Atlas	69.4	76.0	79.4	81.3
MCP Mark Verified	72.8	81.1	92.9	76.4

Riduzione del consumo di token

Il team Moonshot ha riportato una riduzione del 30% rispetto al consumo di token di K2.6, descrivendoli come "meno overthinking". Questo fattore influisce su costo, velocità e limiti di contesto. K2.7-Code genera meno token di output per compito, riduce i tempi di calcolo e mantiene più spazio per compiti complessi.

Usi principali

Uno dei principali utilizzi di K2.7-Code è nella refactorizzazione del codice su larga scala. Indirizzando l'agente verso un set di test che fallisce, il modello legge i file, modifica diversi moduli e riesegue i test fino a superarli.

La revisione del codice rappresenta un altro scena d'applicazione. Si invia una modifica (diff) e si richiede un'analisi del rischio; la finestra di 256K token consente di trattare diff larghi, log e file collegati in un'unica sessione.

I flussi di lavoro MCP sono un terzo scenario. Con un punteggio MCP Mark Verified di 81.1, K2.7-Code mostra la capacità di utilizzare correttamente gli strumenti nel Protocollo di Contesto del Modello.

L’analisi su lungo termine rappresenta un quarto campo d’applicazione. Accetta testi, immagini e video in input. Documentazione, screenshot e tracce video possono condividere uno stesso prompt per un contesto completo.

Pannello Interattivo di Marktechpost

Il team di Moonshot ha fornito accesso ad un tool di esplorazione in tempo reale per valutare le performance e il prezzo. Il modello è attivo dal 12 giugno 2026 e verificato nello stesso periodo.

Avvio rapido

Kimi API è compatibile con OpenAI compatibile e il modello da utilizzare è "kimi-k2.7-code". È importante non alterare i parametri fissi di campionamento, altrimenti la richiesta termina con errore. Un esempio di codice Python per iniziare:


import os
from openai import OpenAI

Base URL e chiave in base al sito ufficiale

client = OpenAI(
apikey=os.environ.get("MOONSHOTAPI_KEY"),
base_url="https://api.moonshot.ai/v1",
)

messages = [
{"role": "system", "content": "You are a coding agent."},
{"role": "user", "content": "Refactor utils.py to remove duplicate code."},
]

resp = client.chat.completions.create(
model="kimi-k2.7-code",
messages=messages,
max_tokens=32768,
)

msg = resp.choices[0].message
print(msg.content)

Due regole principali per l'utilizzo delle chiamate API: mantener il conten