Moonshot AI ha recentemente annunciato la pubblicazione di Kimi K2.7-Code, un modello avanzato di intelligenza artificiale incentrato sulla programmazione e sull’esecuzione di compiti complessi. Le pesanti informazioni del modello sono accessibili su Hugging Face sotto una licenza Modified MIT e i consumatori possono interagire con il modello tramite Kimi API e Kimi Code.
Ciò che differenzia K2.7-Code?
K2.7-Code è un modello Mixture-of-Experts, con un numero totale di 1 trilione di parametri e un'attivazione di 32 miliardi di parametri per token. La sua struttura include 384 esperti, 8 dei quali vengono selezionati per ogni token, uniti a uno condiviso. Il modello possiede anche 61 strati, tra cui un livello denso.
L’attenzione del modello utilizza MLA (Multi-Layer Attention), mentre per il percorso feed-forward si utilizza la funzione SwiGLU. L’encoder visione MoonViT, che ha aggiunto 400 milioni di parametri, è stato incluso per fornire input da immagini e video. K2.7-Code è dotato di una quantizzazione INT4 nativa, con finestra di contesto di 256K token.
Parametri chiave
- Totali: 1T parametri
- Token di attivazione: 32B
- Esperti totali: 384
- Estratto: 8 per token
- Strati: 61 (1 strato denso incluso)
- Encoder visione MoonViT: 400M parametri aggiunti
- Quantizzazione nativa: INT4
- Finestra di contesto: 256K token
Le limitazioni
Due limitazioni fondamentali vengono applicate al modello. La modalità "Thinking" è obbligatoria, e disattivarla provoca un errore nell’API. I parametri di campionamento sono fissi: temperatura 1.0, top_p 0.95, n 1, senza penalità. La massima uscita di token è fissata a 32.768.
Benchmark
I test condotti dal team Moonshot mostrano che K2.7-Code ha superato la versione precedente, K2.6, in tutti gli scenari di valutazione. Il miglioramento più significativo si presenta nel benchmark di codifica Kimi Code Bench v2, passando da 50.9 a 62.0.
Confronto Benchmark
| Benchmark | Kimi K2.6 | Kimi K2.7-Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Code Bench v2 | 50.9 | 62.0 | 69.0 | 67.4 |
| Program Bench | 48.3 | 53.6 | 69.1 | 63.8 |
| MLS Bench Lite | 26.7 | 35.1 | 35.5 | 42.8 |
| Kimi Claw 24/7 Bench | 42.9 | 46.9 | 52.8 | 50.4 |
| MCP Atlas | 69.4 | 76.0 | 79.4 | 81.3 |
| MCP Mark Verified | 72.8 | 81.1 | 92.9 | 76.4 |
Riduzione del consumo di token
Il team Moonshot ha riportato una riduzione del 30% rispetto al consumo di token di K2.6, descrivendoli come "meno overthinking". Questo fattore influisce su costo, velocità e limiti di contesto. K2.7-Code genera meno token di output per compito, riduce i tempi di calcolo e mantiene più spazio per compiti complessi.
Usi principali
Uno dei principali utilizzi di K2.7-Code è nella refactorizzazione del codice su larga scala. Indirizzando l'agente verso un set di test che fallisce, il modello legge i file, modifica diversi moduli e riesegue i test fino a superarli.
La revisione del codice rappresenta un altro scena d'applicazione. Si invia una modifica (diff) e si richiede un'analisi del rischio; la finestra di 256K token consente di trattare diff larghi, log e file collegati in un'unica sessione.
I flussi di lavoro MCP sono un terzo scenario. Con un punteggio MCP Mark Verified di 81.1, K2.7-Code mostra la capacità di utilizzare correttamente gli strumenti nel Protocollo di Contesto del Modello.
L’analisi su lungo termine rappresenta un quarto campo d’applicazione. Accetta testi, immagini e video in input. Documentazione, screenshot e tracce video possono condividere uno stesso prompt per un contesto completo.
Pannello Interattivo di Marktechpost
Il team di Moonshot ha fornito accesso ad un tool di esplorazione in tempo reale per valutare le performance e il prezzo. Il modello è attivo dal 12 giugno 2026 e verificato nello stesso periodo.
Avvio rapido
Kimi API è compatibile con OpenAI compatibile e il modello da utilizzare è "kimi-k2.7-code". È importante non alterare i parametri fissi di campionamento, altrimenti la richiesta termina con errore. Un esempio di codice Python per iniziare:
import os
from openai import OpenAI
Base URL e chiave in base al sito ufficiale
client = OpenAI(
apikey=os.environ.get("MOONSHOTAPI_KEY"),
base_url="https://api.moonshot.ai/v1",
)
messages = [
{"role": "system", "content": "You are a coding agent."},
{"role": "user", "content": "Refactor utils.py to remove duplicate code."},
]
resp = client.chat.completions.create(
model="kimi-k2.7-code",
messages=messages,
max_tokens=32768,
)
msg = resp.choices[0].message
print(msg.content)
Due regole principali per l'utilizzo delle chiamate API: mantener il conten