Cohere ha lanciato il suo primo modello open source dedicato allo sviluppo: North Mini Code, seguito poco dopo da Codestral Embed di Mistral, una novità volta alla ricerca semantica nel codice. Queste novità segnano il passaggio di un mercato fino a oggi monopolizzato da OpenAI e Anthropic verso un contesto in cui i grandi modelli open source si posizionano come contendenti veri.

North Mini Code: un modello open source per sviluppatori

North Mini Code di Cohere è un modello ad architettura Mixture-of-Experts, che utilizza 30 miliardi di parametri totali, di cui attivi ne impiega 3 miliardi per ogni token elaborato. Questa struttura permette di far girare il modello con un unico GPU NVIDIA H100, una risorsa accessibile per la maggior parte delle aziende tech.

Il modello gestisce un contesto di 256.000 token, con capacity up al generatore per fornire risposte fino a 64.000 token, e supporta diverse attività legate allo sviluppo del codice. La sua open sorgente rilasciata sotto Apache 2.0 su Hugging Face permette un’ampia libertà d’uso, rendendolo un prodotto adatto per chi cerca una piena autonomia sul proprio stack.

Sul benchmark Artificial Analysis Coding Index, North Mini Code mostra una performance eccellente, con un punteggio di 33,4. Riesce a superare modelli più grandi come lo Small 4 di Mistral, ma anche strumenti riconosciuti come Gemma 4 (26 B), Devstral Small 2 o persino modelli molto più grandi come il TinyMistral. Cohere, che ha raggiunto un ARR di 240 milioni di dollari nel 2024, sembra concentrata sull’espandersi in un territorio che fino ad oggi era riservato ad aziende più consolidate.

Codestral Embed: ricerca semantica ottimizzata

Dal canto suo Mistral presenta Codestral Embed, un modello focalizzato sulla rappresentazione semantica del codice in tempo reale. Con un costo di 0.15 dollari per milione di token, Codestral Embed presenta diverse caratteristiche distintive.

Uno dei punti forti è la flessibilità: gli sviluppatori possono configurare le dimensioni degli embedding e l’accuratezza, bilanciando tra qualità della ricerca e costi di archiviazione. Anche in configurazioni più semplici, come ad esempio 256 dimensioni con precisione int8, dichiara di offrire prestazioni superiori a concorrenti del livello di OpenAI, Cohere, Voyage, e altri player del mercato.

Il modello si presta ad attività di retrieval-augmented generation e sembra eccellere nel riconoscere pattern di codice, identificare duplicazioni o analisi di grandi repository tecnici in tempo reale.

Punti di forza e criticità

Ottimizzato per contesti aziendali di coding multilinguaggio

Embedding configurabile per adattarsi alle esigenze più complesse

Performance verificate in test interni con dati reali

La sfida alle aziende closed source

Gli sviluppatori di grandi aziende hanno sempre più opzioni per scegliere strumenti open-source come North Mini Code e Codestral Embed, rispetto ai modelli chiusi e costosi come quelli di Claude o GPT-4. Questo tipo di modelli permette una maggiore flessibilità nella costruzione di pipeline di coding agentiche e nella realizzazione di strumenti di controllo interno.

North Mini Code, ad esempio, è specificamente progettato per operare in ambienti di programmazione con interazione terminale, gestione di shell e script avanzati. Questa peculiarità lo rende ideale per pipeline di code review su codebase estesi oppure per mappatura di architetture complesse di sistema.

I limiti di performance vs. i costi

Nonostante i vantaggi tecnologici, entrambi i modelli sono in fase iniziale di adozione aziendale.

Più di una critica riguarda North Mini Code: durante test indipendenti si è visto che genera circa il triplo dei token rispetto a modelli come il QwQ Code, un onere che si ripercuote sui costi di calcolo in contesti a grandi volumi.

Anche Codestral Embed deve dimostrare la sua efficacia in contesti aziendali diversificati, dove il codice si trova in formati disomogenei, spesso scarsamente documentati e multilinguistici.

Una transizione in corso

Il mercato sta assistendo a una sorta di “open sourcing” del campo del codice e del suo supporto AI. Aziende come Cohere e Mistral stanno aprendo le porte di un futuro in cui il vantaggio di modelli come Codestral e North Mini Code è determinato non solo da dimensioni o prestazioni, ma dalla capacità di fornire strumenti controllabili, trasparenti e scalabili.

Se questa tendenza si consolidasse, i prossimi mesi vedranno un aumento nella produzione di soluzioni open-source specifiche per il coding, con benchmark mirati. Si tratta di segnali inequivocabili che il mercato ha iniziato a premiare la trasparenza e il controllo rispetto alle soluzioni tradizionali.