Nei primi anni del boom dell’intelligenza artificiale generativa, la competizione si basava sulle dimensioni dei modelli, sulla potenza di calcolo e sulle nuove feature introdotte. Oggi, però, il mercato sta vivendo una trasformazione: la lotta si sposta sui costi. Le aziende stanno smettendo di guardare ai modelli AI come a strumenti esclusivamente di innovazione e li trattano sempre più come una risorsa industriale da ottimizzare, scegliendo tra modelli premium, open-weight o interni il più adatto alle loro esigenze.
Un nuovo paradigma: il costo per task
Il cambiamento principale sta nell’abbandono del calcolo per token. Se fino a poco tempo fa il prezzo era basato sulla quantità di testo prodotto o elaborato, adesso le aziende stanno iniziando a valutare il costo in base al task svolto. Il focus non è più su quante parole vengono generate o elaborate, ma su come quel compito specifico può essere completato in modo economico e con sufficiente qualità.
Esempio: per compiti di editing o traduzione testuale, aziende come Meta e Google stanno utilizzando modelli open-weight di taglia ridotta, mentre riservano i modelli più costosi solo per compiti avanzati di analisi sentimentale o generazione di contenuti complessi. Questo approccio ibrido permette di risparmiare fino a 90% rispetto all’uso esclusivo di una piattaforma premium.
Le strategie per contenere i costi
I metodi per abbattere i costi sono molteplici:
- Integrazione di modelli open-weight: aziende utilizzano modelli come Llama o Falcon per compiti di base.
- Esecuzione in locale o su server dedicati: per compiti sensibili o regolamentati, spesso si preferisce evitare l’utilizzo esterno.
- Retraining o fine-tuning personalizzato: per alcuni settori specializzati, si addestrano modelli specifici, che richiedono meno token e sono più economici.
- Utilizzo misto di modelli AI differenti: i compiti vengono suddivisi in base all’efficienza di ogni modello.
Queste strategie non solo riducono i costi, ma contribuiscono anche a rendere l’AI una risorsa più democratica per PMI e startup.
I grandi player si risvegliano
Nel frattempo, aziende come OpenAI e Anthropic stanno reagendo. In risposta alle nuove strategie di ottimizzazione, OpenAI ha annunciato l’offerta di planini più flessibili, tra cui la possibilità di acquistare token a prezzi all’ingrosso e il supporto per API personalizzate. Anthropic, da parte sua, sta lavorando su modelli più efficienti per i task critici, cercando di migliorare la performance unitaria per ridurre i costi.
Maggiore trasparenza e performance
Entrambi stanno promettendo di migliorare la trasparenza del costo al task e di fornire strumenti di tracciabilità per gli utenti, permettendo di capire in tempo reale dove e quando l’uso del modello è economicamente sensato. Questi aspetti, finora trascurati, diventano ora fondamentali in un mercato ipercompetitivo.
Il mercato globale si diversifica
Oltre ai grandi attori, il mercato sta iniziando a fiorire di startup specializzate nella generazione di modelli low-cost ma altamente specifici. Questi modelli, disegnati per settori verticali come il retail, l’agricoltura o la sanità, permettono di sfruttare l’AI senza dover pagare per capacità che non si utilizzano.
Ad esempio, una startup canadese ha creato un modello AI dedicato alle richieste frequenti del settore finanziario, con un costo di utilizzo che è un quinto rispetto alle soluzioni di mercato generico. Allo stesso tempo, aziende cinesi stanno diffondendo modelli open-weight su larga scala, grazie al supporto istituzionale, minando ulteriormente posizioni tradizionali.
Che futuro per l’AI aziendale?
In prospettiva, il mercato dell’AI sembra destinato a una divisione netta: una fetta per uso consumer, dove l’esperienza utente prevale, e una fetta industriale, dove la precisione per task e il costo unitario sono elementi critici. Questo cambio di paradigma non solo influenzerà le aziende, ma anche gli sviluppatori che dovranno concentrarsi sempre di più sull’efficienza tecnica, sull’addestramento mirato e su soluzioni scalabili.
Più che una lotta per la potenza, il settore sta entrando in una guerra di economie scalabili. Chi non si adatterà, perderà terreno.