OpenAI e Broadcom hanno svelato Jalapeño, il primo acceleratore intelligente progettato da OpenAI per il futuro dell'inferenza AI sui grandi modelli linguistici. Non si tratta di un chip generico, ma di un processore ottimizzato per eseguire modelli AI in modo rapido ed efficiente quando rispondono alle domande dell'utente su ChatGPT. Questo progetto, che un tempo non sembrava nemmeno possibile, è nato in sole nove mesi, il che rappresenta un ciclo molto rapido per un chip ad alte prestazioni di tale complessità.

Un chip progettato per l’inferenza

Jalapeño è un ASIC, un circuito integrato sviluppato per uno scopo specifico, e non si tratta di un semplice adattamento da architetture precedenti. Esso serve esclusivamente per l’inferenza, ovvero la fase in cui i modelli AI rispondono alle domande, e non per l’addestramento, che richiede invece alte risorse. Il chip è stato progettato per essere più ottimizzabile e meno costoso rispetto alle GPU di Nvidia.

I primi campioni di Jalapeño stanno già funzionando nei laboratori di OpenAI con il modello GPT-5.3-Codex-Spark, dimostrando prestazioni per watt significativamente superiori ai competitor esistenti. Un rapporto tecnico indipendente confermerà ufficialmente le sue prestazioni nei prossimi mesi.

Collaborazione con Broadcom

La produzione di Jalapeño è avvenuta grazie alla stretta collaborazione con Broadcom, un’azienda con esperienza nella gestione di circuiti ad alte prestazioni. I due giganti tecnologici hanno accelerato la progettazione del chip grazie anche ai modelli AI di OpenAI stessi, che hanno aiutato in alcune fasi del processo. Richard Ho, responsabile del programma hardware di OpenAI, ha sottolineato che Jalapeño è stato progettato per massimizzare prestazioni su chiavi fondamentali come il movimento dei dati in memoria, il networking e i pattern di inferenza.

Secondo Hock Tan, CEO di Broadcom, le caratteristiche del chip lo rendono confrontabile con le tecnologie di punta sul mercato, come il Blackwell di Nvidia e le TPU di Google.

Strategia economica e sostenibilità

Dal lancio di ChatGPT nel 2022, OpenAI ha acquisito grandi quantità di GPU Nvidia, ma ora l’azienda cerca di ridurre la sua dipendenza da terzi. Con un IPO che potrebbe valutare OpenAI in oltre 1000 miliardi di dollari, la pressione per ridurre le perdite si fa sentire più che mai. Jalapeño è parte di una strategia volta a ottimizzare la fase di inferenza e a ridurre i costi operativi, inizialmente legati ai costosi cicli d’addestramento.

Un settore in crescita

OpenAI non è l’unica ad aver intrapreso questa strada. Google ha sviluppato le TPU, Amazon utilizza i Trainium e Meta ha investito molto in unità ottimizzate. Il settore sembra chiaro: il controllo dei chip significa controllo del futuro dell’AI.

Greg Brockman, presidente di OpenAI, ha commentato l’importanza di Jalapeño: “Progettando più elementi dello stack da soli, possiamo erogare più intelligenza con maggiore efficienza e continuare a spingere l’AI avanzata verso un accesso più ampio.”

Pianificazione futura

Il lancio su scala di Jalapeño è previsto entro la fine del 2026, con un piano di espansione che porterà fino al 2029. L’implementazione su larga scala avverrà grazie alla collaborazione con Microsoft. Questo sviluppo segna l’inizio di una rivoluzione nel modo con cui l'AI sarà gestita e distribuita globalmente.