OpenAI ha sviluppato Jalapeño, il suo primo chip AI custom con Broadcom: un processore per l’inferenza dei modelli, pensato per ridurre la dipendenza da Nvidia
OpenAI ha presentato Jalapeño, il suo primo chip AI, progettato insieme a Broadcom. Il processore AI è un acceleratore custom dedicato all’inferenza dei grandi modelli linguistici, la fase in cui un modello già addestrato risponde alle richieste degli utenti; l’obiettivo dichiarato è ridurre la dipendenza dalle GPU Nvidia, oggi il collo di bottiglia più costoso dell’intera industria. La consegna dei primi esemplari a Sam Altman e Greg Brockman, da parte del CEO di Broadcom Hock Tan, chiude mesi di indiscrezioni e apre una fase nuova: OpenAI smette di essere soltanto cliente della catena del calcolo e inizia a progettarne i componenti.
Che cos’è Jalapeño, il chip AI di OpenAI
Jalapeño è un ASIC, un circuito integrato disegnato per un compito specifico: in questo caso l’inferenza dei modelli linguistici, non l’addestramento. È la fase che genera la maggior parte dei costi quando centinaia di milioni di persone usano ChatGPT o Codex ogni giorno. Secondo il comunicato ufficiale di OpenAI, l’azienda ha progettato l’architettura attorno alla propria conoscenza interna dei modelli, dei kernel e dei sistemi di serving; Broadcom fornisce l’implementazione del silicio e il networking, con tecnologia Tomahawk ed Ethernet. La produzione fisica è affidata a TSMC, l’assemblaggio dei sistemi a Celestica.
Il dettaglio che ha fatto notizia riguarda i tempi di sviluppo. OpenAI dichiara di essere passata dal progetto al tape-out, l’ultimo passaggio prima della produzione, in circa nove mesi, e di aver usato i propri modelli per accelerare parti del lavoro. I primi esemplari ingegneristici girano già in laboratorio a frequenza e potenza di produzione, dove fanno funzionare anche un modello non ancora pubblico, GPT-5.3-Codex-Spark. L’azienda parla di prestazioni per watt “sostanzialmente migliori” dello stato dell’arte: è una dichiarazione del produttore, non una misura indipendente, e il report tecnico arriverà nei mesi successivi.
Perché OpenAI vuole il processore AI Jalapeño
Per anni ogni grande laboratorio ha addestrato e servito i suoi modelli sulle GPU di un solo fornitore dominante, con tutto ciò che comporta su prezzo, tempi di consegna e potere contrattuale. Brockman lo ha detto a CNBC: OpenAI non riesce a procurarsi calcolo abbastanza in fretta; Hock Tan ha definito “insaziabile” la domanda dei suoi clienti. Quando la materia prima scarseggia e costa, chi la controlla detta le condizioni.
Un processore AI su misura per l’inferenza serve a riprendersi parte di quel potere: meno esposizione ai colli di bottiglia, costo unitario più prevedibile, hardware cucito sulle esigenze dei propri modelli. Sul risparmio Hock Tan ha indicato un valore: circa il 50% di miglioramento di costo rispetto alle tipiche GPU per AI, su parametri come il costo per kilowatt o per token. Resta una stima del venditore, da verificare sui numeri pubblici. La pressione, intanto, è concreta: OpenAI si prepara a una quotazione che potrebbe valutarla attorno al trilione di dollari, e ogni punto di margine sull’inferenza pesa.
La spinta a ridurre la dipendenza da Nvidia attraversa tutto il settore, dai grandi gruppi americani fino al piano cinese da 295 miliardi di dollari che chiude la porta ai chip stranieri. Jalapeño è la versione di OpenAI di un movimento che ormai è globale.
Jalapeño non sostituisce Nvidia: chip custom e diversificazione
Annunciare un chip proprio non significa lasciare Nvidia. Mentre lavora a Jalapeño, OpenAI continua a firmare accordi infrastrutturali da decine di miliardi con Nvidia, e ha intese parallele con AMD, con i chip Trainium di AWS, con Cerebras. La fotografia è quella di un portafoglio che si allarga, non di una rottura.
Conta anche il calendario. Le installazioni iniziali sono previstoeentro la fine del 2026, ma Tan ha parlato di prototipi a fine anno, di una rampa vera nel 2027 e del pieno regime nella prima metà del 2028. Il piano più ampio, annunciato a ottobre, riguarda dieci gigawatt di acceleratori disegnati da OpenAI su più generazioni. Sono cifre da infrastruttura pesante, una traiettoria pluriennale. Nvidia, dal canto suo, resta il riferimento per scala ed ecosistema, come ha mostrato alla GTC 2026 con mille miliardi di dollari di ordini attesi entro il 2027.
Chip AI custom: cosa cambia per chi gestisce l’infrastruttura IT
OpenAI arriva tardi a un tavolo già apparecchiato. Google distribuisce le sue TPU dal 2015; Amazon spinge i propri acceleratori su larga scala; Meta e Microsoft hanno i loro programmi di silicio. Il filo comune è sempre lo stesso: costo, controllo, indipendenza dalla catena di fornitura. In mezzo siede Broadcom, diventata il partner di riferimento per chi vuole un acceleratore proprio senza costruirsi una fonderia.
Per chi dirige sistemi informativi, sicurezza e integrazione il segnale è chiaro: la competitività nell’AI non dipende solo dal modello migliore, ma dal controllo della pila tecnologica, dall’architettura del chip fino al servizio finale, passando per memoria, networking e data center. Chi governa più livelli può ottimizzarli verso lo stesso obiettivo e abbassare il costo dell’intelligenza; chi ne governa pochi resta legato ai prezzi altrui.
Resta una domanda aperta, e nessun comunicato vorrà chiuderla: se Jalapeño manterrà alla scala dei data center quello che promette in laboratorio, quante altre aziende smetteranno di considerare il chip un acquisto e inizieranno a considerarlo una competenza da costruire in casa.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Francesco Marino
Source link



