tecnologia

OpenAI e Broadcom: nuovo chip AI “piccante” per sfidare Nvidia

OpenAI entra nella corsa ai semiconduttori con Jalapeño, il primo chip proprietario per l’inferenza dei modelli linguistici sviluppato con Broadcom e Celestica. L’obiettivo è ridurre costi, consumi e dipendenza dalle Gpu di Nvidia, mentre i grandi gruppi tech spingono su hardware sempre più specializzato

Pubblicato il 25 giu 2026

Aggiungi tra i preferiti su Google

Alessandra Castelli

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

Jalapeño è il primo Intelligence Processor di OpenAI, co-progettato con Broadcom per l’inferenza dei LLM; chip “blank-slate” con claim di migliore performance per watt.
Strategia industriale: controllo dello stack (modelli, rete, chip), tape-out in nove mesi e progressiva diversificazione dall’uso prevalente di Nvidia.
Impatto di mercato: possibile riduzione dei costi marginali dell’inferenza e data center a scala gigawatt, ma servono benchmark completi e dati sull’energia.

Riassunto generato con AI

Si chiama “Jalapeño” il primo “Intelligence Processor”, annunciato da OpenAI il 24 giugno 2026 , un acceleratore progettato insieme a Broadcom per l’inferenza dei large language model, cioè la fase in cui modelli come ChatGPT o Codex generano risposte alle richieste degli utenti. Per l’azienda guidata da Sam Altman è un passaggio industriale rilevante: non più soltanto modelli e prodotti, ma anche un pezzo dell’infrastruttura hardware su cui quei prodotti girano.

La mossa ha un significato economico preciso. L’inferenza è la parte dell’AI che tocca direttamente utenti, imprese e sviluppatori, e assorbe una quota crescente di capacità di calcolo. Ogni miglioramento in velocità, affidabilità e consumo energetico può tradursi in risposte più rapide, costi operativi più bassi e margini migliori sui servizi AI offerti via abbonamento o api.

OpenAI sostiene che i primi test mostrano per Jalapeño (una varietà di peperoncino piccante originaria del Messico), una performance per watt “sostanzialmente migliore” rispetto allo stato dell’arte attuale, anche se i benchmark completi non sono ancora stati pubblicati.

Indice degli argomenti:

Un chip costruito attorno ai bisogni reali dei modelli

Jalapeño viene descritto come un progetto “blank-slate”, nato da zero per l’inferenza dei llm e non come l’adattamento di un acceleratore generalista pensato per altri carichi di lavoro. La società dice di averlo modellato sui pattern che osserva ogni giorno nei propri sistemi: kernel, movimenti di memoria, networking, serving e latenza richiesta da ChatGPT, Codex, api e futuri prodotti agentici. È un punto centrale, perché segnala la volontà di cucire il silicio sulle esigenze del software, invece di adattare il software ai limiti dell’hardware disponibile.

OpenAI aggiunge che i sample ingegneristici del chip stanno già eseguendo carichi machine learning in laboratorio alla frequenza e al consumo previsti in produzione, compresi workload legati a GPT-5.3-Codex-Spark.

Broadcom, dal canto suo, porta nell’alleanza l’implementazione del silicio e le tecnologie di rete, inclusa la famiglia Tomahawk, mentre Celestica contribuisce all’integrazione di schede, rack e sistemi. In altre parole, Jalapeño non è solo un chip: è il primo tassello di una piattaforma completa pensata per essere industrializzata in tempi rapidi.

Perché l’inferenza è il vero terreno dei ricavi

Per anni il dibattito sull’AI si è concentrato soprattutto sull’addestramento dei modelli, cioè sui supercomputer necessari per portarli a frontiera. Ma sul piano economico l’inferenza conta sempre di più, perché è lì che si accumulano le richieste degli utenti e i costi ricorrenti dell’erogazione del servizio. OpenAI lo scrive in modo esplicito: “inference is where AI reaches people”. Tradotto in termini di business, è la parte della catena in cui un miglioramento dell’efficienza può riflettersi su prezzi, uptime, tempi di risposta e capacità di servire più traffico a parità di energia.

Greg Brockman ha collegato Jalapeño a una strategia di lungo periodo fondata sul controllo dell’intero stack. L’idea è semplice: se la stessa azienda governa modelli, prodotti, scheduler, sistemi di memoria, rete e chip, può ottimizzare ogni livello verso lo stesso obiettivo industriale. Nel caso di OpenAI, quell’obiettivo è abbassare il costo del calcolo e rendere l’intelligenza artificiale “più veloce, più affidabile e più accessibile”.

È una visione già adottata da altri grandi gruppi cloud, ma qui assume un peso maggiore perché OpenAI è un produttore di modelli che sta provando a diventare anche operatore infrastrutturale.

Nove mesi per arrivare al tape-out

Uno dei dati più discussi dell’annuncio riguarda i tempi di sviluppo. OpenAI afferma che Jalapeño è passato dal design iniziale al tape-out manifatturiero in nove mesi, un ritmo che la società definisce il più rapido mai raggiunto per un programma asic ad alte prestazioni nei semiconduttori avanzati. L’azienda attribuisce questa velocità alla co-progettazione stretta con Broadcom e all’uso dei propri modelli per accelerare parti del processo di design e ottimizzazione.

Qui il messaggio va oltre il singolo prodotto. OpenAI prova a mostrare che l’AI non serve solo a generare testo o codice, ma può ridurre i tempi di sviluppo dell’infrastruttura che alimenterà le prossime generazioni di modelli. Se questa promessa reggerà alla prova industriale, l’effetto potenziale è ampio: progettazione più rapida, cicli di iterazione più brevi, costi di sviluppo distribuiti su più generazioni di chip e maggiore capacità di adattare l’hardware ai carichi reali. Per un settore che brucia capitali in data center, energia e packaging avanzato, non è un dettaglio.

Il precedente: l’accordo da 10 gigawatt con Broadcom

L’annuncio di questi giorni non nasce dal nulla. Il 13 ottobre 2025 OpenAI e Broadcom avevano già reso pubblica una collaborazione pluriennale per sviluppare e distribuire 10 gigawatt di acceleratori AI personalizzati progettati da OpenAI, con rollout previsto a partire dalla seconda metà del 2026 e completamento entro fine 2029. In quell’occasione le due società avevano già chiarito che OpenAI avrebbe disegnato acceleratori e sistemi, mentre Broadcom avrebbe curato sviluppo, networking e deployment su larga scala.

Jalapeño è quindi la concretizzazione del piano annunciato otto mesi fa. Hock Tan, amministratore delegato di Broadcom, ha definito il chip l’inizio di una roadmap multi-generazionale e ha parlato di data center “a scala gigawatt” con Microsoft e altri partner a partire dal 2026. Questo dettaglio conta perché sposta il tema dall’innovazione di laboratorio alla capacità di mettere in produzione cluster enormi, dove il vantaggio competitivo non dipende solo dal singolo processore ma dalla qualità del sistema nel suo complesso: rete, alimentazione, raffreddamento, orchestrazione e continuità della supply chain.

Meno dipendenza da Nvidia, ma non un divorzio immediato

La lettura più immediata del lancio è che OpenAI voglia ridurre la dipendenza da Nvidia, ancora dominante nei data center per l’AI. È una chiave plausibile e diversi osservatori l’hanno sottolineata, ma va misurata sui fatti disponibili. OpenAI non ha detto che abbandonerà le Gpu Nvidia; anzi, nelle sue comunicazioni più recenti continua a descrivere un’infrastruttura eterogenea.

A maggio 2026 ha spiegato che il protocollo di rete MRC è già usato nei suoi maggiori supercomputer Nvidia GB200, inclusi i siti con Oracle Cloud Infrastructure ad Abilene, in Texas, e nei supercomputer Fairwater di Microsoft.

Lo stesso vale per il sito Stargate di Abilene, che secondo OpenAI gira su Oracle Cloud Infrastructure con sistemi Nvidia GB200 e ha ospitato l’addestramento di GPT-5.5. Il quadro, quindi, non è quello di una sostituzione netta ma di una progressiva diversificazione. OpenAI cerca di spostare una parte dell’inferenza su hardware disegnato in casa, mantenendo al tempo stesso una dipendenza significativa dalle piattaforme generaliste e dalle infrastrutture dei partner cloud. In termini economici, significa avere più leva negoziale sui fornitori e più margine per ottimizzare i costi dove il traffico è più prevedibile.

La corsa ai chip custom coinvolge tutto il settore

Jalapeño arriva dentro una competizione sempre più affollata.

Microsoft ha presentato a gennaio 2026 Maia 200, acceleratore per l’inferenza costruito su processo TSMC a 3 nanometri, con 216 GB di HBM3e e 30% di performance per dollaro in più rispetto all’ultima generazione di hardware già presente nella sua flotta, secondo i dati diffusi dalla stessa azienda. Microsoft ha anche scritto che Maia 200 serve, tra gli altri, i modelli GPT-5.2 di OpenAI all’interno della propria infrastruttura cloud.

Questo incrocio dice molto sul mercato: partner e clienti possono essere anche concorrenti sull’hardware. Microsoft resta un alleato chiave di OpenAI, ma sviluppa chip propri per l’inferenza. Amazon, secondo notizie pubblicate il 18 giugno 2026 da TechCrunch sulla base di dichiarazioni del responsabile AI di AWS Peter DeSantis a Bloomberg, sta valutando la vendita dei chip Trainium anche a soggetti esterni, uscendo così dal solo modello “chip come servizio” via cloud.

La filiera dei semiconduttori per l’AI si sta quindi spostando da un equilibrio dominato dalle gpu standard a un mosaico di acceleratori specializzati, progettati per workload sempre più specifici.

Il nodo energia: il vero vincolo dei data center AI

Dietro la gara sui chip c’è un problema molto concreto: l’energia. OpenAI e Broadcom parlano di infrastrutture a scala gigawatt, una misura che rende l’idea della dimensione dei data center necessari per sostenere modelli sempre più usati. OpenAI ha collegato questa espansione ai progetti Stargate e, nel documento pubblicato a maggio sulla “compute infrastructure for the Intelligence Age”, ha insistito su lavoro, pianificazione energetica, raffreddamento e impatto locale delle nuove installazioni.

Nel caso di Jalapeño, la promessa di una performance per watt migliore del mercato va letta proprio alla luce di questo vincolo. Quando i cluster crescono, il costo dell’energia, quello del raffreddamento e la disponibilità di capacità elettrica diventano fattori decisivi quanto il prezzo del chip. Per questo Broadcom insiste sulla combinazione tra acceleratori custom e rete Ethernet standardizzata: l’obiettivo non è solo fare più token al secondo, ma farli con un costo totale di possesso più basso e con una complessità operativa più gestibile.

Che cosa cambia per il mercato dell’AI

Per OpenAI, Jalapeño può produrre almeno tre effetti. Il primo è industriale: maggiore controllo su una parte cruciale della catena del valore.

Il secondo è finanziario: se i risultati promessi verranno confermati, l’azienda potrebbe ridurre il costo marginale dell’inferenza su larga scala.

Il terzo è strategico: costruire chip propri rafforza l’idea di una piattaforma “full stack”, dal modello al rack, e rende più difficile per concorrenti e partner replicarne l’architettura con la stessa integrazione verticale.

Per il mercato, il segnale è altrettanto chiaro. La partita non si gioca più soltanto sui modelli migliori, ma sulla capacità di servire quei modelli in modo sostenibile quando gli utenti si contano a centinaia di milioni. OpenAI ha dichiarato a maggio di avere oltre 900 milioni di persone che usano ChatGPT ogni settimana; nella nota dell’ottobre 2025 sull’accordo con Broadcom parlava di oltre 800 milioni di utenti attivi settimanali. Con numeri di questa scala, la differenza tra un buon modello e un buon business dipende sempre più dall’hardware che lo sostiene.

Il punto aperto: servono numeri, non solo promesse

L’annuncio, per ora, lascia fuori un elemento decisivo: i benchmark finali. OpenAI parla di prestazioni vicine ai limiti teorici dell’hardware e di un netto vantaggio in performance per watt, ma rinvia a un report tecnico nei prossimi mesi. Finché quei dati non saranno pubblici, l’operazione resta soprattutto una dichiarazione di strategia industriale, credibile perché si appoggia a partner come Broadcom, Celestica, Microsoft e Oracle, ma ancora da misurare sul terreno dei numeri.

Il passaggio però è già rilevante. OpenAI non si presenta più soltanto come la società che costruisce modelli e prodotti di AI generativa. Con Jalapeño prova a diventare uno dei soggetti che definiscono anche il costo fisico dell’intelligenza artificiale: quanta energia consuma, quanta rete richiede, quanto costa ogni risposta, quanto rapidamente può essere scalata. In un’economia dell’AI sempre più dipendente dal calcolo, è lì che si misureranno profitti, prezzi e potere di mercato nei prossimi anni.

@RIPRODUZIONE RISERVATA

Alessandra Castelli

Partecipa alla community

0 Commenti

Più recenti

Più votati

Inline Feedback

Vedi tutti i commenti

Aziende

Argomenti

Canali

OpenAI e Broadcom: nuovo chip AI “piccante” per sfidare Nvidia

Un chip costruito attorno ai bisogni reali dei modelli

Perché l’inferenza è il vero terreno dei ricavi

Nove mesi per arrivare al tape-out

Il precedente: l’accordo da 10 gigawatt con Broadcom

Meno dipendenza da Nvidia, ma non un divorzio immediato

La corsa ai chip custom coinvolge tutto il settore

Il nodo energia: il vero vincolo dei data center AI

Che cosa cambia per il mercato dell’AI

Il punto aperto: servono numeri, non solo promesse

Alessandra Castelli

Partecipa alla community

Articoli correlati

Codice Rss

Codice Rss