Nvidia svela la prossima generazione di chip AI, chiamati “Rubin”, nel tentativo di consolidare la leadership di mercato, in una mossa a sorpresa a meno di tre mesi dal suo ultimo lancio. Alla conferenza Computex a Taipei, l’amministratore delegato, Jensen Huang, ha presentato Rubin, il successore dei chip Blackwell per i data center, attualmente in produzione dopo essere stati annunciati a marzo. La mossa inaspettata di rivelare la prossima ondata di prodotti prima che Blackwell abbia anche iniziato le spedizioni ai clienti mostra come il produttore di chip più quotato al mondo stia cercando di consolidare il suo predominio nei processori AI, che lo ha catapultato tra le aziende più quotate al mondo.

NVIDIA CEO Jensen Huang Keynote at COMPUTEX 2024

Guarda questo video su YouTube Jensen Huang, Ceo di Nvidia, nel suo intervento al Computex 2024

I nuovi processori Rubin dovrebbero arrivare nel 2026

“Sta iniziando una nuova era dell’informatica”, ha detto Huang, mentre Nvidia svelava anche nuovi accordi sui chip AI con i produttori di PC. Rubin dovrebbe iniziare a essere spedito nel 2026 e promette un miglioramento dell’efficienza energetica, mentre l’azienda della Silicon Valley cerca di affrontare le preoccupazioni che l’espansione dei data center AI da parte delle Big Tech sta mettendo sotto pressione la rete energetica in alcune regioni.

Ne arriveranno altri, ha detto Huang, che rivelerà una tabella di marcia per i nuovi semiconduttori che arriveranno a un ritmo di un anno. La piattaforma Rubin succederà alla piattaforma Blackwell, con nuove GPU, una nuova CPU basata su Arm – Vera – e una rete avanzata con NVLink 6, CX9 SuperNIC e lo switch convergente InfiniBand/Ethernet X1600.

“La nostra filosofia di base è molto semplice: costruire l’intera scala del data center, disaggregare e vendere le parti al ritmo di un anno e spingere tutto ai limiti della tecnologia”, ha spiegato Huang.

Il ritmo di innovazione di Nvidia ha assunto un’importanza sproporzionata per il mercato azionario globale, poiché i trader scommettono se l’enorme rally guidato dall’AI in un pugno di Big Tech possa continuare. Il produttore di chip ha aggiunto circa 350 miliardi di dollari alla sua capitalizzazione di mercato, dopo aver riportato una crescita dei ricavi in forte aumento, e l’azienda si sta avvicinando ad Apple per diventare la seconda azienda statunitense più quotata dopo Microsoft.

Sebbene oggi Nvidia venda la maggior parte dei chip AI necessari per addestrare grandi modelli linguistici, come GPT di OpenAI, l’azienda affronta una crescente concorrenza da parte di AMD e Intel, così come chip personalizzati sviluppati da fornitori di cloud computing tra cui Amazon, Google e Microsoft.

Il chip Blackwell di Nvidia è stato lanciato appena un anno dopo che i suoi attuali chip Hopper sono stati svelati.

Rubin, le caratteristiche principali

La piattaforma Rubin presenta nuove CPU Versa e GPU di nuova generazione che raggruppano la memoria ad alta larghezza di banda di SK Hynix, Micron e Samsung per alimentare le applicazioni AI.

Nvidia si sta concentrando sul miglioramento dell’efficienza energetica e sul miglioramento delle capacità di intelligenza artificiale dei suoi chip per data center, il che è fondamentale date le crescenti richieste di potenza dell’hardware di intelligenza artificiale.

Le GPU Rubin R100, che dovrebbero essere prodotte in serie alla fine del 2025, utilizzeranno un design del reticolo 4x e la tecnologia di packaging CoWoS-L di TSMC sul nodo di processo N3, con sistemi come le soluzioni DGX e HGX disponibili nella prima metà del 2026.

Rubin, le tecnologie avanzate

The Rubin R100 GPUs will leverage next-generation HBM4 DRAM, which is expected to be developed by Samsung and SK Hynix by 2025, offering up to 16-Hi stacks for enhanced performance.

NVIDIA prevede di utilizzare le tecnologie di packaging avanzate di TSMC, come CoWoS-L e SoIC, che consentiranno dimensioni del reticolo più grandi (fino a 5,5 volte entro il 2026) e un aumento dei siti HBM (fino a 12) rispetto alle configurazioni attuali.

The GR200 Superchip module, housing two R100 GPUs and an upgraded Grace CPU based on TSMC’s 3nm process, will further enhance the capabilities of the Rubin platform.

Nvidia annuncia accordi con Asus e MSI

Il 2 giugno 2024 l’azienda ha anche annunciato una nuova unità centrale di elaborazione Vera basata su Arm, mentre sta cercando di produrre più chip che per data center AI. Le CPU, un mercato dominato da Intel e AMD, sono tradizionalmente il cavallo da tiro di qualsiasi computer ma Huang sta cercando di ridisegnare il mercato dei server intorno ai suoi chip AI, poiché l’intelligenza artificiale sta assumendo una quota crescente dei carichi di lavoro dei data center.

Nvidia ha iniziato più di 30 anni fa a produrre unità di elaborazione grafica, che agivano come spalla alle CPU Intel nei PC per videogiochi. Ma più di 15 anni fa, Huang si è reso conto che la tecnologia all’interno delle sue GPU era adatta anche ad altri compiti di calcolo intensivo dei dati, come l’AI. L’azienda sta ora cercando di potenziare il suo business dei chip per PC sfruttando la sua dominanza nei chip AI per i data center. Huang ha anche annunciato accordi con due produttori di PC, Asus e MSI, che lanceranno macchine utilizzando le unità di elaborazione grafica GeForce RTX di Nvidia per supportare una serie di compiti AI, dall’esecuzione di assistenti digitali all’editing video e alla codifica.

“Il tuo futuro laptop ti aiuterà costantemente in background”, ha detto Huang. “Il PC eseguirà app potenziate da AI, dalla scrittura, all’editing fotografico, fino a umani digitali che sono AI”, ha detto Huang. Nvidia non ha specificato quando i laptop Asus e MSI saranno in vendita. Si prevede che una serie di produttori di PC e fornitori di componenti utilizzeranno l’evento Computex per fare annunci per posizionarsi come beneficiari dell’attesa ondata “AI PC”.

Il futuro dei PC potenziati da AI

Microsoft ha recentemente svelato una serie di PC e tablet potenziati da AI equipaggiati con il suo strumento assistente Copilot, alimentata dai chip Qualcomm, che inizieranno a essere lanciati alla fine di giugno. Microsoft ha detto che prevede di includere i chip Nvidia e i chip grafici Radeon di AMD nei suoi PC in futuro. Le vendite di PC sono calate da quando è iniziata la pandemia, ma gli analisti prevedono che quando la domanda riprenderà le aziende opteranno sempre più per PC AI integrati con potenti chip per eseguire applicazioni AI, piuttosto che fare affidamento esclusivamente sul cloud.

“I PC AI porteranno l’innovazione più entusiasmante nel settore dei PC negli ultimi due o tre decenni, dalla creazione del World Wide Web alla fine degli anni ’80”, hanno scritto gli analisti di Morgan Stanley. Aggiungendo che l’esecuzione di applicazioni AI sui dispositivi sarebbe più economica e flessibile che sul cloud e avrebbe anche benefici per la privacy dei dati. Morgan Stanley prevede che i PC AI costituiranno circa il 65% delle spedizioni di PC entro il 2028, rispetto al 2% di quest’anno.