Huawei sta cercando di conquistare una quota maggiore del mercato cinese dei chip per l’intelligenza artificiale, dominato da Nvidia, incoraggiando le aziende locali ad adottare i suoi processori rivali per le attività di “inferenza”. Le principali aziende di intelligenza artificiale in Cina si affidano alle unità di elaborazione grafica (GPU) prodotte da Nvidia per “addestrare” modelli linguistici di grandi dimensioni, e i prodotti del chipmaker statunitense da 3,4 miliardi di dollari sono considerati fondamentali per lo sviluppo della tecnologia. Invece di sfidare Nvidia nell’addestramento, Huawei sta posizionando i suoi ultimi processori Ascend AI come hardware di scelta per i gruppi cinesi che eseguono l’inferenza, il calcolo intrapreso dai LLM per generare una risposta a un prompt.
La domanda di chip per l’inferenza è destinata ad aumentare
Il gigante tecnologico cinese scommette che l’inferenza sarà una fonte di domanda maggiore in futuro, se il ritmo dell’addestramento dei modelli rallenterà e le applicazioni di AI come i chatbot diventeranno più diffuse. “L’addestramento è importante, ma avviene solo poche volte”, dichiara Georgios Zacharopoulos, ricercatore senior di AI che lavora sull’accelerazione dell’inferenza presso il laboratorio di Zurigo di Huawei. “Huawei si concentra soprattutto sull’inferenza, che in ultima analisi servirà più clienti”.
Huawei si sta concentrando sul percorso tecnicamente meno impegnativo, ma potenzialmente redditizio, di riadattare i modelli di AI addestrati sui prodotti Nvidia per farli funzionare sui chip Ascend. Poiché le GPU Nvidia e Ascend funzionano con software diversi, Huawei sta aiutando le aziende a utilizzare un altro strumento software per rendere compatibili i due sistemi.
La spinta di Huawei è accompagnata da un sostegno governativo dall’alto verso il basso. I funzionari cinesi hanno esortato i giganti tecnologici locali ad acquistare più chip AI di Huawei e ad abbandonare Nvidia. Secondo indiscrezioni, Huawei è vista internamente come il concorrente più serio nel Paese, aggiungendo che la sua capacità di progettazione di chip è “avanzata”.
Gli Usa stanno cercando di frenare lo sviluppo dell’AI da parte della Cina
Washington ha cercato di frenare lo sviluppo dell’AI da parte di Pechino con controlli sulle esportazioni volti a ostacolare lo sviluppo di tecnologie sensibili in Cina. A differenza dei loro rivali statunitensi, come OpenAI e Google, le aziende non sono in grado di accedere alle GPU più all’avanguardia in Cina. Ma anche se i gruppi cinesi sono in grado di acquistare solo i chip H20 di Nvidia, meno potenti e adattati per soddisfare i controlli sulle esportazioni, le GPU rimangono molto richieste perché considerate migliori delle alternative locali. A differenza dei rivali statunitensi come OpenAI e Google,
Gli analisti e i ricercatori di Huawei affermano che Ascend non è ancora pronto a sostituire Nvidia per l’addestramento dei modelli a causa di problemi tecnici, come ad esempio la rottura dei modi in cui i chip interagiscono tra loro all’interno di un “cluster” più ampio di chip AI durante l’addestramento di modelli sempre più grandi. “Mentre i chip Ascend offrono buone prestazioni a livello di singolo chip, la connettività tra i chip presenta un collo di bottiglia”, ha dichiarato Lin Qingyuan, analista di Bernstein per i semiconduttori in Cina. “Quando si addestra un modello di grandi dimensioni, è necessario suddividerlo in compiti più piccoli. Se un chip si guasta, il software deve trovare un modo per far subentrare gli altri chip senza ritardi”.

Convincere gli sviluppatori a lasciare il software Cuda di Nvidia
L’altra sfida per Huawei è convincere gli sviluppatori ad abbandonare il software Cuda di Nvidia, noto come la “salsa segreta” dell’azienda per essere facile da usare per gli sviluppatori e capace di accelerare enormemente l’elaborazione dei dati. Ma anche l’Ascend 910C, la versione aggiornata del chip AI di Huawei di prossima uscita, dovrebbe risolvere questi problemi.
Huawei e Nvidia devono affrontare una forte concorrenza. Il gruppo internet cinese Baidu e il progettista di chip Cambricon hanno fatto passi da gigante nello sviluppo di chip AI. Nel frattempo, negli Stati Uniti, anche Amazon e Microsoft stanno scommettendo di poter conquistare maggiori quote di mercato nei chip per l’inferenza, man mano che le applicazioni di AI si diffondono.

Nel 2024, Nvidia ha venduto 1 milione di chip H20 in Cina
Secondo le stime di SemiAnalysis, società di consulenza sui chip, l’anno scorso Nvidia ha realizzato 12 miliardi di dollari di vendite in Cina consegnando 1 milione dei suoi chip H20 nel Paese, vendendo il doppio dei chip per l’AI rispetto a Huawei con il suo Ascend 910B. “Le GPU H20 di Nvidia, specifiche per la Cina, costituiscono la maggior parte dei chip AI venduti in Cina. Ma il vantaggio si sta riducendo rapidamente con l’aumento della capacità produttiva di Huawei”, dichiara Dylan Patel, analista capo di SemiAnalysis.
Gli addetti ai lavori avvertono che la spinta di Huawei verso i chip per l’intelligenza artificiale è stata limitata anche da una fornitura insufficiente: due potenziali clienti hanno dichiarato di non essere riusciti ad assicurarsi i chip.
Gli analisti affermano che la produzione di Huawei probabilmente sta affrontando delle sfide a causa dei controlli sulle esportazioni degli Stati Uniti che hanno lasciato le fabbriche cinesi dipendenti da apparecchiature di produzione di chip obsolete. L’attenzione all’inferenza indica anche una dinamica in evoluzione dell’AI cinese, diversa da quella statunitense. I controlli sulle esportazioni imposti da Washington fanno sì che gli operatori cinesi dell’AI non siano impegnati nella stessa corsa dei rivali della Silicon Valley – Meta, x.AI di Elon Musk e OpenAI – per costruire grandi mega-cluster delle GPU più avanzate di Nvidia.
Il gioco delle aziende cinesi
“Le aziende cinesi stanno giocando un gioco diverso. Stanno prestando molta più attenzione all’inferenza rispetto agli Stati Uniti perché è possibile ottenere grandi guadagni di efficienza anche con chip meno potenti, il che significa anche che possono raggiungere la commercializzazione più velocemente”, afferma un analista di Bernstein.
Le aziende cinesi scommettono di poter rimanere competitive nell’ambito dell’AI abbassando il costo dell’inferenza, che a sua volta rende più conveniente l’esecuzione delle applicazioni di AI.
DeepSeek, con sede a Hangzhou e Pechino, ha rilasciato il suo modello V3, che ha attirato l’attenzione per i suoi bassi costi di formazione e di inferenza rispetto ai modelli comparativi degli Stati Uniti. L’azienda ha proposto un nuovo modo in cui un modello di intelligenza artificiale può concentrarsi selettivamente su parti specifiche dei dati di input per ridurre i costi di gestione del modello. Ha inoltre utilizzato la tecnica della “Mixture of experts”, molto diffusa in altre start-up cinesi di AI, che contribuisce a velocizzare l’inferenza perché solo una parte del modello viene utilizzata per generare una risposta.
DeepSeek ha dichiarato che Huawei ha adattato con successo il V3 ad Ascend, fornendo istruzioni dettagliate agli sviluppatori su come utilizzare il chip.