scenari

Cina, nuova sfida agli Usa: GLM-5.2, l’AI per compiti lunghi e complessi

Il sistema introduce un contesto da 1 milione di token, migliora le prestazioni nel coding agentico e offre diversi livelli di effort per bilanciare qualità, tempi di risposta e costi computazionali. Resta aperto con licenza MIT. Sullo sfondo pesano i controlli americani, i costi per le imprese e la partita sulla sovranità tecnologica

Pubblicato il 24 giu 2026

Aggiungi tra i preferiti su Google

Pierluigi Sandonnini

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

La Cina riduce il divario con GLM-5.2 di Z.ai (ex Zhipu): contesto da 1 milione di token, licenza MIT, miglioramenti per coding e agenti prolungati.
Lancio aperto dopo il blocco di Anthropic su Fable 5 e Mythos 5; Artificial Analysis segnala costi relativi elevati ma maggiore accessibilità e continuità.
Benchmark: GLM-5.2 guida i modelli open-weight su FrontierSWE, PostTrainBench e SWE-Marathon, vicino a Opus 4.8 e davanti a GPT-5.5; impatto su investimenti e politica.

Riassunto generato con AI

La Cina torna a premere l’acceleratore sull’AI. Il vantaggio americano sull’intelligenza artificiale non è sparito, ma oggi appare meno largo di quanto sembrasse solo pochi mesi fa. Il motivo della nuova fiammata è il rilascio di GLM-5.2, annunciato da Z.ai, il nuovo nome di Zhipu. Secondo il laboratorio cinese, il modello è progettato per compiti complessi e di lunga durata, con una finestra di contesto fino a 1 milione di token. La società lo presenta come un passo avanti soprattutto nella programmazione e nei flussi agentici, cioè nelle attività in cui il sistema deve portare a termine compiti articolati senza limitarsi a una risposta breve.

Indice degli argomenti:

Dopo DeepSeek, il nuovo segnale arriva da Z.ai

La prima scossa era arrivata a gennaio 2025 con DeepSeek R1. In quelle ore Wall Street aveva reagito in modo brutale: Nvidia aveva perso circa il 17% in una sola seduta, mentre il mercato aveva iniziato a dubitare che la leadership americana nell’AI fosse così inattaccabile. Da allora la narrazione dominante è tornata a concentrarsi sulla capacità dei gruppi Usa di trasformare l’intelligenza artificiale in un business ad alto margine. Ma nelle ultime settimane quella convinzione è stata di nuovo messa sotto pressione.

Il punto non è solo tecnico. Quando un modello cinese si avvicina ai migliori sistemi americani, l’effetto si allarga subito all’economia reale. Le aziende devono decidere quali modelli comprare, con quali costi e con quali garanzie di continuità. Gli investitori, invece, devono capire se i multipli enormi attribuiti all’AI americana reggono anche in uno scenario in cui la Cina offre alternative più economiche e più aperte.

Su questo terreno GLM-5.2 ha colpito nel momento giusto. Un giorno prima del lancio, il 12 giugno, Anthropic aveva comunicato di aver sospeso l’accesso ai modelli Fable 5 e Mythos 5 dopo una direttiva del governo statunitense che vietava l’uso da parte di cittadini stranieri, dentro e fuori gli Stati Uniti, compresi i dipendenti stranieri della stessa azienda. Anthropic ha spiegato che, per rispettare l’ordine, aveva dovuto bloccare l’accesso a tutti gli utenti. È stato uno dei primi casi in cui l’accesso a modelli di frontiera è dipeso in modo così diretto da una decisione governativa americana.

Nel giro di 24 ore, Z.ai ha potuto presentarsi al mercato con un messaggio opposto: modello aperto, pesi disponibili, nessun vincolo territoriale dichiarato. In una fase in cui le imprese iniziano a misurare i costi dell’AI voce per voce, l’argomento ha peso. Non conta soltanto quanto un modello sia bravo. Conta anche quanto costa usarlo e quanto è probabile che resti disponibile nel tempo.

Prestazioni: il gap si è ristretto, ma non è chiuso

Sul piano delle capacità, il dato più solido arriva da Artificial Analysis, società indipendente che confronta i modelli su una batteria di benchmark. Nei giorni successivi al rilascio, GLM-5.2 è stato indicato come il principale modello open-weight per qualità complessiva. La piattaforma segnala però anche un secondo elemento meno favorevole alla narrativa del “modello cinese imbattibile”: GLM-5.2 è tra i più costosi nel confronto con altri modelli aperti di dimensioni simili.

La distinzione è importante. I benchmark pubblici mostrano che la Cina si è avvicinata molto. Ma i benchmark pubblici non esauriscono la questione. Molti ricercatori fanno notare da tempo che i modelli open-weight tendono a rendere meglio sui test noti e replicabili, mentre nei test privati o meno prevedibili il margine dei laboratori americani può restare più ampio.

Il quadro, quindi, non racconta un sorpasso. Racconta piuttosto una riduzione della distanza, soprattutto in alcune aree specifiche come il coding e i compiti agentici di lunga durata.

Lo stesso Z.ai, nel materiale tecnico diffuso con il lancio, colloca GLM-5.2 in una fascia di performance vicina ai modelli Claude Opus 4.7 e 4.8 su diversi compiti di coding, non al vertice assoluto del mercato.

È una scelta comunicativa interessante: il laboratorio cinese non sostiene di aver già raggiunto il leader americano in tutto, ma rivendica un avvicinamento concreto in segmenti che contano per le aziende che automatizzano sviluppo software, analisi documentale e agenti operativi.

GLM-5.2, il nuovo modello punta sui compiti lunghi

Rispetto alla versione precedente, GLM-5.1, il salto è netto soprattutto nella capacità di mantenere coerenza ed efficacia su attività che richiedono molte fasi di lavoro. Per la prima volta, questa evoluzione arriva insieme a un contesto da 1 milione di token realmente utilizzabile.

Tra le principali novità ci sono quattro elementi. Il primo è proprio il contesto esteso da 1 milione di token, progettato per sostenere in modo stabile attività prolungate. Il secondo riguarda il coding avanzato, con diversi livelli di “sforzo” del modello per bilanciare qualità del risultato, velocità di esecuzione e latenza. Il terzo è il miglioramento dell’architettura: Z.ai introduce IndexShare, un sistema che riutilizza lo stesso indicizzatore ogni quattro livelli di attenzione sparsa e riduce di 2,9 volte i FLOPs per token su un contesto da 1 milione.

A questo si aggiunge un affinamento del layer MTP per la decodifica speculativa, che aumenta fino al 20% la lunghezza accettata. Il quarto punto è l’apertura del modello: licenza open-source MIT, senza limiti regionali e con accesso tecnico dichiarato senza confini.

Il nodo non è solo la lunghezza del contesto

Per Z.ai, supportare compiti di lunga durata non significa soltanto aumentare il numero di token che un modello può accettare in input. Il punto decisivo è rendere quel contesto davvero utile in scenari ingegneristici reali. Un sistema deve riuscire a mantenere qualità e affidabilità anche lungo traiettorie di lavoro lunghe, disordinate e piene di correzioni, come accade nei flussi di coding agentico.

In altre parole, dichiarare un contesto da 1 milione di token è relativamente semplice. Molto più difficile è far sì che il modello resti solido quando viene sottoposto alla pressione di progetti tecnici reali. Per questo Z.ai afferma di aver ampliato in modo consistente l’addestramento su scenari di coding-agent a contesto lungo, includendo implementazioni su larga scala, ricerca automatizzata, ottimizzazione delle prestazioni e debugging complesso.

Il risultato, nelle intenzioni della società, è un sistema che non è solo ampio per capacità teorica, ma anche stabile nell’esecuzione pratica, quindi adatto a lavori di ingegneria prolungati.

I benchmark sui compiti di lunga durata

Secondo Z.ai, questa impostazione emerge dai risultati ottenuti da GLM-5.2 in tre benchmark dedicati al coding di lunga durata.

Il primo è FrontierSWE, che misura la capacità di un agente di completare progetti tecnici aperti nell’arco di molte ore, fino a diverse decine di ore. Si tratta di attività che includono ottimizzazione di sistemi, costruzione di grandi basi di codice e ricerca applicata nel machine learning. In questo test, GLM-5.2 si colloca a solo 1% di distanza da Opus 4.8, supera GPT-5.5 di un punto percentuale e fa meglio di Opus 4.7 di 11 punti.

Il secondo benchmark è PostTrainBench, in cui ogni agente riceve una GPU H100 e viene valutato in base alla sua capacità di migliorare piccoli modelli attraverso operazioni di post-training. Qui GLM-5.2 supera sia Opus 4.7 sia GPT-5.5, piazzandosi dietro soltanto a Opus 4.8.

Il terzo è SWE-Marathon, un benchmark di software engineering a orizzonte molto lungo, che comprende attività come la costruzione di compilatori, l’ottimizzazione di kernel e lo sviluppo di servizi pronti per la produzione. In questo caso GLM-5.2 mostra ancora margini di miglioramento: resta indietro di 13 punti percentuali rispetto a Opus 4.8, ma si conferma subito dietro la serie Opus.

Nel complesso, sui tre benchmark citati, GLM-5.2 risulta il modello open-source con il punteggio più alto, segno che il contesto da 1 milione di token, almeno secondo Z.ai, si traduce in una capacità concreta di portare a termine compiti lunghi e articolati.

Coding standard: un passo avanti rispetto a GLM-5.1

Anche sui benchmark di coding più tradizionali, Z.ai sostiene che GLM-5.2 sia oggi il modello open-source più forte. Il progresso rispetto a GLM-5.1 viene descritto come ampio.

Su Terminal-Bench 2.1, il nuovo modello passa da 63,5 a 81,0. Su SWE-bench Pro, sale da 58,4 a 62,1. Sono numeri che, sempre secondo la società, avvicinano il modello al vertice dei sistemi closed-source. In particolare, su Terminal-Bench 2.1, con 81,0 punti, GLM-5.2 resta a pochi punti da Claude Opus 4.8, fermo a 85,0, e si mantiene davanti a Gemini 3.1 Pro.

Il messaggio che Z.ai vuole mandare è chiaro: il nuovo modello non compete solo nel mondo open-source, ma prova a ridurre la distanza dai sistemi proprietari che guidano oggi la fascia più alta del mercato.

Controllo del livello di sforzo

Una delle novità più interessanti introdotte da GLM-5.2 è il controllo del livello di effort, cioè la possibilità per l’utente di scegliere in modo esplicito il compromesso tra qualità del risultato, velocità di esecuzione e costo computazionale.

Nella pratica, questo significa che chi usa il modello può decidere se privilegiare tempi più rapidi oppure maggiore capacità di ragionamento, a seconda del tipo di compito da svolgere. Z.ai sostiene che, a parità di budget di token, GLM-5.2 offra prestazioni di coding agentico nettamente superiori rispetto a GLM-5.1. Sempre secondo la società, con consumi di token simili, le prestazioni del modello si collocano in una fascia intermedia tra Claude Opus 4.7 e Claude Opus 4.8.

Il livello Max, inoltre, consente di assegnare più risorse computazionali ai compiti più difficili, così da estendere ulteriormente le capacità del modello nei casi in cui serve maggiore precisione o profondità di ragionamento. È una scelta di design pensata per rendere GLM-5.2 più flessibile: chi lo usa può selezionare la modalità di ragionamento più adatta al contesto, senza trattare ogni task allo stesso modo.

La scommessa di Z.ai

Nel complesso, GLM-5.2 viene presentato come un modello costruito per un obiettivo preciso: portare l’AI oltre la risposta rapida e verso attività tecniche lunghe, iterative e ad alta complessità. La combinazione tra contesto da 1 milione di token, miglioramenti architetturali, controllo dello sforzo computazionale e licenza MIT serve a posizionarlo come una piattaforma aperta ma competitiva anche su lavori di fascia alta.

La vera scommessa non è soltanto aumentare la potenza del modello. È dimostrare che un sistema open-source può restare affidabile quando viene impiegato su progetti lunghi, pieni di passaggi intermedi, verifiche, errori e correzioni. È su questo terreno che Z.ai prova a differenziarsi con GLM-5.2.

Il prezzo non basta: conta l’efficienza

Il secondo fronte è quello economico. La grande promessa dei modelli cinesi, da DeepSeek in poi, è sempre la stessa: qualità sufficiente o elevata a un costo inferiore. Questo messaggio ha attecchito perché molte imprese occidentali stanno scoprendo che l’AI generativa, una volta portata su larga scala, produce bollette molto meno leggere di quanto sembrasse nelle fasi iniziali.

Però il prezzo per token non dice tutto. Un modello può essere venduto a una tariffa inferiore e allo stesso tempo risultare più caro sul costo totale del compito, se usa molti più token per arrivare alla risposta. Artificial Analysis, infatti, segnala che GLM-5.2 non è economico in termini relativi rispetto ad altri open-weight. Un’analisi recente citata da Axios sul mercato enterprise spiega perché la pressione sul costo stia comunque spingendo gruppi americani a guardare verso modelli alternativi, inclusi quelli cinesi.

Secondo Axios, Microsoft sta valutando DeepSeek V4 come possibile opzione a costo più basso per Copilot Cowork, pur con hosting su Azure e con tutele di sicurezza gestite internamente.

Questa apertura è un segnale industriale forte. Se anche un partner centrale dell’ecosistema OpenAI prende in considerazione un modello cinese o comunque open-source per contenere i costi, significa che il problema non riguarda solo la geopolitica. Riguarda la sostenibilità economica dell’AI dentro le aziende. Non basta avere il modello migliore sulla carta. Serve anche un modello che non trasformi ogni processo automatizzato in una spesa ingestibile.

Accesso e affidabilità: la nuova variabile politica

Negli ultimi mesi la concorrenza tra laboratori ha smesso di essere solo una corsa tecnologica. È diventata anche una corsa all’affidabilità politica. Il blocco imposto a Anthropic dal governo Usa ha mostrato che l’accesso ai modelli di punta può essere interrotto per ragioni di sicurezza nazionale. Per molte imprese globali questa è una novità di grande peso: il rischio regolatorio entra direttamente nel contratto implicito tra fornitore e cliente.

I modelli cinesi aperti giocano proprio su questo punto. Potendo essere scaricati e installati in locale, almeno in teoria riducono la dipendenza da una piattaforma cloud che può staccare la spina. È un vantaggio competitivo reale, soprattutto per chi vuole evitare che una scelta politica a Washington renda improvvisamente inutilizzabile un’infrastruttura critica. Allo stesso tempo, questo vantaggio non è privo di contropartite: negli Stati Uniti cresce il timore che modelli sviluppati in Cina possano portare rischi di sicurezza, esposizione dei dati o dipendenza strategica.

La prova arriva dal Congresso. Il 29 aprile 2026 i presidenti della House Homeland Security Committee e della Select Committee on China hanno annunciato un’indagine congiunta sui rischi per la sicurezza nazionale posti dai modelli AI cinesi. Nelle comunicazioni ufficiali si citano in modo esplicito i timori su vulnerabilità, sorveglianza, esposizione di dati sensibili e accesso a sistemi critici. È il segnale che Washington si prepara a trattare l’AI cinese come una materia di sicurezza economica oltre che tecnologica.

La cornice economica cinese aiuta i campioni nazionali

La sfida, intanto, si inserisce in una strategia industriale molto più larga. Nel Government Work Report diffuso a marzo 2026, il governo cinese ha ribadito l’obiettivo di sviluppare la “smart economy”, promuovere lo sviluppo digitale e intelligente e accelerare i progressi nelle tecnologie core. Non è un dettaglio di linguaggio. Significa che l’AI continua a essere considerata una leva centrale di crescita, produttività e autonomia tecnologica. (Governo della Cina)

Pochi giorni fa, al forum di Dalian noto come “Summer Davos”, il premier Li Qiang ha respinto la lettura occidentale della “China shock 2.0” e ha sostenuto che i progressi cinesi in AI, robotica ed elettrico vadano letti come un’opportunità globale e non come una minaccia. Al di là della formula politica, il messaggio economico è chiaro: Pechino vuole presentare i propri campioni tecnologici come fornitori affidabili e competitivi in un mercato mondiale che chiede prezzi più bassi.

È dentro questa cornice che va letto anche il percorso di Zhipu. La società, secondo il Wall Street Journal, ha debuttato in Borsa a Hong Kong nei primi mesi del 2026, diventando uno dei simboli della nuova generazione di aziende cinesi dell’AI che cercano capitali pubblici per sostenere ricerca e scala industriale. (The Wall Street Journal)

Mercati, margini e la vera domanda per Wall Street

Per gli investitori, il nodo resta sempre lo stesso: quanto margine di vantaggio mantengono i laboratori americani e per quanto tempo potranno monetizzarlo? GLM-5.2 non dimostra che la Cina abbia superato gli Stati Uniti. Dimostra però che il ritardo non si sta allargando come molti avevano previsto dopo le restrizioni sui chip e sui semiconduttori avanzati.

Questa è la notizia economica più rilevante. I controlli all’export avrebbero dovuto rallentare in modo netto i laboratori cinesi. In parte lo hanno fatto. Ma non abbastanza da impedirgli di produrre modelli credibili, competitivi e sempre più appetibili per chi guarda al rapporto tra costo, qualità e libertà di utilizzo. Se il divario resta di alcuni mesi, anziché di anni, allora le valutazioni stellari attribuite ai vincitori americani devono fare i conti con una concorrenza più rapida, più politica e più internazionale.

La partita, quindi, non si gioca solo sui benchmark. Si gioca nei bilanci delle imprese che comprano AI, negli ordini di chip, nei conti economici dei fornitori cloud e nella capacità dei governi di imporre regole senza rendere i propri campioni meno affidabili dei concorrenti. Oggi gli Stati Uniti conservano il primato sui modelli più avanzati e sulla capacità di trasformare ricerca e infrastruttura in potenza commerciale. Ma la Cina, con DeepSeek prima e con GLM-5.2 adesso, ha mostrato di poter ridurre il divario più in fretta del previsto. Per Wall Street e per le aziende che stanno costruendo la propria strategia sull’intelligenza artificiale, questo è già un fatto che cambia i conti.

Keyword:

Titolo Seo: AI Cina-Usa, Zhipu e DeepSeek riaprono la sfida

Metadescription:

@RIPRODUZIONE RISERVATA

Pierluigi Sandonnini

Senior web editor di Nextwork360. Oltre trent’anni di esperienza giornalistica, maturata in diversi settori della tecnologia: audio video, tv digitale, telecomunicazioni, internet, intelligenza artificiale.

Dal 2020 gestisce il sito Ai4business.it, coordinando la redazione, curandone i contenuti e scrivendo articoli.

Seguimi su

Partecipa alla community

0 Commenti

Più recenti

Più votati

Inline Feedback

Vedi tutti i commenti

Argomenti

Canali

Cina, nuova sfida agli Usa: GLM-5.2, l’AI per compiti lunghi e complessi

Dopo DeepSeek, il nuovo segnale arriva da Z.ai

Prestazioni: il gap si è ristretto, ma non è chiuso

GLM-5.2, il nuovo modello punta sui compiti lunghi

Il nodo non è solo la lunghezza del contesto

I benchmark sui compiti di lunga durata

Coding standard: un passo avanti rispetto a GLM-5.1

Controllo del livello di sforzo

La scommessa di Z.ai

Il prezzo non basta: conta l’efficienza

Accesso e affidabilità: la nuova variabile politica

La cornice economica cinese aiuta i campioni nazionali

Mercati, margini e la vera domanda per Wall Street

Pierluigi Sandonnini

Leggi anche:

Partecipa alla community

Articoli correlati

La Cina riprende agli Usa lo scettro dei supercomputer

Qwen 3.6-Plus: la Cina accelera sugli agenti AI e ridisegna la geografia industriale

AI, quasi un lavoratore su due la usa: prevalgono i compiti operativi

Codice Rss

Codice Rss