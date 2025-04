Alibaba, il colosso tecnologico cinese, ha presentato ufficialmente Qwen3, una nuova famiglia di modelli di intelligenza artificiale che, secondo l’azienda, può eguagliare e, in alcuni casi, superare le migliori soluzioni offerte da Google e OpenAI.

La maggior parte di questi modelli è – o sarà presto – disponibile per il download con una licenza “open” sulle piattaforme di sviluppo AI Hugging Face e GitHub.

I modelli variano in dimensioni da 0,6 miliardi a 235 miliardi di parametri. Ricordiamo che i parametri rappresentano, in modo approssimativo, le capacità di problem-solving di un modello: più parametri possiede, migliori sono generalmente le sue prestazioni.

La pressione sui laboratori statunitensi e le restrizioni

La crescita di serie di modelli originati in Cina, come Qwen, ha aumentato la pressione sui laboratori statunitensi, come OpenAI, affinché sviluppino tecnologie AI ancora più avanzate. Questo sviluppo ha spinto anche i decisori politici a introdurre restrizioni volte a limitare la capacità delle aziende cinesi di intelligenza artificiale di ottenere i chip necessari per l’addestramento dei modelli.

Caratteristiche tecniche: modelli “ibridi” e modalità di ragionamento

Secondo Alibaba, i modelli Qwen3 sono modelli “ibridi”, in grado di “prendersi del tempo per ragionare” su problemi complessi oppure di rispondere rapidamente a richieste più semplici. Il ragionamento consente ai modelli di effettuare un auto-controllo dei fatti in modo efficace, simile ai modelli come o3 di OpenAI, ma con il costo di una latenza maggiore.

“Abbiamo integrato senza soluzione di continuità le modalità di pensiero e non pensiero, offrendo agli utenti la flessibilità di controllare il budget di pensiero,” ha scritto il team di Qwen in un post sul blog. “Questo design consente agli utenti di configurare i budget specifici per attività con maggiore facilità.”

Alcuni dei modelli adottano anche un’architettura “mixture of experts” (MoE), che risulta più efficiente dal punto di vista computazionale per rispondere alle query. Il MoE scompone i compiti in sotto-compiti e li assegna a modelli “esperti” specializzati più piccoli.

Qwen3: addestramento su vasta scala e supporto multilingue

I modelli Qwen3 supportano ben 119 lingue, ha affermato Alibaba, e sono stati addestrati su un dataset di quasi 36 trilioni di token. (I token sono le unità fondamentali di dati elaborate da un modello: 1 milione di token corrisponde a circa 750.000 parole.) L’addestramento ha utilizzato una combinazione di manuali scolastici, “coppie domanda-risposta,” frammenti di codice, dati generati da AI e altro materiale.

Questi miglioramenti, insieme ad altre innovazioni, hanno notevolmente potenziato le capacità di Qwen3 rispetto al suo predecessore, Qwen2, secondo quanto dichiarato dall’azienda.

Prestazioni: confronto fra Qwen3, OpenAI e Google

Pur non superando nettamente i modelli più recenti di fascia alta come OpenAI o3 e o4-mini, i modelli Qwen3 mostrano comunque prestazioni elevate. Su Codeforces, una piattaforma di competizioni di programmazione, il modello più grande, Qwen-3-235B-A22B, supera sia OpenAI o3-mini sia Gemini 2.5 Pro di Google, afferma Alibaba.

Inoltre, Qwen-3-235B-A22B ottiene risultati migliori di o3-mini sulla versione più recente di AIME (benchmark matematico avanzato) e su BFCL, un test progettato per valutare la capacità di un modello di ragionare sui problemi.

Tuttavia, Qwen-3-235B-A22B non è ancora disponibile pubblicamente.

Il modello pubblico più grande: Qwen3-32B

Il più grande modello Qwen3 accessibile al pubblico, Qwen3-32B, si mantiene competitivo rispetto a diversi modelli AI proprietari e open source, inclusi quelli del laboratorio cinese DeepSeek con il suo modello R1. Qwen3-32B supera il modello o1 di OpenAI in vari test, incluso il benchmark di codifica LiveCodeBench.

Alibaba ha sottolineato che Qwen3 “eccelle” nelle capacità di utilizzo degli strumenti, oltre a mostrare un’elevata competenza nell’eseguire istruzioni e replicare formati di dati specifici. Oltre ai modelli scaricabili, Qwen3 è disponibile anche tramite provider cloud come Fireworks AI e Hyperbolic.

La visione degli esperti: il futuro dei modelli open source

Tuhin Srivastava, co-fondatore e CEO del cloud host AI Baseten, ha commentato che Qwen3 rappresenta un altro punto a favore della tendenza degli open model a tenere il passo con i sistemi chiusi come quelli di OpenAI.

“Gli Stati Uniti stanno raddoppiando gli sforzi per limitare la vendita di chip alla Cina e gli acquisti dalla Cina, ma modelli come Qwen 3, che sono all’avanguardia e open […] saranno senza dubbio utilizzati a livello domestico,” dichiara Srivastava. “Questo riflette la realtà in cui le imprese costruiscono sia i propri strumenti che acquistano soluzioni pronte da aziende come Anthropic e OpenAI.”