approfondimento

DeepSeek aggiorna il modello R1 e distilla una versione “light” basata su Qwen3-8B



Indirizzo copiato

La startup cinese ha introdotto R1-0528, una versione potenziata che riduce le allucinazioni e migliora la capacità di gestire compiti complessi. Parallelamente, ha lanciato un modello distillato basato su Qwen3-8B, in grado di competere con i migliori modelli americani su benchmark matematici, funzionando però con una sola GPU. Ecco tutti i dettagli

Pubblicato il 30 mag 2025



DeepSeek-R1-0528

DeepSeek ha annunciato il 29 maggio un importante aggiornamento del suo modello R1, il cui debutto globale lo scorso gennaio aveva sconvolto il mercato, facendo crollare le azioni tech non cinesi e infrangendo il mito secondo cui l’avanzamento dell’AI richiederebbe necessariamente enormi risorse computazionali. La nuova versione, denominata R1-0528, rappresenta una release minore, ma con impatti significativi sulle performance logiche e inferenziali del sistema.

Continua a leggere questo articolo

Articoli correlati