approfondimento

DeepSeek-R1, tutto sul modello cinese che sfida OpenAI



Indirizzo copiato

R1 è un modello di ragionamento capace di competere nei benchmark con OpenAI-o1. Utilizza un’architettura Mixture of Experts (MoE) che consente di ridurre significativamente i costi computazionali, attivando solo 37 miliardi di parametri per ogni passaggio, oltre a tecniche di apprendimento per rinforzo (RL) per sviluppare capacità di ragionamento autonomo. Utilizza solo 2.000 GPU, rispetto alle 100mila dei modelli tradizionali. La novità: DeepSeek v3-0324, 671 miliardi di parametri, di cui…

Aggiornato il 26 mar 2025



DeepSeek R1

C’è un nuovo astro nel firmamento dell’intelligenza artificiale mondiale e su di esso non sventola la bandiera a stelle e strisce: è DeepSeek, un laboratorio di AI cinese che sviluppa modelli linguistici open-source avanzati.

Continua a leggere questo articolo

Articoli correlati