La startup AI Mistral ha annunciato il lancio di Devstral, un nuovo modello di intelligenza artificiale progettato specificamente per la programmazione. Sviluppato in collaborazione con l’azienda AI All Hands AI, Devstral si distingue per essere liberamente disponibile con una licenza Apache 2.0, che consente il suo utilizzo commerciale senza alcuna restrizione.
Indice degli argomenti:
Devstral di Mistral, prestazioni superiori su benchmark di coding
Secondo Mistral, Devstral supera altri modelli open source come Gemma 3 27B di Google e V3 del laboratorio cinese DeepSeek nel benchmark SWE-Bench Verified, uno standard per misurare le competenze di coding. In un post sul blog, Mistral sottolinea le capacità di Devstral nel gestire strumenti per esplorare basi di codice, modificare più file contemporaneamente e alimentare agenti di ingegneria software.
Devstral di Mistral risolve problemi reali di GitHub
Sebbene i tipici LLM siano eccellenti in attività di codifica atomica come la scrittura di funzioni autonome o il completamento del codice, attualmente faticano a risolvere problemi di ingegneria del software reali. Lo sviluppo nel mondo reale richiede la contestualizzazione del codice all’interno di una base di codice estesa, l’identificazione delle relazioni tra componenti disparati e l’individuazione di bug sottili in funzioni complesse.
Devstral è progettato per affrontare questo problema. Devstral è addestrato per risolvere problemi reali di GitHub; viene eseguito su scaffold di agenti di codice come OpenHands o SWE-Agent, che definiscono l’interfaccia tra il modello e i casi di test. Qui, mostriamo le prestazioni di Devstral nel popolare benchmark SWE-Bench Verified, un dataset di 500 problemi reali di GitHub che sono stati sottoposti manualmente a screening per verificarne la correttezza.
Devstral raggiunge un punteggio del 46,8% su SWE-Bench Verified, superando di oltre il 6% i precedenti modelli SoTA open source. Valutato con lo stesso scaffold di test (OpenHands, fornito da All Hands AI), Devstral supera modelli molto più grandi come Deepseek-V3-0324 (671B) e Qwen3 232B-A22B.
Nella tabella seguente, un contronto di Devstral anche con modelli chiusi e aperti valutati con qualsiasi scaffold (inclusi quelli personalizzati per il modello). Scopriamo che Devstral raggiunge prestazioni sostanzialmente migliori rispetto a diverse alternative closed-source. Ad esempio, Devstral supera il recente GPT-4.1-mini di oltre il 20%.

Ottimizzato per uso locale e su dispositivi comuni
Una caratteristica importante di Devstral è la sua leggerezza: il modello può essere eseguito su una singola scheda grafica Nvidia RTX 4090 o su un Mac con 32 GB di RAM. Questo lo rende particolarmente adatto all’installazione locale o all’utilizzo direttamente su dispositivi, senza necessità di infrastrutture cloud complesse.
Cresce l’ecosistema degli assistenti AI per programmatori
L’arrivo di Devstral si inserisce in un contesto di crescente diffusione degli assistenti di codifica basati su AI. Solo il mese scorso JetBrains ha lanciato il suo primo modello AI open per la programmazione. Anche colossi come Google, Windsurf e OpenAI hanno presentato modelli specifici per task di programmazione, sia open source che proprietari.
Sfide e potenzialità della AI nella scrittura del codice
Nonostante le promesse, i modelli AI per la programmazione incontrano ancora difficoltà nel generare codice di alta qualità. Sono frequenti vulnerabilità di sicurezza e errori dovuti a limiti nella comprensione della logica di programmazione. Tuttavia, l’effetto sul miglioramento della produttività è significativo: un sondaggio recente ha rilevato che il 76% degli sviluppatori ha usato o intende usare strumenti AI nei propri processi di sviluppo.
Da Codestral a Devstral: un’evoluzione nella licenza e nell’uso commerciale
Mistral era già presente nel settore con Codestral, un modello generativo per codice, ma la sua licenza non permetteva un uso commerciale aperto, vietando esplicitamente l’utilizzo interno da parte di aziende nel contesto delle loro attività. Con Devstral, invece, il modello è disponibile per uso commerciale senza restrizioni.
Disponibilità e costi di utilizzo di Devstral di Mistral
Devstral è disponibile come “anteprima di ricerca” e può essere scaricato da piattaforme di sviluppo AI come Hugging Face oppure utilizzato tramite l’API di Mistral. Il costo è di 0,1 dollari per milione di token in input e 0,3 dollari per milione di token in output. Per contestualizzare, un milione di token corrisponde a circa 750mila parole, ben oltre la lunghezza di romanzi monumentali come “Guerra e Pace”.
Prossimi sviluppi e piani di Mistral
Mistral è già al lavoro su un modello di coding più grande e potente, che sarà disponibile nelle prossime settimane. Devstral, pur non essendo un modello piccolo, conta 24 miliardi di parametri, che indicano in modo approssimativo le sue capacità di risoluzione dei problemi. Generalmente, modelli con più parametri tendono a offrire performance superiori.
Mistral, la giovane startup con grandi ambizioni
Fondata nel 2023, Mistral è un laboratorio francese d’avanguardia che mira a costruire una gamma di servizi AI, fra cui una piattaforma chatbot chiamata Le Chat e app mobili. La startup ha raccolto oltre 1,1 miliardi di euro da investitori come General Catalyst, e conta clienti importanti quali BNP Paribas, AXA e Mirakl.
Un mese ricco di novità: tre lanci in poche settimane
Devstral è il terzo prodotto che Mistral lancia nel corso di questo mese. Poche settimane fa è stato rilasciato Mistral Medium 3, un modello generico efficiente, e contemporaneamente è stato lanciato Le Chat Enterprise, un servizio chatbot dedicato alle aziende, che offre strumenti per costruire agenti AI e integra i modelli Mistral con servizi terzi come Gmail, Google Drive e SharePoint.