La crescente domanda di potenza di calcolo per l’intelligenza artificiale ha messo in crisi gli hyperscaler tradizionali, incapaci di garantire disponibilità e prezzi competitivi per le GPU. In questo scenario si affermano i neocloud provider, operatori specializzati che costruiscono infrastrutture AI-first per supportare carichi intensivi come l’addestramento di foundation model e il fine-tuning di modelli verticali. Non si tratta di una moda passeggera, ma di un cambiamento strutturale che sta ridefinendo il ruolo dei cloud provider e il modo in cui le imprese accedono a risorse critiche per l’AI.
Indice degli argomenti:
Cos’è un neocloud e perché sta emergendo
Il termine neocloud provider identifica una nuova categoria di operatori cloud nati per rispondere a un’esigenza precisa: fornire infrastrutture ottimizzate per l’intelligenza artificiale, in particolare per il calcolo su GPU. A differenza degli hyperscaler tradizionali come AWS, Microsoft Azure o Google Cloud, i neocloud non offrono un portafoglio generalista di servizi, ma si concentrano su risorse ad alte prestazioni dedicate all’AI.
L’origine di questo fenomeno è legata alla crescente carenza di GPU sul mercato globale. Con l’esplosione della domanda di modelli di intelligenza artificiale generativa e machine learning, le grandi piattaforme cloud si sono trovate incapaci di garantire capacità sufficienti a costi sostenibili. Da questa lacuna hanno preso forma i neocloud, provider specializzati in data center costruiti ad hoc per il training e l’esecuzione di modelli AI.
Secondo ABI Research, la loro crescita non è un fenomeno temporaneo legato solo alla scarsità di chip, ma il segnale di una trasformazione strutturale: le aziende richiedono infrastrutture “AI-first”, agili, scalabili e spesso sovrane, che rispondano a esigenze di performance, sicurezza e compliance che i colossi generalisti non riescono a soddisfare pienamente.
A trainare questo mercato sono stati player come CoreWeave, Nebius, Lambda Labs e Crusoe, che hanno iniziato a costruire data center specializzati e a offrire GPU come servizio (GPUaaS). Molti di questi provider provengono dal settore del mining di criptovalute, riadattando competenze e infrastrutture per il mondo AI.
La spinta verso i neocloud si spiega quindi con tre fattori principali:
- La scarsità e i costi elevati delle GPU nei cloud tradizionali, con prezzi che possono superare i 100 dollari/ora per un’istanza H100.
- La necessità di maggiore flessibilità e performance, attraverso infrastrutture progettate nativamente per AI e machine learning.
- L’esigenza di sovranità e trasparenza, soprattutto in Europa, dove le normative come GDPR e AI Act spingono verso soluzioni locali e dedicate.
In sintesi, i neocloud provider si collocano come anello intermedio tra hyperscaler e infrastrutture dedicate, offrendo un’alternativa più rapida, focalizzata e in alcuni casi più conveniente per chi sviluppa e adotta soluzioni di intelligenza artificiale.
Come funzionano i neocloud provider
I neocloud provider operano con un modello radicalmente diverso da quello dei cloud generalisti. La loro proposta di valore si fonda sulla capacità di offrire GPU-as-a-Service (GPUaaS), cioè ambienti scalabili in cui le aziende possono noleggiare risorse grafiche e di calcolo ad alte prestazioni per addestrare, ottimizzare e mettere in produzione modelli di intelligenza artificiale.
A differenza degli hyperscaler, che hanno adattato architetture CPU-centriche alla domanda di AI, i neocloud nascono con infrastrutture AI-first: data center progettati nativamente per l’elaborazione massiva su GPU, integrazione stretta con i vendor di chip (NVIDIA, AMD) e stack software completo che va dall’hardware all’orchestrazione dei carichi. Questo approccio consente loro di massimizzare le performance, ottimizzare i consumi e offrire tempi di provisioning molto rapidi rispetto ai colossi generalisti.
Architetture AI-first e GPU-as-a-Service
Un neocloud tipico mette a disposizione cluster di GPU di ultima generazione (come le Nvidia H100 o Blackwell) collegati tramite reti ad alta velocità e supportati da sistemi di raffreddamento avanzati. A livello software, forniscono strumenti per la gestione del ciclo di vita dei modelli:
- Training di foundation model
- Fine-tuning di modelli verticali
- Inferenza multimodale su larga scala
- Integrazione con tool di MLOps per pipeline automatizzate
Questi ambienti permettono di superare i colli di bottiglia delle architetture tradizionali, offrendo alle imprese una capacità elastica e specializzata per gestire workload AI intensivi.

Modelli di business dei neocloud
L’ecosistema dei neocloud può essere suddiviso in quattro archetipi principali:
- GPUaaS opportunisti: sfruttano la scarsità temporanea di GPU per offrire capacità a breve termine.
- Piattaforme AI-first full-stack: forniscono non solo GPU, ma anche orchestrazione, MLOps e servizi aggiuntivi.
- Marketplace decentralizzati di compute: creano mercati secondari in cui gli utenti possono rivendere o acquistare risorse di calcolo in modo flessibile.
- Provider verticali e specializzati: offrono soluzioni mirate a specifici settori o regioni, ad esempio neocloud “sovrani” per l’Europa o piattaforme ottimizzate per la sostenibilità.
Alcuni, come Mithril, hanno introdotto meccanismi innovativi di orchestrazione e rivendita delle risorse GPU per ridurre sprechi e costi. Altri, come Nebul, puntano sulla compliance e sulla sovranità dei dati per il mercato europeo, mentre player come Nscale e Crusoe integrano la sostenibilità nella loro value proposition sfruttando energie rinnovabili o surplus energetici.
Vantaggi e criticità dei neocloud
I neocloud provider si stanno affermando come un’alternativa strategica agli hyperscaler, ma la loro proposta non è priva di sfide. Le imprese che valutano queste soluzioni devono considerare attentamente i punti di forza e le criticità prima di integrare un neocloud nelle proprie strategie multicloud.
Costi e performance: confronto con gli hyperscaler
Uno dei principali vantaggi è l’ottimizzazione dei costi per workload AI intensivi. Secondo Uptime Institute, un’istanza Nvidia DGX H100 presso un hyperscaler costa in media 98 dollari/ora, contro i 34 dollari/ora offerti da un neocloud – un risparmio del 66%. Inoltre, i neocloud permettono di accedere più facilmente a capacità GPU di ultima generazione, evitando lunghe code di provisioning tipiche dei cloud generalisti.
Questa convenienza diventa particolarmente evidente per attività di training di modelli di grandi dimensioni, che richiedono cluster GPU dedicati e continui per settimane.
Sovranità dei dati e sostenibilità come fattori distintivi
Un secondo vantaggio riguarda la compliance. In Europa, la spinta normativa (GDPR, AI Act) favorisce provider in grado di garantire sovranità digitale, mantenendo i dati all’interno di specifici confini giuridici. Neocloud come Nebul o Nscale si posizionano proprio su questa leva, offrendo infrastrutture sovrane e localizzate.
In parallelo, il tema della sostenibilità sta diventando un criterio di scelta. Alcuni neocloud sfruttano energie rinnovabili o surplus energetici per alimentare i data center: è il caso di Crusoe, che utilizza gas naturale in eccesso, o di Nscale, che colloca i suoi data center nell’Artico per sfruttare energia idroelettrica e raffreddamento naturale.
I rischi: investimenti elevati, concentrazione clienti, volatilità del mercato
Non mancano però criticità. Molti neocloud nascono come startup e affrontano barriere di sostenibilità economica: i costi di costruzione dei data center e l’acquisto di GPU sono enormi. CoreWeave, ad esempio, ha annunciato investimenti superiori a 20 miliardi di dollari in un solo anno.
Inoltre, il modello di business è esposto a rischi legati a:
- Concentrazione dei clienti: pochi grandi contratti possono determinare il destino del provider.
- Volatilità della domanda: il mercato AI è in forte crescita, ma soggetto a oscillazioni e consolidamenti.
- Competizione degli hyperscaler: che, sebbene oggi dipendano in parte dai neocloud per capacità aggiuntiva, nel medio periodo potrebbero recuperare terreno o acquisire direttamente questi operatori.
In sintesi, i vantaggi di performance, costi e compliance rendono i neocloud attraenti per le imprese, ma la loro adozione richiede una valutazione attenta di rischi finanziari, solidità aziendale e affidabilità sul lungo periodo.
I principali neocloud provider sul mercato
Il panorama dei neocloud provider è oggi estremamente variegato e in rapida evoluzione. Accanto ai pionieri che hanno saputo intercettare subito la carenza di GPU, stanno emergendo player innovativi che puntano su specializzazione, sovranità o sostenibilità per differenziarsi.
CoreWeave, Nebius, Lambda Labs e Crusoe: i pionieri
Tra i protagonisti della prima ondata si collocano CoreWeave, Nebius, Lambda Labs e Crusoe, che hanno saputo trasformare la carenza di GPU in un’opportunità di business.
CoreWeave è probabilmente il nome più noto, con investimenti che superano i 20 miliardi di dollari in nuovi data center e con un accordo strategico di lungo termine con Microsoft per garantire capacità GPU fino al 2029.
Nebius, spin-off nato nell’Europa orientale, ha costruito data center focalizzati sull’AI ad alte prestazioni, ritagliandosi un ruolo sempre più rilevante nella fornitura di GPU-as-a-Service.
Lambda Labs ha scelto invece una strada diversa, puntando su un approccio community-driven, con offerte pensate per startup e team di ricerca che necessitano di potenza di calcolo senza gli oneri degli hyperscaler.
Crusoe, infine, rappresenta un caso di trasformazione particolarmente interessante: partito come realtà legata al mining di criptovalute, ha riconvertito la propria infrastruttura in un modello cloud sostenibile, utilizzando surplus energetici per alimentare i propri data center e posizionandosi come attore innovativo anche sul fronte ambientale.
Nuovi attori innovativi: Nebul, Nscale, Runpod, Mithril
Accanto ai pionieri si stanno affermando nuovi attori che stanno ridefinendo i confini del mercato con approcci originali.
Nebul
Con sede nei Paesi Bassi, ha lanciato uno dei primi esempi di sovereign AI cloud per l’Europa, offrendo servizi full-stack che includono soluzioni come Private GPT e garantendo compliance con normative come GDPR e AI Act.
Nscale
ecco un altro esempio che ha scelto di costruire i propri data center nell’Artico, alimentandoli esclusivamente con energia rinnovabile e sfruttando tecniche avanzate di raffreddamento liquido per coniugare performance e sostenibilità.
Runpod
spicca sul fronte della user experience; si propone come piattaforma developer-first, mettendo a disposizione GPU serverless, ambienti preconfigurati per framework come PyTorch e modelli di pricing trasparenti, caratteristiche che lo rendono molto adatto a scenari di sperimentazione e inferenza.
Mithril
Nato in California, ha introdotto un marketplace innovativo che consente di rivendere capacità GPU inutilizzate e di gestire i carichi attraverso una sofisticata piattaforma di orchestrazione, riducendo sprechi e ottimizzando i costi.
Implementare una strategia con i neocloud provider
L’adozione di un neocloud provider non è mai una scelta puramente tecnologica, ma si inserisce in una più ampia strategia aziendale che deve conciliare esigenze di performance, governance e sostenibilità economica. La logica prevalente non è quella della sostituzione totale degli hyperscaler, ma piuttosto dell’integrazione: i neocloud diventano parte di un ecosistema multicloud in cui i diversi provider si specializzano per tipologie di workload.
In questo contesto, i neocloud trovano la loro collocazione ideale per la gestione di attività ad alto consumo di GPU, come il training di foundation model o il fine-tuning di modelli verticali. Una volta completata la fase di addestramento, l’inferenza e l’integrazione nei processi di business possono avvenire più agevolmente sulle infrastrutture degli hyperscaler, che restano dominanti per la scalabilità globale e per la varietà di servizi complementari.
Un altro aspetto chiave riguarda la compliance normativa e la sovranità dei dati. Provider come Nebul e Nscale hanno costruito offerte mirate a mercati regolamentati come finanza, sanità o pubblica amministrazione europea, in cui il rispetto delle normative locali è imprescindibile. In questi scenari, scegliere un neocloud significa mitigare rischi legati a normative extraterritoriali, come il Cloud Act statunitense, e rafforzare il controllo sulla governance dei dati.
Le best practice
Sul piano operativo, le imprese che valutano i neocloud devono adottare alcune best practice. È essenziale pianificare attentamente l’integrazione nei workflow esistenti, evitando fenomeni di lock-in attraverso strumenti di containerizzazione e orchestrazione che rendano portabili i workload tra ambienti differenti. Inoltre, la selezione del provider dovrebbe basarsi non solo su parametri di costo e performance, ma anche su elementi di trasparenza nei modelli di pricing, sulla solidità finanziaria del player e sulla capacità di garantire SLA affidabili.
In definitiva, la scelta di un neocloud provider è più indicata quando le aziende devono affrontare workload intensivi, picchi di domanda non gestibili dagli hyperscaler, o quando la compliance e la sovranità diventano criteri prioritari di selezione. L’approccio più efficace resta quello ibrido, che combina la flessibilità e la specializzazione dei neocloud con l’affidabilità e la portata globale dei cloud tradizionali.
Prospettive future del mercato neocloud
Il futuro dei neocloud provider si gioca su un equilibrio complesso tra crescita esplosiva e rischi strutturali. La domanda di infrastrutture AI è destinata a rimanere elevata: ABI Research prevede che entro il 2030 i neocloud genereranno oltre 65 miliardi di dollari di ricavi legati al modello GPU-as-a-Service.
Questo trend riflette non solo la scarsità di risorse disponibili presso gli hyperscaler, ma anche una trasformazione più profonda: le imprese vogliono infrastrutture agili, sovrane e trasparenti, progettate nativamente per i carichi di lavoro AI.
Tuttavia, il percorso di consolidamento è già all’orizzonte. Secondo diverse analisi di mercato, molti neocloud attuali operano come risposta contingente alla scarsità di GPU e rischiano di non reggere sul lungo periodo. Gli ingenti investimenti in data center e l’assenza di linee di ricavo diversificate – come quelle su cui possono contare gli hyperscaler – espongono queste aziende a forti pressioni finanziarie. È probabile che solo i player con maggiore solidità e partnership strategiche sopravvivranno, mentre altri diventeranno target di acquisizioni da parte dei grandi operatori.
Un’altra direttrice di sviluppo sarà la specializzazione. I provider più promettenti sono quelli che riescono a differenziarsi su segmenti precisi: infrastrutture sovrane per mercati regolamentati, modelli di business basati sulla sostenibilità energetica, piattaforme developer-first per accelerare il time-to-market delle startup. In questo senso, i neocloud stanno contribuendo a ridefinire la catena del valore dell’AI, assumendo il ruolo di nuovi “gatekeeper” nell’accesso a GPU e infrastrutture di calcolo avanzato.
Guardando avanti, la vera sfida sarà trovare un equilibrio tra scalabilità, sostenibilità e trasparenza. Le imprese chiederanno prezzi più prevedibili, contratti più chiari e un’integrazione sempre più fluida con ecosistemi multicloud e hybrid cloud. Allo stesso tempo, governi e regolatori giocheranno un ruolo decisivo nel favorire provider locali in grado di garantire sovranità digitale e sicurezza.




