Microsoft e Uber stanno offrendo uno dei primi segnali concreti di un problema che finora era rimasto sullo sfondo del dibattito sull’AI: l’adozione su larga scala può far crescere i costi più rapidamente dei benefici misurabili. Non perché la tecnologia non funzioni, ma perché quando entra nei flussi quotidiani di sviluppo, prodotto e operations cambia radicalmente la struttura della spesa.
Secondo un recente report di The Verge, Microsoft ha iniziato a revocare gran parte delle licenze dirette di Claude Code, spingendo gli ingegneri verso GitHub Copilot CLI. Il punto rilevante, al di là della scelta di prodotto, è che la correzione arriva pochi mesi dopo l’apertura dell’accesso interno a migliaia di dipendenti.
Nel caso di Uber, il segnale è ancora più esplicito: The Information, ripreso poi da altri osservatori del settore, ha riferito che il budget 2026 per gli strumenti AI di coding sarebbe stato sostanzialmente esaurito già entro aprile.
Indice degli argomenti:
I costi AI enterprise emergono quando l’uso diventa davvero diffuso
Per mesi il racconto dominante sull’AI enterprise si è concentrato soprattutto sulla produttività attesa. I casi più recenti spostano l’attenzione su un’altra variabile: che cosa succede ai conti quando l’adozione interna non resta sperimentale ma diventa comportamento diffuso.
Nel caso Microsoft, la retromarcia sulle licenze dirette di Claude Code non equivale a un abbandono dei modelli Anthropic. Il report di The Verge segnala piuttosto un riordino verso strumenti più direttamente governabili all’interno dell’ecosistema GitHub e Copilot. È un dettaglio importante, perché suggerisce che il problema non è soltanto quale modello usare, ma quale interfaccia, quale procurement e quale visibilità di spesa un’azienda riesce a sostenere.
Uber mostra la stessa tensione da un altro lato. L’adozione degli strumenti AI per il coding era stata incentivata internamente, ma la crescita d’uso avrebbe superato le ipotesi di budget. Quando il consumo è tariffato a token o a chiamata e i team iniziano a integrare l’AI in modo continuo, il conto non cresce in modo lineare.
Perché i token cambiano l’economia dell’AI enterprise
Il nodo dei costi AI enterprise sta qui. Più l’AI viene incorporata nei processi, più aumenta il numero di interazioni, tentativi, revisioni, chiamate a modelli e catene di task. È questa dinamica che rende i workflow agentici molto diversi dalla semplice esperienza di un chatbot.
Gartner, nella previsione pubblicata il 25 marzo 2026, stima che entro il 2030 il costo di inferenza per un LLM da un trilione di parametri potrà scendere di oltre il 90% rispetto al 2025. Ma la stessa società di analisi avverte che questo calo non si tradurrà automaticamente in AI enterprise più economica. La ragione è chiara: i modelli agentici richiedono da 5 a 30 volte più token per task rispetto a un chatbot standard, e la crescita dei volumi può superare la riduzione del costo unitario.
Goldman Sachs Research, in un’analisi pubblicata il 20 maggio 2026, spinge ancora oltre il ragionamento: l’adozione di agenti da parte di imprese e consumatori potrebbe portare il consumo mensile a 120 quadrilioni di token entro il 2030, pari a un aumento di 24 volte rispetto ai livelli iniziali considerati dal report. Il dato interessa non solo i provider, ma anche i buyer enterprise: se il prezzo per token scende e il numero di token esplode, il totale pagato può comunque salire.
I workflow agentici non sono soltanto più potenti: sono molto più costosi
Un’indicazione utile arriva anche dalla ricerca accademica. Un preprint pubblicato su arXiv nell’aprile 2026 da Longju Bai e coautori, dedicato al consumo di token nei task di coding agentico, rileva che queste attività possono consumare fino a 1000 volte più token rispetto a forme più semplici di code reasoning e code chat. Lo studio aggiunge due elementi che interessano direttamente chi deve governare la spesa.
Il primo è la forte variabilità: esecuzioni dello stesso task possono differire fino a 30 volte nel consumo totale di token. Il secondo è che più spesa non significa automaticamente più accuratezza. In molti casi, osservano gli autori, le performance migliorano fino a una soglia intermedia e poi tendono a saturare.
Questa è una cattiva notizia per i responsabili di budget, perché rende più difficile prevedere il costo reale di un task e più fragile l’idea che basti aumentare l’uso per ottenere ritorni proporzionali.
La tabella riassume i numeri che oggi descrivono meglio la pressione sui costi AI enterprise
| Indicatore | Fonte | Dato chiave | Implicazione |
|---|---|---|---|
| Riduzione attesa del costo di inferenza entro il 2030 | Gartner, marzo 2026 | Oltre -90% vs 2025 | Il costo unitario scende, ma non basta a garantire risparmio finale |
| Token richiesti da modelli agentici vs chatbot standard | Gartner, marzo 2026 | 5-30x per task | I flussi avanzati moltiplicano il consumo |
| Crescita attesa del consumo mensile di token entro il 2030 | Goldman Sachs Research, maggio 2026 | 24x fino a 120 quadrilioni al mese | La scala d’uso può far crescere la spesa aggregata |
| Consumo di token nei task di coding agentico | Bai et al., arXiv, aprile 2026 | Fino a 1000x vs code chat/reasoning | I casi d’uso più autonomi sono i più costosi da sostenere |
Dai casi limite a una nuova agenda per Cio e Cfo
I casi Microsoft e Uber non dimostrano da soli che l’AI costi più del lavoro umano in ogni contesto. Dimostrano però qualcosa di più utile per le aziende: i modelli economici dell’adozione sono ancora instabili. Quando un’organizzazione spinge l’uso con classifiche interne, target di consumo o incentivi impliciti, rischia di ottimizzare la metrica sbagliata.
La frase più netta sul punto è arrivata da Bryan Catanzaro, vicepresidente applied deep learning di Nvidia, che in un’intervista ad Axios ha spiegato che, nel suo team, il costo del compute supera di molto quello dei dipendenti. Non è una misura universale, ma è una dichiarazione significativa perché arriva da uno dei protagonisti dell’infrastruttura AI globale.
Intanto il mercato continua a promettere una crescita massiccia degli agenti. Jensen Huang, CEO di Nvidia, ha ipotizzato a marzo 2026 un futuro in cui ogni dipendente lavori affiancato da 100 agenti AI. La visione è coerente con la traiettoria del settore, ma apre una domanda molto concreta per chi compra tecnologia: quanto costerà davvero governare quella scala, con quali margini e con quale disciplina operativa.
Il vero test dei costi AI enterprise è la misurabilità del ritorno
La prossima fase dell’AI enterprise probabilmente non sarà definita dall’entusiasmo per l’adozione, ma dalla capacità di collegare spesa, uso e risultati. Le aziende che continueranno a investire con efficacia saranno quelle capaci di introdurre metriche più mature: costo per workflow completato, costo per ticket risolto, tempo effettivamente risparmiato, qualità del codice, riduzione del rework, impatto su margini o ricavi.
Finché l’AI verrà spinta soprattutto come volume di utilizzo, il rischio sarà continuare a confondere sperimentazione diffusa con produttività dimostrata. E proprio qui i casi emersi nelle ultime settimane smettono di essere semplici curiosità interne ai big tech: diventano un avvertimento per tutto il mercato enterprise.
Fonti



