analisi

Costi AI in azienda, Microsoft e Uber mostrano il nodo dei token



Indirizzo copiato

Più l’AI viene usata, più il conto rischia di salire. Dietro la corsa all’adozione nelle grandi aziende emerge un problema di token, inferenza e governance dei costi che può cambiare le strategie di Cio, Cfo e responsabili di prodotto

Pubblicato il 28 mag 2026



1774986668_copertina_verticale_AI_2026-1
AI Questions Icon
Chiedi all'AI
Riassumi questo articolo
Approfondisci con altre fonti

Punti chiave

  • L’adozione su larga scala può aumentare i costi più dei benefici: casi di Microsoft (revoca licenze Claude Code, spinta a GitHub Copilot CLI) e Uber che ha esaurito budget AI 2026.
  • La tariffazione a token rende i workflow agentici molto costosi: Gartner e ricerche mostrano 5–30× o fino a 1000× più token per task e forte variabilità dei consumi.
  • Servono governance e metriche: misurare costo per workflow, qualità del codice e ritorno economico; avvertimento di Nvidia sulla prevalenza del costo compute rispetto al personale.
Riassunto generato con AI

Microsoft e Uber stanno offrendo uno dei primi segnali concreti di un problema che finora era rimasto sullo sfondo del dibattito sull’AI: l’adozione su larga scala può far crescere i costi più rapidamente dei benefici misurabili. Non perché la tecnologia non funzioni, ma perché quando entra nei flussi quotidiani di sviluppo, prodotto e operations cambia radicalmente la struttura della spesa.

Secondo un recente report di The Verge, Microsoft ha iniziato a revocare gran parte delle licenze dirette di Claude Code, spingendo gli ingegneri verso GitHub Copilot CLI. Il punto rilevante, al di là della scelta di prodotto, è che la correzione arriva pochi mesi dopo l’apertura dell’accesso interno a migliaia di dipendenti.

Nel caso di Uber, il segnale è ancora più esplicito: The Information, ripreso poi da altri osservatori del settore, ha riferito che il budget 2026 per gli strumenti AI di coding sarebbe stato sostanzialmente esaurito già entro aprile.

I costi AI enterprise emergono quando l’uso diventa davvero diffuso

Per mesi il racconto dominante sull’AI enterprise si è concentrato soprattutto sulla produttività attesa. I casi più recenti spostano l’attenzione su un’altra variabile: che cosa succede ai conti quando l’adozione interna non resta sperimentale ma diventa comportamento diffuso.

Nel caso Microsoft, la retromarcia sulle licenze dirette di Claude Code non equivale a un abbandono dei modelli Anthropic. Il report di The Verge segnala piuttosto un riordino verso strumenti più direttamente governabili all’interno dell’ecosistema GitHub e Copilot. È un dettaglio importante, perché suggerisce che il problema non è soltanto quale modello usare, ma quale interfaccia, quale procurement e quale visibilità di spesa un’azienda riesce a sostenere.

Uber mostra la stessa tensione da un altro lato. L’adozione degli strumenti AI per il coding era stata incentivata internamente, ma la crescita d’uso avrebbe superato le ipotesi di budget. Quando il consumo è tariffato a token o a chiamata e i team iniziano a integrare l’AI in modo continuo, il conto non cresce in modo lineare.

Perché i token cambiano l’economia dell’AI enterprise

Il nodo dei costi AI enterprise sta qui. Più l’AI viene incorporata nei processi, più aumenta il numero di interazioni, tentativi, revisioni, chiamate a modelli e catene di task. È questa dinamica che rende i workflow agentici molto diversi dalla semplice esperienza di un chatbot.

Gartner, nella previsione pubblicata il 25 marzo 2026, stima che entro il 2030 il costo di inferenza per un LLM da un trilione di parametri potrà scendere di oltre il 90% rispetto al 2025. Ma la stessa società di analisi avverte che questo calo non si tradurrà automaticamente in AI enterprise più economica. La ragione è chiara: i modelli agentici richiedono da 5 a 30 volte più token per task rispetto a un chatbot standard, e la crescita dei volumi può superare la riduzione del costo unitario.

Goldman Sachs Research, in un’analisi pubblicata il 20 maggio 2026, spinge ancora oltre il ragionamento: l’adozione di agenti da parte di imprese e consumatori potrebbe portare il consumo mensile a 120 quadrilioni di token entro il 2030, pari a un aumento di 24 volte rispetto ai livelli iniziali considerati dal report. Il dato interessa non solo i provider, ma anche i buyer enterprise: se il prezzo per token scende e il numero di token esplode, il totale pagato può comunque salire.

I workflow agentici non sono soltanto più potenti: sono molto più costosi

Un’indicazione utile arriva anche dalla ricerca accademica. Un preprint pubblicato su arXiv nell’aprile 2026 da Longju Bai e coautori, dedicato al consumo di token nei task di coding agentico, rileva che queste attività possono consumare fino a 1000 volte più token rispetto a forme più semplici di code reasoning e code chat. Lo studio aggiunge due elementi che interessano direttamente chi deve governare la spesa.

Il primo è la forte variabilità: esecuzioni dello stesso task possono differire fino a 30 volte nel consumo totale di token. Il secondo è che più spesa non significa automaticamente più accuratezza. In molti casi, osservano gli autori, le performance migliorano fino a una soglia intermedia e poi tendono a saturare.

Questa è una cattiva notizia per i responsabili di budget, perché rende più difficile prevedere il costo reale di un task e più fragile l’idea che basti aumentare l’uso per ottenere ritorni proporzionali.

La tabella riassume i numeri che oggi descrivono meglio la pressione sui costi AI enterprise

IndicatoreFonteDato chiaveImplicazione
Riduzione attesa del costo di inferenza entro il 2030Gartner, marzo 2026Oltre -90% vs 2025Il costo unitario scende, ma non basta a garantire risparmio finale
Token richiesti da modelli agentici vs chatbot standardGartner, marzo 20265-30x per taskI flussi avanzati moltiplicano il consumo
Crescita attesa del consumo mensile di token entro il 2030Goldman Sachs Research, maggio 202624x fino a 120 quadrilioni al meseLa scala d’uso può far crescere la spesa aggregata
Consumo di token nei task di coding agenticoBai et al., arXiv, aprile 2026Fino a 1000x vs code chat/reasoningI casi d’uso più autonomi sono i più costosi da sostenere

Dai casi limite a una nuova agenda per Cio e Cfo

I casi Microsoft e Uber non dimostrano da soli che l’AI costi più del lavoro umano in ogni contesto. Dimostrano però qualcosa di più utile per le aziende: i modelli economici dell’adozione sono ancora instabili. Quando un’organizzazione spinge l’uso con classifiche interne, target di consumo o incentivi impliciti, rischia di ottimizzare la metrica sbagliata.

La frase più netta sul punto è arrivata da Bryan Catanzaro, vicepresidente applied deep learning di Nvidia, che in un’intervista ad Axios ha spiegato che, nel suo team, il costo del compute supera di molto quello dei dipendenti. Non è una misura universale, ma è una dichiarazione significativa perché arriva da uno dei protagonisti dell’infrastruttura AI globale.

Intanto il mercato continua a promettere una crescita massiccia degli agenti. Jensen Huang, CEO di Nvidia, ha ipotizzato a marzo 2026 un futuro in cui ogni dipendente lavori affiancato da 100 agenti AI. La visione è coerente con la traiettoria del settore, ma apre una domanda molto concreta per chi compra tecnologia: quanto costerà davvero governare quella scala, con quali margini e con quale disciplina operativa.

Il vero test dei costi AI enterprise è la misurabilità del ritorno

La prossima fase dell’AI enterprise probabilmente non sarà definita dall’entusiasmo per l’adozione, ma dalla capacità di collegare spesa, uso e risultati. Le aziende che continueranno a investire con efficacia saranno quelle capaci di introdurre metriche più mature: costo per workflow completato, costo per ticket risolto, tempo effettivamente risparmiato, qualità del codice, riduzione del rework, impatto su margini o ricavi.

Finché l’AI verrà spinta soprattutto come volume di utilizzo, il rischio sarà continuare a confondere sperimentazione diffusa con produttività dimostrata. E proprio qui i casi emersi nelle ultime settimane smettono di essere semplici curiosità interne ai big tech: diventano un avvertimento per tutto il mercato enterprise.

Fonti

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati

0
Lascia un commento, la tua opinione conta.x