La prima fase dell’adozione aziendale dell’intelligenza artificiale è stata segnata da una spinta quasi senza freni: più chatbot, più assistenti per il codice, più automazione nei reparti tecnici e operativi. Ora il quadro cambia. Diverse grandi aziende che avevano portato gli strumenti di AI sulle scrivanie dei dipendenti stanno introducendo limiti di spesa, tetti ai consumi e indicazioni più severe su quando usare davvero questi sistemi. Il punto non è un ripensamento strategico sull’AI, ma il prezzo della sua industrializzazione. Secondo il Financial Times, Amazon, Walmart, Uber, Cisco e Meta hanno già adottato misure per contenere usi ritenuti dispersivi o troppo costosi.
Il nodo è emerso con più forza quando molte attività sono passate dal semplice chatbot agli agenti. Un agente non si limita a rispondere a una domanda: esegue passaggi multipli, interroga strumenti esterni, richiama altri modelli, produce codice, documenti o azioni automatiche. Ogni passaggio consuma capacità di calcolo e quindi token, cioè l’unità di misura con cui molti fornitori fatturano i modelli. Più workflow, più contesto, più iterazioni: la spesa sale.
Goldman Sachs Research prevede che l’uso degli agenti possa portare a un aumento di 24 volte del consumo di token entro il 2030. (Fonte: goldmansachs.com)
Indice degli argomenti:
Dai chatbot agli agenti: perché la bolletta cresce
Il cambiamento è tecnico ma ha un effetto molto concreto sui bilanci. OpenAI spiega nella propria documentazione che le api sono tariffate in base ai token di input e output, con costi diversi a seconda del modello e degli strumenti collegati. Anche Anthropic pubblica listini per milione di token e segnala differenze significative tra modelli più avanzati e versioni meno costose. Questo significa che una richiesta più lunga, un contesto più ampio o una catena di operazioni autonome possono moltiplicare la spesa in modo poco visibile per il singolo dipendente ma molto evidente per il direttore finanziario.
Costi Perricos, responsabile globale per l’AI generativa in Deloitte, dichiara che i costi di calcolo stanno entrando nelle valutazioni di Cfo e consigli di amministrazione, dopo una fase in cui consumatori e imprese erano stati abituati a percepire l’AI come economica o quasi gratuita.
Anche Sam Altman, amministratore delegato di OpenAI, ha definito il costo un “grande problema” per i clienti nel 2026, segno che la questione non riguarda più solo i fornitori di infrastrutture ma è ormai entrata nella gestione ordinaria delle imprese.
Uber e Walmart: i limiti arrivano nei reparti
Il caso più netto è quello di Uber. La società ha introdotto un tetto di utilizzo che limita i dipendenti a 1.500 dollari al mese di spesa in token per i singoli strumenti di AI, dopo aver esaurito entro aprile l’intero budget ai previsto per il 2026. Andrew Macdonald, presidente e chief operating officer del gruppo, ha spiegato che è diventato più difficile giustificare la spesa quando non si riesce a collegarla in modo chiaro a un aumento misurabile delle funzionalità utili per gli utenti.
Walmart si è mossa in modo simile. Il gruppo ha limitato l’uso del proprio agente interno fissando un numero massimo di token disponibili ai dipendenti. Suresh Kumar, chief technology officer globale, ha detto che l’uso della piattaforma interna Code Puppy è cresciuto molto rapidamente e che per questo serviva una pausa per capire quali strumenti fossero davvero appropriati per i singoli compiti. Il segnale è chiaro: la fase dell’adozione indiscriminata lascia spazio a una gestione più selettiva.
Amazon, Meta e la fine dell’AI “per fare classifica”
Amazon ha corretto anche il messaggio interno. L’azienda ha invitato i dipendenti a smettere di usare “AI solo per il gusto di usare AI”, dopo che alcuni ingegneri avevano iniziato a distribuire agenti anche per scalare classifiche interne legate all’adozione. Il gruppo ha quindi modificato il modo in cui misura il successo dell’adozione, nel tentativo di frenare costi associati a un uso improprio degli strumenti. Meta avrebbe preso misure analoghe già ad aprile.
Per aziende di queste dimensioni il problema non è soltanto il prezzo pagato a terzi. Amazon e Meta hanno modelli sviluppati internamente, ma continuano a dipendere anche da fornitori esterni per strumenti, servizi e casi d’uso specializzati. Quando l’ecosistema AI in azienda si compone di modelli proprietari, modelli di terzi, tool di coding e agenti integrati nei processi, la governance dei costi diventa più complessa. Ogni team tende a massimizzare l’utilità del proprio flusso di lavoro. La direzione finanziaria, invece, chiede una prova sul ritorno economico.
Cisco: più agenti, più infrastruttura
Jeetu Patel, presidente e chief product officer di Cisco, ha descritto bene il salto di scala. Un agente, ha spiegato, richiede molta più infrastruttura di un chatbot. Per ogni persona possono esserci 10, 100 o perfino 1.000 agenti software che continuano a lavorare senza pausa e consumano capacità di calcolo. La differenza è decisiva: il chatbot è una conversazione, l’agente è una fabbrica di richieste, controlli e azioni. Quando questa logica entra in reparti come sviluppo, assistenza, compliance o operations, il consumo di token e cloud sale in modo quasi strutturale.
La previsione di Goldman Sachs si inserisce qui. Il report di maggio 2026 sostiene che l’esplosione dei consumi legata agli agenti possa aggravare la tensione sull’offerta di chip nei prossimi 12-18 mesi, pur in un contesto in cui il costo unitario per token tende a scendere. In altri termini, il singolo token può diventare più economico, ma il numero di token usati cresce talmente tanto da mettere comunque pressione a budget e infrastrutture. (Fonte: goldmansachs.com)

Workato: “abbiamo creato un mostro”
Il caso di Workato mostra perché il problema non riguarda solo i giganti della Silicon Valley. L’azienda software, circa 1.300 dipendenti, ha visto esplodere l’uso degli agenti dopo la diffusione interna avviata nell’estate del 2025. Il chief information officer Carter Busse riporta che la spesa è aumentata di sette volte in un solo giorno quando Anthropic ha spostato l’azienda su un modello di prezzo basato sui token nel maggio 2026. La frase riportata dal Financial Times è diventata il simbolo di questa fase: “abbiamo creato un mostro”.
La risposta di Workato non è stata il blocco dell’accesso, ma una disciplina più stretta. Le sessioni interne dedicate all’abilitazione AI, che prima servivano a stimolare l’innovazione, sono state riorientate verso la “responsabilità finanziaria” nell’uso dell’AI. Tradotto: usare modelli più vecchi e meno costosi quando bastano, evitare sprechi, scegliere il livello di potenza adeguato al compito. È una logica che si ritrova anche nelle piattaforme dei fornitori.
I fornitori spingono il routing per tagliare la spesa
Mentre le imprese cercano di frenare la crescita della bolletta, i provider stanno costruendo strumenti per instradare ogni richiesta al modello più adatto per costo, qualità e latenza. Microsoft descrive il proprio model router in Foundry come un sistema che analizza il prompt in tempo reale e lo invia al modello più adatto tra quelli disponibili. Amazon Bedrock offre funzionalità di intelligent prompt routing con lo stesso obiettivo: evitare che ogni attività venga eseguita sul modello più potente e più caro.
Google sta spingendo in parallelo una linea finops per l’era dell’AI. Ad aprile 2026 Google Cloud ha presentato strumenti di visibilità e “spend caps” pensati per dare ai clienti limiti di spesa e controllo più fine sui costi generati dai carichi AI. Il messaggio del mercato è coerente: non basta vendere più modelli, bisogna offrire alle aziende modi pratici per non perdere il controllo del conto economico.
La pressione dei modelli cinesi
Un altro fattore che pesa sulle scelte delle imprese è la concorrenza di modelli cinesi più economici. Il Financial Times ha scritto in aprile che, secondo i dati di OpenRouter, dall’inizio del 2026 i modelli cinesi hanno superato quelli statunitensi nel consumo di token sulla piattaforma. Lo stesso articolo attribuisce questo vantaggio a costi energetici inferiori e a modelli più efficienti, con prezzi che in alcuni casi risultano molto sotto quelli dei principali gruppi americani.
Per le aziende clienti il punto non è solo geopolitico. È una questione di procurement. Se la differenza di prezzo tra modelli è ampia, la tentazione di usare versioni meno costose per una parte consistente dei carichi aumenta. In parallelo cresce l’interesse per modelli open source o open weight da eseguire in locale, sui server aziendali o persino sui dispositivi, così da ridurre la dipendenza dai laboratori AI e dai grandi cloud provider.
Dalla corsa all’adozione alla prova del ritorno economico
Per oltre un anno il mercato ha premiato soprattutto la velocità di adozione. Le aziende dovevano mostrare agli investitori che stavano sperimentando, distribuendo copiloti, automatizzando processi e formando i dipendenti. Adesso il criterio si sta spostando. La domanda non è più quante persone usano l’AI, ma quali attività producono un beneficio misurabile rispetto al costo dei token, del cloud, della sicurezza e della supervisione umana. Lo stesso Kyle Daigle, chief operating officer di GitHub, ha spiegato che la vera domanda per l’utente è quale modello sia più adatto al compito, non se si debba usare sempre il modello di frontiera.
Questo passaggio può avere effetti anche sui ricavi futuri dei grandi laboratori AI. Se i clienti aziendali iniziano a spostare parte dei carichi su modelli meno costosi, router intelligenti o soluzioni locali, la crescita della domanda resta alta ma il mix di ricavi cambia. Il mercato enterprise continua a spendere, però con maggiore selettività. Non è una frenata dell’AI in sé. È la fine della fase in cui quasi ogni uso sembrava giustificato dal solo entusiasmo per la tecnologia.
Il conto finale è politico, industriale e finanziario
La stretta sui consumi non segnala che l’AI stia perdendo centralità nelle imprese. Segnala il contrario: sta entrando nei centri di costo veri, nei budget annuali, nelle policy interne e nei criteri con cui si approvano gli investimenti. Quando una tecnologia diventa spesa strutturale, smette di essere una sperimentazione.
Per questo Amazon, Walmart, Uber, Cisco e altre società stanno cambiando linguaggio: meno celebrazione dell’adozione, più attenzione alla produttività effettiva e al prezzo di ogni workflow. La prossima fase dell’AI aziendale si giocherà qui, nella capacità di usare più automazione senza trasformare i token in una voce fuori controllo.




Partecipa alla community