Un team raddoppia il consumo di Claude in un mese. Fino a ieri era un dato che un responsabile IT scopriva a fine ciclo, sulla fattura, quando ormai la corsa era finita e restava solo la sorpresa. Con i nuovi controlli per Claude Enterprise annunciati il 2 luglio, quello stesso raddoppio si vede mentre accade, accanto al suo costo, scomposto per gruppo e per singola persona.
Il contesto lo inquadra Anthropic quando osserva che, man mano che Claude prende in carico lavoro agentico sempre più complesso in tutta l’azienda, i pattern di uso e di costo iniziano a somigliare poco a quelli di un normale strumento di chat. Un assistente conversazionale ha un costo quasi lineare, prevedibile, ancorato al numero di persone che lo usano.
Un agente che apre file, esegue skill, orchestra connettori e produce artefatti consuma in modo discontinuo, a strappi, legato a cosa sta facendo e non a quante persone lo hanno aperto.

Indice degli argomenti:
Dal chatbot al lavoro agentico, la bolletta cambia forma
Il salto dal pilot alla produzione è il momento in cui questa differenza si fa sentire. Nei mesi di sperimentazione i costi restano piccoli e la domanda quasi non si pone. Poi l’adozione cresce, gli agenti entrano nei processi reali, e la spesa inizia a muoversi con una logica che il vecchio cruscotto per utente non riesce più a leggere. A valle di questo passaggio la voce di costo dell’AI smette di essere una riga marginale e diventa qualcosa che una direzione finanziaria guarda con attenzione, mese dopo mese.
Per un CTO o un innovation manager il rischio, in questa fase, è di trovarsi davanti a due strade entrambe sbagliate. Lasciar correre e scoprire il conto a consuntivo, oppure tagliare alla cieca e frenare proprio chi con l’AI sta producendo di più. Serve una terza via, e passa dalla capacità di leggere l’uso mentre avviene.
Analytics, vedere prima di tagliare
Il primo istinto, davanti a una spesa che accelera, è metterci un tetto e stringere. Ma un limite calato senza sapere dove il valore si concentra rischia di fermare le persone che stanno producendo di più. Carter Busse, CIO di Workato, racconta di non voler rallentare chi sta trainando il trimestre migliore, e aggiunge che nemmeno il suo direttore finanziario glielo chiede: la domanda che gli arriva riguarda il ritorno, non il contenimento.
La sua azienda ha collegato Claude ai propri server MCP e ha legato quell’uso a un incremento di fatturato del 4 per cento, e vedere il costo accanto all’impatto per team è ciò che gli permette di sostenere quel ragionamento davanti al vertice.
Qui sta il ribaltamento di prospettiva. La visibilità granulare non serve a spaventare chi consuma troppo, serve a capire dove l’investimento rende e dove invece si disperde. Il cruscotto di analytics per gli amministratori ora mostra uso e costo per gruppo e per utente, con accanto gli artefatti creati, i file modificati, le skill e i connettori attivati. Le stesse metriche si filtrano per i gruppi SCIM che l’IT già gestisce, così la lettura segue l’organigramma esistente invece di imporne uno nuovo. La stessa visibilità si estende al singolo utente, che vede i propri consumi e il progresso verso il limite, senza arrivare impreparato al blocco.
Entitlement per modello: il default non parte dall’opzione più cara
Sul piano operativo il primo strumento di controllo agisce prima ancora che parta la conversazione. Con i default e gli entitlement per modello un amministratore decide quale modello Claude apre le nuove conversazioni in chat, in Cowork e in Claude Code, così che il lavoro di routine non finisca per girare sempre sull’opzione più costosa. La stessa leva stabilisce quali modelli restano disponibili per un ruolo specifico o per l’intera organizzazione.
Dentro la console, Claude Code aggiunge due schede, una sull’uso e una sul valore. La prima riporta gli sviluppatori attivi, il numero di sessioni e i comandi più frequenti nell’organizzazione, con aggiornamento quotidiano. La seconda prova a tradurre quell’attività in termini che un dirigente riconosce: stima dell’aumento di produttività, costo per commit, valore annuo. Ogni formula resta visibile nella scheda e i suoi parametri si possono modificare, il che evita il numero-oracolo calato dall’alto e apre invece una discussione su come quel numero è stato costruito.
Soglie di spesa al 75 e al 90 per cento prima del blocco
Il secondo blocco tecnico riguarda la spesa vera e propria. Gli avvisi di soglia notificano gli amministratori al 75 e al 90 per cento del limite a livello di organizzazione, con il margine per alzare il tetto prima che qualcuno resti bloccato a metà di un compito. Gli utenti ricevono un avviso in-app al 75 e al 95 per cento e possono chiedere un aumento del limite direttamente al proprio amministratore, senza uscire da Claude.
Chi gestisce limiti su molti gruppi sposta questi flussi in script attraverso l’Admin API, per far scalare i controlli insieme all’organizzazione, automatizzando le richieste di aumento e segnalando chi si avvicina alla soglia.

Il pezzo che chiude il cerchio è l’Analytics API. I dati di uso e costo diventano interrogabili in modo programmatico, filtrabili per intervallo di date, team, prodotto o modello, e finanza e IT li portano dentro gli strumenti che già usano ogni giorno, da Datadog Cloud Cost Management a CloudZero, accanto al resto della spesa cloud. Le skill riportano il proprio consumo e nuovi endpoint tracciano l’adozione dei plugin e la creazione di artefatti.
Kyra Abbu, product manager, ricorda che la visibilità sui costi non è un esercizio da fare una volta al mese, e che avvisi e dati granulari danno ai team una spinta regolare a rivalutare come stanno usando Claude, al posto della sorpresa a fine fatturazione.
Il segnale di valore sono le skill rieseguite, non i token
Resta la questione più difficile, quella su cosa misurare davvero. Ciro Yamada, product director in Nubank, invita a diffidare del dato più immediato: il consumo di token, da solo, dice poco. Il segnale da osservare è quali skill vengono rieseguite di continuo in tutta l’organizzazione, perché è lì che affiora il valore reale, nell’uso che si ripete perché funziona e non perché qualcuno lo impone.
È un cambio di sguardo che sposta il baricentro dal contenimento alla decisione. Gli strumenti per vedere e per contenere ora ci sono, documentati fin nei dettagli per iniziare. La parte scoperta è un’altra, ed è la più scomoda: una volta che il costo di ogni team e delle skill che quel team mette al lavoro è finalmente sotto gli occhi, resta da decidere quali di quelle attività meritano di crescere e quali stavamo alimentando solo perché nessuno, fino a ieri, ne vedeva il conto.







Partecipa alla community