analisi

AI in azienda: quanto costa? Ecco tre leve per spendere meno e meglio



Indirizzo copiato

La voce relativa all’intelligenza artificiale generativa occupa un posto rilevante nei budget. Licenze sovrapposte, modelli premium usati per task banali, abbonamenti che mascherano i consumi reali: le PMI rischiano di pagare più di quanto necessario. Tre le leve di ottimizzazione che permettono di ridurre la spesa senza intaccare la produttività

Pubblicato il 8 mag 2026

Gioele Fierro

CEO e Founder Promezio Engineering



ottimizzazione costi AI
AI Questions Icon
Chiedi all'AI
Riassumi questo articolo
Approfondisci con altre fonti

Il bilancio AI di Uber per il 2026 è stato interamente esaurito nei primi tre mesi: gli ingegneri che usano Claude Code hanno bruciato in pochi mesi tutto il budget annuale dell’azienda. In Meta, i dipendenti hanno consumato 60,2 trilioni di token in trenta giorni, una cifra che, ai prezzi di listino dell’API di Anthropic, vale circa 900 milioni di dollari, anche scontando le tariffe enterprise. Un singolo ingegnere di OpenAI ha processato 210 miliardi di token in una settimana, l’equivalente di circa 33 volte la dimensione di Wikipedia.

Questi sono dati emersi a fine aprile dall’inchiesta del New York Times sul fenomeno del tokenmaxxing, il consumo deliberatamente esteso degli strumenti AI come forma di status interno. Questi eccessi sono storie da Silicon Valley, ma la stessa dinamica, in scala minore, inizia a riguardare anche i conti delle PMI.

Il problema: spesa che cresce, governance che resta indietro

Il prezzo unitario dei token, vale a dire le unità minime di testo che i modelli linguistici elaborano, è in calo da due anni. Ogni nuova generazione costa meno della precedente a parità di capacità. La bolletta complessiva delle aziende, però, continua a salire: anche se la riduzione del prezzo per token ha reso più economico il singolo prompt, il consumo aggregato è divenuto più imprevedibile e i casi d’uso sono diventati più complessi e richiedono modelli più grandi e più capaci. Gli agenti autonomi, le finestre di contesto da un milione di token, le chiamate ricorsive e i workflow con tool calling moltiplicano le richieste.

Secondo gli Osservatori Startup Thinking e Digital Transformation Academy del Politecnico di Milano, il budget ICT delle imprese italiane crescerà dell’1,8% nel 2026. Nelle PMI, l’intelligenza artificiale arriva al dodicesimo posto fra le priorità di investimento, con il 19% delle aziende che la considera un’area prioritaria.

Un’ipotetica azienda manifatturiera che attiva Microsoft 365 Copilot per l’integrazione con la suite Office, sottoscrive ChatGPT Plus per il marketing, affiancato a Claude Pro per la direzione tecnica, su quaranta dipendenti spende diverse decine di migliaia di euro l’anno solo in licenze, prima ancora di calcolare eventuali consumi API delle automazioni che girano in background.

Il rischio concreto è bruciare denaro perché si pagano strumenti differenti che fanno la stessa cosa e si usano modelli premium per compiti che, in realtà, richiederebbero modelli di fascia bassa. In molti casi, inoltre, nella fase di scelta mancano le valutazioni che permettano di comprendere quando conviene usare le API e quando, invece, converrebbero gli abbonamenti.

Prima leva: l’audit dei tool e il taglio delle ridondanze

L’impiegato medio usa oggi 13 strumenti SaaS (Software as a Service), contro i 7 del 2022, con una crescita dell’85% in due anni (rapporto Torii). Le organizzazioni sprecano in media il 24% del budget SaaS in applicazioni inutilizzate o ridondanti. In numeri, questo significa che un’azienda che spende 100mila euro l’anno in licenze software spreca 24mila euro in tool che non producono valore.

Nel campo specifico dell’AI, il problema della sovrapposizione è particolarmente acuto, perché ogni vendor sta espandendo l’offerta verso le stesse funzionalità. Microsoft 365 Copilot, ChatGPT Plus, Claude Pro, Google AI Pro e Gemini Advanced offrono tutti, in misura diversa, sintesi di documenti, generazione di email, riassunti di riunioni e supporto alla scrittura. Se aggiungiamo alla lista gli strumenti specializzati, possiamo facilmente immaginare scenari in cui un’impresa, per alcuni dipendenti, può ritrovarsi sei o sette abbonamenti AI attivi, magari acquisiti da dipartimenti differenti.

Un primo strumento per evitare il proliferare dei costi superflui è un inventario completo e sempre aggiornato degli strumenti AI in uso, ottenuto incrociando i log di Single Sign-On, le note spese sulle carte aziendali e le interviste ai responsabili di funzione.

Un secondo passaggio importante è la classificazione per funzione. Una matrice semplice mette sulle righe i casi d’uso (scrittura testi, analisi dati, sintesi documenti, trascrizione meeting, generazione codice, ricerca web, immagini) e sulle colonne gli strumenti attivi. Le caselle con due o più crocette sono candidate al consolidamento. Il principio di Vertice e dei principali framework di SaaS Management è che un caso d’uso ad alta frequenza dovrebbe essere coperto da uno strumento principale, mentre i tool specialistici sopravvivono solo dove portano un valore distintivo misurabile.

La logica del single front door impone che ogni nuova richiesta di software AI passi da un punto unico di approvazione, di solito un comitato che riunisce IT, finance e l’owner di processo. Senza questa governance, la riduzione di oggi diventa la sovrapposizione di domani.

Per una PMI di 40-50 dipendenti, un audit serio porta tipicamente all’eliminazione di tre o quattro abbonamenti su dieci, con un risparmio annuo che oscilla fra gli 8.000 e i 15.000 euro. Più importante del taglio in sé è il fatto che, dopo l’audit, l’azienda sa esattamente cosa paga e perché.

Seconda leva: il modello giusto per il task giusto

Il listino API di Anthropic ad aprile 2026 fissa Claude Haiku 4.5 a un dollaro per milione di token in input e cinque dollari in output. Claude Sonnet 4.6 costa tre dollari in input e quindici in output. Claude Opus 4.7, il modello di punta, costa cinque dollari in input e venticinque in output. Il modello premium costa quindi cinque volte il modello di fascia bassa per i token in output. Su OpenAI il quadro è simile.

In ottica di ottimizzazione, bisogna individuare con esattezza quale modello è in uso per i vari compiti. In assenza di governance, si tende a usare sempre il più potente: è la scelta di default che porta agli sprechi più grandi. Il principio di base del model routing è il riconoscimento che i task hanno complessità diverse.

Una classificazione, un’estrazione strutturata di dati o una sintesi standard di un documento, sono compiti che modelli piccoli ed economici, come Haiku 4.5 o Gemini 3 Flash, gestiscono con un’accuratezza più che sufficiente. La generazione di contenuti complessi, il ragionamento multi-passo e il coding non triviale richiedono invece modelli più avanzati.

I modelli di frontiera, infine, hanno senso solo per attività dove la qualità marginale conta davvero, come i pareri tecnico-legali, le analisi su documenti molto lunghi o la code review architetturale.

Una ricerca pubblicata su arXiv nell’ottobre 2025 ha mostrato che strategie di routing ben calibrate possono superare in performance il singolo modello più potente, riducendo i costi in misura sostanziale.

Come le Pmi possono risparmiare sull’AI

Per una Pmi, tradurre questa logica in pratica significa segmentare i workflow. L’implementazione tecnica passa da framework come LiteLLM, Portkey o Martian, che fanno da gateway fra l’applicazione e i diversi provider AI, instradando ogni chiamata sul modello più appropriato in base a regole stabilite o a un classificatore di complessità. Per le aziende che non hanno dimensioni sufficienti da giustificare la costruzione di un’infrastruttura dedicata, gli stessi vantaggi possono arrivare da una progettazione esplicita dei prompt.

Anziché un unico assistente generalista, si configurano agenti specializzati che, sotto il cofano, utilizzano modelli diversi.

A questo si aggiungono meccanismi tecnici che riducono ulteriormente i costi senza richiedere routing.

Il prompt caching, disponibile per i principali provider, permette di memorizzare la parte ripetitiva del prompt (un system prompt aziendale, un manuale operativo, un set di esempi) e di pagare per i successivi accessi solo il 10% del costo standard, con un risparmio fino al 90% sull’input ricorrente.

Le API in batch, per i workload non in tempo reale, permettono di ottenere uno sconto del 50% sulla tariffa, in cambio di un tempo di risposta rilassato, entro un certo numero di ore. Sommando caching e batch, il costo effettivo di una chiamata può scendere al 5% del prezzo di listino.

Terza leva: la scelta corretta fra API e abbonamento

Il listino consumer di ChatGPT Plus, Claude Pro e Google AI Pro al momento converge sui 20 euro mensili IVA inclusa per l’utente italiano. Le stesse aziende offrono piani API a consumo: si paga per ogni token effettivamente processato, senza una quota fissa. Le due modalità sembrano alternative e, in molte PMI vengono trattate come opposte. La realtà operativa richiede di sceglierle in base al profilo di consumo.

Il calcolo del break-even è meno complesso di quanto sembri. Un dipendente medio che usa l’AI in modo standard effettua tra le trenta e le cinquanta chiamate al giorno, generando quindi, in un mese di lavoro, fra 600 e 1.000 chiamate, per un costo API che oscilla fra 20 e 30 dollari. Per tale utente, l’abbonamento Pro a 20 dollari è quasi sempre più conveniente, perché include anche l’interfaccia conversazionale, la gestione dei file e l’integrazione con strumenti come Sora o Codex.

Gli utenti conversazionali, come la direzione, il marketing, il commerciale, o l’HR, traggono il massimo valore dagli abbonamenti consumer o dai piani team aziendali.

Gli utenti tecnici intensivi, come sviluppatori e analisti dati, hanno bisogno di piani con limiti più alti. Tutti i workload ripetitivi che possono essere automatizzati andrebbero sempre gestiti tramite API. Qui il prezzo per token, le opzioni di caching, gli sconti batch e il routing fra modelli diventano le variabili decisive. Nella maggior parte dei casi è necessaria una gestione ibrida tra abbonamenti e workflow automatizzati che utilizzano le API.

Gestione consapevole dell’AI

Questi strumenti di controllo dei costi devono essere applicati in parallelo. L’audit dei tool ridondanti dà i risultati più rapidi e visibili: il risparmio è immediato e misurabile in euro non spesi al rinnovo degli abbonamenti. Il routing dei modelli ha tempi di implementazione più lunghi e richiede competenze tecniche; la sua applicazione concreta dipende da quanto è matura l’integrazione AI nei processi. In un’azienda che usa l’intelligenza artificiale solo via interfacce conversazionali, il routing si limita a far scegliere agli utenti il modello giusto all’interno dell’app. In un’azienda con automazioni in produzione, serve un gateway o una progettazione architetturale dei flussi.

La scelta corretta fra API e abbonamento è una questione più strategica, da valutare nel medio periodo: richiede di chiedersi, per ogni caso d’uso, se il valore sta nell’interfaccia o nell’automazione.

I KPI da monitorare sono relativamente pochi e facilmente individuabili. Il costo AI totale mensile per dipendente dà la baseline della spesa. Il numero di strumenti AI sanzionati segnala il livello di sprawl, mentre la percentuale di chiamate API instradate su modelli di fascia bassa misura la maturità del routing. È possibile valutare anche il rapporto fra abbonamenti attivi e abbonamenti effettivamente usati (login negli ultimi trenta giorni) per capire quanto si sta sprecando in licenze inutilizzate. Un’azienda che riesce a tenere questi quattro indicatori sotto controllo ha già fatto più del 90% delle aziende italiane di pari dimensione.

La spesa in AI, comunque, non è una voce da minimizzare in assoluto. Dalle ricerche del Politecnico già menzionate nell’articolo, emerge che il 41% dei lavoratori italiani che usa l’AI svolge attività che altrimenti non riuscirebbe a portare a termine. La produttività marginale di una licenza ben spesa è elevata. Ottimizzare i costi significa smettere di pagare per ciò che non genera valore, per investire negli strumenti giusti che fanno crescere l’impresa

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati

0
Lascia un commento, la tua opinione conta.x