Nel giro di pochi mesi, i costi delle API dei modelli linguistici di ultima generazione si sono abbassati notevolmente, mentre la qualità è aumentata. Per imprese e PA, la sfida ora è la qualità: ottimizzare per la performance oggi conviene più che inseguire il risparmio.
Immaginate un settore in cui il costo della materia prima scende di continuo, mentre la qualità del prodotto migliora trimestre dopo trimestre. È ciò che sta succedendo nell’AI generativa: il costo d’uso dei modelli di punta si sta riducendo, mentre le loro capacità crescono. In pochissimi settori si assiste a un fenomeno come questo. È un’accelerazione che non riguarda (solo) gli addetti ai lavori.
Per l’economia significa una cosa precisa: strutturalmente, produrre intelligenza artificiale costa meno, mentre il “prodotto” diventa sempre più raffinato. Quando i costi crollano e la produttività cresce, cambiano i modelli di business, si abbassano le barriere all’ingresso, e cittadini e imprese si ritrovano con servizi più accessibili
Come imprenditore, sto seguendo da vicino l’andamento dei prezzi delle API dei modelli linguistici più avanzati, e ho imparato a distinguere due grandi categorie:
- da una parte ci sono i modelli di ultima generazione, usati per compiti relativamente semplici come riepiloghi, estrazioni e traduzioni;
- dall’altra quelli progettati per affrontare problemi più complessi, che richiedono ragionamento, pianificazione e la capacità di gestire sequenze di passaggi.
Negli ultimi mesi, il quadro che vedo è piuttosto chiaro: il prezzo medio per unità di calcolo trattata continua a scendere, mentre le capacità dei modelli crescono, soprattutto nella loro intelligenza operativa, ovvero nella loro abilità di portare a termine compiti articolati dall’inizio alla fine.
Indice degli argomenti:
Che cosa cambia per aziende e PA italiane?
Prima di tutto, la prototipazione diventa più rapida e meno costosa. Quando il costo marginale per testare un’idea scende, la logica porta a sperimentare di più. E processi che prima richiedevano mesi e budget importanti oggi possono essere avviati e valutati in tempi molto più brevi, con un impatto diretto sull’innovazione.
La discesa dei costi spinge anche a privilegiare la qualità rispetto al prezzo. Scegliere il modello migliore, anche se forse costa qualche euro in più, ha senso perché presto quel prezzo si ridurrà, mentre la qualità resterà un vantaggio competitivo duraturo.
Ci sono poi i nuovi casi d’uso che diventano economicamente sostenibili. Attività che prima erano fuori portata (assistenza interna, estrazione conoscenza da archivi, automazione documentale, supporto decisionale di primo livello, etc), iniziano a rientrare nel perimetro del possibile.
Infine, c’è un effetto particolarmente rilevante sulle piccole e medie imprese, che costituiscono la spina dorsale del tessuto produttivo del nostro Paese: l’abbassamento delle barriere di costo rende accessibili strumenti e soluzioni che fino a poco tempo fa erano riservate solo alle grandi aziende. In questo senso, l’AI diventa una tecnologia “a gradini più bassi”, più democratica.
La regola d’oro: ottimizzare la performance, non più i costi
In questa fase non ha senso progettare sul prezzo. L’obiettivo dovrebbe essere selezionare il modello che eroga la migliore qualità per il compito, disegnare bene il flusso (prompt, controlli, metriche) e mettere in produzione. Perché il prezzo tende a scendere. Concentrarsi oggi nel limare costi che domani saranno irrisori rischia di farci perdere tempo e – peggio ancora – vantaggio competitivo.
Naturalmente, non mancano le obiezioni. La prima riguarda il budget, che per molte aziende resta un vincolo che non si può ignorare. Ma il punto non è ignorare i costi: piuttosto, si tratta di spostare il controllo a valle. Si può agire con sistemi di rate-limit, quote e monitoraggio.
C’è poi la questione ambientale. I modelli linguistici consumano risorse, ma la direzione intrapresa dai provider è chiara: ridurre progressivamente l’impatto energetico per ogni token o operazione. Anche in questo caso, progettare bene non solo taglia i costi, ma limita anche i consumi.
Infine, il timore del lock-in sui fornitori. È un rischio reale, ma gestibile. Progettare l’integrazione con livelli di astrazione – per esempio tramite adapter – permette di sostituire un modello con un altro senza dover riscrivere tutto da zero. Così, se domani nasce una tecnologia migliore, la migrazione diventa un’opportunità, non un incubo tecnico.
Il messaggio non è “spendere a occhi chiusi”, ma investire dove conta: qualità del modello, design del workflow, misure di sicurezza (contenuti illeciti, privacy, confidenzialità).
Tre raccomandazioni per i decisori dell’AI
Ci sono tre raccomandazioni che desidero fare a chi è chiamato a prendere decisioni nel campo dell’AI.
- La prima riguarda l’approccio: conviene partire dall’alto, definendo chiaramente il risultato che si vuole ottenere. Significa stabilire fin da subito la metrica di qualità – che si tratti del tasso di risoluzione di una pratica, della precisione nell’estrazione dei dati o della soddisfazione del cliente – e poi scegliere il modello che massimizza proprio quel parametro.
- La seconda raccomandazione è progettare l’osservabilità fin dal primo giorno. Tracciare richieste, costi, qualità e modalità di fallimento non è un dettaglio tecnico, ma un requisito essenziale per scalare in modo sano. L’osservabilità diventa così una sorta di assicurazione: permette di capire dove intervenire, evitare sprechi e mantenere il controllo man mano che i sistemi crescono.
- La terza e ultima riguarda la questione dell’aggiornamento costante: il ritmo di innovazione è talmente alto che non ha senso considerare la scelta di un modello come definitiva. È utile fissare delle finestre di revisione, per esempio su base trimestrale, in cui testare alternative e, se necessario, passare a soluzioni più efficaci senza esitazione.
Il passaggio storico dell’AI non riguarda solo la tecnologia, ma l’economia nel suo insieme. Quando una capacità diventa più affidabile e meno costosa, si aprono le porte a trasformazioni diffuse. È già accaduto con il cloud e con la banda larga, e oggi sta accadendo con l’intelligenza artificiale. E come in ogni infrastruttura, non è il prezzo di un singolo bullone a determinare il valore, ma ciò che quel bullone consente di costruire sopra.






