Ambienti di lavoro simulati, agenti AI misurabili e dati integrati sono alcuni dei principali fattori che caratterizzeranno l’azienda del futuro.
Lo prevede Salesforce AI Research, che nell’ultimo trimestre ha attivato il proprio team di esperti per vedere come è possibile accelerare l’evoluzione delle imprese verso modelli sempre più digitali e basati sull’Agentic AI.
Gli specialisti di intelligenza artificiale hanno quindi definito nuove soluzioni tecnologiche: tra queste, la simulazione di un ambiente aziendale per testare le capacità degli agenti AI in scenari realistici; un nuovo strumento di benchmarking per misurare le prestazioni degli agenti AI in diversi casi d’uso; importanti miglioramenti per i sistemi Data Cloud, che ora sfruttano language model di varie dimensioni per unificare automaticamente i dati e migliorarne la qualità.
Indice degli argomenti:
I piloti non imparano a volare in mezzo alla tempesta
“Dalla definizione di nuovi standard di misurazione delle performance degli agenti AI alla gestione evoluta dei dati, queste innovazioni preparano il terreno per la realizzazione di prodotti di nuova generazione che rispondano alle principali sfide di CIO e responsabili IT”, fanno notare i ricercatori di Salesforce AI Research, “offrendo alle imprese strumenti concreti per trasformarsi in organizzazioni dove il lavoro umano e quello digitale collaborano in piena sinergia”.
I piloti non imparano a volare in mezzo a una vera tempesta ma nei simulatori, dove possono affrontare situazioni estreme senza rischi. In contesti complessi, le competenze nascono in spazi sicuri e controllati, dove il fallimento è un’occasione per imparare, non un errore costoso.
Simulare ambienti aziendali con agenti AI
Allo stesso modo, anche gli agenti AI traggono vantaggio da test e training in ambienti di simulazione, che li preparano ad affrontare in anticipo l’imprevedibilità degli scenari aziendali quotidiani.
Sulla base del progetto originale CRMArena, focalizzato su singole interazioni B2C, Salesforce AI Research ha sviluppato CRMArena-Pro, un sistema pensato per valutare le prestazioni degli agenti AI in scenari complessi, multi-turno e multi-agente, come la previsione delle vendite, la gestione dei ticket di assistenza e i processi di CPQ (Configure-Price-Quote).
Attraverso l’uso di dati sintetici, l’integrazione sicura con le API dei sistemi aziendali e rigorose misure di protezione dei dati personali, CRMArena-Pro è in grado di sviluppare un ambiente di simulazione aziendale evoluto e realistico, progettato per verificare non solo se un agente AI funziona, ma se è in grado di operare con precisione, efficienza e continuità su larga scala in casi d’uso specifici per l’impresa.
Perfezionare l’addestramento degli agenti AI
Salesforce AI Research sta perfezionando l’addestramento degli agenti AI attraverso queste simulazioni, permettendo alle aziende di testarli in anticipo in situazioni critiche, come l’escalation del servizio clienti o le interruzioni della supply chain.
Integrando l’imprevedibilità del mondo reale, “le imprese possono valutare con maggiore precisione le performance, rafforzare la resilienza nei casi limite e ridurre il divario tra la fase di formazione e l’operatività sul campo”, spiegano gli sviluppatori. Il risultato? “Agenti AI non solo competenti, ma anche coerenti, affidabili e pronti a supportare i processi aziendali”.

Misurare la preparazione degli agenti AI
Con la continua evoluzione di modelli e aggiornamenti di AI applicata al business, le aziende si trovano davanti a una sfida crescente e sempre più delicata: capire quale modello o combinazione di modelli sia davvero il più adatto per potenziare gli agenti AI nei contesti aziendali reali.
Non bastano le mode del momento o le dimensioni tecniche dei modelli: serve un approccio rigoroso, capace di misurarne le prestazioni in scenari concreti e rilevanti per il business.
Per rispondere a questa esigenza, Salesforce ha sviluppato Agentic Benchmark for CRM, il primo strumento di benchmarking progettato per valutare gli agenti AI nei contesti più strategici per le aziende: servizio clienti, assistenza sul campo, marketing e vendite.
Nuove sfide, nuovi benchmark
Il benchmark analizza gli agenti secondo cinque metriche chiave: accuratezza, costo, velocità, affidabilità e sostenibilità. In questo modo viene garantita una valutazione completa e basata sui dati.
Per esempio la sostenibilità, come metrica più recente, è un indicatore chiave della preparazione di un agente AI per le aziende. Questo parametro evidenzia l’impatto ambientale relativo dei sistemi di AI, che spesso richiedono grandi risorse computazionali.
Allineando le dimensioni del modello al livello di intelligenza artificiale realmente necessario per svolgere un certo compito specifico, le imprese possono ridurre la propria impronta ambientale e valutare la sostenibilità della propria AI, senza rinunciare alle prestazioni richieste. In questo modo, il benchmark consente di superare la complessità dei modelli disponibili e fornisce un metodo chiaro e basato sui dati per abbinare i modelli giusti agli agenti AI giusti e più efficaci.
Il fattore centrale dei dati aziendali
Su un altro fronte di attività e innovazione fondamentale, quello dei dati aziendali, il team di ricerca di Salesforce AI ha sviluppato e perfezionato modelli linguistici per potenziare Account Matching, la funzionalità che identifica e unifica automaticamente gli account presenti in grandi set di dati frammentati e incoerenti.
Per esempio, invece di trattare “The Example Company, Inc.” e “Example Co.” come entità diverse, l’AI le riconosce come un’unica azienda e le consolida in un record più completo e autorevole.
A differenza dei sistemi statici basati su regole, che richiedono configurazioni manuali complesse, “Account Matching riconcilia milioni di dati in tempo reale, garantendo miglioramenti significativi in termini di accuratezza”, rilevano gli ingegneri AI. Il risultato? “Dati puliti, unificati e pronti ad alimentare gli agenti AI, abilitando un’automazione più intelligente, una personalizzazione più ricca e decisioni rapide e scalabili”.






