Si va dalla simulazione avanzata degli scenari aziendali al benchmarking delle performance degli agenti AI, fino al consolidamento dei dati con tecnologie linguistiche di nuova generazione
Autore: Redazione ImpresaCity
Non sono poche le novità introdotte nell’ultimo trimestre da Salesforce AI Research per accelerare l’evoluzione delle aziende verso modelli sempre più digitali e basati sull’Agentic AI. Tra queste, la simulazione un ambiente aziendale per testare le capacità degli agenti AI in scenari realistici, un nuovo strumento di benchmarking per misurare le prestazioni degli agenti in diversi casi d’uso e significativi miglioramenti a Data Cloud di Salesforce, che ora sfrutta language model di varie dimensioni per unificare automaticamente i dati e migliorarne la qualità.
Dalla definizione di nuovi standard di misurazione delle performance degli agenti AI alla gestione avanzata dei dati, queste innovazioni preparano il terreno per la realizzazione di prodotti di nuova generazione che rispondano alle principali sfide di CIO e responsabili IT, offrendo alle aziende strumenti concreti per trasformarsi in organizzazioni dove il lavoro umano e quello digitale collaborano in sinergia.
Oggi gli agenti AI traggono vantaggio da test e training in ambienti di simulazione, che li preparano ad affrontare in anticipo l’imprevedibilità degli scenari aziendali quotidiani. Sulla base del progetto originale CRMArena, focalizzato su singole interazioni B2C, Salesforce AI Research lancia ora CRMArena-Pro, pensato per valutare le prestazioni degli agenti in scenari complessi, multi-turno e multi-agente, come la previsione delle vendite, la gestione dei ticket di assistenza e i processi di CPQ (Configure-Price-Quote).
Grazie all’uso di dati sintetici, all’integrazione sicura con le API dei sistemi aziendali e a rigorose misure di protezione dei dati personali, CRMArena-Pro offre un ambiente di simulazione aziendale avanzato e realistico, progettato per verificare non solo se un agente funziona, ma se è in grado di operare con precisione, efficienza e continuità su larga scala in casi d’uso specifici per l’impresa.
Salesforce AI Research, evidenzia una nota, sta anche perfezionando l’addestramento degli agenti AI attraverso queste simulazioni, permettendo alle aziende di testarli in anticipo in situazioni critiche, come l’escalation del servizio clienti o le interruzioni della supply chain. Integrando “l’imprevedibilità” del mondo reale, le imprese possono valutare con maggiore precisione le performance, rafforzare la resilienza nei casi limite e ridurre il divario tra la fase di formazione e l’operatività sul campo
Non solo: con la continua evoluzione di modelli e aggiornamenti, le aziende si trovano davanti a una sfida crescente: capire quale modello o combinazione di modelli, sia davvero il più adatto per potenziare gli agenti AI nei contesti aziendali reali. Non bastano le mode del momento o le dimensioni tecniche dei modelli: serve un approccio rigoroso, capace di misurarne le prestazioni in scenari concreti e rilevanti per il business.
Per rispondere a questa esigenza, Salesforce ha presentato Agentic Benchmark for CRM, il primo strumento di benchmarking progettato per valutare gli agenti AI nei contesti più strategici per le aziende: servizio clienti, assistenza sul campo, marketing e vendite.
Il benchmark analizza gli agenti secondo cinque metriche chiave: accuratezza, costo, velocità, affidabilità, sicurezza e sostenibilità. In questo modo viene garantita una valutazione completa e basata sui dati.
A completare la suite, il team di esperti di Salesforce AI Research ha introdotto MCP-Eval e MCP-Universe, due benchmark complementari pensati per valutare gli agenti con livelli diversi di approfondimento, monitorando le interazioni dei modelli linguistici con i server MCP (Model Context Protocol) in scenari d’uso reali, con MCP-Eval per le valutazioni iniziali e ad ampio raggio e MCP-Universe per le analisi più approfondite e la risoluzione dei problemi.
Infine, è noto che le prestazioni affidabili e scalabili degli agenti AI si fondano su dati unificati e di alta qualità, indispensabili per un processo decisionale accurato, contestualizzato e conforme alle policy aziendali. Tuttavia, per molte aziende questo è sempre stato un ostacolo. Spesso i dati non sono né puliti né organizzati: i record dei clienti risultano duplicati tra i reparti, i campi spesso incompleti e le convenzioni di formattazione o denominazione incoerenti, rendendo la riconciliazione tra i sistemi complessa e dispendiosa.
Per superare questa sfida, i team di ricerca e prodotto di Salesforce AI hanno sviluppato e perfezionato modelli linguistici per potenziare Account Matching, la funzionalità che identifica e unifica automaticamente gli account presenti in set di dati frammentati e incoerenti. A differenza dei sistemi statici basati su regole, che richiedono configurazioni manuali complesse, Account Matching riconcilia milioni di dati in tempo reale, garantendo miglioramenti significativi in termini di accuratezza.