Salesforce AI Research: simulazioni, benchmark e dati integrati per l’AI aziendale

Salesforce AI Research ha presentato una serie di innovazioni pensate per rendere l’adozione dell’Intelligenza Artificiale nelle imprese più sicura, misurabile e scalabile. Dalla creazione di ambienti di simulazione al benchmarking delle performance degli agenti AI, fino al consolidamento dei dati attraverso modelli linguistici di nuova generazione, le novità delineano “l’azienda del futuro”.

Simulare scenari complessi con CRMArena-Pro

“I piloti non imparano a volare in mezzo a una vera tempesta ma nei simulatori, dove possono affrontare situazioni estreme senza rischi”, ricorda il team di Salesforce. Con lo stesso principio nasce CRMArena-Pro, evoluzione del progetto CRMArena, che consente di testare gli agenti AI in scenari multi-turno e multi-agente, come la gestione di ticket di assistenza, processi di CPQ o la previsione delle vendite.

Grazie all’uso di dati sintetici e all’integrazione sicura con le API aziendali, l’ambiente permette di valutare non solo la funzionalità degli agenti, ma anche la loro capacità di operare in modo affidabile e continuo su larga scala.

Benchmarking: Agentic Benchmark for CRM

Per aiutare le aziende a scegliere il modello più adatto alle proprie esigenze, Salesforce ha lanciato Agentic Benchmark for CRM, il primo strumento per misurare le performance degli agenti AI nei contesti chiave del CRM: marketing, vendite, servizio clienti e assistenza sul campo. Il benchmark si fonda su cinque metriche: accuratezza, costo, velocità, affidabilità/sicurezza e sostenibilità. Quest’ultima, in particolare, misura “l’impatto ambientale relativo dei sistemi di AI, che spesso richiedono grandi risorse computazionali”, sottolinea Salesforce, evidenziando l’importanza di un approccio più efficiente e responsabile.

MCP-Eval e MCP-Universe

A supporto, arrivano MCP-Eval e MCP-Universe, due benchmark complementari che valutano le capacità degli agenti AI con task sintetici e scenari complessi. L’obiettivo è chiaro: identificare i limiti dei modelli linguistici e rafforzare la resilienza operativa.

Dati puliti con Account Matching

Infine, un tassello fondamentale: la qualità dei dati. Con la funzionalità Account Matching, Salesforce applica modelli linguistici per unificare in tempo reale account duplicati o incoerenti. “Invece di trattare ‘The Example Company, Inc.’ e ‘Example Co.’ come entità diverse, l’AI le riconosce come un’unica azienda”, spiegano i ricercatori. Il risultato è un patrimonio informativo pulito e affidabile, pronto ad alimentare agenti AI capaci di offrire automazione intelligente e decisioni più rapide.

Per ulteriori approfondimenti: SalesforceAIResearch.com

COMMENTI