“Let’s talk”: benvenuti nell’era della voice first experience

voice-first-exp Da più parti si sente parlare della voce come nuova interfaccia destinata a conquistare una fetta sempre più ampia delle interazioni uomo-macchina e cliente-azienda. Secondo alcuni esperti di Intelligenza Artificiale, per esempio, entro il 2020 metà del traffico di ricerca coinvolgerà voce e immagini, mentre secondo Gartner entro il 2022 il 30% di tutte le ricerche verrà eseguito senza far ricorso a uno schermo. Dopo aver attraversato le fasi di type, click e touch, a quanto pare siamo giunti nell’era della voce: ma cosa comporterà questo cambiamento?

Secondo quanto emerso durante il nostro Talk About Il potere della voce nel Customer Service, i principali catalizzatori di questa trasformazione sono gli smart speaker – due fra tutti: Amazon Alexa e Google Home – che in molti casi hanno “sdoganato” l’utilizzo della voce anche su altri device da parte degli utenti. Un importante ruolo da apripista è stato giocato inoltre dal settore automotive: da 15 anni, infatti, le auto – dopo il telefono – hanno il maggior numero di utenti inclini all’utilizzo di interfacce vocali, in questo caso anche per questioni connesse alla sicurezza.

Breve storia di assistenti vocali e smart speaker: fiaba o thriller?

Lasciamo per un attimo da parte i vip delle interazioni vocali e torniamo alle origini dei vocal assistant: come raccontato da Bea Dobrzynska di CELI, il capostipite Nabaztag è nato nel 2006, seguito da altri suoi simili tutti accomunati da un destino che li ha condotti a essere ritirati dal mercato perché troppo costosi, inquietanti o potenzialmente rischiosi per la privacy. Di questi errori le attuali interfacce vocali hanno almeno in parte fatto tesoro, in particolare per evitare l’effetto perturbante che va sotto il nome di uncanny valley, e che si verifica quando questi dispositivi risultano eccessivamente umanizzati.

Ma, come abbiamo già detto, siamo entrati ormai nel voice first world – dove con l’espressione voice first ci si riferisce a tutte CELI-voice-first-exp quelle applicazioni e tecnologie che privilegiano l’interazione vocale, senza tuttavia escludere altre modalità di interazione –, in cui il conversational design e la creazione di voci artificiali fanno a pieno titolo parte delle attività di branding aziendale. Con più di 200 milioni di smart speaker sul mercato worldwide, è giunto quindi il momento di interrogarsi e concentrarsi sulle caratteristiche e i tratti distintivi di una buona voice experience, che sappia essere veloce, sicura e in grado di ottimizzare il business, senza trascurare la dimensione più emotiva ed emozionale delle interazioni. Per raggiungere questi obiettivi le interfacce vocali devono essere progettate tenendo conto che la ricerca via voce si differenzia da quella via testo per molti aspetti, come la struttura della query, l’intento più specifico, la restituzione di un solo risultato per ciascuna richiesta – aperto comunque a ulteriori domande da parte dell’utente. Attualmente, ha ricordato Bea, gli smart speaker vengono utilizzati soprattutto per la ricerca di informazioni semplici e per l’entertainment, con i due terzi dei consumatori che indicano come qualità fondamentale la capacità degli assistenti vocali di capirli davvero. Seguono la qualità del suono (54,9%), il ventaglio di funzionalità (50,7%) e la velocità di risposta (45,1%); solo il 15,4% dei proprietari di uno smart speaker, invece, considera importante che l’assistente vocale abbia una personalità. Considerando infine le fasi di un’efficace strategia di implementazione di soluzioni voice first, ha concluso Bea, è necessario partire dalla definizione delle necessità e degli obiettivi da raggiungere per sviluppare un’applicazione in linea con tali bisogni, che deve inoltre essere soggetta a un processo di ottimizzazione costante, che tenga conto delle esigenze emerse durante l’utilizzo e ne valorizzi il potenziale in termini di Customer Engagement e capacità di intercettare nuovi segmenti di mercato.

La voce all’opera

Come ribadito da Piergiorgio Vittori di Spitch, allo stadio attuale – e se correttamente implementate – le tecnologie vocali permettono di migliorare la Customer Experience, i livelli di personalizzazione e la sicurezza dei servizi grazie a biometria vocale e speech analytics, rispondendo al contempo alle aspettative di trasformazione delle interazioni brand-clienti che questi ultimi nutrono fin dall’avvento della mobile revolution e dalla diffusione sempre più capillare delle nuove tecnologie. Lato aziende, inoltre, l’adozione di soluzioni basate su Intelligenza Artificiale e NLP permette di ridurre i costi, ottimizzare i processi interni Spitch-voice-first-exp e farsi trovare pronte lungo il cammino che le condurrà verso la nuova frontiera del Customer Service, caratterizzata dall’integrazione trasparente di digital e human, dall’automazione e dalla ridefinizione del Customer Journey.

A testimonianza dell’assoluta fattibilità di questa evoluzione delle relazioni sono intervenuti anche Omar Lafi di Casa della Salute ed Enrico Reboscio di Dotvocal, che insieme a Spitch hanno realizzato un progetto dedicato al Customer Care della società che opera nel settore della sanità privata, mirato all’automatizzazione delle prenotazioni, alla gestione dei recall, alla riduzione dei margini d’errore e all’erogazione di servizi 24/7 in un periodo di forte crescita per l’azienda, sia in termini di nuove sedi aperte sul territorio sia in termini di ampliamento dei bacini d’utenza. Casa della Salute offre ora un’experience coerente, fluida e multicanale attraverso telefono e chatbot testuale e vocale – presente su sito web e pagina Facebook aziendali –, facilitando le interazioni tra utenti e sistema. Tra le funzionalità dell’interfaccia conversazionale implementata, oltre a NLU e NLP, c’è la capacità di dialogare in real time con il gestionale di Casa della Salute e di comprendere il Customer Intent attraverso l’analisi semantica delle interazioni. La realizzazione della soluzione è stata preceduta da un’attività di mappatura delle modalità in cui le persone utilizzano il linguaggio naturale in questo contesto, seguita da una fase di tuning e di analisi qualitativa di vari punti dei flussi di interazione.

Come abbiamo potuto constatare il 9 maggio, quindi, sono già attive sul mercato società in grado di offrire soluzioni vocali su misura, la cui realizzazione e operatività richiedono però la collaborazione delle aziende clienti, al fine di individuare chiaramente focus e punti nevralgici di ogni progetto specifico. Occorre infine prestare sempre attenzione a quello che rimane il maggior fattore di criticità – di cui tuttavia il mass market appare ancora poco consapevole –, ovvero il carattere always on degli smart speaker, che li rende potenzialmente vulnerabili rispetto alla privacy e alla sicurezza dei dati degli utilizzatori.

Emma Pisati
CMI Customer Management Insights

“Let’s talk”: benvenuti nell’era della voice first experience

Breve storia di assistenti vocali e smart speaker: fiaba o thriller?

La voce all’opera

Condividi:

Può interessarti anche:

AUTORE: redazioneCMI

CONSIGLIATI

COMMENTI