Come la tecnologia può catturare le emozioni umane
Alexa, Siri e co. sono gli assistenti vocali più conosciuti. La differenza tra questi e altre applicazioni simili ma più semplici è l’impiego dell’analisi del sentiment, che consente di rilevare contesti linguistici ed emozionali. Gli esperti di Reply Practice Voice Machine Interfaces mettono questa tecnologia a disposizione dei propri clienti, così che possano utilizzarla per ottenere insights più approfonditi e migliorare il proprio business.
Il riconoscimento vocale intelligente esiste dal 1952, anno in cui Bell Labs ha presentato il riconoscimento automatico delle cifre (Automatic Digit Recognition), una macchina in grado di riconoscere dei numeri pronunciati a voce con un’elevata precisione. Oggi, i sistemi di riconoscimento vocale, come ad esempio i chatbot, sanno fare molte più cose e vengono utilizzati per numerose interfacce vocali ad alta prestazione intuitive e facili da usare, come Alexa.
Tuttavia, si riscontrano ancora dei problemi su un aspetto che può risultare decisivo per il servizio clienti o i feedback sui prodotti, ovvero la cosiddetta “sentiment analysis”. Gli assistenti vocali dovrebbero infatti essere in grado di riconoscere ed interpretare in maniera corretta il tono della voce e l’umore di chi parla.
L’analisi del sentiment offre un grande valore aggiunto per le aziende di ogni settore. L’utilizzo di software in grado di analizzare in modo automatizzato testi scritti o contenuti parlati consente di ottenere benefici in termini di tempo ed efficienza operativa soprattutto in questi contesti dove è richiesta l’analisi di testi lunghi, contorti e pieni di errori, come ad esempio il monitoraggio dei social media o la raccolta di recensioni dei clienti o feedback sui servizi di assistenza.
Cosa succede quando un discorso viene captato da un microfono? Una risposta semplificata a questa domanda è che la tecnologia vocale registra il parlato attraverso un modello di riconoscimento di pattern e successivamente lo digitalizza convertendolo in linguaggio binario. Di conseguenza, i singoli suoni, le parole o le interrelazioni perdono il loro significato “umano”.
Le macchine utilizzano questi moduli linguistici acquisiti per confrontarli con modelli digitali memorizzati in precedenza. Il confronto può avvenire su diversi livelli: utilizzando un semplice riconoscimento automatico delle cifre è possibile ad esempio elaborare una selezione di numeri nella coda di attesa di una hotline, mentre reti semantiche altamente complesse, come quelle dell’analisi del sentiment, sono in grado di riconoscere significati relazionali in testi più complessi.
Grazie all’analisi del sentiment, un’applicazione vocale può riconoscere la semantica di una frase. Le singole componenti linguistiche e vocali di una frase vengono infatti collegate tra di loro, in modo che sia possibile attribuire ad essa un contesto e un significato. Per garantirne la correttezza, tuttavia, la tecnologia deve poter comprendere anche il tono, l’umore e i sentimenti dell’utente.
Le applicazioni ad alte prestazioni vengono supportate da complessi modelli di Machine Learning, che acquisiscono il contesto di dichiarazioni parlate o scritte, così da quantificare emozioni, cortesia, veemenza e, naturalmente, anche il contenuto fattuale.
Nell'analisi del sentiment sono previsti diversi livelli di performance. Le versioni software più semplici ricercano nei testi termini univoci, le cosiddette “borse di parole”, che si possono attribuire con sicurezza ad una situazione emotiva. “Oggi mi sento benissimo”, oppure “Oggi il tempo è bruttissimo!” sono ad esempio espressioni facilmente classificabili grazie agli aggettivi che includono.
La situazione diventa più complessa quando l’applicazione deve comprendere il senso generale di dichiarazioni o testi più lunghi e individuare tonalità che cambiano all’interno della stessa affermazione. A tale scopo si utilizzano reti semantiche in grado di comprendere le relazioni tra singole parole. Ad esempio, se un utente emette il comando vocale “Sto cercando una sistemazione per me e per i miei 100 polli”, la tecnologia vocale dovrà riconoscere che in questo caso non si sta cercando un normale albergo.
La maggior parte delle applicazioni fornisce una valutazione relativamente semplice, composta da parole chiave e un appropriato calcolo di probabilità, che può essere elaborato mediante algoritmi, salvato ed utilizzato per altre applicazioni. A tale scopo, vengono determinati sia uno stato emotivo su scala popolare (come ad esempio gioia o rabbia), sia la rispettiva probabilità di esattezza tra zero e uno. La valutazione “gioia: 0,78456” indica ad esempio che molto probabilmente l’affermazione dell’utente è stata felice e positiva.
Un ulteriore livello di complessità è rappresentato dalle cosiddette ontologie, le quali riconoscono singoli termini come un insieme di caratteristiche collegate concettualmente ad altri termini. A esempio, l’affermazione “È stata proprio una sorpresa!” potrebbe essere positiva se riferita ad un film, mentre nel contesto dell’utilizzo di un’applicazione software potrebbe avere più probabilmente un’accezione negativa.
Utilizzando interfacce appositamente programmate per questi contesti, come quelle di Alexa o Google Home, è possibile valutare questo tipo di affermazioni tramite API speech-to-text per l’analisi del sentiment, determinandone in maniera più precisa emozionalità e polarità.
Tuttavia, gli assistenti vocali “ascoltano” solo per pochi secondi quando elaborano un’affermazione, per cui non sono adatti ad analisi più approfondite come quelle di testi o discorsi lunghi.
Le aziende utilizzano l’analisi del sentiment soprattutto per fare “opinion mining”, ovvero analizzare le opinioni. Per i rivenditori online o i fornitori di servizi finanziari è ad esempio molto importante sapere cosa viene scritto sui social media riguardo i loro prodotti e servizi.
Grazie all’analisi del sentiment è inoltre possibile farsi un’idea di quali siano le attese di un determinato target group o l’umore di un cliente che chiama un call center.
Le informazioni acquisite tramite l’analisi possono poi essere utilizzate per migliorare il proprio business o per operazioni di marketing mirate.