Migliorare i processi e la fidelizzazione del cliente con AI e Sentiment Analysis

Technology Reply - Financial Services ha elaborato uno Use Case basato sulle metodologie di apprendimento automatico in grado di valutare la polarità del sentimento sulla base di dati testuali.

Contesto

Con la diffusione sempre più massiva dei social media e dei canali di comunicazione, i dati testuali, ora più che mai, rappresentano fonte di inestimabile valore e di potenziale profitto. Con il termine “dati testuali” si fa riferimento a testi, commenti e recensioni elaborati per iscritto da persone che hanno usato lo stesso linguaggio adottato per conversare oralmente. Per un’azienda saper analizzare questo tipo di dato in modo preciso e mirato implica la possibilità di venire a conoscenza del pensiero dei propri utenti e clienti, comprendere i propri punti di forza e quelli di debolezza, nonché di adoperarsi al fine di risolvere le eventuali criticità riscontrate.

Il progetto sviluppato da Technology Reply si colloca nel campo della Opinion Mining, meglio conosciuto come Sentiment Analysis, il cui obiettivo è dare agli algoritmi la capacità di analizzare il dato testuale espresso sotto forma di linguaggio naturale, il linguaggio comunemente adottato nella comunicazione tra individui.


Ciò è reso possibile attraverso l’implementazione di modelli di Intelligenza Artificiale e Natural Language Processing, sempre più avanzati e complessi, in grado di cogliere anche le minime sfumature di sentimento. All’interno di questo perimetro è bene tenere in considerazione quattro elementi di fondamentale importanza:

  • Utenze: chiamate anche opinion holders, sono coloro che esprimono un’opinione in merito a qualcosa.
  • Oggetto: è l’entità verso la quale è rivolta un'opinione, solitamente un’azienda, un servizio, un’organizzazione
  • Aspetto: caratteristica dell’oggetto che si vuole analizzare
  • Opinione: intesa in senso lato, è l’opinione espressa dall’utente nei confronti di una qualità di un oggetto

Le interazioni tra questi elementi danno luogo a situazioni complesse la cui analisi risulta essere rilevante e strategica per il business.

Use Case

Questo Use Case è stato pensato e sviluppato per rispondere all’esigenza di studiare una soluzione in grado di valutare il livello di qualità dei servizi percepiti dal cliente. Nello specifico, si vuole disporre di uno strumento automatico in grado di intercettare tempestivamente possibili malcontenti dovuti a disservizi o problematiche interne, nonché di fornire all’ufficio preposto indicazioni chiare e precise su come intervenire per una pronta risoluzione.

Per l’essere umano leggere un testo per comprenderne significato e semantica risulta essere un’azione intuitiva, quasi del tutto banale. Tuttavia, non è così per un computer. Il linguaggio naturale, per i motivi che verranno esposti qui di seguito, risulta essere un elemento di complessa analisi, la cui elaborazione richiede un effort significativo e precisi accorgimenti.

Nello specifico si fa presente come il dato testuale:

  • sia di natura non strutturata e ciò richiede tecniche matematiche complesse affinché possa essere elaborato da un modello di apprendimento automatico.
  • sia intrinsecamente ambiguo. Esistono infatti modi indiretti per esprimere un’opinione (si pensi all’ironia, al sarcasmo, ecc…) la cui corretta identificazione è una sfida complessa per un algoritmo di AI.
  • possiede parole, sintagmi e sfumature sintattiche che dipendono strettamente dalla lingua impiegata per scrivere il testo. Si pensi per esempio ad articoli, preposizioni e congiunzioni, i quali ricorrono generalmente un numero considerevole di volte senza però fornire alcun tipo di contributo per l’identificazione del sentiment e che, quindi, necessitano di essere gestiti.
  • in base al contesto, lo stesso sostantivo può essere espresso ora al femminile ora al maschile, al singolare o al plurale, passando per tutta una serie di alterazioni linguistiche quali il diminutivo, accrescitivo, vezzeggiativo e così via. Questo elevato livello di varianza che potrebbe sembrare di scarso impatto, è in realtà una caratteristica del linguaggio naturale che dovrebbe essere sempre tenuto in considerazione.
  • in base al contesto, lo stesso sostantivo può essere espresso ora al femminile ora al maschile, al singolare o al plurale, passando per tutta una serie di alterazioni linguistiche quali il diminutivo, accrescitivo, vezzeggiativo e così via. Questo elevato livello di varianza che potrebbe sembrare di scarso impatto, è in realtà una caratteristica del linguaggio naturale che dovrebbe essere sempre tenuto in considerazione.
  • un testo elaborato in linguaggio naturale può comprendere i cosiddetti typo, ovvero errori di scrittura che possono essere di natura volontaria o non. Volontaria qualora il testo sia stato elaborato mediante l’uso slang o di particolari "storpiature". Involontaria quando nel testo sono presenti errori sintattici o grammaticali dovuti, per esempio, ad errori indesiderati di battitura. In entrambi i casi, la varianza introdotta dai typo si somma alla già presente varianza che è intrinseca del linguaggio naturale.
  • infine, la carenza di grandi collezioni di dati etichettati da esperti di dominio fruibili con licenza open, rende il compito della Sentiment Analysis ancora più complesso e laborioso.

Soluzione

La soluzione qui proposta si compone di tre fasi distinte:

  • Una fase di Data Visualization, il cui obiettivo è quello di eseguire una prima ispezione visuale e ad alto livello della realtà oggetto di indagine per estrarre specifici insight. Si cita lo studio della distribuzione generale del sentiment e la sua distribuzione per fasce geografiche e temporali, fino all’analisi puntuale della distribuzione del sentimento per tutte quelle componenti delle frasi che occorrono con i caratteri speciali @ e #.
  • In seconda istanza è stata definita una pipeline di data pre-processing, una tra le fasi più importanti dell’intero panorama del NLP, il cui obiettivo è trasformare il dato testuale grezzo (formato qualitativo) in vettori (formato quantitativo), ossia oggetti matematici che godono di specifiche proprietà. In questa fase rivestono ruolo di primo piano le tecniche per la rimozione di numeri e caratteri speciali, la tokenizzazione, lo stemming e/o lemmatizzazione e la costruzione degli embedding. Questa catena di trasformazioni è molto importante affinché il testo possa essere trasformato in un formato elaborabile da modelli di AI i quali, per precise ragioni matematiche, non sono in grado di ricevere direttamente un input nel suo formato qualitativo. Questi processi possono essere computazionalmente esosi. Per questo motivo è quindi opportuno attrezzarsi con un'infrastruttura adeguata (ad es. DB Oracle, soluzioni cloud, etc.)
  • Infine, sono stati infine studiati ed implementati approcci di Deep Learning basati su reti neurali profonde di tipo B-LSTM. Questa fase riveste un ruolo di primissimo piano in ogni progetto di sentiment analysis, il cui fine è la definizione di modelli di AI in grado di etichettare grandi collezioni di testi per far emergere chiaramente il livello di soddisfazione (o insoddisfazione) percepito della clientela.

Vantaggi

Come dimostrato in precedenza, strumenti come la Sentiment Analysis sono in grado di fornire un contributo significativo e tangibile a livello di business. Per i motivi sopra citati, non solo risulta essere uno strumento prezioso per identificare i propri punti di forza, permettendo quindi di consolidare la propria realtà e il proprio business ma permette, al tempo stesso, di identificare i propri punti di debolezza, dando la possibilità a chi di competenza di lavorare sugli aspetti più carenti dell’organizzazione.

Saper ascoltare il cliente, identificare le sue esigenze e raccogliere i feedback è un qualcosa di imprescindibile per un’azienda che ha come obiettivo crescere e migliorare in modo continuativo. Se ascoltare il cliente è importante, cosa ancora più importante è disporre delle competenze e degli strumenti adatti per raggiungere tale scopo in modo efficace. Oggi, come mai prima, la Sentiment Analysis e il Machine Learning sono in grado di fornire alle aziende questo tipo di contributo.