Anomaly Detection nella Customer Retention

Come il potere del Cloud può aiutare a gestire ritorni di clientela fraudolenti

Contesto

La customer retention è un tema molto delicato per ogni azienda. Una buona strategia di conservazione della clientela dovrebbe puntare ad un alto numero di clienti fedeli. Ma cosa succede se i clienti abbandonano temporaneamente i servizi offerti dall’azienda per poi ripresentarsi con dati personali differenti per approfittare delle condizioni promozionali riservati ai nuovi clienti? Per mezzo di algoritmi di Machine Learning è stato possibile assegnare a ciascun nuovo cliente uno score per aiutare i venditori a riconoscerli e ad offrire loro un listino un prezzo più vantaggioso prima che disdicano i servizi o un listino da ex cliente nel caso in cui la disdetta sia già avvenuta.

Il nostro approccio

Per una grande società operante in ambito Media/Telco, sono state impiegate le conoscenze di Machine Learning Reply per trovare una risposta efficace al problema. I dati utilizzati si riferiscono alle abitazioni dei clienti, indirizzi IP/MAC, ai contratti, alle modalità di pagamento e ai loro recapiti mail o telefonici. Data l’enorme quantità di dati da analizzare, le soluzioni di Google Cloud sono risultate fondamentali per rendere il calcolo degli score associati ai clienti più rapido, l’architettura maggiormente scalabile e integrabile con gli algoritmi di Machine Learning adattati alle esigenze del cliente.

Per ogni cliente su una customer base di circa 10 milioni, due volte al mese viene calcolato uno score che indica la probabilità che lo stesso non voglia privarsi dei servizi offerti ma che lo farà temporaneamente per poi ripresentarsi approfittando di offerte più vantaggiose. A coloro che presentano uno score alto, per cercare di conservare il cliente, si può procedere con una promozione ad hoc risparmiando dunque sulle spese di disdetta e apertura di un contratto e sull’uscita del tecnico. Altrimenti si possono conservare le informazioni sul cliente, proponendo gli stessi servizi ad un costo meno vantaggioso rispetto a quello promozionale per i nuovi clienti.

Disegno della soluzione

Quali sono gli aspetti principali del nostro approccio

Scalabilità: un aspetto essenziale

I dati, frequentemente aggiornati, da analizzare riguardano circa 10 milioni di clienti. I servizi Google Cloud permettono di calcolare gli score da assegnare ai clienti in modo scalabile ed efficiente con un’ampia potenza di calcolo.

Costi facilmente monitorabili

L’utilizzo dei servizi Google Cloud permette un monitoraggio dei costi delle esecuzioni delle pipeline. Si può scegliere tra costi variabili in base alla mole di dati analizzati o tra costi fissi indipendentemente dalle analisi svolte.

Visualizzazione dei dati Tableau, grazie ad un connettore ad hoc, permette di creare report informativi e sempre aggiornati con dati provenienti Google Bigquery: in questo modo risulta più semplice la lettura e la comprensione dei dati.

Google Cloud Platform

La potenza del cloud di Google ha facilitato la creazione di una soluzione robusta e scalabile grazie all'utilizzo del cloud in PaaS
  • strip-0

    Google BigQuery

    Google BigQuery è un data warehouse cloud di Google che consente di archiviare e analizzare dati utilizzando un ambiente SQL. È uno strumento essenziale per poter eseguire query molto complesse su tabelle partizionate che risiedono in Bigquery stesso, senza procedere con estrazioni di dati costose in termini di tempo e denaro.


    Google BigQuery ha dato la possibilità di applicare complessi algoritmi di Machine Learning su tabelle da circa 10 milioni di osservazioni in poche ore. Grazie ai costi limitati per lo storage di tabelle su Google BigQuery, questo servizio è stato utilizzato sia per l’esecuzione delle query sia per lo storage dei risultati, rendendo le fasi di lettura e di scrittura dei dati molto più rapide.

  • Google Cloud Composer

    Google Cloud Composer è un servizio di orchestrazione dei flussi di lavoro completamente gestito che consente di creare, programmare e monitorare le pipeline. Composer è un servizio consigliato quando si vuole creare una pipeline con task da eseguire solo quando quello precedente ha terminato l’esecuzione in modo tale da evitare sovrapposizioni. Inoltre, offre la possibilità di ritentare automaticamente task falliti, di invia notifiche in caso di fallimento per poter intervenire tempestivamente e risolvere eventuali problemi.


    L’utilizzo del servizio Google Cloud Composer nel progetto ha portato ad un miglioramento significativo nei tempi di esecuzione delle query su Google Bigquery. Infatti, segmentando la query che genera il dataset sul quale applicare gli algoritmi di Machine Learning in diverse query minori indipendenti tra di loro, è possibile eseguirle sfruttando il parallelismo offerto da Google Cloud Composer. Una volta che tutte le query minori avranno terminato l’esecuzione parallela, le si potranno aggregare e procedere con i task successivi.

    strip-1
  • strip-2

    Google Cloud Storage

    Google Cloud Storage è il servizio Google dedicato all’archiviazione di oggetti. È caratterizzato da uno spazio di archiviazione illimitato senza dimensione minima degli oggetti, da una massima accessibilità, bassa latenza e durabilità elevata.


    Grazie alla sua affidabilità, Google Cloud Storage è stato utilizzato per conservare le configurazioni relative ai modelli di Machine Learning applicati, gli iperparametri impostati negli algoritmi, i log e altre informazioni sull’esecuzione complessiva del modello. È fondamentale per poter avere in modo ordinato uno storico su ogni esecuzione della pipeline avvenuta.