Validazione delle identità tramite i documenti

Convalidare l’identità dei clienti nel più breve tempo possibile

Il valore dell'identità

In un mondo dove ogni attività quotidiana è scandita dallo scambio di dati e informazioni, il controllo della identità personale ha un ruolo centrale. Che si tratti di aprire un conto corrente, chiedere un prestito o affittare una cassetta di sicurezza, spesso viene richiesto di fornire le scansioni dei nostri documenti identificativi. Le aziende sono quindi costrette a impiegare molte risorse in un’onerosa attività di verifica e comparazione tra i documenti e i dati in possesso. Per ovviare alla complessità di questo compito, la maggior parte delle aziende dà semplicemente in outsourcing l’attività di controllo.

La complessità dei documenti

Pensiamo alle diverse tipologie di documenti disponibili: carte d’identità, carte regionali dei servizi, patente, codici fiscali, etc. Ognuno di questi materiali potrebbe essere utilizzato per accedere al servizio richiesto dal cliente. Questo implica di dover estrarre dati ed elaborare documenti che spesso potrebbero essere forniti in condizioni tutt’altro che ottimali. L’immagine della scansione potrebbe difatti essere di bassa qualità, oppure all’interno di una singola immagine potrebbero essere contenuti diversi documenti, alcuni potrebbero essere sfocati proprio nei particolari che interessano e così via. La molteplicità delle casistiche crea un quadro meritevole di essere analizzato e affrontato in ogni sua declinazione.

Intelligent Character Recognition in azione

Per affrontare la complessità della questione, abbiamo elaborato una soluzione in grado di supportare l’automazione del processo di identificazione, allo scopo di rendere il processo efficace, economico, preciso e adatto ad ogni caso.


  • In primo luogo, avvalendoci di specifiche Reti Neurali separiamo durante la scansione iniziale i frammenti che ci servono dalle immagini fornite, ottenendo così i dati necessari per l’elaborazione.

  • Questi frammenti vengono poi passati al pre-processing tramite opportuni algoritmi di Computer Vision, in maniera da pulire e filtrare le immagini iniziali e ottenere un risultato che garantisca l’efficienza del processo.

  • Una volta filtrate e selezionate, le immagini sottoposte ad un ensemble di sistemi di OCR, il cui risultato viene successivamente ripulito corretto e classificato grazie ad algoritmi di Text Processing e Machine Learning.

  • Così facendo otteniamo l’estrazione automatizzata e ottimale dei dati che interessano. Dati che possono essere dunque utilizzati nelle procedure di sicurezza e verifica delle identità delle aziende, con il massimo risparmio possibile di tempo e risorse.

Conclusioni

Anche su dataset particolarmente complessi, caratterizzati da immagini in bassa qualità di documenti di difficile lavorazione, come le carte di identità cartacee, l’accuratezza minima ottenuta dalla pipeline realizzata si attesta intorno al 70%, per arrivare virtualmente al 100% su documenti maggiormente strutturati e qualità di immagini superiori.

In un contesto in cui il costo di validazione di ogni documento da parte di un outsourcer è nell’ordine delle decine di centesimi al pezzo, anche volumi di poche decine di migliaia di pezzi al mese possono generare risparmi ingenti grazie all’adozione della soluzione automatizzata.