Utilizzare l'IA per combattere le frodi
Le criptovalute, come i Bitcoin, sono sulle prime pagine dei giornali da ormai diversi anni. Questi token digitali hanno alcune qualità in comune con le valute forti e possono essere comprati, venduti e spesi. In realtà, è nato un vero e proprio mercato intorno al commercio delle valute digitali con investitori e speculatori che controllano costantemente tutte le oscillazioni di queste monete.
Al centro di questo mercato c'è Coinbase, una piattaforma di scambio e portafoglio digitale con sede a San Francisco su cui 20 milioni di commercianti e clienti muovono oltre 150 miliardi in criptovalute dal 2012, anno della sua fondazione.
Come tutte le società di servizi finanziari, Coinbase deve fornire un'esperienza agile ai clienti proteggendo al tempo stesso l'ambiente in cui si sviluppa. Per questo motivo, la società si affida all'intelligenza artificiale (IA) utilizzando gli strumenti di machine learning di Amazon Web Services (AWS).
"L'IA fa parte del DNA dell'azienda fin dall'inizio", racconta Soups Ranjan, director of Data Science di Coinbase. "Uno dei principali fattori di rischio che lo scambio di criptovalute deve tenere presente è la frode e il machine learning è il fulcro del nostro sistema anti-frode".
Con Amazon SageMaker, lo strumento che crea, addestra e implementa facilmente i modelli di machine learning, gli ingegneri di Coinbase hanno sviluppato un sistema gestito da machine learning che riconosce incompatibilità e anomalie nelle fonti di identificazione dell'utente e permette, quindi, di intraprendere tempestivamente le azioni necessarie contro potenziali rischi di frode.
"L'autenticazione ID online è in realtà un problema enorme", spiega Ranjan. "Quando vai in un locale, il buttafuori guarda la tua patente di guida e ne trae diverse informazioni, oltre a vedere alcuni messaggi nascosti come gli ologrammi".
Questo non è possibile online, quindi Coinbase utilizza SageMaker per sviluppare degli algoritmi di machine learning e identificare le truffe grazie all'analisi delle immagini. Ad esempio, un algoritmo che riconosce i tratti fisionomici estrae automaticamente i volti dai documenti di identità caricati e li confronta con tutti gli altri volti che sono stati caricati. I truffatori spesso utilizzano la stessa foto per più documenti di identità al fine di evitare di dover modificare il volto in troppi punti del documento. Con questo tipo di algoritmo, l'azienda riesce a identificare tempestivamente le falsificazioni.
"Il machine learning ci aiuta a bilanciare i rischi per Coinbase e ci dà la flessibilità necessaria per offrire ai clienti la migliore esperienza possibile".
Soups Ranjan
Director of Data Science
Coinbase
"Il machine learning ci aiuta a bilanciare i rischi per Coinbase e ci dà la flessibilità necessaria per offrire ai clienti la migliore esperienza possibile".
Soups Ranjan
Director of Data Science
Coinbase
"La realtà dei fatti è che per i clienti è semplice passare da un servizio di criptovalute all'altro", dice Ranjan. "Il machine learning ci aiuta a bilanciare i rischi per Coinbase e ci dà la flessibilità necessaria per offrire ai clienti la migliore esperienza possibile".
Le informazioni dettagliate ottenute dalla creazione di algoritmi anti-frode permettono a Coinbase di sviluppare esperienze personalizzate anche in base ai singoli utenti: un modo semplice e intuitivo di segmentare gli investitori che comprano e conservano il capitale, rispetto agli utenti professionisti che vendono e comprano molto di più. In un recente esercizio di segmentazione dei clienti, un analista di Coinbase è riuscito a scrivere un algoritmo di clustering su un computer e a eseguirlo tramite SageMaker per analizzare il modo in cui i clienti utilizzano le criptovalute, suddividendo quelli interessati solo al commercio e quelli che investono a lungo termine.
Ma la gestione dei rischi è solo una parte della storia. Considerando le sue radici digitali, non sorprende il fatto che la criptovaluta, come succede nei mercati finanziari tradizionali, sia strettamente collegata a un'enorme quantità di dati. "Il nostro data warehouse raccoglie dati da diversi microservizi, tra cui la blockchain e i dati degli utenti, il che si traduce in centinaia di terabyte totali", dice Ranjan. "Dall'inizio dell'anno, questo numero è raddoppiato".
Tuttavia, operando in un ambiente altamente regolato, Coinbase adotta molte misure aggiuntive per garantire la protezione dei dati dei clienti, anche da parte dei suoi data scientist e dei suoi ingegneri. Tutti i codici eseguiti sui server di Coinbase sono stati revisionati e controllati da diversi team prima di andare in produzione. "Una delle nostre priorità è mettere sempre la sicurezza al primo posto proprio perché dobbiamo tenere al sicuro le criptovalute dei nostri clienti", spiega Ranjan.
L'accesso limitato ai dati in un ambiente altamente protetto rende il lavoro del machine learning molto più complicato. Coinbase supera questa sfida consentendo agli ingegneri, responsabili del machine learning, di accedere ai registri di dati solo tramite codici che sono stati meticolosamente revisionati e controllati in Amazon Elastic Container Registry. Per questo, gli ingegneri responsabili del machine learning non possono entrare nei server di produzione ed eseguire codici che non sono stati revisionati.
Alla fine, l'esistenza delle criptovalute digitali è fondata sulla fiducia degli investitori. E le società come Coinbase si affidano ad AWS per creare e mantenere la fiducia degli investitori lavorando per far fronte a tutti i possibili rischi.