Janssen Pharmaceuticals incrementa la precisione del machine learning del 21% grazie ad Amazon SageMaker
2022
Janssen Pharmaceuticals (Janssen), un gruppo di aziende farmaceutiche che fanno parte di Johnson & Johnson dal 1961, impiega il machine learning (ML) per approfondire la comprensione dell'esperienza dei pazienti che seguono le terapie Janssen. Per automatizzare il flusso di lavoro di implementazione e creare un'interfaccia migliore tra gli ambienti di sviluppo e produzione, i data scientist di Janssen hanno utilizzato Amazon Web Services (AWS). Utilizzando i servizi AWS, tra cui Amazon SageMaker, un servizio di ML che può essere utilizzato per creare, addestrare e implementare modelli di ML praticamente per qualsiasi caso d'uso, Janssen ha implementato un processo di operazioni di ML automatizzate (MLOps). Tale processo ha migliorato del 21% l'accuratezza delle previsioni dei modelli e aumentato di circa il 700% la velocità delle attività di ingegneria delle funzionalità, aiutando Janssen a ridurre i costi e a incrementare al contempo l'efficienza.
Invece di organizzare ogni fase del processo in modo sequenziale, utilizzando AWS Glue e AWS Step Functions in combinazione, potremmo parallelizzare i processi di preparazione dei dati e ingegneria delle funzionalità e le loro modalità di orchestrazione."
Jenna Eun
Principal Data Scientist presso Janssen Pharmaceuticals
Ricerca dell'automazione nelle MLOps per accelerare la ricerca
Janssen offre un'ampia varietà di prodotti che coprono diverse aree terapeutiche, tra cui l'immunologia, le malattie infettive, le neuroscienze e l'oncologia. "Fornire la miglior assistenza possibile ai pazienti lungo i loro complessi percorsi terapeutici è fondamentale, perciò ricorriamo all'intelligenza artificiale e al machine learning per comprendere meglio le esperienze dei pazienti con le terapie e per rispondere più efficacemente alle loro necessità nel corso della malattia", ha spiegato Jenna Eun, principal data scientist presso Janssen.
Per velocizzare l'effetto sull'esperienza dei pazienti delle soluzioni basate sul machine learning, il team Business Technology Commercial Data Sciences di Janssen ha scelto di focalizzarsi sulle MLOps, un insieme di pratiche volte a implementare e mantenere in modo affidabile ed efficiente i modelli di ML in produzione, con l'obiettivo di incrementare l'automazione e soddisfare i requisiti aziendali e tecnologici. "Il nostro obiettivo per le MLOps è favorire la sperimentazione e il monitoraggio delle prestazioni dei modelli nel tempo", afferma Eun. "Per noi è fondamentale poter sperimentare facilmente ed esplorare in profondità lo spazio degli iperparametri per rafforzare la fiducia nei nostri modelli di machine learning."
Janssen ha quindi formato un team interfunzionale per sviluppare un processo di MLOps automatizzato, riconoscendo l'importanza di allineare le esigenze tecnologiche ai requisiti interni di sicurezza. "Dato che i processi che sviluppiamo implicano l'impiego di dati sanitari, adottiamo rigide misure di sicurezza e privacy che devono essere accuratamente seguite nello sviluppo e nell'implementazione delle nostre soluzioni tecnologiche", ha dichiarato Eun. A partire dalla fine del 2020, il team Business Technology Commercial Data Sciences di Janssen e il team Technology CloudX di Johnson & Johnson hanno collaborato con il team di architettura delle soluzioni Amazon SageMaker e AWS Professional Services, un gruppo globale di esperti dedicati a supportare le aziende nel raggiungimento dei loro obiettivi aziendali su AWS.
Aumento della velocità e della precisione del machine learning su AWS
Collaborando con il team di architettura delle soluzioni Amazon SageMaker e AWS Professional Services, il team Business Technology Commercial Data Sciences di Janssen e il team Technology CloudX di Johnson & Johnson hanno automatizzato i moduli di preparazione dei dati e di ingegneria delle funzionalità in meno di tre mesi. L'ingegneria delle funzionalità è il processo di creazione delle variabili di input dai dati dei pazienti per l'addestramento di modelli di ML supervisionati. Attraverso l'automazione dei processi correlati, i team sono stati in grado di aumentare di circa il 600% la velocità di preparazione dei dati e di circa il 700% la velocità nell'ingegneria delle funzionalità. Janssen ha raggiunto questo obiettivo utilizzando AWS Step Functions, un servizio di flusso di lavoro visivo a basso codice che semplifica la sequenza dei passaggi necessari per raccogliere, elaborare e normalizzare i dati di origine. AWS Step Functions coordina i processi su AWS Glue, un servizio di integrazione dei dati serverless che dispone di una funzionalità per sincronizzare facilmente gli ambienti di sviluppo e produzione per un'implementazione più rapida di soluzioni di ML sperimentate e ottimizzate. "Invece di eseguire ogni fase del processo in sequenza, siamo stati in grado di parallelizzare i processi di preparazione dei dati e di ingegneria delle funzionalità e di orchestrare il tutto utilizzando AWS Glue e AWS Step Functions insieme", ha spiegato Eun. "Questo ci ha permesso di collegare agevolmente gli ambienti di sviluppo e produzione; in tal modo, ciò che sperimentiamo può essere rapidamente trasformato in processi AWS Glue avviati da AWS Step Functions."
Dopo aver implementato la soluzione di MLOps su AWS, Janssen ha aumentato del 21% la precisione della sua modellazione predittiva. "Dato che la pipeline dei dati è più automatizzata e richiede meno tempo, possiamo concentrarci maggiormente sulle prestazioni del modello", ha affermato Eun. Un aspetto fondamentale per incrementare l'accuratezza del modello di machine learning è l'ottimizzazione degli iperparametri. Una volta definiti i modelli e i dati, il team di Janssen utilizza Amazon SageMaker per ottimizzare automaticamente un modello, regolando migliaia di combinazioni di parametri dell'algoritmo per ottenere le previsioni più precise possibili. Tale automazione, combinata con il suo algoritmo di ottimizzazione bayesiana, riduce sostanzialmente il tempo di ricerca dei parametri. "Grazie alla nostra vasta ricerca sugli iperparametri, siamo più fiduciosi nei confronti del modello di ML che abbiamo sviluppato", ha dichiarato Eun.
Il team di Janssen e il team Technology CloudX di Johnson & Johnson sono riusciti a documentare questo progetto e a condividerlo con altri team di Johnson & Johnson che lavorano su progetti di ML simili. La diffusione di queste conoscenze contribuisce ad accelerare altri progetti, che devono comunque rispettare le policy di sicurezza di Johnson & Johnson, e a promuovere all'interno dell'intera organizzazione una cultura associata alle MLOps. "Definendo un esempio per gli altri, abbiamo illustrato il modo di integrare diversi servizi AWS per sviluppare una pipeline di machine learning completa nell'ambiente di Johnson & Johnson", commenta Eun. "La capacità di creare e incrementare l'efficienza in alcune aree del nostro precedente processo di sviluppo e implementazione del machine learning ci ha fatto comprendere meglio la flessibilità e la scalabilità che possiamo raggiungere."
Miglioramento delle terapie per i pazienti in tutto il mondo
La soluzione di MLOps di Janssen consente di fornire soluzioni di data science su larga scala. "Man mano che mettiamo in pratica la nostra soluzione nel mondo reale e ne dimostriamo l'impatto, prevediamo di estenderla a regioni geografiche più ampie e di adattarla ad altri scenari aziendali all'interno di Johnson & Johnson", conclude Eun.
Informazioni su Janssen Pharmaceuticals
Janssen Pharmaceuticals, che fa parte di Johnson & Johnson dal 1961, è un'organizzazione di ricerca e sviluppo focalizzata sul miglioramento degli esiti dei pazienti affetti da malattie gravi in sei aree terapeutiche, tra cui salute cardiovascolare, immunologia, neurologia e oncologia.
Vantaggi di AWS
- Velocità di preparazione dei dati incrementata di circa il 600%
- Velocità di ingegneria delle funzionalità migliorata di circa il 700%
- Precisione dei modelli di ML più accurata del 21%
- Definizione di un'architettura di riferimento di MLOps standardizzata per gli altri team di Johnson & Johnson
Servizi AWS utilizzati
Amazon SageMaker
Amazon SageMaker aiuta sviluppatori e data scientist a preparare, creare, addestrare e implementare rapidamente modelli di machine learning (ML) di alta qualità combinando un’ampia gamma di funzionalità create ad hoc per il ML.
AWS Step Functions
AWS Step Functions è il servizio di flusso di lavoro visivo low-code che gli sviluppatori utilizzano per creare applicazioni distribuite, automatizzare processi IT e aziendali e costruire pipeline di dati e machine learning attraverso i servizi AWS.
AWS Glue
AWS Glue è un servizio di estrazione, trasferimento e caricamento (ETL) che semplifica la preparazione e il caricamento dei dati in strumenti di analisi.
AWS Professional Services
L'organizzazione AWS Professional Services è un team globale di esperti che ti aiuta a raggiungere i risultati aziendali auspicati utilizzando il cloud AWS.
Nozioni di base
Organizzazioni di tutte le dimensioni in tutti i settori trasformano il proprio business e realizzano le loro missioni ogni giorno utilizzando AWS. Contatta i nostri esperti e inizia subito il tuo percorso verso il cloud AWS.