Illumina porta la genomica dai campioni alle risposte utilizzando AWS
2021
Nell'ultimo decennio, la genomica ha conosciuto una grande evoluzione: da area di ricerca specialistica, è diventata un potente strumento clinico che ha inaugurato una nuova era di assistenza sanitaria incentrata sul paziente. Il sequenziamento e l'analisi del genoma sono diventati più semplici, economici e completi, cosicché oggi i medici hanno la possibilità di ordinare test genetici per singoli pazienti e i ricercatori possono esaminare migliaia di campioni per stabilire connessioni tra variazioni genetiche e malattie umane. Mentre il sequenziamento del primo genoma umano ha richiesto decenni, ora gli scienziati possono sequenziare in modo efficiente un intero genoma umano in meno di 24 ore.
La missione di Illumina è sfruttare il potere del genoma per migliorare la salute umana. Partner AWS, l'azienda è stata una forza trainante del progresso tecnologico nel campo della genomica, passando dal ruolo di fornitore di strumenti di sequenziamento a provider di soluzioni complete per la genomica, e dal 2013 implementa le sue soluzioni software su Amazon Web Services (AWS). Con il supporto di AWS, le soluzioni software di Illumina stanno abbattendo le barriere di ingresso e aiutano i ricercatori a fare nuove scoperte ogni giorno, agevolando la scoperta di nuovi farmaci e altro ancora.
"L'industria della genomica si sta espandendo in tutte le direzioni, dai test diretti al consumatore ai vaccini antitumorali personalizzati", afferma Susan Tousi, chief commercial officer presso Illumina. "L'obiettivo di Illumina è democratizzare l'accesso alle tecnologie genomiche in tutto il mondo; abbiamo collaborato con AWS sin dall'inizio per fornire ai nostri clienti le risposte di cui hanno bisogno. Negli ultimi dieci anni, abbiamo ampliato il nostro portfolio di software disponibile su AWS per fornire una suite di soluzioni completa e olistica, che è possibile implementare immediatamente o personalizzare in base alle proprie esigenze specifiche."
Offriamo un flusso di lavoro completo, dalla preparazione dei campioni all'analisi terziaria, nell'ambiente sicuro di AWS, che consente di aggregare e analizzare tutte le informazioni generate prima e dopo il sequenziamento."
Rami Mehio
Vice President of Bioinformatics and Instrument Software presso Illumina
Passare dai campioni alle risposte
Un flusso di lavoro genomico completo di nuova generazione inizia con la raccolta, la preparazione e il sequenziamento dei campioni, ma questo è solo l'inizio. Successivamente viene il gravoso lavoro della bioinformatica, che inizia con il controllo della qualità della lettura grezza, la pre-elaborazione e l'allineamento dei dati. Dopodiché, gli scienziati possono passare ad analisi secondarie come la determinazione delle varianti e, infine, condurre analisi terziarie avanzate in base ai loro interessi. Le analisi terziarie possono includere annotazioni filogenetiche, associazioni genotipo-fenotipo e molto altro. Per ricercatori e medici privi di esperienza in bioinformatica, l'esecuzione di ogni passaggio su una piattaforma separata può facilmente far perdere il controllo.
Illumina semplifica l'intero flusso di lavoro genomico offrendo ai clienti soluzioni integrate per ogni fase. Fin dall'inizio,BaseSpaceTM Clarity LIMS (Laboratory Information Management Systems) aiuta i clienti del settore della genomica a tracciare i campioni e ottimizzare i flussi di lavoro di sequenziamento. Gli strumenti di sequenziamento possono caricare i dati direttamente nella piattaforma Illumina Connected Analytics (ICA), dove gli utenti possono gestire set di dati e sfruttare gli strumenti analitici all'interno della piattaforma su AWS. La piattaforma DRAGENTM Bio-IT fornisce risultati delle analisi secondarie accurati a velocità elevatissima. Allo stesso tempo, BaseSpace Correlation Engine integra i set di dati e le query dei singoli ricercatori in un archivio di set di dati pubblici ad accesso aperto e controllato per supportare un'ampia varietà di analisi terziarie.
I dati di queste piattaforme sono archiviati su Amazon Simple Storage Service (Amazon S3), un servizio di archiviazione di oggetti scalabile. I clienti di Illumina potenziano e accelerano notevolmente le loro analisi con DRAGEN in esecuzione su Amazon Elastic Compute Cloud (Amazon EC2), un servizio web che fornisce capacità di calcolo sicura e dimensionabile nel cloud.
"Offriamo un flusso di lavoro completo, dalla preparazione dei campioni all'analisi terziaria, nell'ambiente sicuro di AWS, che consente di aggregare e analizzare tutte le informazioni generate prima e dopo il sequenziamento", afferma Rami Mehio, vice president of software and bioinformatics presso Illumina. "È una soluzione potente per i clienti che desiderano tracciare i campioni nel tempo, incrociare i propri dati con i database disponibili al pubblico e raccogliere informazioni per ottenere risultati più rapidi."
Mentre gli utenti avanzati hanno la possibilità di personalizzare strumenti come ICA e DRAGEN per eseguire ricerche di nicchia, Illumina offre anche soluzioni cloud end-to-end con funzionalità pronte all'uso per casi specifici. Queste includono TruSightTM Software Suite, una soluzione software di analisi delle varianti per ottenere approfondimenti sulle malattie rare, e TruSight Oncology 500, un test di sequenziamento ottimizzato per l'analisi dei tumori e l'identificazione di biomarcatori immuno-oncologici.
"I potenti strumenti di AWS sono l'ossatura su cui facciamo affidamento e che ci consentono di concentrarci sulla progettazione di algoritmi specifici per la genomica", afferma Mehio. "Man mano che le esigenze dei ricercatori e dei medici cambiano, possiamo implementare nuove funzionalità e versioni dei nostri prodotti con facilità."
AWS consente di ridurre i costi
Fin dalla sua nascita, Illumina ha ridotto il costo della tecnologia genomica a un ritmo che supera la legge di Moore. Nel 2001, il sequenziamento di un singolo genoma umano era costato oltre 100 milioni di dollari, mentre oggi, a 20 anni di distanza, può costarne appena 600.
"Vogliamo democratizzare l'accesso alle tecnologie genomiche e trasferire i risparmi sui costi ai nostri clienti è un aspetto fondamentale", afferma Tousi. "Il costo non dovrebbe essere un fattore decisivo per la ricerca o le applicazioni cliniche: le persone dovrebbero avere la possibilità di eseguire il sequenziamento e l'analisi esclusivamente in base a come prevedono di utilizzare i dati."
Le classi di archiviazione Amazon S3 possono essere personalizzate in base alle diverse esigenze di dati, facilitando l'ottimizzazione e consentendo a Illumina di ottenere il massimo risparmio sui costi. Archiviando petabyte di dati ad accesso sporadico in Deep Archive Amazon S3 Glacier, i clienti di Illumina risparmiano oltre il 90% sui costi di archiviazione. Analogamente, DRAGEN viene eseguito sulle istanze F1 di Amazon EC2, che offrono capacità di calcolo accelerata e conveniente in grado di supportare i processi paralleli richiesti da Illumina. Le istanze F1 offrono un'accelerazione hardware personalizzabile con serie di porte programmabili sul campo (FPGA) DRAGEN. Per dimensionare DRAGEN sulle istanze F1, l'azienda ha utilizzato Batch AWS, un servizio di elaborazione in batch completamente gestito che pianifica, programma ed esegue carichi di lavoro di elaborazione in batch.
"AWS ci offre varie opzioni per ottimizzare velocità, flessibilità e costi e soddisfare i casi d'uso e le esigenze dei clienti finali", afferma Mehio. "Per alcuni utenti, la priorità è eseguire le analisi genetiche nel minor tempo possibile, mentre alcuni utenti accademici potrebbero tollerare di impiegare più tempo per ridurre i costi e risparmiare dollari di sovvenzioni alla ricerca. Sfruttando tipi di istanze F1 e opzioni di archiviazione differenti, i nostri utenti beneficiano della flessibilità e della capacità di aumentare e ridurre verticalmente in base alle esigenze."
Inoltre, Illumina riduce i costi per i clienti finali eseguendo molti processi di calcolo delle sue piattaforme su istanze spot di Amazon EC2, disponibili a un prezzo fino al 90% inferiore rispetto ai prezzi on demand. "Solo nell'ultimo anno, i nostri clienti hanno utilizzato centinaia di migliaia di ore di istanze spot, traendone un notevole risparmio sui costi", afferma Tousi.
I risparmi sui costi e i vantaggi tecnici possono andare di pari passo. Di recente, Illumina ha migrato l'analisi terziaria Correlation Engine ad AWS, ottenendo un risparmio sui costi e il dimensionamento delle pipeline di importazione dei dati fino a sei volte per far crescere la knowledge base più velocemente e incrementare la potenza.
Soluzioni sicure per far crescere la genomica a livello globale
I dati genomici umani possono essere associati a informazioni sanitarie altamente personali e le violazioni dei dati rappresentano un rischio in continua crescita per le organizzazioni sanitarie di tutto il mondo. Di conseguenza, la sicurezza è un aspetto fondamentale per Illumina e i suoi clienti, molti dei quali devono rispettare normative sempre più rigide in materia di gestione dei dati.
"La sicurezza ha la precedenza su tutto: è al centro di tutto ciò che facciamo", afferma Tousi. "Di base, possiamo contare sul modello di responsabilità condivisa AWS per garantire che la nostra infrastruttura cloud sottostante soddisfi i requisiti di sicurezza e conformità a livello aziendale. Sfruttando le regioni Amazon EC2 a livello globale, forniamo capacità di calcolo per i dati, supportando i clienti in ogni parte del mondo e consentendo loro di mantenere la sovranità dei dati."
AWS supporta migliaia di standard di sicurezza e certificazioni di conformità, tra cui HIPAA, GDPR, ISO 27001 e ISO 13485, aiutando i clienti a soddisfare i requisiti di conformità in tutti i loro flussi di lavoro genomici. Illumina offre ai clienti una maggiore tranquillità con la gestione dei dati in Amazon Virtual Private Cloud (Amazon VPC), che avvia altre risorse AWS in una rete virtuale personalizzata logicamente isolata che separa i dati di un cliente da quelli di un altro.
Queste caratteristiche di scalabilità e implementazione globali facilitano una collaborazione significativa sia per i progetti a lungo termine sia per intervenire rapidamente in risposta alle crisi. Nel 2020 e nella prima metà del 2021, ricercatori di ogni parte del mondo hanno analizzato oltre 371.000 campioni relativi al COVID-19 sulle app COVID-19 BaseSpace di Illumina. "Se i clienti fossero stati in grado di condurre le analisi soltanto on-premise, avremmo incontrato seri vincoli. Pertanto, il cloud è stato fondamentale per sostenere e consentire la risposta globale alla pandemia a quel livello", afferma Tousi.
Costruire il futuro della genomica e della biotecnologia
Con l'aumento delle iniziative di genetica delle popolazioni su larga scala e l'ampliamento dell'accesso a potenti soluzioni software di analisi come ICA, Illumina sta sfruttando appieno la potenza dei big data nella genomica per aiutare i clienti a estrarre approfondimenti da enormi volumi di dati di sequenziamento. Questi progetti promuoveranno una nuova era della genomica personalizzata, consentendo ai ricercatori di stabilire connessioni tra geni e risultati sulla salute che campioni più piccoli non consentivano di evidenziare.
Inoltre, le piattaforme di Illumina stanno aiutando la ricerca a eseguire in modo ottimale la transizione a un futuro multiomico. La pipeline DRAGEN Single-Cell RNA basata su cloud, ad esempio, consente agli scienziati di annotare l'espressione genica delle singole cellule. Con l'accelerazione DRAGEN, la piattaforma può elaborare contemporaneamente tre campioni di cellule in parallelo in circa 53 minuti.
"Con ICA, DRAGEN e altri strumenti implementati su AWS, forniamo soluzioni che consentono ai clienti di aggregare qualsiasi tipo di dati, inclusi dati di sequenziamento di prossima generazione e dati sanitari, per estrarre nuove informazioni dalle ampie coorti disponibili e migliorare la salute umana su larga scala", afferma Mehio.
Ulteriori informazioni
Scopri come AWS supporta altre importanti organizzazioni del settore delle scienze della vita nella loro ricerca volta a migliorare la salute umana.
Informazioni su Illumina
Illumina sviluppa, produce e commercializza sistemi integrati per l'analisi della variazione genetica e della funzione biologica.
Vantaggi di AWS
- Accesso facilitato a flussi di lavoro semplificati, unificati e personalizzabili, dai campioni all'analisi
- Drastica riduzione dei costi di calcolo e archiviazione con le istanze spot di Amazon EC2 e Glacier Amazon S3
- Implementazione di un solido portfolio di soluzioni genomiche a livello globale in un ambiente sicuro e conforme
- Accelerazione della ricerca e promozione della collaborazione tra i clienti in tutto il mondo per processare oltre 371.000 campioni relativi al COVID-19
Servizi AWS utilizzati
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) è un servizio Web che fornisce capacità di elaborazione sicura e scalabile nel cloud. È concepito per rendere più semplice il cloud computing su scala Web per gli sviluppatori.
Amazon S3
Amazon Simple Storage Service (Amazon S3) è un servizio di storage di oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore.
AWS Virtual Private Cloud
Amazon Virtual Private Cloud (Amazon VPC) permette di avviare risorse AWS in una rete virtuale isolata logicamente definita dall'utente.
Istanze Spot di Amazon EC2
Le istanze Spot di Amazon EC2 ti permettono di sfruttare la capacità EC2 inutilizzata all'interno di AWS Cloud. Le istanze Spot sono disponibili con prezzi scontati fino al 90% inferiori rispetto ai prezzi delle istanze on demand.
Inizia
Le aziende di tutte le taglie e di tutti i settori stanno trasformando ogni giorno la propria attività grazie ad AWS. Contatta i nostri esperti e inizia subito il tuo viaggio in AWS Cloud.