Genentech Memaksimalkan Nilai Data Penanda Biologi Klinis Menggunakan AWS
2022
Saat kebanyakan orang berpikir tentang penelitian translasional, Genentech memikirkan terjemahan bench-to-bedside—wawasan yang dimulai di laboratorium dan pada akhirnya diterapkan di klinik sebagai terapi baru atau strategi pengobatan. Di era big data dalam ilmu hayati, para peneliti juga dapat memikirkan tentang “terjemahan terbalik,” di mana informasi yang dikumpulkan di klinik mengarah pada penemuan baru di laboratorium. Namun, untuk menuai wawasan ini diperlukan data klinis yang aman, dapat diakses, stabil, dan dapat dicari—sering kali lebih mudah diucapkan daripada dilakukan.
“Anda harus memiliki data berkualitas tinggi yang tepat. Jika Anda memasukkan banyak data sampah ke dalam algoritma analitik yang canggih, Anda masih harus mengeluarkan sampah itu,” kata Christina Lu, kepala manajemen data dan rekayasa dalam ilmu pengembangan informatika (head of data management and engineering in development sciences informatics) di Genentech.
Genentech, adalah perusahaan bioteknologi dan farmasi terkemuka yang merupakan anggota dari Roche Group. Genentech telah mengumpulkan banyak data biologis dunia nyata dari uji klinis dan penelitian selama bertahun-tahun. Pada tahun 2017, kelompok ilmu pengembangan di Genentech menerapkan strategi untuk mengoptimalkan data tersebut untuk penelitian dan pengembangan, yang bertujuan untuk menjawab pertanyaan-pertanyaan kunci seperti “Apa target obat kita selanjutnya?” dan “Bagaimana data dari uji klinis yang telah selesai menginformasikan desain uji coba di masa depan?” Strategi ini melibatkan pembangunan ekosistem data pada platform AWS untuk secara retrospektif mengurasi data ke dalam repositori yang dapat dicari serta menempatkan alat dan proses untuk manajemen data prospektif ke depan.
Para peneliti yang dulunya membutuhkan waktu berminggu-minggu untuk menyelesaikan analisis data klinis, sekarang hanya membutuhkan waktu beberapa jam. Inilah cara kami membuat setiap titik data diperhitungkan untuk memberikan obat yang tepat kepada pasien yang tepat pada waktu yang tepat.”
Christina Lu
Kepala Manajemen dan Rekayasa Data (Head of Data Management and Engineering), Genentech
Kurasi Data Membuka Wawasan Klinis
“Kami berada pada titik belok dalam penelitian klinis—untuk saat ini, jika Anda tidak memiliki data di tempat, Anda benar-benar kehilangan peluang signifikan untuk mengembangkan perawatan baru dan meningkatkan perawatan pasien,” kata Lu. Dalam kasus Genentech, banyak dari peluang tersebut yang berpusat di sekitar analisis penanda biologis—molekul terukur dalam tubuh manusia yang terkait dengan keadaan biologis tertentu—untuk memahami proses penyakit dan mekanisme molekuler.
Target untuk “memiliki data di tempat” adalah untuk memenuhi standar menjadi FAIR: Dapat Ditemukan, Dapat Diakses, Interoperabilitas, dan Dapat Digunakan Kembali (Findable, Accessible, Interoperable, and Reusable). Laporan tahun 2018 memperkirakan bahwa ekonomi Uni Eropa saja kehilangan 10,2 miliar EUR per tahun dengan menggunakan data penelitian Non-FAIR. Namun demikian, ilmuwan data menghabiskan waktu mereka hingga 80% untuk mengumpulkan, membersihkan, dan mengatur data sendiri, padahal keahlian mereka akan lebih baik digunakan untuk membangun model atau melakukan tugas-tugas khusus lainnya.
“Kurasi data warisan mahal, memakan waktu, dan tidak dapat diskalakan,” jelas Lu. Untuk menghemat biaya dan mencapai skalabilitas dan efisiensi, Genentech mengonsolidasikan dan mentransfer data penanda biologis yang ada dari jaringan organisasi penelitian kontrak (CRO) mereka ke dalam satu repositori terpusat yang dikelola dengan baik dan di-hosting di Amazon Simple Storage Service (Amazon S3), layanan penyimpanan objek. Hal ini memberi ilmuwan Genentech dan peneliti eksternal akses efisien ke sejumlah besar informasi, yang pada gilirannya akan menambah kekuatan statistik pada studi yang dapat mengungkapkan terapi gen baru atau target obat kanker.
Lu menjelaskan “Jika strategi kurasi data ini dapat diterapkan secara prospektif, kita dapat mencapai lebih banyak hal untuk memberi dampak pada kesehatan manusia”.
Membangun Ekosistem Data di AWS
“Repositori data penanda biologis yang kami bangun di AWS menampung petabita data penanda biologis eksplorasi dan menyediakan antarmuka tempat para ilmuwan dapat dengan mudah menemukan data yang mereka butuhkan untuk studi tertentu,” kata Lu.
Repositori penanda biologis disimpan di Amazon S3. Sedangkan Amazon Relational Database Service (Amazon RDS) merupakan layanan basis data relasional terkelola yang menangani metadata terkait, dengan pengindeksan dan pencarian cepat yang didukung oleh Amazon Elasticsearch Service. Genentech menggunakan Amazon API Gateway untuk membuat API yang memberikan akses khusus studi yang aman kepada para peneliti sesuai kebutuhan.
“Berkat arsitektur yang efisien ini, para peneliti yang dulunya membutuhkan waktu berminggu-minggu untuk menyelesaikan analisis data klinis, sekarang hanya membutuhkan waktu beberapa jam.,” ujar Lu. “Inilah cara kami membuat setiap titik data diperhitungkan untuk memberikan obat yang tepat kepada pasien yang tepat pada waktu yang tepat.”
Pelajari Selengkapnya
Cari tahu cara AWS mengubah manajemen data untuk perusahaan ilmu hayati lainnya.
Tentang Genentech
Genentech adalah sebuah perusahaan bioteknologi anggota Roche Group yang berdedikasi mengembangkan perawatan baru untuk penyakit serius dan mengancam jiwa.
Manfaat AWS
- Menyimpan petabita data penanda biologis eksplorasi dengan aman
- Mengurasi data menjadi Dapat Ditemukan, Dapat Diakses, Interoperabilitas, dan Dapat Digunakan Kembali (FAIR), baik secara retrospektif maupun prospektif
Layanan AWS yang Digunakan
Amazon RDS
Amazon Relational Database Service (Amazon RDS) memudahkan penyiapan, pengoperasian, dan penskalaan database relasional di cloud.
Amazon S3
Amazon Simple Storage Service (Amazon S3) adalah layanan penyimpanan objek yang menawarkan skalabilitas, ketersediaan data, keamanan, dan performa terdepan dalam industri.
Amazon API Gateway
Amazon API Gateway adalah layanan terkelola penuh yang memudahkan developer untuk membuat, menerbitkan, memelihara, memantau, dan mengamankan API pada segala skala.
AWS Lambda
AWS Lambda adalah layanan komputasi yang memungkinkan Anda membangun aplikasi yang merespons informasi dan peristiwa baru dengan cepat.
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) menawarkan platform komputasi terluas dan terdalam, dengan lebih dari 500 instans dan pilihan prosesor, penyimpanan, jaringan, sistem operasi, serta model pembelian terbaru untuk membantu menyesuaikan dengan kebutuhan beban kerja Anda.
Amazon Elasticsearch Service
Amazon Elasticsearch Service adalah layanan terkelola sepenuhnya yang mempermudah deployment, pengamanan, dan pengoperasian Elasticsearch dalam skala besar, tetapi tetap hemat biaya.
Mulai
Perusahaan segala ukuran dan lintas industri mentransformasikan bisnisnya setiap hari menggunakan AWS. Hubungi ahli kami dan mulai perjalanan AWS Cloud Anda sendiri sekarang juga.