Panduan ini membantu Anda menghubungkan instrumen data ilmu hayati dan file sistem laboratorium ke AWS Cloud, baik melalui internet maupun koneksi langsung dengan latensi rendah. Anda dapat mengurangi biaya penyimpanan untuk data yang lebih jarang diakses atau membuatnya dapat diakses untuk komputasi performa tinggi untuk genomika, pencitraan, dan beban kerja intens lainnya, semuanya di AWS.
Diagram Arsitektur
Langkah 1
Teknisi laboratorium menjalankan eksperimen atau pengujian, dan hasilnya ditulis dalam folder di server file on-premise. Tugas AWS DataSync disiapkan untuk menyinkronkan data dari penyimpanan lokal ke bucket di Amazon Simple Storage Service (Amazon S3).
Langkah 2
Data ditransfer ke AWS Cloud, baik melalui internet maupun koneksi langsung dengan latensi rendah yang tidak menggunakan internet, seperti AWS Direct Connect.
Langkah 3
Buku catatan laboratorium elektronik (ELN) dan sistem manajemen informasi laboratorium (LIMS) berbagi metadata eksperimen dan pengujian dua arah dengan AWS Cloud melalui peristiwa dan API. Pelajari lebih lanjut tentang integrasi ini di Panduan untuk Jala Data Laboratorium di AWS.
Langkah 4
Entitas partner, seperti organisasi riset kontrak (CRO), dapat mengunggah hasil studi ke Amazon S3 dengan menggunakan AWS Transfer Family untuk FTP, SFTP, atau FTPS.
Langkah 5
Anda dapat mengoptimalkan biaya penyimpanan dengan menulis data instrumen ke bucket S3 yang dikonfigurasi untuk akses yang tidak sering dilakukan. Identifikasi pola akses penyimpanan S3 Anda untuk mengonfigurasi kebijakan siklus hidup bucket S3 Anda secara optimal dan mentransfer data ke Amazon S3 Glacier.
Langkah 6
Dengan Amazon FSx for Lustre, data dapat diakses oleh komputasi performa tinggi (HPC) di Cloud untuk genomika, pencitraan, dan beban kerja intensif lainnya untuk menyediakan sistem file bersama dengan latensi milidetik rendah.
Langkah 7
Pipeline bioinformatika diatur dengan AWS Step Functions, AWS HealthOmics, dan AWS Batch untuk komputasi CPU dan GPU yang fleksibel.
Langkah 8
Machine learning dilakukan dengan toolkit kecerdasan buatan dan machine learning (AI/ML) yang menggunakan Amazon SageMaker untuk rekayasa fitur, pelabelan data, pelatihan model, deployment, dan operasi ML. Amazon Athena digunakan untuk kueri SQL yang fleksibel.
Langkah 9
Untuk peneliti yang menggunakan aplikasi on-premise untuk analisis data dan pelaporan, mereka melihat dan mengakses data di Amazon S3 dengan menggunakan Sistem File Jaringan (NFS) atau Blok Pesan Server (SMB) melalui Gateway File Amazon S3.
Pilar Well-Architected
Kerangka Kerja AWS Well-Architected membantu Anda memahami keuntungan dan kerugian dari keputusan yang Anda buat saat membangun sistem di cloud. Enam pilar dari Kerangka Kerja ini memungkinkan Anda mempelajari praktik terbaik arsitektur untuk merancang dan mengoperasikan sistem yang andal, aman, efisien, hemat biaya, dan berkelanjutan. Dengan Alat AWS Well-Architected yang tersedia secara gratis di Konsol Manajemen AWS, Anda dapat meninjau beban kerja dan membandingkannya terhadap praktik terbaik ini dengan menjawab serangkaian pertanyaan untuk setiap pilar.
Diagram arsitektur di atas adalah contoh Solusi yang dibuat dengan mempertimbangkan praktik terbaik Well-Architected. Untuk menjadi Well-Architected sepenuhnya, Anda harus mengikuti praktik terbaik Well-Architected sebanyak mungkin.
-
Keunggulan Operasional
Seiring dengan munculnya sumber data dan partner baru, berbagai layanan transfer data dapat digunakan untuk beradaptasi dengan pola akses yang berubah ini. Untuk lingkungan multisitus, Gateway File S3 dapat digunakan untuk mentransfer sementara Anda mempertahankan cache di tempat untuk aplikasi lain. Transfer Family memungkinkan entitas partner, seperti CRO, mengunggah hasil studi dengan mudah.
-
Keamanan
Untuk tujuan perlindungan data, kami merekomendasikan Anda untuk melindungi kredensial akun AWS Anda dan menyiapkan akun pengguna individual dengan AWS Identity and Access Management (IAM), sehingga setiap pengguna hanya diberikan izin yang diperlukan untuk memenuhi tugas pekerjaannya. Kami juga menyarankan Anda menggunakan enkripsi diam, dan layanan menggunakan enkripsi bergerak secara default.
-
Keandalan
DataSync memanfaatkan satu atau beberapa titik akhir VPC untuk memastikan bahwa jika suatu Zona Ketersediaan tidak tersedia, agen tersebut dapat mencapai titik akhir lainnya. DataSyncadalah layanan yang dapat diskalakan yang memanfaatkan kumpulan agen untuk memindahkan data. Tugas dan agen tersebut dapat diskalakan berdasarkan permintaan jumlah data yang perlu dimigrasi.
DataSync mencatat semua peristiwa ke Amazon CloudWatch. Jika suatu pekerjaan gagal, tindakan dapat diambil untuk lebih memahami masalah dan letak kesalahan tugas. Setelah tugas selesai, pekerjaan setelah pemrosesan dapat dimulai untuk menyelesaikan fase berikutnya dari proses pipeline.
Amazon S3 menyediakan infrastruktur penyimpanan yang sangat tahan lama yang dirancang untuk penyimpanan data penting dan utama.
-
Efisiensi Performa
Penyimpanan FSx for Lustre menyediakan latensi submilidetik, throughput hingga ratusan GB/dtk, dan jutaan IOPS.
-
Optimisasi Biaya
Dengan menggunakan teknologi nirserver yang menskalakan sesuai permintaan, Anda hanya membayar untuk sumber daya yang Anda gunakan. Untuk lebih mengoptimalkan biaya, Anda dapat menghentikan lingkungan notebook di SageMaker saat tidak digunakan. Jika Anda tidak berencana menggunakan dasbor visualisasi Amazon QuickSight , Anda dapat memilih untuk tidak men-deploy dasbor tersebut untuk menghemat biaya.
Biaya Transfer Data terdiri dari dua area utama: DataSync, yang dikenakan per GB yang ditransfer; dan Direct Connect atau data VPN yang ditransfer. Selain itu, biaya lintas-Zona Ketersediaan dapat dikenakan jika titik akhir VPC digunakan.
-
Keberlanjutan
Metrik CloudWatch memungkinkan pengguna untuk mengambil keputusan yang didorong data berdasarkan peringatan dan tren. Dengan menggunakan layanan terkelola dan penskalaan dinamis secara ekstensif, Anda meminimalkan dampak lingkungan dari layanan backend. Sebagian besar komponen bersifat mandiri.
Sumber Daya Implementasi
Panduan mendetail disediakan untuk bereksperimen dan digunakan dalam akun AWS Anda. Setiap tahap pembuatan Panduan, termasuk deployment, penggunaan, dan pembersihan, diperiksa guna mempersiapkannya untuk deployment.
Kode sampel adalah titik awal. Kode sampel ini diivalidasi industri, bersifat preskriptif, tetapi tidak definitif, dan coba periksa kode sampel ini untuk memulai.
Konten Terkait
Membangun Laboratorium yang Terhubung secara Digital dengan AWS
Postingan ini membahas alat, praktik terbaik, dan partner yang membantu laboratorium Ilmu Hayati memaksimalkan skala dan performa AWS Cloud.
Panduan untuk Jala Data Laboratorium di AWS
Panduan ini menunjukkan bagaimana cara membangun sistem manajemen data ilmiah yang mengintegrasikan data instrumen laboratorium dan perangkat lunak dengan tata kelola data cloud, penemuan data, dan pipeline bioinformatika, menangkap peristiwa metadata utama di sepanjang jalan yang dilalui.
Resilience Membangun Jala Data Global untuk Konektivitas Laboratorium di AWS
Studi kasus ini menjelaskan bagaimana cara Resilience, perusahaan inovator biomanufaktur, merevolusi cara obat-obatan baru diproduksi dengan jaringan yang terhubung untuk transfer data di AWS.
Penafian
Kode sampel; pustaka perangkat lunak; alat baris perintah; bukti konsep; templat; atau teknologi terkait lainnya (termasuk yang sebelumnya disediakan oleh personel kami) disediakan untuk Anda sebagai Konten AWS berdasarkan Perjanjian Pelanggan AWS, atau perjanjian tertulis yang relevan antara Anda dan AWS (mana saja yang berlaku). Anda tidak boleh menggunakan Konten AWS ini di akun produksi Anda, atau pada produksi atau data penting lainnya. Anda bertanggung jawab untuk menguji, mengamankan, dan mengoptimalkan Konten AWS, seperti kode sampel, yang sesuai untuk penggunaan tingkat produksi berdasarkan praktik dan standar kontrol kualitas spesifik Anda. Melakukan deployment Konten AWS dapat dikenai biaya AWS untuk membuat atau menggunakan sumber daya AWS berbayar, seperti menjalankan instans Amazon EC2 atau menggunakan penyimpanan Amazon S3.
Referensi ke layanan atau organisasi pihak ketiga dalam Panduan ini tidak menyiratkan dukungan, sponsor, atau afiliasi antara Amazon atau AWS dan pihak ketiga. Panduan dari AWS adalah titik awal teknis, dan Anda dapat menyesuaikan integrasi Anda dengan layanan pihak ketiga saat melakukan deployment arsitektur.