Étude de cas : International Centre for Radio Astronomy Research (ICRAR)
2014
L'International Centre for Radio Astronomy Research (ICRAR) a été créé en 2009 en tant que joint-venture entre l'université Curtin et l'université d'Australie-Occidentale. Les 110 employés de l'ICRAR, situé à Perth, en Australie-Occidentale, participent actuellement à une initiative internationale de développement du plus gros radiotélescope du monde, connu sous le nom de Square Kilometre Array (SKA). Pendant sa durée de vie de plus de 50 ans, le SKA permettra d'approfondir notre connaissance de l'univers
« L'évolutivité d'AWS s'est avérée très utile. Je peux ajouter très simplement davantage de capacités en fonction de mes besoins. Le recours à AWS nous a permis de traiter plus de 150 Go d'images du ciel et de stocker plus de 400 Go de données d'imagerie chaque mois. »
Kevin Vinsen
Professeur-chercheur adjoint à l'ICRAR
Le défi
Une fois opérationnel, le SKA devrait rassembler et traiter autant de données provenant du ciel chaque jour que le monde en produit actuellement chaque année. Le SKA se servira de ces données pour créer des cartes du ciel que les scientifiques pourront utiliser pour étudier l'univers. Une seule image du SKA pourrait représenter jusqu'à 600 To, et chaque carte du ciel nécessitera des milliers d'images.
« Nous devons relever des défis informatiques incommensurables », a affirmé Kevin Vinsen, professeur-chercheur adjoint à l'ICRAR. « Lorsqu'il sera pleinement opérationnel au cours de la prochaine décennie, en fonction de la science, le SKA pourrait collecter entre 500 To et 1 Po de données d'imagerie chaque jour. Rien que l'intensité de la puissance de calcul brute dont nous avons besoin pour parvenir à cela est extraordinaire. »
Afin d'amasser des ressources de calcul pour une série d'expériences préliminaires, l'ICRAR a lancé une initiative de calcul informatique communautaire appelée theSkyNet. Ce projet permet à l'ICRAR d'utiliser des cycles CPU mis à disposition par le public afin de simuler un superordinateur. Vinsen et ses collègues utilisent alors la puissance de calcul générée par theSkyNet pour analyser des images de galaxies issues du télescope Pan-STARRS1 à Hawaï dans le cadre du projet theSkyNet.
Les projets de calcul informatique approvisionné à grande échelle entraînent souvent des problèmes d'adaptation de la capacité du serveur physique à la charge de données entrantes. Il fallait que l'ICRAR réalise des expériences à l'aide de theSkyNet de manière rentable et flexible afin que Vinsen et son équipe obtiennent rapidement des résultats.
Avantages d'Amazon Web Services
La nature évolutive et l'offre à la demande d'Amazon Web Services (AWS) en ont fait un choix logique pour les expériences nécessaires à la conception du SKA. AWS peut fournir les ressources dont l'ICRAR a besoin pour analyser de larges volumes de données d'imagerie. Vinsen a obtenu une subvention Enseignement AWS pour lancer l'initiative theSkyNet en 2012 et le projet s'est développé jusqu'à atteindre 40 téraFLOPS l'année dernière. Un téraFLOP équivaut à un billion d'opérations en virgule flottante par seconde.
« Nous considérons les solutions basées sur le cloud et les installations de calcul de haute performance comme étant complémentaires et pensons que ces deux éléments joueront un rôle dans le traitement, le stockage et la diffusion d'énormes volumes de données créées par les observatoires de nouvelle génération », déclare le professeur adjoint Vinsen. « Nous souhaitons être flexibles et nous pouvons facilement utiliser AWS pour nos expériences au lieu d'un superordinateur dédié. »
L'ICRAR a recours à Amazon Route 53 pour acheminer tous les utilisateurs externes vers ses sites Web theSkyNet. Les scientifiques utilisent alors une instance medium Amazon Elastic Compute Cloud (Amazon EC2) et des images machine Amazon à la demande (AMI Amazon) pour traiter les cycles CPU approvisionnés à grande échelle de theSkyNet, et une autre petite instance Amazon EC2 comme serveur de fichiers réseau.
Pour stocker les données d'imagerie, l'ICRAR monte deux volumes Amazon Elastic Block Store (Amazon EBS) de 60 Go et archive les données à l'aide d'Amazon Glacier. L'équipe ICRAR utilise également Amazon Simple Storage Service (Amazon S3) comme élément de stockage clé pour montrer aux volontaires les galaxies que la puissance de traitement de leurs PC aide à analyser.
Les avantages
L'ICRAR a élaboré le projet theSkyNet sur AWS en seulement quatre jours. L'équipe peut à présent développer rapidement et efficacement l'infrastructure de cloud, le public proposant davantage de cycles CPU pour soutenir l'initiative.
« L'évolutivité d'AWS s'est avérée très utile », a déclaré le professeur adjoint Vinsen. « Je peux ajouter très simplement davantage de capacités en fonction de mes besoins. Le recours à AWS nous a permis de traiter plus de 150 Go d'images du ciel et de stocker plus de 400 Go de données d'imagerie chaque mois. »
En utilisant Amazon S3 comme un élément de stockage de valeur fondamentale, l'ICRAR peut répertorier et opérer sans problème l'entrée de centaines de milliers de CPU publiques du monde entier. Amazon ELB aide l'ICRAR à opérer le flux de données allant vers et provenant de la communauté theSkyNet.
L'ICRAR utilise Amazon EBS pour stocker plus de 400 Go de données d'imagerie tous les mois, celles-ci étant traitées par la communauté. Amazon EC2 offre à l'ICRAR les capacités de calcul nécessaires pour analyser simultanément entre 400 et 500 galaxies.
Ce projet s'est révélé être très populaire et peu après la migration vers AWS, les communautés en ligne en Russie, en Amérique et en Australie ont surchargé le serveur theSkyNet de l'ICRAR. Cependant, il n'a fallu que deux heures au professeur adjoint Vinsen pour accroître la capacité. « Dans les autres projets de calcul informatique communautaire, cela a pris des jours pour se remettre de surcharges, car il a fallu trouver un plus grand nombre de ressources d'infrastructure pour lancer de nouveaux serveurs », a-t-il affirmé. « Avec AWS, il me suffit de mettre en service une plus grosse instance. »
L'ICRAR prévoit d'utiliser AWS pour répondre aux besoins en matière de calcul continu des futures expériences qui auront lieu au sein de theSkyNet.
À propos de l'International Centre for Radio Astronomy Research (ICRAR)
L'International Centre for Radio Astronomy Research (ICRAR) a été créé en 2009 en tant que joint-venture entre l'université Curtin et l'université d'Australie-Occidentale.
Services AWS utilisés
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) est un service Web qui fournit une capacité de calcul sécurisée et redimensionnable dans le cloud. Destiné aux développeurs, il est conçu pour faciliter l'accès aux ressources de cloud computing à l'échelle du Web.
Amazon S3
Amazon Simple Storage Service (Amazon S3) est un service de stockage d'objet offrant une scalabilité, une disponibilité des données, une sécurité et des performances de pointe.
En savoir plus »
Amazon Route 53
Amazon Route 53 est un service Web DNS (Domain Name System) dans le cloud hautement disponible et évolutif.
En savoir plus »
Amazon Glacier
Amazon S3 Glacier et S3 Glacier Deep Archive sont des classes de stockage dans le cloud sécurisées, durables et à très faibles coûts Amazon S3 qui permettent l'archivage et la sauvegarde des données longue durée.
En savoir plus »
AMI Amazon
L'AMI Amazon Linux est une AMI Linux prise en charge et mise à jour par Amazon Web Services. Elle est destinée à être utilisée sur Amazon Elastic Compute Cloud (Amazon EC2).
En savoir plus »
Amazon EBS
Amazon Elastic Block Store (EBS) est un service de stockage par bloc hautes performances et simple d'utilisation, destiné à être utilisé avec Amazon Elastic Compute Cloud (EC2) pour les charges de travail exigeantes en débit et à haut niveau de transactions à n'importe quelle échelle.
En savoir plus »
Démarrer
Les entreprises de toutes tailles et de tous les secteurs d’activités transforment chaque jour leurs activités à l’aide d’AWS. Contactez nos spécialistes et entamez votre transition vers le Cloud AWS dès aujourd'hui.