Architecture de données moderne Amazon Redshift
Le volume de données générées par l'IoT, les appareils intelligents, les applications cloud et les réseaux sociaux augmente de façon exponentielle. Vous avez besoin de méthodes pour analyser simplement et de façon rentable toutes ces données avec un délai minimal d'accès à l'information, quels que soient le format ou l'emplacement des données.
Amazon Redshift optimise l'architecture de données moderne, ce qui vous permet d'interroger les données de votre entrepôt de données, de votre lac de données et des bases de données opérationnelles afin d'obtenir plus rapidement des insights approfondis auxquels vous n'auriez pas accès avec d'autres solutions. Avec une architecture de données moderne, vous pouvez stocker les données dans des formats de fichier ouverts dans votre lac de données Amazon S3. Cela vous permet de mettre ces données facilement à la disposition d'autres outils d'analytique et de machine learning au lieu de les enfermer dans un nouveau silo.
Avec une architecture de données moderne Amazon Redshift, vous pouvez :
- interroger facilement des données dans votre lac de données et réécrire des données dans votre lac de données dans des formats ouverts ;
- utiliser des instructions SQL familières pour combiner et traiter des données à travers tous vos magasins de données ;
- exécuter des requêtes sur des données en direct dans vos bases de données opérationnelles sans avoir besoin de charger les données et de pipelines ETL.
Fonctionnalités
L'architecture de données moderne Amazon Redshift est optimisée par les capacités suivantes :
Amazon Redshift Spectrum
Interrogez les données au format ouvert directement dans le lac de données Amazon S3 sans avoir à charger les données ou à dupliquer votre infrastructure. À l'aide de la fonction Amazon Redshift Spectrum, vous pouvez interroger des formats de fichiers ouverts tels qu'Apache Parquet, ORC, JSON, Avro et CSV. Suivez ce didacticiel étape par étape pour commencer.
Data Lake Export
Enregistrez les résultats d'une requête Amazon Redshift directement dans votre lac de données S3 dans un format de fichier ouvert (Apache Parquet) l'aide de la fonction Data Lake Export. Vous pouvez ensuite analyser ces données avec la fonction Amazon Redshift Spectrum, ainsi que d'autres services AWS comme SageMaker pour le machine learning et EMR pour les opérations ETL. Regardez cette vidéo de 5 minutes pour commencer.
Requête fédérée
La requête fédérée permet à Amazon Redshift d'interroger des données directement dans Amazon RDS et les magasins Aurora PostgreSQL. Cela vous permet d'intégrer des données opérationnelles opportunes et actualisées dans vos applications de reporting et de BI sans aucune opération ETL. Regardez cette vidéo de 5 minutes ou lisez ce tutoriel pour commencer.
« Nous utilisons de nombreux outils d'analytique tiers et AWS, et nous sommes ravis de voir qu'Amazon Redshift continue à utiliser les mêmes modèles de transformation de données variés que ceux dont nous nous servons avec notre propre solution. Nous utilisons la capacité d'Amazon Redshift qui permet d'interroger des formats de données ouverts dans notre lac de données avec Redshift Spectrum depuis 2017 et maintenant, avec la nouvelle fonction Redshift Data Lake Export, nous pouvons facilement réécrire les données dans notre lac de données. Les performances sont rapides et régulières, y compris pour nos charges de requêtes les plus élevées. Nous sommes impatients d'utiliser la synergie d'une pile de Big Data intégrée afin de renforcer le partage de données entre les clusters Amazon Redshift et d'obtenir davantage de valeur pour un coût inférieur dans le cadre de tous nos jeux. »
Kurt Larson, Directeur technique des opérations de marketing analytique - Warner Bros. Analytique
Ressources
Modèles de conception ETL et ELT pour l'architecture de données moderne à l'aide d'Amazon Redshift : 1re partie
Créez des modèles de conception ETL et ELT évolutifs pour l'architecture de données moderne à l'aide d'Amazon Redshift : 1re partie.
Démarrer avec Amazon Redshift Spectrum
Didacticiel étape par étape pour démarrer sur Amazon Redshift Spectrum.
Mettre à l'échelle l'analytique des données avec Amazon Redshift
Découvrez comment Warner Bros, une entreprise de divertissement, utilise Amazon Redshift pour mettre à l'échelle ses charges de travail d'analytique des données.
Créez un compte AWS pour accéder instantanément à l'offre gratuite AWS.
Testez gratuitement la plateforme, les produits et les services AWS.
Migrez vos bases de données rapidement et en toute sécurité avec AWS Database Migration Service.