Attention : Ce cours comprend également des contenus du cours « Building Data Analytics Solutions using Amazon Redshift ».
Data Warehousing on AWS introduit les concepts, stratégies et bonnes pratiques de conception d’une solution d’entrepôt de données basé sur le cloud avec Amazon Redshift. Cette formation montre comment ingérer, stocker et transformer des données dans l’entrepôt de données. Les thèmes abordés sont : le but d’Amazon Redshift, comment Amazon Redshift gère les défis commerciaux et techniques, les capacités et fonctionnalités d’Amazon Redshift, la conception d’une solution d’entrepôt de données sur AWS en utilisant les bonnes pratiques basées sur le Well-Architected Framework, l’intégration avec des produits et services AWS et non AWS, l’ajustement des performances, l’orchestration, la sécurisation et la surveillance d’Amazon Redshift.
Jour 1Module 1 : Les concepts d’entrepôt de données - Les architectures modernes de données
- Introduction au fil rouge de la formation
- L’entrepôt de données avec Amazon Redshift
- L’architecture serverless d’Amazon Redshift
- Exercice pratique : Lancer et configurer un entrepôt de donnée sans serveur (serverless) Amazon Redshift
Module 2 : Paramétrer Amazon Redshift - Les modèles de données avec Amazon Redshift
- La gestion de données avec Amazon Redshift
- La gestion des autorisations sur Amazon Redshift
- Exercice pratique : Mettre en place un entrepôt de données avec Amazon Redshift sans serveur
Module 3 : Charger des données - Aperçu des sources de données
Charger des données depuis Amazon Simple Storage Service (Amazon S3)
Extraire, transformer et charger (ETL) et extraire, charger et transformer (ELT)
Charger les donnes en flux
Charger des données depuis des bases de données relationnelles
Exercice pratique : Alimenter l’entrepôt de données
Jour 2Module 4 : Exploration de SQL Query Editor v2 et des Notebooks - Fonctionnalités d’Amazon Redshift Query Editor v2
- Démonstration : Utiliser Amazon Redshift Query Editor v2
- Recherche avancée
- Exercice pratique : Traitement des données sur AWS
Module 5 : Sécurisation et récupération - Récupération après sinistre
- Sauvegarder et récupérer Amazon Redshift provisionné
- Sauvegarder et récupérer Amazon Redshift sans serveur
Module 6 : Ajuster les performances d’Amazon Redshift - Les facteurs qui impactent la performance des requêtes
- Maintenance des tables et vues matérialisées
- Analyse d’une requête
- Gestion des flux de travail
- Guide de paramétrage
- Surveillance d’Amazon Redshift
- Exercice pratique : Ajuster les performances de l’entrepôt de données
Module 7 : Sécuriser Amazon Redshift
- Introduction à la sécurité et la conformité d’Amazon Redshift
- Authentification avec Amazon Redshift
- Contrôle des accès avec Amazon Redshift
- Le chiffrement de données avec Amazon Redshift
- Audit et conformité avec Amazon Redshift
- Exercice pratique : Sécuriser Amazon Redshift
Jour 3Module 8 : Orchestration - Aperçu de l’orchestration de données
- Orchestration avec AWS Step Functions
- Orchestration avec Amazon Managed Workflows for Apache Airflow (MWAA)
- Exercice pratique : Orchestrer le pipeline de l’entrepôt de données
Module 9 : Amazon Redshift ML - Aperçu du machine learning
- Débuter avec Amazon Redshift ML
- Scénarios de flux de travail d’Amazon Redshift ML
- Utilisation d’Amazon Redshift ML
- Exercice pratique : Prédire le taux de désabonnement des clients avec Amazon Redshift ML
Module 10 : Partage de données sur Amazon Redshift - Aperçu du partage de données sur Amazon Redshift
- Amazon DataZone pour le DAAS (Data as a service)
Module 11 : Conclusion - Exercice pratique : Exercice de fin de formation
Fait partie des cours suivants
-
Data Warehousing on AWS – Formation intensive