Le contenu de cette formation intensive est basé sur le contenu de l’examen «
DP-203: Data Engineering on Microsoft Azure ». Préparez-vous dès maintenant au cours avec les contenus Microsoft Learn. Lors des sessions journalières intensives avec nos experts, vous travaillerez avec les supports de formation officiels Microsoft (plus d’informations à la rubrique « méthodologie et didactique »).
Ce cours est une formation intensive (bloc de sessions journalières), si vous préférez suivre cette formation au format flexible (6 à 8 sessions virtuelles de 3 heures sur max. 4 semaines),
cliquez ici.
Contenu de la formation :Module 1 : Bien démarrer avec l'ingénierie des données dans AzureDans la plupart des organisations, un ingénieur Données est le rôle principal responsable de l’intégration, de la transformation et du regroupement des données de divers systèmes de données structurés et non structurés dans des structures adaptées à la création de solutions d’analytique. Les Ingénieurs Données Azure veillent également à ce que les pipelines de données et les magasins de données restent très performants, efficaces, organisés et fiables, en fonction d’un ensemble spécifique d’exigences et de contraintes stratégiques.
Chapitres - Présentation de l'ingénierie des données dans Azure
- présentation d'Azure data Lake Storage Gen2
- Présentation d'Azure Synapse Analytics
Module 2 : Créer des solutions d’analytique données avec des pools SQL serverless Azure SynapseSi vous avez de grands volumes de données stockés en tant que fichiers dans un lac de données, vous aurez besoin d’un moyen pratique pour explorer et analyser les données qu’ils contiennent. Azure Synapse Analytics vous permet d’appliquer les compétences SQL que vous utilisez dans une base de données relationnelle aux fichiers d’un lac de données.
Chapitres - Utiliser un pool SQL serverless Azure Synapse pour interroger des fichiers dans un lac de données
- Utiliser des pools SQL serverless Azure Synapse pour transformer les données dans un lac de données
- Créer une base de données Data Lake dans Azure Synapse Analytics
- Sécuriser les données et gérer les utilisateurs dans les pools SQL serverless Azure Synapse
Module 3 : Appliquer l'ingénierie des données avec des pools Azure Synapse Apache SparkApache Spark est une solution de traitement distribué hautement scalable pour l’analytique et la transformation du Big Data. Vous pouvez tirer parti de sa puissance dans Azure Synapse Analytics par le biais de pools Spark.
Chapitres - Analyser des données avec Apache Spark dans Azure Synapse Analytics
- Transformer des données avec Spark dans Azure Synapse Analytics
- Utiliser Delta Lake dans Azure Synapse Analytics
Module 4 : Utiliser des entrepôts de données avec Azure Synapse AnalyticsLes entrepôts de données relationnels sont au cœur de nombreuses solutions de business intelligence et d’analytique d’entreprise. Vous pouvez utiliser Azure Synapse Analytics pour implémenter des entrepôts de données hautement scalables dans le cloud.
Chapitres - Analyser les données dans un entrepôt de données relationnelles
- Charger des données dans un entrepôt de données relationnel
- Gérer et superviser les activités d'un entrepôt de données dans Azure Synapse Analytics
- Analyser et optimiser le stockage de l'entrepôt de données dans Azure Synapse Analytics
- Sécuriser un entrepôt de données dans Azure Synapse Analytics
Module 5 : Transférer et transformer des données avec des pipelines Azure Synapse AnalyticsAzure Synapse Analytics permet d’intégrer des données en utilisant des pipelines, que vous pouvez utiliser pour automatiser et orchestrer des activités de transfert et de transformation de données.
Chapitres - Créer un pipeline de données dans Azure synapse Analytics
- Utiliser des notebooks Spark dans un pipeline Azure Synapse
Module 6 : Utiliser des solutions de traitement transactionnel et analytique hybrides avec Azure Synapse AnalyticsLe traitement transactionnel et analytique hybride (HTAP) est une technique pour l’analytique en temps quasi réel sans solution ETL complexe. Dans Azure Synapse Analytics, HTAP est pris en charge via Azure Synapse Link.
Chapitres - Planifier un traitement transactionnel et analytique hybride avec Azure Synapse Analytics
- Implémenter Azure synapse Link avec Azure Cosmos DB
- Implémenter Azure Synapse Link pour SQL
Module 7 : Implémenter une solution de streaming de données avec Azure Stream AnalyticsLe traitement de flux vous permet de capturer et d’analyser des données en temps réel. Azure Stream Analytics est un moteur de traitement de flux basé sur le cloud que vous pouvez utiliser pour créer des solutions d’analytique en temps réel hautement scalables.
Chapitres - Bien démarrer avec Azure Stream Analytics
- Intégrer des données de streaming à l'aide d'Azure Stream Analytics et Azure Synapse Analytics
- Visualiser des données en temps réel avec Azure Stream Analytics et Power BI
Module 8 : Gérer les données dans une entrepriseUtilisez Microsoft Purview pour inscrire et analyser des données, des artefacts de données de catalogue, rechercher des données pour la création de rapports et gérer artefacts Power BI afin d’améliorer la gouvernance des données dans votre organisation.
Chapitres - Présentation de Microsoft Purview
- Découvrir les données approuvées avec Microsoft Puview
- Artefacts de données de catalogue à l'aide de Microsoft Purview
- Gérer les ressources Power BI avec Microsoft Purview
- intégrer Microsoft Purview et Azure Synapse Analytics
Module 9 : Ingénierie des données avec Azure DatabricksApprenez à tirer parti de la puissance des clusters Apache Spark exécutés sur la plateforme Azure Databricks pour traiter de grandes charges de travail d’engineering données dans le cloud.
Chapitres - Explorer Azure Databricks
- Utiliser Apache Spark dans Azure Databricks
- Utiliser Delta Lake dans Azure Databricks
- Utiliser les entrepôts SQL dans Azure Databricks
- Exécuter des notebooks Azure Databricks avec Azure Data Factory
Fait partie des cours suivants
-
Data Engineering on Microsoft Azure – Formation intensive