Découvrez comment Amazon EMR intègre des projets open source comme Apache Hive, Hue et HBase ainsi qu’avec des services AWS comme AWS Glue et AWS Lake Formation. Cette formation aborde la collecte, l’ingestion, le catalogage, le stockage et le traitement de données dans le contexte de Spark et Hadoop. Vous apprendrez à utiliser des Notebooks EMR pour soutenir des charges de travail d’analyse et de machine learning. Vous apprendrez également comment intégrer les bonnes pratiques de sécurité, performance et gestion des coûts à Amazon EMR.
Contenu :
Module A : Aperçu de l’analytique de données et du pipeline de données
Module 1 : Introduction à Amazon EMR
Module 2 : Le pipeline d’analytique de données avec Amazon EMR : Ingestion et stockage
Module 3 : L’analytique de données en lot de haute performance avec Apache Spark sur Amazon EMR
Module 4 : Traiter et analyser des données en lot avec Amazon EMR et Apache Hive
Module 5 : Traitement des données sans serveur
Module 6 : Sécuriser et surveiller les clusters Amazon EMR
Module 7 : Créer des solutions d’analytique de données en lot
Module B : Développer des architectures modernes de données sur AWS
Cette formation comprend des présentations, des démos interactives, des exercices pratiques, des discussions et des exercices en classe.
Cette formation marque une étape essentielle vers la certification « AWS Certified Data Analytics - Specialty » pour laquelle il faut passer l'examen « AWS Certified Data Analytics – Specialty » (DAS-C01).
Afin d'être pleinement préparé à l'examen de certification, nous vous conseillons de suivre également les formations suivantes :
L’examen, dont l’inscription se fait directement auprès d’AWS, dure 180 minutes et coûte USD 300.
Matériel