Cours
Digicomp Code AWSM02
Machine Learning Engineering on AWS – Formation intensive («AWSM02»)
Description de la formation
- Expliquer les concepts fondamentaux du ML et ses applications dans le cloud AWS
- Traitement, transformation et ingénierie des données pour les tâches de ML lors de l’utilisation des services AWS
- Sélectionner des algorithmes de ML appropriés et des approches de modélisation basées sur les exigences du problème et l’interprétabilité du modèle
- Concevoir et mettre en œuvre des pipelines de ML évolutifs avec les services AWS pour entraîner, déployer et orchestrer des modèles
- Créer des pipelines d’intégration et de livraison continue (CI/CD) automatisés pour les flux de travail de ML
- Discuter les mesures sécuritaires appropriées pour les ressources de ML sur AWS
- Mettre en œuvre des stratégies de surveillances pour les modèles de ML déployés, y compris des techniques pour détecter les dérives de données
Vous acquerrez une expérience pratique dans l’utilisation des services AWS tels qu’Amazon SageMaker et des outils d’analyse tels qu’Amazon EMR afin de développer des applications d’apprentissage automatique robustes, évolutives et prêtes à être mises en production.
Contenu
Jour 1
Module 0 : Introduction
Module 1 : Introduction au Machine Learning (ML) sur AWS
- Thème A : Introduction au ML
- Thème B : Amazon SageMaker AI
- Thème C : ML responsable
Module 2 : Analyser les défis liés au machine learning (ML)
- Thème A : Évaluer les défis commerciaux du ML
- Thème B : Les approches d’entraînement du ML
- Thème C : Les algorithmes d’entraînement du ML
Module 3 : Traitement des données pour le Machine Learning (ML)
- Thème A : Préparation des données et types
- Thème B : Analyse de données exploratoire
- Thème C : Options de stockage AWS et choisir le bon stockage
Module 4 : Transformation des données et ingénierie des caractéristiques (Feature Engineering)
- Thème A : Gérer des données manquantes, incorrectes ou dupliquées
- Thème B : Concepts de l’ingénierie des caractéristiques
- Thème C : Techniques de sélection des caractéristiques
- Thème D : Services AWS de transformation des données
- Exercice 1 : Analyser et préparer les données avec Amazon SageMaker Data Wrangler et Amazon EMR
- Exercice 2 : Traiter les données avec SageMaker Processing et SageMaker Python SDK
Jour 2
Module 5 : Choisir une approche de modélisation
- Thème A : Les algorithmes intégrés à Amazon SageMaker AI
- Thème B : Sélectionner un algorithme d’entraînement intégré
- Thème C : Amazon SageMaker Autopilot
- Thème D : Considérations concernant la sélection du modèle
- Thème E : Considérations budgétaires du ML
Module 6 : Entraîner les modèles de Machine Learning (ML)
- Thème A : Concepts d’entraînement de modèle
- Thème B : Entraîner des modèles dans Amazon SageMaker AI
- Exercice 3 : Entraîner un modèle avec Amazon SageMaker AI
Module 7 : Évaluer et régler les modèles de Machine Learning (ML)
- Thème A : Évaluer la performance du modèle
- Thème B : Technniques de réduction du temps d’entraînement
- Thème C : Techniques de réglage des hyperparamètres
- Exercice 4 : Réglage du modèle et optimisation des hyperparamètres avec Amazon SageMaker AI
Module 8 : Stratégies de déploiement du modèle
- Thème A : Considérations concernant le déploiement et options de ciblage
- Thème B : Les stratégies de déploiement
- Thème C : Choisir une stratégie d’inférence de modèle
- Thème D : Conteneurs et types d’instance pour les inférences
- Exercice 5 : Déplacement du trafic A/B
Jour 3
Module 9 : Sécuriser les ressources AWS du Machine Learning (ML)
- Thème A : Contrôle des accès
- Thème B : Contrôle des accès au réseau des ressources de ML
- Thème C : Considérations de sécurité pour les pipelines CI/CD
Module 10 : Machine Learning Operations (MLOps) et déploiement automatisé
- Thème A : Introduction au MLOps
- Thème B : Automatisation des tests dans les pipelines CI/CD
- Thème C : Services de livraison continue
- Exercice 6 : Utiliser les pipelines d’Amazon SageMaker et le modèle de registre Amazon SageMaker avec Amazon SageMaker Studio
Module 11 : Surveiller les performances du modèle et la qualité des données
- Thème A : Détecter les dérives dans les modèles de ML
- Thème B : SageMaker Model Monitor
- Thème C : Surveiller la qualité des données et du modèle
- Thème D : Correction et dépannage automatisés
- Exercice 7 : Surveiller un modèle pour détecter une dérive de données
Module 12 : Résumé et conclusion de la formation
- Connaître les concepts de base du Machine Learning
- Connaissances pratiques du langage de programmation Python et des bibliothèques usuelles de science des données telles que NumPy, Pandas et Scikit-learn
- Connaissances de base des concepts du cloud computing et connaissances d’AWS
- Expérience préalable avec des systèmes de contrôle de version tels que Git (utile, mais non obligatoire)