Grâce à des présentations, démos, exercices pratiques et études de cas réels, les participantes et participants accumuleront de l’expérience avec la surveillance full stack, la gestion et l’analyse des logs en temps réel, le débogage du code en production, le suivi des goulets d’étranglement des performances d’application et le profilage de l’utilisation du CPU et de la mémoire.
1 Introduction à la suite Google Cloud Operations
- Décrire l’objectif et les capacités de la suite Google Cloud Operations
- Expliquer l’objectif de l’outil Cloud Monitoring
- Expliquer l’objectif des outils Cloud Logging et Error Reporting
- Expliquer l’objectif des outils de gestion des performances d’application
2 Surveiller les systèmes critiques
- Utiliser Cloud Monitoring pour consulter les mesures de plusieurs projets cloud
- Expliquer les différents types de tableaux de bord et de graphiques qui peuvent être créés
- Créer une vérification du temps de fonctionner
- Expliquer l’architecture de Cloud Operations
- Expliquer et démontrer l’objectif de l’utilisation de Monitoring Query Language (MQL) pour la surveillance
3 Politiques d’alerte
- Expliquer les stratégies d’alerte
- Expliquer les politiques d’alerte
- Expliquer le budget d’erreur
- Expliquer pourquoi les indicateurs de niveau de serveur (SLI), les objectifs de niveau de service (SLO) et les accords de niveau de service (SLA) sont importants
- Identifier les types d’alerte et les utilisations courantes pour chacune d’entre elles
- Utiliser Cloud Monitoring pour gérer les services
4 Journalisation avancée et analyse
- Utiliser les fonctionnalités Log Explorer
- Expliquer les fonctionnalités et avantages des mesures basées sur les logs
- Définir des récepteurs de logs (log sinks, filtres d’inclusion) et les filtres d’exclusion
- Expliquer comment BigQuery peut être utilisé pour analyser les logs
- Exporter des logs vers BigQuery pour analyse
- Utiliser l’analytique de logs sur Google Cloud
5 Travailler avec Cloud Audit Logs
- Expliquer Cloud Audit Logs
- Lister et expliquer les différents journaux d’audit (audit logs)
- Expliquer les fonctionnalités des différents journaux d’audit (audit logs)
- Lister les bonnes pratiques d’implémentation des journaux d’audit (audit logs)
6 Configurer les services Google Cloud pour l’observabilité
- Utiliser Ops Agent avec Compute Engine
- Activer et utiliser Kubernetes Monitoring
- Expliquer les avantages de l’utilisation de Google Cloud Managed Service pour Prometheus
- Expliquer l’utilisation de PromQL pour interroger les mesures Cloud Monitoring
- Expliquer l’utilisation d’Open Telemetry
- Expliquer les mesures personnalisées
7 Surveiller le réseau Google Cloud
- Collecter et analyser les journaux de flux VPC (VPC Flow Logs) et les journaux des règles de pare-feu
- Activer et surveiller Packet Mirroring
- Expliquer les capacités du Network Intelligence Center
8 Enquêter sur les problèmes de performance des applications
- Expliquer les fonctionnalités et avantages d’Error Reporting, Cloud Trace et Cloud Profiler
9 Optimiser les coûts de la suite Operations
- Analyser le coût d’utilisation des ressources des composants liés à la surveillance au sein de Google Cloud
- Implémenter des bonnes pratiques de contrôle des coûts de la surveillance au sein de Google Cloud