Kurs
STACKD
Logging Monitoring and Observability in Google Cloud («STACKD»)
Kurs-Facts
- Erläutern des Zwecks und der Funktionen der Google Cloud Operations Suite
- Implementieren der Überwachung für mehrere Cloud-Projekte
- Erstellen von Benachrichtigungsrichtlinien, Betriebszeitprüfungen und Warnungen
- Installieren und Verwalten von Ops Agent zum Sammeln von Protokollen für Compute Engine
- Erläutern von Cloud Operations für GKE
- Analysieren von VPC-Flow-Protokollen und Firewall-Regelprotokollen
- Analysieren und Exportieren von Cloud Audit Logs Instanzen
- Profiling und Identifizieren ressourcenintensiver Funktionen in einer Anwendung
- Analysieren der Kosten für die Ressourcennutzung zur Überwachung von Komponenten in Google Cloud
Anhand einer Kombination aus Präsentationen, Demos, praktischen Übungen und realen Fallstudien sammeln die Teilnehmer Erfahrungen mit Full-Stack-Monitoring, Echtzeit-Protokollverwaltung und -analyse, Debugging von Code in der Produktion, Aufspüren von Engpässen in der Anwendungsleistung und Erstellung von Profilen für CPU- und Speichernutzung.
1 Einführung in die Google Cloud Operations Suite
- Beschreiben des Zwecks und der Möglichkeiten der Google Cloud Operations Suite
- Erläutern des Zwecks des Cloud Monitoring-Tools
- Erläutern des Zwecks der Cloud Logging und Error Reporting Tools
- Erläutern des Zwecks der Application Performance Management-Tools
2 Überwachung kritischer Systeme
- Cloud Monitoring verwenden, um Metriken für mehrere Cloud-Projekte anzuzeigen
- Erklären Sie die verschiedenen Arten von Dashboards und Diagrammen, die erstellt werden können
- Erstellen eines Uptime-Checks
- Erkären der Architektur des Cloud-Betriebs
- Erklären und demonstrieren des Zweck der Verwendung von Monitoring Query Language (MQL) für die Überwachung
3 Alerting-Richtlinien
- Erläutern von Alerting-Strategien
- Erläutern von Alerting Policies
- Erläutern des Fehlerbudgets
- Erklären, warum Server-Level-Indikatoren (SLIs), Service-Level-Ziele (SLOs) und Service-Level-Agreements (SLAs) wichtig sind
- Arten von Alarmen und deren häufige Verwendung zu identifizieren
- Cloud Monitoring zur Verwaltung von Diensten verwenden
4 Erweiterte Protokollierung und Analyse
- Funktionen des Log Explorers verwenden
- Erläutern der Funktionen und Vorteile von protokollbasierten Metriken
- Definieren von Protokollsenken (Einschlussfilter) und Ausschlussfiltern
- Erläutern, wie BigQuery zur Analyse von Protokollen verwendet werden kann
- Exportieren von Protokollen in BigQuery zur Analyse
- Verwenden von Log-Analysen auf Google Cloud
5 Arbeiten mit Cloud-Audit-Protokollen
- Erläutern von Cloud Audit Logs
- Auflisten und Erklären verschiedener Audit-Protokolle
- Erläutern der Merkmale und Funktionalitäten der verschiedenen Audit-Protokolle
- Auflisten der besten Praktiken zur Implementierung von Audit-Protokollen
6 Konfigurieren von Google Cloud Services für Observability
- Verwenden von Ops Agent mit Compute Engine
- Aktivieren und Verwenden von Kubernetes Monitoring
- Erklären der Vorteile der Verwendung von Google Cloud Managed Service für Prometheus
- Erläutern der Verwendung von PromQL zur Abfrage von Cloud Monitoring Metriken
- Erläutern der Verwendung von Open Telemetry
- Erläutern von benutzerdefinierten Metriken
7 Überwachen des Google-Cloud-Netzwerks
- Sammeln und Analysieren von VPC Flow Logs und Firewall Rules Logs
- Aktivieren und Überwachen Sie Packet Mirroring
- Erklären der Möglichkeiten des Network Intelligence Center
8 Untersuchen von Problemen mit der Anwendungsleistung
- Erläutern der Merkmale, Vorteile und Funktionalitäten von Error Reporting, Cloud Trace und Cloud Profiler
9 Optimieren der Kosten für die Operations Suite
- Analysieren der Kosten für die Ressourcennutzung für überwachungsbezogene Komponenten innerhalb von Google Cloud
- Implementieren von Best Practices zur Kontrolle der Kosten für die Überwachung innerhalb von Google Cloud
- Cloud-Architekten, -Administratoren und SysOps-Mitarbeiter
- Cloud-Entwickler und DevOps-Mitarbeiter
Um den grössten Nutzen aus diesem Kurs zu ziehen, sollten die Teilnehmenden:
- Grundkenntnisse in der Skripterstellung oder Programmierung haben
- sich mit Befehlszeilentools und Linux-Betriebssystemumgebungen auskennen
Wir empfehlen ausserdem den Besuch des folgenden Kurses bzw. gleichwertige Erfahrungen:
Produkte
- Cloud Logging
- Cloud Monitoring
- Fehler-Berichterstattung
- Cloud Trace
- Cloud Profiler
- Google Compute Engine Monitoring
- Google Kubernetes Engine Monitoring
- VPC Flow Logs
- Firewall-Regeln-Logs
- Data Access Audit Logs
Nicht abgedeckt
- SRE-Konzepte
- SRE-Best-Practices
- Reaktion auf Vorfälle