Kurs
digicode: AGTOBS
Agent Observability on Google Cloud
Kurs-Facts
Als PDF herunterladen- Verfolgen nicht-deterministischer Agentenlogik mithilfe von Cloud Trace Spans und der ReAct-Schleife
- Implementieren von Kosten- und Qualitätskontrollen mithilfe benutzerdefinierter Cloud Monitoring-Dashboards
- Aufbauen eines kontinuierlichen Qualitätskreislaufs mit Golden Test Cases
- Implementieren von Governance und Nachvollziehbarkeit mithilfe logbasierter Sicherheitsmetriken
- Abstimmen technischer Observability-Metriken auf geschäftliche KPIs (Kosten, ROI)
Die Teilnehmer erlernen die Methodik und die praktischen Fähigkeiten, die erforderlich sind, um nicht-deterministische Agentenlogik in transparente, überprüfbare und skalierbare Systeme umzuwandeln.
Der Kurs behandelt zentrale operative Disziplinen, darunter die Abbildung der komplexen Denkprozesse des Agenten (ReAct-Loops) auf Cloud Trace Spans zur Fehlerbehebung, die Implementierung logbasierter Sicherheitsmetriken zur Einhaltung von Compliance-Vorgaben sowie die Einrichtung umsetzbarer Warnmeldungen und benutzerdefinierter Dashboards in Cloud Monitoring, um Kostenüberschreitungen und Qualitätsabweichungen proaktiv zu kontrollieren. Der Kurs nutzt Präsentationen, visuelle Walkthroughs und strategische Diskussionen, um ein effektives Lernen zu gewährleisten, das direkt auf das Vertex AI-Ökosystem anwendbar ist.
- Die Anforderungen an die Observability von Agenten
- Verfolgung des Arbeitsablaufs der Agent-Engine
- Einrichtung eines unveränderlichen Prüfpfads
- Erklärung nicht-deterministischer Verhaltensweisen
- Aufschlüsselung von Ausführungen in Cloud Trace-Spans
- Begründung des unveränderlichen Prüfpfads für Vertrauen
- Implementierung von Echtzeit-Metriken
- Entwurf umsetzbarer Alarmrichtlinien
- Bewertung zur kontinuierlichen Verbesserung
- Erstellung benutzerdefinierter Dashboards für Kosten und Leistung
- Entwurf umsetzbarer Alarme zur Vermeidung von Budgetüberschreitungen
- Einrichtung eines kontinuierlichen Qualitätskreislaufs mit Golden Test Cases
- Observability für Audit und Sicherheit
- Skalierung der Agent-Entwicklung und -Bereitstellung
- Skalierung des Observable Enterprise
- Implementierung von Governance-Kontrollen für die Einhaltung von PII-Vorschriften
- Bewertung von Kompromissen bei der Bereitstellung für die Skalierung
- Abstimmung technischer Metriken auf geschäftliche KPIs
- Wiederholung der Kernkonzepte
- Überprüfung des Verständnisses der Kernkonzepte des Kurses anhand von szenariobasierten Fragen
- AI/ML-Ingenieur: Muss verstehen, wie Trace-Daten (ReAct Spans) bei der Fehlerbehebung nicht-deterministischer Schlussfolgerungen helfen und wie Qualitätskennzahlen (Halluzinationsrate) für strategische Entscheidungen gemessen werden
- Data Scientist: Benötigt Einblick in Leistungstrends, Bewertungsergebnisse (Golden Test Cases) und Compliance-Probleme, um das ethische Verhalten des Agenten und die Datenintegrität sicherzustellen
- SRE/DevOps-Ingenieur: Verantwortlich für die Operationalisierung des Agenten. Muss wissen, wie man die Überwachung an Kostenspitzen anpasst, P99-Latenzwarnungen implementiert und Kompromisse bei der Bereitstellung (Agent Engine vs. Cloud Run) verwaltet.
Verwaltung der Beobachtbarkeit, Governance oder Produktionsskalierung von Gemini-basierten agentischen Workflows auf Google Cloud beteiligt sind.
- Vertrautheit mit grundlegenden Konzepten des maschinellen Lernens (ML), insbesondere mit der Unterscheidung zwischen Modellen und Agenten
- Erfahrung mit Konzepten und Diensten von Google Cloud, einschliesslich der grundlegenden Navigation in der Google Cloud-Konsole
- Vertrautheit mit Prinzipien der Softwareentwicklung und Entwicklungslebenszyklen (DevOps/MLOps)
- Erfahrung mit der Google Cloud CLI und den Vertex AI-Diensten
- Grundlegendes Verständnis von Git/Versionskontrolle im Zusammenhang mit der Bereitstellung von Code
- Vertrautheit mit der Strukturierung von Protokollen (z. B. JSON) und der Einrichtung grundlegender Überwachungswarnungen
- Google Cloud-Produkte: Vertex AI Agent Engine, Cloud Trace, Cloud Monitoring, Cloud Logging, Cloud Billing, VPC Service Controls
- Konzepte/Protokolle: Gemini Enterprise, OpenTelemetry, Logs-Based Metrics (LBMs)