Kurs
Digicomp Code SRE101
Developing a Google SRE Culture («SRE101»)
Kurs-Facts
- Erörtern von Googles Ansichten zur DevOps-Philosophie und der Beziehung zwischen DevOps und SRE
- Erörtern des Wertes, den SRE für den eigenen IT-Betrieb haben kann
- Darlegen der technischen und kulturellen Grundlagen von SRE bei Google
- Bewerten des Reifegrads der eigenen Organisation bei der Einführung von SRE
- Identifizieren der Fähigkeiten, die ein Site Reliability Engineer mitbringen sollte, und wie bestehende Mitarbeitende geschult werden können
- Erörtern der Frage, wie Google helfen kann, SRE im eigenen Unternehmen einzuführen
In vielen IT-Organisationen klafft eine Lücke zwischen Entwicklern, die sich auf Flexibilität konzentrieren, und Betreibern, die sich auf Stabilität konzentrieren. Mit Site Reliability Engineering (SRE) überbrückt Google die Kluft zwischen Entwicklung und Betrieb und bietet gleichzeitig geschäftskritischen Produktionssupport.
In diesem Kurs lernen Sie die Grundlagen und Best Practices von SRE kennen, erfahren, wie wichtig die Einführung einer SRE-Kultur ist und wie SRE die Zusammenarbeit zwischen IT- und Unternehmensleitern verbessern kann - und damit den Erfolg des gesamten Unternehmens fördert.
1 Willkommen bei der Entwicklung einer Google SRE-Kultur
- Definieren von Site Reliability Engineering
2 DevOps, SRE und warum es sie gibt
- Unterscheiden zwischen DevOps und SRE
- Erläutern der Säulen von DevOps
- Erläutern, wie SRE-Praktiken auf die DevOps-Säulen abgestimmt sind
3 SLOs mit Konsequenzen
- Erläutern des Werts, den SRE für eine Organisation haben kann
- Beschreiben der technischen Grundlagen von SRE (SLOs, Fehlerbudgets und tadellose Postmortems)
- Beschreiben der kulturellen Grundlagen von SRE (psychologische Sicherheit, Schuldlosigkeit, einheitliche Vision, Zusammenarbeit und Wissensaustausch)
4 Das Morgen besser machen als das Heute
- Beschreiben der technischen Grundlagen von SRE (kontinuierliche Integration/kontinuierliche Bereitstellung, Canarying und Toil-Automatisierung)
- Beschreiben der kulturellen Grundlagen von SRE (Design Thinking, Prototyping, Psychologie des Wandels und Widerstand gegen Veränderungen)
5 Arbeitslast regulieren
- Beschreiben der technischen Grundlagen von SRE (Messung des Arbeitsaufwands und der Zuverlässigkeit sowie Überwachung)
- Beschreiben der kulturellen Grundlagen von SRE (Zielsetzung, Transparenz, datengesteuerte Entscheidungsfindung)
6 SRE in ihrer Organisation anwenden
- Bewerten des SRE-Reifegrads einer Organisation
- Erkennen, wo SRE in einem Unternehmen angewendet werden kann
- Erkennen, welche Fähigkeiten ein SRE benötigt
- Darlegen der verschiedenen Arten von SRE-Team-Implementierungen darlegen
- Einsetzen für die Einführung einer SRE-Kultur in einem Unternehmen
7 Abschliessende Bewertung
- Bewerten Ihres Wissens über die technischen und kulturellen SRE-Grundlagen.
- IT-Führungskräfte und Unternehmensleiter, die an der SRE-Philosophie interessiert sind. Zu den Rollen gehören unter anderem: CTO, IT-Direktor/-Manager, technischer Vizepräsident/Direktor/Manager.
- Andere Produkt- und IT-Rollen wie Betriebsleiter oder Ingenieure, Software-Ingenieure, Service-Manager oder Produktmanager können diesen Inhalt ebenfalls als Einführung in SRE nützlich finden.
Empfohlene Lektüre: Site Reliability Engineering: How Google Runs Production Systems - Kapitel 1 Einführung
Nicht abgedeckt
In diesem Kurs werden keine detaillierten Beispiele für technische SRE-Praktiken behandelt.