Kurs
Building Data Analytics Solutions Using Amazon Redshift – Intensive Training («AWSB06»)
Kurs-Facts
- Vergleich der Funktionen und Vorteile von Data Warehouses, Data Lakes und modernen Datenarchitekturen
- Entwerfen und Implementieren einer Data-Warehouse-Analyselösung
- Identifizieren und Anwenden geeigneter Techniken, einschliesslich Komprimierung, zur Optimierung der Datenspeicherung
- Auswählen und Bereitstellen geeigneter Optionen für die Aufnahme, Umwandlung und Speicherung von Daten
- Auswahl der geeigneten Instanz- und Knotentypen, Cluster, automatischen Skalierung und Netzwerktopologie für einen bestimmten geschäftlichen Anwendungsfall
- Verstehen, wie sich die Datenspeicherung und -verarbeitung auf die Analyse- und Visualisierungsmechanismen auswirkt, die erforderlich sind, um verwertbare Geschäftseinblicke zu gewinnen
- Sicherung von Daten im Ruhezustand und bei der Übertragung
- Überwachung von Analyse-Workloads, um Probleme zu erkennen und zu beheben
- Anwendung von Best Practices für das Kostenmanagement
Der Kurs konzentriert sich auf die Komponenten der Datenerfassung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung der Analysepipeline. Sie lernen, Amazon Redshift in einen Data Lake zu integrieren, um sowohl Analyse- als auch maschinelle Lernarbeitslasten zu unterstützen. Sie werden auch lernen, die besten Praktiken für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon Redshift anzuwenden.
Inhalt
Modul A: Überblick über Datenanalyse und die Datenpipeline
- Anwendungsfälle der Datenanalyse
- Verwendung der Datenpipeline für die Datenanalyse
Modul 1: Verwendung von Amazon Redshift in der Datenanalyse-Pipeline
- Warum Amazon Redshift für Data Warehousing?
- Überblick über Amazon Redshift
Modul 2: Einführung in Amazon Redshift
- Architektur von Amazon Redshift
- Interaktive Demo 1: Rundgang durch die Amazon-Redshift-Konsole
- Amazon-Redshift-Funktionen
- Übung 1: Laden und Abfragen von Daten in einem Amazon-Redshift-Cluster
Modul 3: Ingestion und Speicherung
- Datenübernahme
- Interaktive Demo 2: Verbinden Ihres Amazon-Redshift-Clusters mit einem Jupyter-Notebook mit
- Daten-API
- Datenverteilung und -speicherung
- Interaktive Demo 3: Analysieren semi-strukturierter Daten mit dem Datentyp SUPER
- Abfrage von Daten in Amazon Redshift
- Übung 2: Datenanalyse mit Amazon Redshift Spectrum
Modul 4: Verarbeiten und Optimieren von Daten
- Datentransformation
- Erweiterte Abfragen
- Praxisübung 3: Datentransformation und -abfrage in Amazon Redshift
- Verwaltung von Ressourcen
- Interaktive Demo 4: Anwendung von gemischtem Workload-Management auf Amazon Redshift
- Automatisierung und Optimierung
- Interaktive Demo 5: Grössenänderung des Amazon-Redshift-Clusters vom dc2.large zum ra3.xlplus-Cluster
Modul 5: Sicherheit und Überwachung von Amazon Redshift-Clustern
- Absicherung des Amazon-Redshift-Clusters
- Überwachung und Fehlersuche bei Amazon-Redshift-Clustern
Modul 6: Entwerfen von Data-Warehouse-Analytiklösungen
- Überprüfung von Data-Warehouse-Anwendungsfällen
- Aktivität: Entwerfen eines Data-Warehouse-Analyse-Workflows
Modul B: Entwickeln moderner Datenarchitekturen auf AWS
- Moderne Datenarchitekturen
Dieser Kurs beinhaltet Präsentationen, interaktive Demos, praktische Übungen, Diskussionen und Klassenübungen.
Dieser Kurs richtet sich an folgende Jobrollen:
- Data Engineer