Kurs

DP312

Implementierung von Datenanalysen mit Azure Synapse – Intensive Training («DP312»)

Dieser Kurs behandelt SQL Dedicated und Serverless Spark Pools und bietet Anleitungen zum Datenwrangling und dem ELT-Prozess mit Synapse Pipelines, ähnlich wie Azure Data Factory (ADF), um Daten in die Synapse Dedicated Pool Datenbank zu verschieben.
Herstellercode

DP-3012

Dauer 1 Tag
Preis 900.–   zzgl. 8.1% MWST
Kursdokumente Offizielle Microsoft-Kursunterlagen auf Microsoft Learn

Kurs-Facts

  • Verstehen von Azure Synapse Analytics als Cloud-Plattform für die Verarbeitung und Analyse von Big Data
  • Verwenden von serverlosen SQL-Pools zur Abfrage und Umwandlung von Daten direkt aus einem Data Lake, ohne sie in eine Datenbank zu laden
  • Verwenden von Spark in Azure Synapse Analytics, um grosse Datenmengen in einem Data Lake zu analysieren und zu visualisieren
  • Verwenden von Azure Synapse Analytics zur Implementierung von Sicherheit zum Schutz der Daten
  • Verwenden von Spark Notebooks in einer Azure-Synapse-Analytics-Pipeline zum Aufbau integrierter Datenlösungen, die Daten über verschiedene Systeme hinweg extrahieren, transformieren und laden

1 Implementierung einer Datenanalyse-Lösung mit Azure Synapse Analytics

Modul 1: Einführung in Azure Synapse Analytics
Lernen Sie die Funktionen und Möglichkeiten von Azure Synapse Analytics kennen - einer Cloud-basierten Plattform für die Verarbeitung und Analyse von Big Data

Modul 2: Verwendung von Azure Synapse Serverless SQL Pool zur Abfrage von Dateien in einem Data Lake
Mit dem serverlosen SQL-Pool von Azure Synapse können Sie Ihre SQL-Kenntnisse nutzen, um Daten in Dateien zu untersuchen und zu analysieren, ohne die Daten in eine relationale Datenbank laden zu müssen.

Modul 3: Analysieren von Daten mit Apache Spark in Azure Synapse Analytics
Apache Spark ist eine Kerntechnologie für gross angelegte Datenanalysen. Erfahren Sie, wie Sie Spark in Azure Synapse Analytics verwenden, um Daten in einem Data Lake zu analysieren und zu visualisieren.

Modul 4: Verwendung von Delta Lake in Azure Synapse Analytics
Delta Lake ist ein relationaler Open-Source-Speicherbereich für Spark, den Sie zur Implementierung einer Data-Lake-House-Architektur in Azure Synapse Analytics verwenden können.

Modul 5: Analysieren von Daten in einem relationalen Data Warehouse
Relationale Data Warehouses sind ein Kernelement der meisten Business Intelligence (BI)-Lösungen in Unternehmen und werden als Grundlage für Datenmodelle, Berichte und Analysen verwendet.

Modul 6: Erstellen einer Datenpipeline in Azure Synapse Analytics
Pipelines sind das Lebenselixier einer Datenanalyselösung. Erfahren Sie, wie Sie Azure Synapse Analytics-Pipelines verwenden, um integrierte Datenlösungen zu erstellen, die Daten über verschiedene Systeme hinweg extrahieren, transformieren und laden.

2 Erstellen von Datenanalyselösungen mit Azure Synapse serverlosen SQL-Pools

Modul 7: Verwendung von Azure Synapse serverless SQL Pools zur Abfrage von Dateien in einem Data Lake
Mit Azure Synapse Serverless SQL Pool können Sie Ihre SQL-Kenntnisse nutzen, um Daten in Dateien zu untersuchen und zu analysieren, ohne die Daten in eine relationale Datenbank laden zu müssen.

Modul 8: Verwendung von Azure Synapse serverlosen SQL-Pools zur Transformation von Daten in einem Data Lake
Durch die Verwendung eines serverlosen SQL-Pools in Azure Synapse Analytics können Sie die allgegenwärtige SQL-Sprache verwenden, um Daten in Dateien in einem Data Lake zu transformieren.

Modul 9: Erstellen einer Lake-Datenbank in Azure Synapse Analytics
Warum zwischen der Arbeit mit Dateien in einem Data Lake oder einem relationalen Datenbankschema wählen? Mit Lake-Datenbanken in Azure Synapse Analytics können Sie die Vorteile von beidem kombinieren.

Modul 10: Daten sichern und Benutzer in Azure Synapse serverlosen SQL-Pools verwalten
Erfahren Sie, wie Sie die Sicherheit bei der Verwendung von Azure Synapse Serverless SQL Pools einrichten können.

3 Führen Sie Data Engineering mit Azure Synapse Apache Spark Pools durch

Modul 11: Analysieren von Daten mit Apache Spark in Azure Synapse Analytics
Apache Spark ist eine Kerntechnologie für gross angelegte Datenanalysen. Erfahren Sie, wie Sie Spark in Azure Synapse Analytics verwenden, um Daten in einem Data Lake zu analysieren und zu visualisieren.

Modul 12: Datenumwandlung mit Spark in Azure Synapse Analytics
Dateningenieure müssen in der Regel grosse Datenmengen transformieren. Apache Spark-Pools in Azure Synapse Analytics bieten eine verteilte Verarbeitungsplattform, die sie zur Erreichung dieses Ziels nutzen können.

Modul 13: Verwendung von Delta Lake in Azure Synapse Analytics
Delta Lake ist ein relationaler Open-Source-Speicherbereich für Spark, den Sie zur Implementierung einer Data-Lakehouse-Architektur in Azure Synapse Analytics verwenden können.

4 Arbeiten mit Data Warehouses mit Azure Synapse Analytics

Modul 14: Analysieren von Daten in einem relationalen Data Warehouse
Relationale Data Warehouses sind ein Kernelement der meisten Business Intelligence (BI)-Lösungen in Unternehmen und werden als Grundlage für Datenmodelle, Berichte und Analysen verwendet.

Modul 15: Laden von Daten in ein relationales Data Warehouse
Eine der Hauptaufgaben eines Data Engineers ist die Implementierung einer Lösung zur Datenaufnahme, mit der neue Daten in ein relationales Data Warehouse geladen werden.

Modul 16: Verwalten und Überwachen von Data Warehouse-Aktivitäten in Azure Synapse Analytics
Erfahren Sie, wie Sie Azure Synapse Analytics verwalten und überwachen können.

Modul 17: Sichern eines Data Warehouse in Azure Synapse Analytics
Lernen Sie, wie Sie Sicherheit zum Schutz Ihrer Daten mit Azure Synapse Analytics angehen und implementieren.

5 Übertragen und Transformieren von Daten mit Azure Synapse Analytics-Pipelines

Modul 18: Erstellen einer Datenpipeline in Azure Synapse Analytics
Pipelines sind der Lebensnerv einer Datenanalyselösung. Erfahren Sie, wie Sie Azure Synapse Analytics-Pipelines verwenden, um integrierte Datenlösungen zu erstellen, die Daten über verschiedene Systeme hinweg extrahieren, transformieren und laden.

Modul 19: Verwendung von Spark Notebooks in einer Azure Synapse-Pipeline
Apache Spark bietet Dateningenieuren eine skalierbare, verteilte Datenverarbeitungsplattform, die in eine Azure Synapse Analytics-Pipeline integriert werden kann.

Dieser Kurs richtet sich an Administratoren und Dateningenieure.

Die Teilnehmenden sollten mit Notebooks vertraut sein, die verschiedene Sprachen und eine Spark-Engine verwenden, wie Databricks, Jupyter Notebooks, Zeppelin Notebooks und mehr. Sie sollten auch einige Erfahrung mit SQL, Python und Azure-Tools wie Data Factory haben.

Download

Fragen zum Kurs