Kurs

Implement a data lakehouse analytics solution w/ Azure Databricks – Intensive Training («DP311»)

Erfahren Sie, wie Sie die Leistungsfähigkeit von Apache Spark und leistungsstarke Cluster auf Basis der Azure-Databricks-Plattform nutzen können, um grosse Data-Engineering-Workloads in der Cloud zu bewältigen.
Herstellercode

DP-3011

Dauer 1 Tag
Preis 900.–   zzgl. 8.1% MWST
Kursdokumente Offizielle Microsoft-Kursunterlagen auf Microsoft Learn

Kurs-Facts

Key Learnings
  • Identifizieren von Kernarbeitslasten und Bereitstellen eines Azure Databricks-Arbeitsbereichs
  • Verwenden der Data Governance-Tools Unity Catalog und Microsoft Purview
  • Beschreiben der Schlüsselkonzepte einer Azure Databricks-Lösung
  • Verwenden der verschiedenen Datenexplorationswerkzeuge in Azure Databricks
  • Analysieren von Daten mit DataFrame APIs
  • Beschreiben der Schlüsselelemente der Apache Spark-Architektur
  • Erstellen und Konfigurieren eines Spark-Clusters
  • Verwenden von Spark zur Verarbeitung und Analyse von in Dateien gespeicherten Daten und zur Visualisierung von Daten
  • Verwenden von Datenpipelines für die Datenverarbeitung in Echtzeit
  • Bereitstellen von Arbeitslasten mit Azure Databricks Workflows
Inhalt

1 Erkunden Sie Azure Databricks
Azure Databricks ist ein Cloud-Dienst, der eine skalierbare Plattform für die Datenanalyse mit Apache Spark bietet.

2 Durchführen von Datenanalysen mit Azure Databricks
Lernen Sie, wie Sie mit Azure Databricks Datenanalysen durchführen können. Lernen Sie verschiedene Methoden zur Datenaufnahme kennen und erfahren Sie, wie Sie Daten aus Quellen wie Azure Data Lake und Azure SQL Database integrieren. Dieses Modul führt Sie durch die Verwendung von kollaborativen Notebooks zur Durchführung von explorativen Datenanalysen (EDA), damit Sie Daten visualisieren, bearbeiten und untersuchen können, um Muster, Anomalien und Korrelationen aufzudecken.

3 Verwenden Sie Apache Spark in Azure Databricks
Azure Databricks basiert auf Apache Spark und ermöglicht es Dateningenieuren und -analysten, Spark-Aufträge auszuführen, um Daten in grossem Umfang zu transformieren, zu analysieren und zu visualisieren.

4 Verwalten Sie Daten mit Delta Lake
Delta Lake ist eine Datenverwaltungslösung in Azure Databricks, die Funktionen wie ACID-Transaktionen, Schemaerzwingung und Zeitreisen zur Gewährleistung der Datenkonsistenz, Integrität und Versionierung bietet.

5 Erstellen von Datenpipelines mit Delta Live Tables
Der Aufbau von Datenpipelines mit Delta Live Tables ermöglicht eine skalierbare und zuverlässige Datenverarbeitung in Echtzeit unter Verwendung der erweiterten Funktionen von Delta Lake in Azure Databricks.

6 Bereitstellen von Workloads mit Azure Databricks Workflows
Die Bereitstellung von Workloads mit Azure Databricks Workflows umfasst die Orchestrierung und Automatisierung komplexer Datenverarbeitungspipelines, Workflows für maschinelles Lernen und Analyseaufgaben. In diesem Modul erfahren Sie, wie Sie Workloads mit Databricks Workflows bereitstellen können.

Zielpublikum
Dieser Kurs richtet sich an Data Engineers, Data Analysts oder Data Scientists, die lernen möchten, wie man Azure Databricks für Data Lakehouse-Analysen verwendet.
Anforderungen
  • Die Teilnehmer sollten über grundlegende Kenntnisse von Datenanalysekonzepten verfügen.
  • Die Teilnehmer sollten die Azure Data Fundamentals-Zertifizierung erwerben, bevor sie mit diesem Kurs beginnen.

Download

Fragen zum Kurs

Haben Sie Fragen zum Kurs? Wir beraten Sie gerne.
Vorname
Nachname
Firma optional
E-Mail
Telefon
Möchten Sie diesen Kurs für Ihr Team oder Unternehmen buchen?
Vorname
Nachname
Firma
E-Mail
Telefon
Anzahl Teilnehmende
Gewünschter Kursort
Gewünschtes Startdatum (DD.MM.YYYY)
Gewünschtes Enddatum (DD.MM.YYYY)
Keine Kurstermine verfügbar? Kein Problem.

Keine Kurstermine verfügbar? Kein Problem.

Ob für Sie oder Ihr Team – wir planen gemeinsam mit Ihnen eine passende Durchführung. Melden Sie sich für eine unverbindliche Beratung.

Kontaktieren Sie uns
Keine Kurstermine verfügbar? Kein Problem.