1 Erkunden Sie Azure Databricks
Azure Databricks ist ein Cloud-Dienst, der eine skalierbare Plattform für die Datenanalyse mit Apache Spark bietet.
2 Durchführen von Datenanalysen mit Azure Databricks
Lernen Sie, wie Sie mit Azure Databricks Datenanalysen durchführen können. Lernen Sie verschiedene Methoden zur Datenaufnahme kennen und erfahren Sie, wie Sie Daten aus Quellen wie Azure Data Lake und Azure SQL Database integrieren. Dieses Modul führt Sie durch die Verwendung von kollaborativen Notebooks zur Durchführung von explorativen Datenanalysen (EDA), damit Sie Daten visualisieren, bearbeiten und untersuchen können, um Muster, Anomalien und Korrelationen aufzudecken.
3 Verwenden Sie Apache Spark in Azure Databricks
Azure Databricks basiert auf Apache Spark und ermöglicht es Dateningenieuren und -analysten, Spark-Aufträge auszuführen, um Daten in grossem Umfang zu transformieren, zu analysieren und zu visualisieren.
4 Verwalten Sie Daten mit Delta Lake
Delta Lake ist eine Datenverwaltungslösung in Azure Databricks, die Funktionen wie ACID-Transaktionen, Schemaerzwingung und Zeitreisen zur Gewährleistung der Datenkonsistenz, Integrität und Versionierung bietet.
5 Erstellen von Datenpipelines mit Delta Live Tables
Der Aufbau von Datenpipelines mit Delta Live Tables ermöglicht eine skalierbare und zuverlässige Datenverarbeitung in Echtzeit unter Verwendung der erweiterten Funktionen von Delta Lake in Azure Databricks.
6 Bereitstellen von Workloads mit Azure Databricks Workflows
Die Bereitstellung von Workloads mit Azure Databricks Workflows umfasst die Orchestrierung und Automatisierung komplexer Datenverarbeitungspipelines, Workflows für maschinelles Lernen und Analyseaufgaben. In diesem Modul erfahren Sie, wie Sie Workloads mit Databricks Workflows bereitstellen können.
Ob für Sie oder Ihr Team – wir planen gemeinsam mit Ihnen eine passende Durchführung. Melden Sie sich für eine unverbindliche Beratung.
Kontaktieren Sie uns