Kurs
Digicomp Code GCBDF
Google Cloud Big Data and Machine Learning Fundamentals («GCBDF»)
Kurs-Facts
- Identifizieren des Daten-zu-AI-Lebenszyklus in Google Cloud und der wichtigsten Produkte für Big Data und maschinelles Lernen
- Entwerfen von Streaming-Pipelines mit Dataflow und Pub/Sub
- Analysieren von Big Data in grossem Umfang mit BigQuery
- Identifizieren verschiedener Optionen zum Aufbau von Lösungen für maschinelles Lernen in der Google Cloud
- Beschreiben eines Workflows für maschinelles Lernen und der wichtigsten Schritte mit Vertex AI
- Aufbauen einer Pipeline für maschinelles Lernen mit AutoML
Erforschen der Prozesse, Herausforderungen und Vorteile beim Aufbau einer Big-Data-Pipeline und von Modellen für maschinelles Lernen mit Vertex AI auf Google Cloud.
1 Kurseinführung
In diesem Abschnitt werden die Teilnehmenden zum Kurs "Grundlagen von Big Data und maschinellem Lernen" begrüsst und erhalten einen Überblick über die Kursstruktur und die Ziele.
- Erkennen des Daten-zu-AI-Lebenszyklus in Google Cloud
- Erkennen der Verbindung zwischen Data Engineering und maschinellem Lernen
2 Big Data und maschinelles Lernen in der Google Cloud
In diesem Abschnitt werden die Schlüsselkomponenten der Google Cloud-Infrastruktur untersucht. Wir stellen viele der Produkte und Services für Big Data und maschinelles Lernen vor, die den Lebenszyklus von Daten zu KI in Google Cloud unterstützen.
- Identifizieren, wie Elemente der Google-Cloud-Infrastruktur Big-Data- und Machine-Learning-Funktionen ermöglicht haben
- Identifizieren der Big-Data- und Machine-Learning-Produkte in der Google Cloud
- Erforschen eines BigQuery-Datensatzes
- Übung: Erforschen eines öffentlichen BigQuery-Datensatzes
3 Datentechnik für Streaming-Daten
In diesem Abschnitt wird die Lösung von Google Cloud für die Verwaltung von Streaming-Daten vorgestellt. Es wird eine End-to-End-Pipeline untersucht, einschliesslich Dateneingabe mit Pub/Sub, Datenverarbeitung mit Dataflow und Datenvisualisierung mit Looker und Data Studio.
- Beschreiben eines End-to-End-Workflows für Streaming-Daten von der Datenaufnahme bis zur Datenvisualisierung
- Identifizieren der Herausforderungen moderner Datenpipelines und wie Sie diese mit Dataflow in grossem Umfang lösen können
- Erstellen von kollaborativen Echtzeit-Dashboards mit Datenvisualisierungstools
- Übung: Erstellen einer Streaming Data Pipeline für ein Echtzeit-Dashboard mit Dataflow
4 Big Data mit BigQuery
In diesem Abschnitt werden die Teilnehmer mit BigQuery vertraut gemacht, dem vollständig verwalteten, serverlosen Data Warehouse von Google. Ausserdem werden BigQuery ML und die Prozesse und Schlüsselbefehle erläutert, die zur Erstellung benutzerdefinierter Modelle für maschinelles Lernen verwendet werden.
- Beschreiben der wesentlichen Merkmale von BigQuery als Data Warehouse
- Erläutern, wie BigQuery Abfragen verarbeitet und Daten speichert
- Definieren der BigQuery ML-Projektphasen
- Erstellen eines benutzerdefinierten maschinellen Lernmodells mit BigQuery ML
- Übung: Vorhersage von Besucherkäufen mit BigQuery ML
5 Optionen für maschinelles Lernen in der Google Cloud
In diesem Abschnitt werden vier verschiedene Optionen zur Erstellung von Modellen für maschinelles Lernen in der Google Cloud untersucht. Ausserdem wird Vertex AI vorgestellt, die einheitliche Plattform von Google zur Erstellung und Verwaltung des Lebenszyklus von ML-Projekten.
- Identifizieren verschiedener Optionen für die Erstellung von ML-Modellen in der Google Cloud
- Definieren von Vertex AI und seiner wichtigsten Funktionen und Vorteile
- Beschreiben von AI-Lösungen in horizontalen und vertikalen Märkten
6 Der Arbeitsablauf des maschinellen Lernens mit Vertex AI
Dieser Abschnitt konzentriert sich auf die drei Hauptphasen - Datenvorbereitung, Modelltraining und Modellvorbereitung - des Workflows für maschinelles Lernen in Vertex AI. Die Lernenden können die Erstellung eines Modells für maschinelles Lernen mit AutoML üben.
- Beschreiben eines ML-Workflow und der wichtigsten Schritte
- Identifizieren der Werkzeuge und Produkte zur Unterstützung jeder Phase
- Erstellen eines durchgängigen ML-Workflows mit AutoML
- Übung: Vertex AI: Vorhersage von Kreditrisiken mit AutoML
7 Kurszusammenfassung
Dieser Abschnitt gibt einen Überblick über die im Kurs behandelten Themen und bietet zusätzliche Ressourcen zum weiteren Lernen
- Beschreiben des Lebenszyklus von Daten zu KI in der Google Cloud und identifizieren der wichtigsten Produkte von Big Data und maschinellem Lernen
- Data Analysts, Data Scientists und Business Analysts, die mit Google Cloud einsteigen möchten
- Personen, die für den Entwurf von Pipelines und Architekturen für die Datenverarbeitung, die Erstellung und Pflege von Modellen für maschinelles Lernen und Statistik, die Abfrage von Datensätzen, die Visualisierung von Abfrageergebnissen und die Erstellung von Berichten verantwortlich sind
- Führungskräfte und IT-Entscheidungsträger, die Google Cloud für die Nutzung durch Data Scientists evaluieren
Grundlegende Kenntnisse in einem oder mehreren der folgenden Bereiche:
- Datenbank-Abfragesprache wie z. B. SQL
- Arbeitsabläufe in der Datentechnik, von Extrahieren, Umwandeln, Laden bis hin zu Analyse, Modellierung und Einsatz
- Modelle des maschinellen Lernens, z. B. überwachte und nicht überwachte Modelle
Produkte
- BigQuery
- BigQuery ML
- Dataflow
- Pub/Sub
- Apache Beam
- Looker
- Looker Studio
- Vertex AI
- AutoML
- Vertex Workbench
- Document AI
- Contact Center AI (CCAI)
- TPU (Tensor Processing Unit)
- Google Kubernetes Engine
- Compute Engine