1 Grundlagen von Numpy
- Was kann dieses Package?
- Welche Datenanalysen sind damit möglich?
2 Einführung in Pandas
- Pandas-Datenstrukturen
- Funktionalität
- Welche Datenanalysen sind mit Pandas möglich und sinnvoll
3 Daten laden und speichern
- Praktischer Umgang mit den wichtigsten Dateiformaten
- Excel-Einbindung mit Pandas
- SQL-Abfragen mit Pandas
- API-Abfragen mit Pandas
- Python-Anbindung an gängige Cloud-Lösungen (Google, Microsoft, AWS)
4 Daten vorbereiten und bereinigen
- Der Umgang mit fehlenden Daten
- Datentransformation
- Daten verknüpfen, kombinieren und umformen
- Aggregation und Gruppierung von Daten
- Umgang mit Zeitstempeln und Kalenderdaten
- Effizienz, Performance und Zuverlässigkeit
5 Visualisierung
- Grundlagen der Visulaisierung mit Matplotlib
- Publikationsfähige Grafiken mit Seaborn
- Interaktive Web-Visualisierungen mit Plotly
6 Zeitreihenanalyse
- Einführung in die Methodik
- Das Statsmodels-Package
- Automatisierte Zeitreihen-Modellierung
7 Lernende Modelle
- Einführung in die Methodik
- Übersicht lernender Modelle mit scikit
- Daten für Machine Learning aufbereiten
- Klassifikation und Regression von Daten
- Ergebnisse interpretieren und darstellen
8 Einführung in Geodaten-Analyse
- Einführung in die Methodik
- Geopandas und Shapely
Zu jedem Punkt: Beispiele zu Python-basierter Datenanalyse an realen Fällen