Daten richtig in Excel importieren
Aufgrund eines Datenimport-Fehlers in Excel verschwanden in Grossbritannien fast 16’000 positive Covid-Fälle aus der Statistik. Wie .csv-Dateien richtig importiert werden, zeigt Trainer Abdul Kerim Aydemir in dieser Anleitung.
Wenn beim Datenimport in Excel etwas schiefläuft, fehlen Ihnen im besten Fall einige unbedeutende Daten, im schlimmsten Fall kann es Leben kosten. Das zeigt ein aktuelles Beispiel aus Grossbritannien:
Die zuständige Gesundheitsbehörde, Public Health England (PHE), verwaltet seit Beginn der Corona-Pandemie die Fallzahlen in Excel-Tabellen. Jedoch ist Ihnen ein fataler Fehler unterlaufen.
Statt mit .xlsx haben sie das veraltete Excel-Dateiformat .xls verwendet. Eine .xls-Datei kann lediglich rund 65’000 Zeilen beinhalten, wogegen das neue Dateiformat, .xlsx bis zu rund 1 Million Zeilen auflisten kann. Dadurch sind beim Import der .csv-Datei, die unbegrenzt grosse Datenmengen beinhalten kann, knapp 16’000 positiv getestete Patienten nicht in der Statistik aufgelistet und gefährdete Kontaktpersonen nicht informiert worden.
Damit Ihnen das nicht passiert, möchte ich Ihnen zwei Dinge in diesem Beitrag zeigen:
- Wie erkenne ich, ob meine Excel-Datei im neuen Dateiformat .xlsx erstellt ist?
- Wie importiere ich grosse .csv-Dateien richtig?
1. Dateiformate in Excel erkennen
Wenn Sie mit den Excel-Versionen 2007 oder höher arbeiten, wird in der Regel bei einer leeren Arbeitsmappe bereits das korrekte Excel-Format (.xlsx) verwendet.
Mit der Version 2007 wurden neue Dateiformate wie .xlsx, .xlsb, .xlsm, .xltx etc. eingeführt. Dadurch werden Excel-Dateien besser komprimiert und eine höhere Sicherheit gewährleistet, zumal Makro-beinhaltende Excel-Dateien im Format .xlsm gespeichert werden müssen.
Trotzdem ist es möglich, die Arbeitsmappe auch im alten .xls-Dateiformat zu speichern. Früher war das notwendig, damit die Empfänger einer Excel-Datei, die noch mit früheren Excel-Versionen, wie Excel 2003 und älter arbeiteten, die jeweilige Datei auch öffnen können. Seit Jahren ist das aber nicht mehr der Fall. Auch ältere Excel-Versionen können durch den sog. Kompatibilitätsmodus neuere Excel-Dateien aufstarten.
Eine Datei, die im alten .xls-Format erstellt ist, zeigt auf der Titelleiste folgende Meldung an:
Diese Meldung zeigt Ihnen an, dass Sie mit dem alten Excel-Dateiformat .xls arbeiten und damit genau nur 65’036 Zeilen und 256 Spalten zur Verfügung haben und die neuesten Funktionen und Befehle wie (Prognoseblatt, Add-ins, Sparklines, etc.) nicht funktionieren. Sie können die bestehende Datei ohne Verlust in das neue Dateiformat konvertieren.
Hierzu gehen Sie wie folgt vor:
- Wählen Sie dazu die Registerkarte Datei, Informationen und klicken Sie auf «Konvertieren».
- Bestätigen Sie die Konvertierung mit einem Klick auf «OK».
- Bestätigen Sie nun das Schliessen und das erneute Öffnen der Arbeitsmappe mit einem Klick auf «Ja».
Nun stehen Ihnen wieder alle Funktionen Ihrer aktuellen Excel-Funktion zur Verfügung. Auch die erweiterte Anzahl an Zeilen und Spalten kann nun genutzt werden.
2. Importieren von .csv-Dateien in Microsoft Excel 2019 oder Microsoft Excel 365
Wir arbeiten mit grossen Datenmengen in unseren CRM- oder ERP-Systemen. Oftmals wollen wir diese analysieren und auswerten, können dies aber nicht, da diese Systeme nicht die flexibelsten und einfachsten sind.
Sie haben aber die Möglichkeit Ihre Berichte, Tabellen oder generell Ihre Daten, also .csv-Dateien (oder direkt als .xlsx-Dateien) zu exportieren und diese dann in Microsoft Excel zu importieren.
In der Excel Version 2016 und aufwärts arbeiten wir dem Power Query. Mit Power Query ist es sehr einfach und effizient möglich, Daten aus vielen, verschiedenen Dateiformaten zu importieren.
Ein Beispiel:
Wir möchten eine .csv-Datei mit 100’000 Datenzeilen in Excel importieren und mit PivotTables analysieren.
Original-Datei (Customer Data.csv)
Importierte Datei (Customer Data.xlsx)
Und nun Schritt für Schritt:
1. Klicken Sie zuerst auf den Register «Daten», um die Datenimport-Möglichkeiten einzusehen.
2. Wählen Sie das Format oder den Bereich aus, den Sie in das aktive Excel-Arbeitsblatt importieren möchten. In diesem Beispiel wählen wir den Befehl «Aus Text/CSV».
3. Wählen Sie die Datei in Ihrem Windows Explorer, die Sie importieren möchten.
4. Sobald Sie auf «Importieren» geklickt haben, erscheint das Power Query Import Fenster. Basierend auf den ersten 200 Zeilen empfiehlt Ihnen Power Query, welches Trennzeichen das richtige ist, um die Daten aus der ersten Spalte der Original-Datei auf mehrere Spalten sinnvoll zu splitten. Hier ist es ein Komma.
5. Natürlich kann auch ein anderes Trennzeichen verwendet werden, falls Power Query nicht in der Lage ist das richtige Trennzeichen zu eruieren.
6. Im letzten Schritt müssen Sie nur noch auf «Laden» klicken. Basierend auf Ihren Eingaben wird die .csv-Datei in Microsoft Excel importiert. Dabei wird das gewünschte Trennzeichen für die Trennung der Daten verwendet.
Wie Sie sehen, ist dieser Vorgang sehr effizient und schnell durchführbar. Bitte beachten Sie nun beim Speichern, dass Sie definitiv das neue Excel-Format .xlsx oder z.B. .xlsm ausgewählt haben, damit auch wirklich die 1’048’576 Zeilen für den Import und die Speicherung zur Verfügung stehen.