Das Gehirn der KI – so funktioniert Deep Learning einfach erklärt
Rund um die Künstliche Intelligenz kursieren allerhand Begriffe, darunter auch Deep Learning. Was das mit dem menschlichen Gehirn zu tun hat und wo uns Deep Learning im Alltag begegnet: Wir haben für dich alle wichtigen Infos zusammengestellt.
Propeller, Raketenantrieb, Spritze, Lupe: Einige der bedeutendsten Technologien hat der Mensch schlichtweg geklaut. Der Propeller ist von der Flügelfrucht des Ahorns abgeguckt, für den Raketenantrieb wurde das Rückstossprinzip von Quallen nachgeahmt, die Idee für Spritzen stammt vom Giftstachel der Bienen und für die Lupe wurde beim Regentropfen gespickt.
Für eine der modernsten Technologien hat der Mensch nun aber sich selbst zum Vorbild genommen, genauer gesagt: sein Gehirn. Dabei geht es um die neuesten Modelle der Künstlichen Intelligenz, das Deep Learning. Sie sind in der Lage, selbstständig zu lernen – so wie das Vorbild Mensch.
Was ist Deep Learning einfach erklärt?
Deep Learning, auf Deutsch «tiefes Lernen», ist ein Teilbereich der Künstlichen Intelligenz – genauer gesagt eine Unterart des Machine Learning, also des maschinellen Lernens.
Bildquelle: Eigene Darstellung
Deep Learning ahmt die Struktur des menschlichen Gehirns nach. In unserem Gehirn sind Nervenzellen in einem Netzwerk verzweigt, sie empfangen Signale und leiten sie weiter. Deep Learning nutzt Künstliche Neuronale Netze (KNN), die aus vielen Schichten einzelner Einheiten, den künstlichen Neuronen, bestehen. Daher kommt auch die Bezeichnung «deep», für die immer tiefer liegenden Schichten.
Deep-Learning-Modelle gehen also ähnlich vor wie Menschen: Sie nehmen Infos wahr, denken darüber nach und ziehen einen Schluss daraus.
Wie funktioniert Deep Learning?
Die künstlichen Neuronen des Deep Learning sind einzelne Computerprogramme. Sie führen mathematische Berechnungen aus und senden diese an die anderen künstlichen Neuronen im Netzwerk weiter. Das Netzwerk besteht aus mehreren Schichten, mindestens drei Stück: einer Eingabeschicht, einer Ausgabeschicht und mindestens einer Zwischenschicht.
Jedes Neuron einer Schicht ist mit jedem Neuron in der folgenden Schicht verbunden und gibt seine Berechnung an diese weiter. Das heisst, dass die nachfolgenden Neuronen die Berechnungen mehrerer vorgelagerter Neuronen für ihre eigene Analyse verwenden.
Je mehr Neuronen in der ersten Schicht sind und je mehr folgende Schichten ein Deep-Learning-Modell hat, desto komplexere Analysen kann es durchführen. Denn für die Analyse von Bildern zum Beispiel werden die Neuronen der ersten Schicht mit je einem Pixel gefüttert. Sprich: Soll ein Deep-Learning-Modell Graustufenbilder mit einer Grösse von 10×10 Pixeln verarbeiten, braucht es in der ersten Schicht 100 Neuronen.
Mit jeder weiteren Schicht wird die Berechnung dann abstrakter: Aus einem Pixel wird ein Rand, aus Rändern ein Muster, aus Mustern ein Objekt. Welche Merkmale jeweils wichtig sind, entscheidet das Modell selbst, zudem sind die Zwischenschichten verborgen. Deshalb gilt Deep Learning als «Black Box», weil der Entscheidungsweg kaum nachzuvollziehen ist.

Trainierte Deep-Learning-Modelle können riesige Datensätze innerhalb kürzester Zeit selbstständig analysieren und filtern.
Bildquelle: «The Simple Guide to Deep Learning», Iskender Dirik
Um grosse Datensätze zu analysieren, braucht Deep Learning ein grosses Netzwerk an künstlichen Neuronen und vor allem auch viel Rechenleistung. Vorab muss es zudem mit sehr vielen Daten trainiert werden. Nur so kann es Wissen aufbauen und später eigene und richtige Schlüsse ziehen.
Die drei Arten von Deep Learning Modellen
1 Convolutional Neural Network (CNN)
Das Convolutional Neural Network (CNN), zu Deutsch faltendes neuronales Netzwerk, ist in erster Linie für die Analyse von Bildern da. Es erkennt lokale Muster, also Beziehungen zwischen benachbarten Pixeln in einem Bild.
CNNs verarbeiten Bilder in mehreren Ebenen. Diese werden als «Faltungsschichten» bezeichnet und wenden jeweils bestimmte Filter an. So erkennt jede Schicht Merkmale, die immer detaillierter werden, je weiter die Analyse fortschreitet: Die erste Faltungsschicht erkennt einfache Merkmale wie Kanten, die tieferen zunehmend komplexe Formen. So erstellen CNNs eine «Merkmalskarte» und können visuelle Objekte erkennen.
2 Recurrent Neural Network (RNN)
Das Recurrent Neural Network (RNN), also wiederkehrendes neuronales Netzwerk, nutzt Rückkopplungen und baut eine Art Gedächtnis auf. Es eignet sich besonders für die Analyse von Zeitreihen – für Wettervorhersagen zum Beispiel.
RNNs können selbst bestimmen, in welche Richtung Informationen durch die Schichten fliessen. Die Berechnung eines Neurons muss nicht zwingend in die nächsttiefere Schicht weitergehen, sondern kann auch an ein Neuron in derselben oder der vorherigen Schicht fliessen. RNNs können ältere Infos mit aktuellen Eingaben verbinden und so Beziehungen zwischen einzelnen Elementen erkennen. Dadurch können sie präzise Vorhersagen treffen.
3 Transformer Model (TM)
Transformer Models (TMs) sind eine Weiterentwicklung der RNNs. TMs wandeln Wörter in mehrdimensionale Vektoren um und verstehen so den Kontext eines Wortes. Sie kommen bei der Verarbeitung von Sprache zum Einsatz und sind ein entscheidender Bestandteil von Natural Language Processing (NLP) und Retrieval-Augmented Generation (RAG).
Beispiele für Deep Learning im Alltag
Deep Learning begegnet uns im Alltag bereits an vielen Stellen. Zum Beispiel hier:
- Sprachverarbeitung: Für Chatbots, Übersetzungen, Stimmungsanalysen
- Gesichtserkennung: Um das Smartphone zu entsperren oder Bilder und Videos zu analysieren
- Selbstfahrende Autos: Hindernisse, Schilder, Ampeln und Personen erkennen; Autos reagieren dann entsprechend (bremsen, ausweichen)
- Gesundheitsfürsorge: Für die Analyse medizinischer Bilder, um beispielsweise Krebszellen zu erkennen
- Empfehlungssysteme: Individuelle Vorschläge bei Streaming-Diensten, im E-Commerce, in sozialen Medien
FAQ: Die häufigsten Fragen auf einen Blick – und die Antworten darauf
Wann ist Deep Learning besser als klassisches Machine Learning?
Machine Learning eignet sich sehr gut für die Analyse von strukturierten Daten und für gut erklärbare Ergebnisse. Deep Learning wird hingegen für grosse und unstrukturierte Daten verwendet, weil es auch komplexe Muster selbstständig erkennt. Allerdings sind die Trainingszeiten für Deep Learning länger und auch die Rechenleistungen höher als für Machine Learning. Welches Modell du wählst, hängt also von der Datenlage, der Aufgabenkomplexität und der verfügbaren Rechenressourcen ab.
Ist Deep Learning immer KI?
Ja. Deep Learning ist eine Unterart des Maschinellen Lernens, das wiederum ein Teilbereich der Künstlichen Intelligenz ist. Somit ist Deep Learning eine spezifizierte Art von Künstlicher Intelligenz.
Warum braucht Deep Learning grosse Datenmengen?
Deep Learning braucht für das Training so viele Daten, weil die Modelle automatisch lernen sollen. Je mehr Daten für das Training genutzt werden, desto besser kann das Modell allgemeingültige Muster erkennen und verlässliche Entscheidungen treffen. Wichtig ist jedoch nicht nur die Datenmenge, sondern auch die Datenqualität.