Bilder generieren mit AI: Richtig prompten mit DALL-E, Midjourney & Co.
Früher musstest du dich entscheiden: Stockbilder nutzen oder individuelle Grafiken in Auftrag geben. Heute bieten KI-Bildgeneratoren eine attraktive dritte Option. Wir zeigen dir die besten Tools zur KI-Bildgenerierung und geben Tipps zum richtigen Prompting.
ChatGPT von OpenAI, das vielleicht bekannteste KI-Tool, kann nicht nur Texte erstellen, sondern generiert auf Wunsch durch die Anbindung an «DALL-E 3» auch Bilder. Neben «DALL-E» gibt es mit «Adobe Firefly» oder «Midjourney» weitere Konkurrenten. Eines haben alle KI-Bildtools gemeinsam: Wie gut die Bildqualität ist, hängt entscheidend vom richtigen Prompting ab.
Wie funktioniert das Erstellen von AI-generierten Bildern?
Während der Trainingsphase nutzen heutige KI-Technologien eine riesige Anzahl an Bildern, die das neuronale Netzwerk erweiterten. So ist es einem AI-Generator möglich, die wesentlichen Eigenschaften von Bildern zu erlernen und sinnvoll anzuordnen. Zu diesen Eigenschaften gehören Kanten, Formen, Farben, Szenen und verschiedene Objekte.
Um neue Bilder zu generieren, erhält das KI-Modell von dir eine spezifische Anweisung, den sogenannten Prompt. Je exakter deine Formulierungen sind, desto besser wird in der Regel der Output. Falls dir ein Bild nicht gefällt, kannst du der AI weiteren Input geben und explizite Verbesserungswünsche äussern.
Prompting optimieren: So erhalten Sie das gewünschte AI-Bild
Da KI-Systemen das echte Verständnis der Welt fehlt, erkennen und reproduzieren sie Muster basierend auf Trainingsdaten, ohne dabei die Beziehungen zwischen Objekten zu verstehen. Deshalb braucht es deinen gezielten Input.
Die AI erstellt bereits ein Bild, wenn du kurze Schlagworte wie «drei Katzen» eingibst. Damit gibst du dem Programm jedoch zu viel Spielraum – alle nicht spezifizierten Details entscheidet die KI relativ zufällig.
Hier einige wichtige Tipps zum besseren Prompting:
- Spezifische Angaben: Je genauer du bist, desto besser versteht die AI deine Wünsche. Statt «Eine Katze» beschreibe detaillierter: «Eine Britisch-Kurzhaar-Katze, die auf einem Liegestuhl auf dem Balkon liegt.»
- Kontext und Stimmung: Gib den Kontext und die gewünschte Stimmung an, z.B.: «Ein friedlicher Waldweg mit grünen Bäumen und leichtem Sonnenschein.»
- Beleuchtung und Farben: Weisen du auf die Farbumgebung und das Licht hin. Ein Beispiel: «Ein lebhaftes Porträt einer blonden Frau, beleuchtet von der Sonne, mit satten orangefarbenen und blauen Farbtönen.»
- Kunststil: Wenn du einen bestimmten Stil möchtest, spezifizier ihn. Beispiele: «Claude Monet» oder «Gemalt mit schnellen Pinselstrichen.»
- Realismus oder Abstraktion: Entscheide, ob das Bild abstrakt oder realistisch sein soll. Das beeinflusst die Interpretation durch die AI.
- Adjektivreiche Sprache: Nutze Begriffe wie «beschaulich, gruselig, romantisch, ästhetisch, strahlend», um der AI genaue Hinweise zu geben.
Tipp: Prompts auf Englisch können oft genauer verstanden werden, da die meisten KI-Tools auf Englisch programmiert sind und so weniger Interpretationsspielraum besteht.
Text-zu-Bild-Prompting vs. Bild-zu-Bild-Prompting
Heute nutzen die meisten AI-Generatoren die Text-zu-Bild-Technologie. du gibst in Worten deine Wünsche ein, und das Programm wandelt diese in ein Bild um. Beispiel-Prompt: «Drei Katzen, die über einen grün bewachsenen Hügel spazieren». Ein Bild-zu-Bild-Generator funktioniert hingegen mit einem visuellen Input. du stellst ein Bild zur Verfügung, das dann stilistisch angepasst wird.
Achtung: KI-Tools dürfen nicht einfach Personen als KI-Version nachbilden, da dies gegen Persönlichkeitsrechte verstossen könnte. Auch reale Personen oder Markenlogos sollten aus rechtlichen Gründen nicht als Vorlage für KI-Bilder verwendet werden.
DALL-E, Midjourney & Firefly: Diese AI-Bild-Generatoren sollten Sie kennen
Es gibt inzwischen zahlreiche Tools, die dir hochwertige Bilder erstellen. Hier einige Empfehlungen:
- DALL-E: Das hauseigene Bild-Tool von OpenAI ist in die Pro-Version von ChatGPT integriert und generiert künstlich wirkende Bilder. Trotz einer Funktion zur Detailanpassung ist die Umsetzung nicht immer zuverlässig.
- Midjourney: Bekannt und beliebt, wird über Discord genutzt und ist kostenpflichtig (ab 10 Franken pro Monat). Neben der Text-zu-Bild-Generierung kann Midjourney zwei Bilder kombinieren oder vorhandene Bilder verbessern. Profi-Tipp: Nutze den Parameter «–no», um bestimmte Elemente aus Bildern auszuschliessen, oder trenn Begriffe mit «::», um diese separat zu betrachten.
- Adobe Firefly: Firefly wurde mit Daten aus Adobe Stock trainiert und lässt sich ideal mit anderen Adobe-Programmen verbinden, z.B., um Hintergründe per KI zu füllen. Die Nutzung ist für viele Anwender/innen kostenlos.
.