Artikel 42
KI Grundlagen

Bilder mit KI erstellen - Grundlagen verstehen

Sebastian Rydz30. Januar 202618 min Lesezeit

Stell dir vor, du könntest deine Ideen sichtbar machen

Stell dir vor, du arbeitest an einem Blogbeitrag und brauchst ein passendes Titelbild. Früher hättest du entweder einen Grafiker beauftragt, stundenlang in Bilderdatenbanken nach dem perfekten Stockfoto gesucht oder einfach irgendetwas genommen, das halbwegs passt. Jetzt stell dir vor, du tippst stattdessen ein paar Sätze in ein Textfeld, drückst auf „Generieren“ und bekommst innerhalb von Sekunden ein einzigartiges Bild, das genau zu deinem Thema passt. Kein Stockfoto, das schon auf tausend anderen Websites auftaucht. Kein teurer Grafikauftrag. Ein Bild, das es vorher nirgendwo auf der Welt gab.

Klingt nach Science-Fiction? Ist es nicht. Es ist Realität, und zwar seit Ende 2022 für jeden zugänglich. Bild-KIs wie Midjourney, DALL-E und Stable Diffusion haben eine Revolution ausgelöst, die mindestens genauso bedeutend ist wie die Einführung von ChatGPT. Millionen von Menschen erstellen täglich Bilder mit KI, und du brauchst dafür weder Zeichentalent noch Photoshop-Kenntnisse noch ein grosses Budget.

In diesem Artikel erfährst du, wie Bild-KIs funktionieren, welche Tools es gibt, was sie kosten und wie du noch heute dein erstes KI-generiertes Bild erstellst. Und keine Sorge: Wir fangen ganz von vorne an.

Willkommen in Modul 7: KI für Bilder und visuelle Inhalte

Mit diesem Artikel startest du in ein völlig neues Kapitel unserer Blogreihe „KI meistern - Fit für die Zukunft“. In den bisherigen Modulen hast du gelernt, wie du mit Text-KIs umgehst, wie du bessere Prompts schreibst, wie KI im Beruf und im Alltag hilft und wie Selbstständige davon profitieren. Das alles drehte sich primär um Text und Sprache. Jetzt wechseln wir die Perspektive komplett.

Modul 7 dreht sich um visuelle Inhalte. Du lernst, wie du mit KI Bilder erstellst, wie du Bild-Prompts formulierst, wie du Fotos bearbeitest und wie du visuelle Inhalte für verschiedene Zwecke nutzen kannst. Ob für Social Media, deine Website, Präsentationen oder kreative Projekte: Nach diesem Modul wirst du in der Lage sein, beeindruckende visuelle Inhalte zu erzeugen, ohne je einen Pinsel in der Hand gehalten zu haben.

Und damit ändert sich auch etwas Wichtiges im Promptgenerator auf optiprompt.io: Ab jetzt wechselst du von der Kategorie „LLM“ zur Kategorie Bilder. Denn Bild-Prompts folgen ganz anderen Regeln als Text-Prompts, und der Promptgenerator ist darauf vorbereitet. Doch dazu später mehr.

Dieser erste Artikel von Modul 7 legt das Fundament. Er gibt dir das Grundverständnis, das du brauchst, um in den folgenden Artikeln richtig durchzustarten. Lass uns loslegen.

Wie funktionieren Bild-KIs? Einfach erklärt

Bevor du dein erstes Bild generierst, hilft es zu verstehen, was im Hintergrund passiert. Keine Angst, wir halten es einfach und verzichten auf technischen Jargon.

Stell dir eine Bild-KI vor wie einen Künstler, der Milliarden von Bildern studiert hat. Er hat sich jedes Detail gemerkt: wie ein Sonnenuntergang aussieht, wie sich Licht auf Wasser spiegelt, wie Schatten fallen, welche Farben ein Herbstwald hat. Wenn du ihm jetzt sagst „Male mir einen Sonnenuntergang am Meer mit einem einsamen Boot“, dann kombiniert er sein gesammeltes Wissen und erschafft ein neues Bild, das es vorher noch nie gegeben hat.

Technisch gesehen funktioniert das so: Die KI wurde mit Millionen oder sogar Milliarden von Bild-Text-Paaren trainiert. Zu jedem Bild gab es eine Beschreibung. Die KI hat gelernt, welche visuellen Muster zu welchen Worten gehören. „Sonnenuntergang“ bedeutet warme Farben, ein tiefer Horizont, langes Licht. „Meer“ bedeutet Wasser, Wellen, Weite. „Boot“ bedeutet eine bestimmte Form auf dem Wasser. Die KI kombiniert all diese gelernten Muster zu einem völlig neuen Bild.

Der eigentliche Generierungsprozess basiert bei den meisten modernen Bild-KIs auf einem Konzept namens „Diffusion“. Klingt kompliziert? Hier eine Analogie, die ich besonders hilfreich finde: Stell dir vor, du hast ein fertiges Foto und streust nach und nach immer mehr Rauschen darüber, bis nur noch ein chaotisches Pixelgewirr übrig ist. Die KI lernt nun den umgekehrten Weg. Sie startet mit dem Rauschen und entfernt Schritt für Schritt das Chaos, bis ein klares Bild entsteht. Dein Text-Prompt gibt ihr dabei die Richtung vor, in welche Richtung sie das Rauschen „aufräumen“ soll.

Für den praktischen Alltag musst du das nicht im Detail verstehen. Aber es erklärt ein paar wichtige Dinge. Erstens: Warum Bild-KIs manchmal seltsame Ergebnisse liefern. Wenn dein Prompt unklar ist, weiss die KI nicht genau, in welche Richtung sie „aufräumen“ soll, und das Ergebnis wird entsprechend unscharf oder unerwartet. Zweitens: Warum jedes generierte Bild einzigartig ist. Selbst wenn du denselben Prompt zweimal eingibst, bekommst du zwei verschiedene Bilder, weil der Ausgangspunkt (das Rauschen) jedes Mal anders ist.

Die wichtigste Lektion für den Anfang: Je klarer und präziser dein Prompt, desto besser das Bild. Das gilt für Bild-KIs genauso wie für Text-KIs, nur die Art der Klarheit ist eine andere. Aber dazu kommen wir gleich.

Midjourney, DALL-E und Stable Diffusion im Überblick

Es gibt mittlerweile Dutzende von Bild-KIs auf dem Markt. Drei davon haben sich als die wichtigsten etabliert, und jede hat ihre eigenen Stärken und Eigenheiten. Lass uns die drei Grossen anschauen, damit du weisst, womit du es zu tun hast.

Midjourney gilt als der Favorit für künstlerische und ästhetisch hochwertige Bilder. Die Ergebnisse sehen oft aus wie professionelle Kunstwerke, Illustrationen oder Filmszenen. Midjourney wird über die Chat-Plattform Discord bedient, was am Anfang etwas ungewohnt sein kann. Du tippst deinen Prompt in einen Chat-Kanal, und die KI liefert dir vier Bildvarianten, aus denen du wählen kannst. Mittlerweile gibt es auch eine eigene Web-Oberfläche, die den Einstieg erleichtert. Midjourney ist kostenpflichtig, es gibt keinen dauerhaften kostenlosen Zugang. Die Qualität ist jedoch herausragend, besonders bei Landschaften, Porträts und fantastischen Szenen. Wenn du ein Bild siehst, das dich sprachlos macht, steckt oft Midjourney dahinter.

DALL-E ist die Bild-KI von OpenAI, den Machern von ChatGPT. Die neueste Version DALL-E 3 ist direkt in ChatGPT integriert, was die Nutzung extrem einfach macht. Du schreibst einfach in deinem ChatGPT-Gespräch „Erstelle mir ein Bild von...“ und bekommst das Ergebnis direkt im Chat. DALL-E ist besonders gut darin, Anweisungen präzise umzusetzen. Wenn du sagst „ein roter Apfel auf einem blauen Teller vor einer weissen Wand“, bekommst du genau das. Diese Texttreue ist eine grosse Stärke, gerade für Anfänger, weil du das bekommst, was du beschreibst. DALL-E 3 ist in der kostenpflichtigen ChatGPT Plus Version enthalten und bietet auch begrenzte kostenlose Bildgenerierungen.

Stable Diffusion ist der Open-Source-Champion unter den Bild-KIs. Das bedeutet: Der Quellcode ist öffentlich zugänglich, und jeder kann die Software kostenlos herunterladen und auf dem eigenen Computer laufen lassen. Das macht Stable Diffusion zur flexibelsten Option von allen. Du hast volle Kontrolle über das Modell, kannst es anpassen, eigene Stile trainieren und bist nicht von einem Abo abhängig. Der Nachteil: Die Einrichtung auf dem eigenen Computer erfordert etwas technisches Wissen und eine leistungsstarke Grafikkarte. Es gibt aber auch webbasierte Oberflächen wie Automatic1111 oder ComfyUI, die den Einstieg deutlich erleichtern. Stable Diffusion ist die Wahl für alle, die maximale Freiheit und Kontrolle wollen.

Welche Bild-KI ist die richtige für dich? Das hängt von deinen Bedürfnissen ab. Hier eine kurze Orientierung:

  • Für den einfachsten Einstieg: DALL-E über ChatGPT. Du brauchst nichts extra installieren und kannst sofort loslegen.
  • Für die ästhetisch anspruchsvollsten Ergebnisse: Midjourney. Wenn du visuell beeindruckende Bilder brauchst und bereit bist, ein Abo zu bezahlen.
  • Für maximale Kontrolle und Flexibilität: Stable Diffusion. Wenn du technisch versiert bist oder es werden willst und die volle Kontrolle haben möchtest.
  • Für gelegentliche Nutzung ohne Kosten: DALL-E in der kostenlosen ChatGPT-Version oder der Bing Image Creator reichen für den Anfang völlig aus.

Im Laufe dieses Moduls wirst du alle drei besser kennenlernen und herausfinden, welche am besten zu dir und deinen Projekten passt. Für den Anfang empfehle ich dir, mit DALL-E über ChatGPT zu starten, weil der Einstieg dort am leichtesten ist.

Der fundamentale Unterschied zu Text-Prompts

Wenn du die bisherigen Artikel dieser Serie gelesen hast, bist du mittlerweile routiniert darin, Prompts für Text-KIs zu schreiben. Du weisst, wie du eine Rolle vergibst, Kontext lieferst und klare Anweisungen formulierst. Bei Bild-Prompts gelten jedoch ganz andere Regeln, und dieser Unterschied ist so grundlegend, dass er einen eigenen Abschnitt verdient.

Bei einem Text-Prompt schreibst du typischerweise einen oder mehrere Absätze. Du erklärst der KI, wer sie sein soll, was du brauchst, für wen das Ergebnis ist und in welchem Ton es geschrieben sein soll. Das funktioniert, weil Text-KIs darauf trainiert sind, natürliche Sprache in Dialogform zu verarbeiten.

Bei einem Bild-Prompt ist das komplett anders. Bild-KIs verarbeiten Prompts nicht als Gespräch, sondern als eine Art Beschreibungsliste. Je kürzer und präziser deine Beschreibung, desto besser. Statt langer Sätze arbeitest du oft mit Stichworten, die durch Kommas getrennt sind.

Hier ein Vergleich, der den Unterschied deutlich macht:

Typischer Text-Prompt: „Du bist ein erfahrener Ernährungsberater. Erstelle mir einen Wochenplan für gesunde Mahlzeiten. Die Mahlzeiten sollten einfach zuzubereiten sein und maximal 30 Minuten dauern. Berücksichtige, dass ich vegetarisch esse und ein Budget von 50 Euro pro Woche habe.“

Typischer Bild-Prompt: „Sonnenuntergang über dem Meer, goldenes Licht, einzelnes Segelboot am Horizont, ruhiges Wasser, dramatische Wolken, fotorealistisch, 4K, goldene Stunde“

Siehst du den Unterschied? Beim Text-Prompt erklärst du ausführlich, gibst Kontext und definierst eine Rolle. Beim Bild-Prompt beschreibst du das gewünschte Ergebnis in kompakten, beschreibenden Begriffen. Du sagst der Bild-KI nicht, was sie tun soll, sondern was du sehen willst.

Ein weiterer wichtiger Unterschied: Bei Bild-Prompts spielen Stilangaben eine zentrale Rolle. Du kannst Begriffe wie „fotorealistisch“, „Ölgemälde“, „Aquarell“, „Cartoon“, „minimalistisch“ oder „surreal“ hinzufügen, um den visuellen Stil zu steuern. Bei Text-Prompts gibt es diese visuelle Dimension schlicht nicht.

Auch technische Parameter sind bei Bild-Prompts üblich. Begriffe wie „4K“, „8K“, „Bokeh-Effekt“, „Weitwinkel“, „Makro“ oder „Vogelperspektive“ beeinflussen, wie das Bild technisch umgesetzt wird. Das ist vergleichbar mit den Einstellungen einer Kamera, nur dass du sie in Worten angibst statt an Knöpfen zu drehen.

Und dann gibt es noch die Reihenfolge. Bei Text-Prompts ist es relativ egal, ob du den Kontext am Anfang oder am Ende gibst. Bei Bild-Prompts hingegen haben Begriffe am Anfang des Prompts typischerweise mehr Gewicht als Begriffe am Ende. Wenn du „Sonnenuntergang, Meer, Boot“ schreibst, liegt der Fokus auf dem Sonnenuntergang. Schreibst du „Boot, Meer, Sonnenuntergang“, wird das Boot prominenter dargestellt.

Die gute Nachricht: Du musst das nicht alles sofort beherrschen. Im nächsten Artikel, „Bild-Prompts schreiben - Die Kunst der Beschreibung“, gehen wir tief in die Praxis ein und du lernst Schritt für Schritt, wie du perfekte Bild-Prompts formulierst. Für heute reicht es zu wissen: Bild-Prompts funktionieren fundamental anders als Text-Prompts, und du darfst dein Denken umstellen, wenn du von Text zu Bild wechselst.

Kostenlose und bezahlte Optionen im Vergleich

Eine der häufigsten Fragen, die mir gestellt wird: „Was kostet das?“ Die gute Nachricht vorweg: Du kannst heute sofort und kostenlos anfangen, Bilder mit KI zu generieren. Die Frage ist eher, wie viel du brauchst und welche Qualität du erwartest.

Kostenlose Optionen:

  • DALL-E über ChatGPT (kostenlose Version): OpenAI bietet eine begrenzte Anzahl an Bildgenerierungen pro Tag kostenlos an. Für erste Experimente und gelegentliche Nutzung reicht das völlig aus.
  • Bing Image Creator: Microsofts kostenloser Bildgenerator nutzt DALL-E im Hintergrund und liefert solide Ergebnisse. Du brauchst nur ein Microsoft-Konto, und schon kannst du loslegen.
  • Stable Diffusion lokal: Wenn du eine leistungsstarke Grafikkarte besitzt (mindestens 8 GB VRAM), kannst du Stable Diffusion kostenlos auf deinem eigenen Computer laufen lassen. Einmal eingerichtet, fallen keine weiteren Kosten an, und du kannst unbegrenzt Bilder generieren.
  • Webbasierte Alternativen: Plattformen wie Leonardo.ai, Playground AI oder SeaArt bieten kostenlose Kontingente an. Die Qualität variiert, aber zum Ausprobieren und Lernen sind sie hervorragend geeignet.

Bezahlte Optionen:

  • Midjourney: Ab etwa 10 US-Dollar pro Monat. Dafür bekommst du eine bestimmte Anzahl an Generierungen und Zugang zu den neuesten Modellen. Für professionelle Nutzung gibt es höhere Tarife mit mehr Kontingent und schnellerer Verarbeitung.
  • ChatGPT Plus mit DALL-E 3: Für 20 US-Dollar pro Monat bekommst du neben dem besseren Textmodell auch umfangreichen Zugang zu DALL-E 3. Wenn du ChatGPT ohnehin für Textaufgaben nutzt, ist das ein hervorragendes Gesamtpaket.
  • Stable Diffusion Cloud-Dienste: Wenn du keine leistungsstarke Grafikkarte hast, kannst du Stable Diffusion über Cloud-Dienste wie RunPod oder Vast.ai nutzen. Die Kosten liegen meist bei wenigen Cent pro Bild, was sehr günstig ist.

Mein Tipp für den Einstieg: Starte kostenlos. Nutze die freien Kontingente von DALL-E, dem Bing Image Creator oder einer webbasierten Alternative. Probiere aus, experimentiere, mache Fehler. Erst wenn du merkst, dass du regelmässig Bilder generierst und mehr Qualität oder Kontrolle brauchst, lohnt sich ein bezahltes Abo. Für die meisten Anwender reicht die kostenlose Version für die ersten Wochen oder sogar Monate völlig aus.

Ein wichtiger Hinweis zu den Nutzungsrechten: Bei den meisten Bild-KIs darfst du die generierten Bilder kommerziell nutzen, solange du ein bezahltes Abo hast. Bei kostenlosen Versionen gibt es manchmal Einschränkungen. Lies dir die Nutzungsbedingungen des jeweiligen Tools durch, bevor du ein KI-generiertes Bild für geschäftliche Zwecke einsetzt. Besser einmal zu viel nachgeschaut als einmal zu wenig.

Die Kategorie Bilder im Promptgenerator

Wenn du den Promptgenerator auf optiprompt.io schon kennst, hast du bisher vermutlich die Kategorie „LLM“ genutzt. Diese dreht sich um Text-Prompts für ChatGPT, Claude, Gemini und ähnliche Sprachmodelle. Ab jetzt wird es Zeit für etwas Neues: die Kategorie Bilder.

Wenn du im Promptgenerator die Kategorie „Bilder“ auswählst, verändert sich einiges. Die generierten Prompts sind nicht mehr auf natürliche Sprache und Dialogform ausgelegt, sondern auf die kompakte, beschreibende Struktur, die Bild-KIs brauchen. Der Promptgenerator berücksichtigt automatisch die Besonderheiten von Bild-Prompts: Stilangaben, technische Parameter, Kompositionshinweise und die richtige Reihenfolge der Begriffe.

Warum ist das wichtig? Weil die Reihenfolge und Gewichtung der Begriffe bei Bild-Prompts eine grosse Rolle spielt. Begriffe, die am Anfang des Prompts stehen, haben typischerweise mehr Einfluss auf das Ergebnis als Begriffe am Ende. Der Promptgenerator weiss das und strukturiert deine Eingabe entsprechend, damit du von Anfang an bessere Ergebnisse bekommst.

Die Kategorie „Bilder“ bietet dir wieder drei Varianten, genau wie du es von der LLM-Kategorie kennst:

  • Strukturierte Variante: Ein detaillierter Bild-Prompt mit klarer Struktur und vielen beschreibenden Elementen. Ideal, wenn du ein sehr spezifisches Bild im Kopf hast und möglichst nah an deine Vorstellung herankommen willst. Der Prompt enthält Angaben zu Motiv, Stil, Beleuchtung, Perspektive und technischen Details.
  • Kompakte Variante: Ein kurzer, fokussierter Prompt mit den wichtigsten Elementen. Gut für schnelle Ergebnisse und wenn du der KI etwas kreativen Spielraum lassen möchtest. Weniger ist hier manchmal mehr.
  • Kreative Variante: Ein Prompt, der bewusst ungewöhnliche Perspektiven, überraschende Stilelemente und künstlerische Freiheiten einbringt. Perfekt, wenn du überrascht werden willst und Inspiration suchst. Diese Variante liefert oft die unerwartetsten und interessantesten Ergebnisse.

Ein praktischer Tipp: Probiere bei jedem Motiv zunächst alle drei Varianten aus. Du wirst schnell ein Gefühl dafür entwickeln, welche Variante für welchen Zweck am besten funktioniert. Und du wirst sehen, dass der Unterschied zwischen einem durchschnittlichen und einem hervorragenden Bild-Prompt genauso gross ist wie der Unterschied zwischen einem vagen und einem präzisen Text-Prompt. Der Promptgenerator ist dabei dein Werkzeug, um von Anfang an auf der richtigen Seite zu stehen.

Typische Anfängerfehler und wie du sie vermeidest

Bevor du in die Übung einsteigst, möchte ich dir ein paar typische Stolperfallen zeigen, die fast jeder am Anfang macht. Wenn du sie kennst, sparst du dir Frust und kommst schneller zu guten Ergebnissen.

Fehler 1: Zu vage Beschreibungen. „Ein schönes Bild“ oder „eine Landschaft“ ist für eine Bild-KI zu wenig Information. Sie braucht konkrete Details: Welche Landschaft? Welche Tageszeit? Welche Stimmung? Welcher Stil? Je mehr relevante Details du lieferst, desto besser wird das Ergebnis. „Eine neblige Berglandschaft bei Sonnenaufgang im Stil eines Ölgemäldes“ ist deutlich besser als „eine Berglandschaft“.

Fehler 2: Zu komplexe Szenen. Am anderen Ende des Spektrums steht der Versuch, zu viel in ein einzelnes Bild zu packen. „Drei Personen sitzen an einem Tisch, eine liest ein Buch, die andere schreibt einen Brief, die dritte schaut aus dem Fenster, draussen ist Winter und ein Hund spielt im Schnee“ überfordert die meisten Bild-KIs. Fang einfach an und steigere die Komplexität schrittweise.

Fehler 3: Menschliche Hände und Text. Bild-KIs haben bekannte Schwächen bei der Darstellung von Händen und geschriebenem Text. Finger werden manchmal zu viele oder zu wenige, und Buchstaben auf Schildern sehen oft wie Kauderwelsch aus. Das wird mit jeder Generation besser, ist aber noch nicht perfekt. Wenn dein Bild Hände oder Text enthält, prüfe das Ergebnis genau.

Fehler 4: Keine Stilangabe. Ohne Stilangabe wählt die KI selbst einen Stil, der oft generisch und langweilig wirkt. Ein einfaches „fotorealistisch“, „Illustration“ oder „Aquarell“ am Ende deines Prompts kann den Unterschied zwischen einem mittelmässigen und einem beeindruckenden Bild ausmachen.

Fehler 5: Nach dem ersten Versuch aufgeben. Bild-Generierung ist ein iterativer Prozess. Dein erstes Ergebnis wird selten perfekt sein. Aber genau das ist der Punkt: Du passt deinen Prompt an, generierst neu, verfeinerst weiter. Jede Iteration bringt dich näher an dein Wunschbild. Gib nicht nach dem ersten Versuch auf, sondern betrachte jeden Versuch als Lernschritt.

Das Schöne an KI-Bildgenerierung: Du kannst nichts kaputt machen. Jedes Experiment ist kostenlos (oder kostet nur Bruchteile eines Cents), und jeder Fehlversuch lehrt dich etwas über die Funktionsweise der KI. Das ist wie mit einem Malprogramm spielen, nur dass die KI den Pinsel hält und du der kreative Kopf bist.

Deine Übung: Ein erstes Bild generieren - Sonnenuntergang am Meer

Jetzt wird es praktisch. In dieser Übung erstellst du dein erstes KI-generiertes Bild. Wir nehmen ein universelles Motiv, das sich hervorragend als Einstieg eignet: einen Sonnenuntergang am Meer. Dafür nutzen wir den Promptgenerator auf optiprompt.io mit der Kategorie Bilder und probieren alle drei Varianten aus.

So gehst du vor:

Schritt 1: Öffne den Promptgenerator. Gehe auf optiprompt.io und wähle die Kategorie Bilder aus. Das ist wichtig: Ab diesem Modul arbeiten wir nicht mehr mit der LLM-Kategorie, sondern mit der Bild-Kategorie. Du wirst sofort sehen, dass sich die Oberfläche leicht verändert hat, um den Besonderheiten von Bild-Prompts gerecht zu werden.

Schritt 2: Beschreibe dein Motiv. Gib in das Eingabefeld eine einfache Beschreibung ein, zum Beispiel: „Ein Sonnenuntergang am Meer mit warmen Farben und einem kleinen Segelboot am Horizont“. Halte es zunächst einfach. Wir steigern die Komplexität in den nächsten Artikeln Schritt für Schritt.

Schritt 3: Lass dir alle drei Varianten generieren. Probiere nacheinander die strukturierte, die kompakte und die kreative Variante. Lies dir jeden generierten Prompt durch und achte auf die Unterschiede. Du wirst sehen, dass die strukturierte Variante deutlich mehr Details enthält, die kompakte Variante sich auf das Wesentliche konzentriert und die kreative Variante überraschende Elemente einbringt.

Schritt 4: Generiere die Bilder. Kopiere jeden der drei Prompts und füge ihn in die Bild-KI deiner Wahl ein. Wenn du noch keine nutzt, empfehle ich für den Anfang den Bing Image Creator (kostenlos, keine Anmeldung nötig) oder DALL-E über ChatGPT. Generiere mit jedem der drei Prompts ein Bild.

Schritt 5: Vergleiche die Ergebnisse. Lege die drei Bilder nebeneinander und vergleiche sie. Welches gefällt dir am besten? Welcher Prompt hat das Ergebnis geliefert, das am nächsten an deiner Vorstellung liegt? Welche Variante hat dich positiv überrascht? Gibt es Elemente in einem Bild, die du in einem anderen vermisst?

Schritt 6: Experimentiere weiter. Ändere kleine Details an deiner Eingabe und beobachte, was passiert. Was ändert sich, wenn du „dramatische Wolken“ hinzufügst? Oder „minimalistisch“ als Stil angibst? Oder „Aquarell“ statt „fotorealistisch“? Probiere mindestens drei verschiedene Abwandlungen und beobachte, wie sich die Ergebnisse verändern.

Du wirst schnell merken: Schon kleine Änderungen in der Beschreibung können das Ergebnis komplett verändern. Ein einzelnes Wort kann den Unterschied zwischen einem durchschnittlichen und einem atemberaubenden Bild ausmachen. Genau das macht Bild-Prompts so faszinierend, und genau deshalb lohnt es sich, die Kunst des Bild-Promptings zu lernen.

Fazit: Deine Reise in die Welt der visuellen KI beginnt jetzt

Du weisst jetzt, wie Bild-KIs grundlegend funktionieren: Sie haben aus Milliarden von Bildern gelernt und können auf Basis deiner Textbeschreibung neue, einzigartige Bilder erschaffen. Du kennst die drei grossen Tools, Midjourney, DALL-E und Stable Diffusion, und weisst, welches für welchen Zweck am besten geeignet ist. Du verstehst den fundamentalen Unterschied zwischen Text-Prompts und Bild-Prompts. Und du hast die Kategorie „Bilder“ im Promptgenerator kennengelernt, die dich ab jetzt durch dieses gesamte Modul begleiten wird.

Das Wichtigste: Du hast dein erstes KI-generiertes Bild erstellt. Das ist ein echter Meilenstein, auch wenn es vielleicht noch nicht perfekt aussieht. Denn wie bei allem gilt: Übung macht den Meister. Und die gute Nachricht ist, dass du dafür kein Zeichentalent brauchst, sondern nur die richtigen Worte.

Im nächsten Artikel, „Bild-Prompts schreiben - Die Kunst der Beschreibung“, gehen wir tief in die Praxis ein. Du lernst, wie du deine Bild-Prompts so formulierst, dass die KI genau das Bild erstellt, das du dir vorstellst. Wir schauen uns Komposition, Lichtstimmung, Stilangaben und fortgeschrittene Techniken an, die deine Ergebnisse auf ein völlig neues Level heben werden.

Bis dahin: Experimentiere. Generiere Bilder. Versuche verschiedene Prompts und verschiedene Tools. Je mehr du ausprobierst, desto besser wirst du verstehen, wie Bild-KIs „denken“ und was sie brauchen, um grossartige Ergebnisse zu liefern. Du kannst nichts kaputt machen, und jeder Versuch bringt dich weiter. Willkommen in der Welt der visuellen KI. Es wird spannend.

Autor

Sebastian Rydz

Das OptiPrompt Team teilt Wissen und Best Practices rund um KI und Prompt Engineering, um dir zu helfen, bessere Ergebnisse mit KI-Modellen zu erzielen.

Bereit, deine Prompts zu optimieren?

Erstelle mit OptiPrompt professionelle Prompts in Sekunden – kostenlos starten.