KI-Influencer Prompt Engineering: Der vollständige Leitfaden für konsistente Charaktere

Vom AIInfluencer.tools Team | | 15 Min. Lesezeit

Inhaltsverzeichnis

  1. Warum Freitext-Prompts bei Charakteren scheitern
  2. Die 9-Feld-Prompt-Struktur
  3. Charaktermerkmale fixieren und Szenen variieren
  4. Negative Prompts, die wirklich helfen
  5. Seed-Nutzung in Midjourney und Stable Diffusion
  6. LoRA-Training-Grundlagen für Charakterkonsistenz
  7. 7 häufige Prompt-Fehler

Sie können in Sekunden ein wunderschönes KI-Bild generieren. Denselben Charakter über 200 verschiedene Bilder hinweg gleich gut aussehen zu lassen? Das ist die eigentliche Herausforderung. Der Unterschied zwischen einem gescheiterten KI-Influencer-Projekt und einem monetarisierbaren liegt fast immer in der Prompt-Engineering-Disziplin.

Nach dem Aufbau von Prompt-Workflows für Agenturen, die Dutzende von KI-Charakteren verwalten, haben wir den Prozess in ein wiederholbares System destilliert. Dieser Leitfaden vermittelt Ihnen dieses System von Grund auf.

Warum Freitext-Prompts bei Charakteren scheitern

Die meisten Menschen schreiben Prompts wie diesen:

A beautiful young woman with brown hair at a coffee shop, photorealistic, 4k, detailed

Das funktioniert für Einzelbilder. Für einen Charakter, der in über 500 Bildern über Monate hinweg erscheinen soll, ist es eine Katastrophe. Hier ist der Grund:

Die Lösung ist strukturiertes Prompting - behandeln Sie Ihren Prompt wie ein Formular mit definierten Feldern statt als Fließtext.

Die 9-Feld-Prompt-Struktur

Jeder KI-Influencer-Bild-Prompt sollte in genau 9 Felder aufgeteilt werden. Die ersten drei definieren den Charakter (und ändern sich nie). Die restlichen sechs definieren die Szene (und ändern sich mit jedem Bild).

1. Face

Gesichtsform, Hautton, Augenfarbe/-form, Nase, Lippen, Sommersprossen, Muttermale. Seien Sie äußerst spezifisch.

2. Hair

Farbe, Länge, Textur, Stil, Scheitelrichtung. Beschreiben Sie, wie das Haar im Verhältnis zu den Schultern fällt.

3. Body

Statur, Höheneindruck, markante körperliche Merkmale. Konsistent halten, aber nicht überbeschreiben.

4. Clothing

Oberteil, Unterteil, Schuhe, Accessoires. Ändert sich pro Bild, sollte aber im Stil des Charakters bleiben.

5. Style

Fotografiestil: editorial, street, candid, studio, lifestyle. Bestimmt den gesamten Rendering-Ansatz.

6. Lighting

Typ, Richtung, Farbtemperatur. Golden Hour, Studio-Softbox, Neon-Ambiente, bewölktes Naturlicht.

7. Camera

Objektiv, Brennweite, Blende, Winkel. "85mm f/1.8, Augenhöhe" vs. "35mm f/2.8, niedrige Perspektive" verändert das Gefühl drastisch.

8. Setting

Ort und Hintergrunddetails. Seien Sie spezifisch: "Industrie-Loft mit sichtbarem Backstein und großen Fenstern" statt nur "drinnen".

9. Mood

Emotionaler Ton und Ausdruck. "Selbstbewusst, direkter Blickkontakt, leichtes Schmunzeln" vs. "nachdenklich, wegschauend, sanftes Lächeln".

Ein vollständiges 9-Feld-Beispiel

Face: heart-shaped face, light olive skin, hazel green eyes with gold flecks, straight nose with slight upturn, full natural lips, subtle beauty mark above left lip

Hair: long wavy dark brown hair with subtle caramel highlights, center parted, reaching mid-back, loose face-framing layers

Body: athletic lean build, toned arms, 5'8" proportions

Clothing: oversized vintage band tee (tucked front), black high-waisted mom jeans, white Air Force 1 sneakers, thin gold chain necklace

Style: street photography, editorial, magazine quality

Lighting: late afternoon golden hour, warm directional light from camera left, soft shadows

Camera: Canon R5, 85mm f/1.4, shallow depth of field, eye-level angle

Setting: Brooklyn sidewalk, brownstone buildings in background, a few parked cars, autumn leaves on ground

Mood: casual confidence, walking toward camera, natural mid-stride pose, relaxed half-smile

Wenn Sie dies an Midjourney, Flux oder Stable Diffusion übergeben (als korrekt formatierter einzelner Prompt), ist das Ergebnis dramatisch kontrollierter als ein Freitext-Absatz. Und wenn Sie das nächste Bild generieren, kopieren Sie die Felder 1-3 exakt und ändern nur die Felder 4-9.

Charaktermerkmale fixieren und Szenen variieren

Die 9-Feld-Struktur gibt Ihnen das Fundament. Aber es gibt zusätzliche Techniken zur Aufrechterhaltung der Konsistenz über Generierungen hinweg:

Die Anker-Prompt-Technik

Erstellen Sie ein "Ankerbild" - Ihre absolut beste Generierung des Charakters. Dieses wird zu Ihrem Referenzpunkt. In Midjourney verwenden Sie --cref [anchor_image_url] bei jeder nachfolgenden Generierung. In Stable Diffusion verwenden Sie den Anker als img2img-Referenz mit 0,3-0,5 Denoising-Stärke.

Der Anker-Prompt sollte ein einfaches, gut beleuchtetes, frontal aufgenommenes Porträt mit minimalen Hintergrundablenkungen sein. Denken Sie an "Passfoto, aber gut". Das gibt dem KI-Modell die klarstmögliche Referenz für die Gesichtsmerkmale des Charakters.

Prompt-Gewichtung

Nicht alle Prompt-Elemente sind gleich wichtig. Geben Sie charakterdefinierenden Merkmalen höhere Gewichtung:

(heart-shaped face, hazel green eyes, beauty mark above left lip:1.3), (long wavy dark brown hair:1.2), athletic build, wearing a red sundress, standing in a flower garden, golden hour lighting

In Midjourney verwenden Sie ::2-Gewichtung. In Stable Diffusion nutzen Sie die (Merkmal:Gewicht)-Syntax. Eine Gewichtung der Gesichtsmerkmale bei 1,2-1,4 sagt dem Modell "diese Merkmale sind nicht verhandelbar", während Szenenelemente bei Standardgewichtung für natürlichere Variation bleiben.

Konsistente technische Parameter

Halten Sie diese über alle Generierungen eines Charakters gleich:

Negative Prompts, die wirklich helfen

Negative Prompts sagen dem Modell, was es vermeiden soll. Für KI-Influencer-Content sollten diese Negativ-Prompts bei jeder Generierung Standard sein:

Negative: deformed hands, extra fingers, merged fingers, bad anatomy, disfigured face, asymmetric eyes, blurry, low quality, watermark, text overlay, cartoon, anime, illustration, 3d render, plastic skin, overly smooth skin, uncanny valley

Nischen-spezifische Negativ-Prompts

Ein häufiger Fehler ist das Schreiben enormer Negativ-Prompts mit 50+ Begriffen. Das schadet tatsächlich der Ausgabequalität, weil das Modell zu viel Rechenleistung darauf verwendet, Dinge zu vermeiden, anstatt das zu generieren, was Sie wollen. Beschränken Sie Negativ-Prompts auf maximal 15-25 Begriffe, fokussiert auf Probleme, die tatsächlich auftreten.

Seed-Nutzung in Midjourney und Stable Diffusion

Seeds steuern die Zufälligkeit bei der Bildgenerierung. Gleicher Prompt + gleicher Seed = gleiches (oder sehr ähnliches) Ergebnis. So setzen Sie sie strategisch ein:

Midjourney-Seed-Workflow

  1. Generieren Sie Ihr Ankerbild ohne Angabe eines Seeds.
  2. Reagieren Sie mit dem Briefumschlag-Emoji, um die Seed-Nummer vom Bot zu erhalten.
  3. Verwenden Sie --seed [Nummer] bei nachfolgenden Generierungen mit modifizierten Prompts, um ähnliche Komposition und Merkmale beizubehalten.

Wichtiger Hinweis: Seeds in Midjourney sind nicht deterministisch über verschiedene Prompts hinweg. Sie beeinflussen das zufällige Startrauschen, nicht das Endergebnis. Ein Seed garantiert dasselbe Bild nur, wenn der Prompt identisch ist. Bei unterschiedlichen Prompts erzeugt derselbe Seed Bilder mit "ähnlichem Gefühl", nicht identische.

Stable-Diffusion-Seed-Workflow

In SD sind Seeds deterministischer. Gleicher Seed + gleicher Prompt + gleiches Modell + gleiche Einstellungen = jedes Mal identisches Ergebnis. Nutzen Sie dies für:

LoRA-Training-Grundlagen für Charakterkonsistenz

LoRA (Low-Rank Adaptation) ist eine Technik zur Feinabstimmung eines KI-Modells auf einen kleinen Satz von Bildern. Für KI-Influencer-Arbeit trainieren Sie ein LoRA auf 15-30 Bildern Ihres Charakters, und dann generiert jeder Prompt mit diesem LoRA Ihren spezifischen Charakter.

Wann ein LoRA trainiert werden sollte

LoRA-Training-Schnellstart

  1. Trainingsbilder sammeln: Generieren Sie 20-30 hochwertige Bilder Ihres Charakters aus Ihrem besten Prompt. Variieren Sie Posen, Ausdrücke und Winkel, aber halten Sie das Gesicht konsistent. Kuratieren Sie manuell; entfernen Sie alle, die "daneben" aussehen.
  2. Bilder beschriften: Verwenden Sie BLIP oder WD Tagger für Auto-Beschriftungen, dann bearbeiten Sie die Beschriftungen, um sicherzustellen, dass die einzigartigen Merkmale Ihres Charakters konsistent beschrieben werden.
  3. Trainieren: Verwenden Sie Kohya_ss oder die Trainings-Oberfläche von civitai.com. Einstellungen: 1000-1500 Schritte, Lernrate 1e-4, Rang 32-64. Das Training dauert 15-30 Minuten auf einer RTX 3090.
  4. Testen: Generieren Sie 10 Bilder mit unterschiedlichen Prompts. Wenn das Gesicht über alle 10 konsistent ist, ist Ihr LoRA einsatzbereit.

Ein gut trainiertes LoRA ist der Goldstandard für Charakterkonsistenz. Es ermöglicht Ihnen, einfache Prompts wie "Luna am Strand, Sonnenuntergang, lässiges Outfit" zu schreiben und jedes Mal einen wiedererkennbaren Charakter zu erhalten. Der Kompromiss ist die anfängliche Zeitinvestition und die Notwendigkeit einer guten GPU (oder eines Cloud-GPU-Dienstes wie RunPod für ca. 0,50 $/Stunde).

7 häufige Prompt-Fehler

1. Den Charakter jedes Mal anders beschreiben

"Brown hair" in einem Prompt, "brunette" im nächsten, "dark chestnut hair" in einem dritten. Das sind für die KI keine Synonyme. Wählen Sie eine exakte Formulierung und kopieren Sie sie jedes Mal identisch.

2. Haut überbeschreiben

"Flawless porcelain skin, smooth, perfect complexion, no blemishes" erzeugt den Plastikpuppen-Look, der für Betrachter nach "KI" schreit. Verwenden Sie stattdessen "natural skin texture, subtle skin pores".

3. Handplatzierung ignorieren

KI hat immer noch Schwierigkeiten mit Händen. Überlassen Sie die Handposition nicht dem Zufall. Spezifizieren Sie: "hands in pockets", "holding a coffee cup with both hands" oder "arms crossed". Definierte Handpositionen erzeugen dramatisch weniger Artefakte.

4. "Photorealistic" als Krücke verwenden

Das Wort "photorealistic" ist in den Trainingsdaten so überstrapaziert, dass es fast bedeutungslos geworden ist. Geben Sie stattdessen die tatsächliche Kamera und das Objektiv an: "shot on Canon R5, 85mm f/1.4" signalisiert Fotorealismus durch technische Spezifität.

5. Stil mitten im Feed wechseln

Von "cinematic photography" zu "street photography" zu "fashion editorial" über drei aufeinanderfolgende Posts zu wechseln, lässt den Feed inkohärent wirken. Wählen Sie einen primären Stil und verwenden Sie ihn für 80 %+ Ihres Contents.

6. Hintergrunddetails vernachlässigen

"Blurred background" ist faul und erzeugt generische Bokeh-Kleckse. "Coffee shop with exposed brick, warm ambient lighting, a few blurred patrons" gibt dem Modell genug Kontext, um eine glaubwürdige Umgebung zu schaffen.

7. Prompts nicht speichern

Wenn Sie Prompts nicht in einem strukturierten Format speichern, verlieren Sie den Überblick darüber, was funktioniert hat. Speichern Sie jeden erfolgreichen Prompt zusammen mit dem generierten Bild. Genau das automatisieren Tools wie AIInfluencer.tools - strukturierte Prompt-Speicherung, Versionierung und Charakter-Feld-Fixierung über Ihr gesamtes Projekt.

Für mehr zum Thema Gesichtskonsistenz im Speziellen lesen Sie unseren speziellen Leitfaden: So bleibt das Gesicht Ihres KI-Influencers konsistent über alle Posts hinweg.

Automatisieren Sie Ihre Prompt-Struktur

AIInfluencer.tools verwendet das in diesem Artikel beschriebene 9-Feld-Prompt-System. Laden Sie ein Referenzbild hoch, und unsere KI extrahiert strukturierte Felder, die Sie fixieren, variieren und in jede Generierungsplattform exportieren können.

Kostenlos testen